فزون­مهر (۱۳۸۴) و حشمتی و همکاران (۱۳۸۳) بالاتر و از اعتبار بدست آمده در مطالعه­ جزایری (۱۳۸۴)، پایین­تر بوده است. ضریب تمیز دروس مورد مطالعه در این تحقیق، نسبت به مطالعه­ رحیمی (۱۳۸۷)، واحدی و فزون­مهر (۱۳۸۴)، شاطریان محمدی (۱۳۸۴) و حشمتی و همکاران (۱۳۸۳) در وضعیت مطلوب­تری قرار دارد. همچنین، ضریب دشواری بدست آمده برای دروس مورد مطالعه با ضریب دشواری مطالعات مذکور، همخوان است. میانگین ضریب دشواری زیست­شناسی در این تحقیق (۵۰/۰) پایین­تر از میانگین ضریب دشواری زیست­شناسی در استان لرستان (۶۱/۰) در مطالعه­ حشمتی و همکاران (۱۳۸۳) می­باشد که بیانگر دشوار بودن امتحان زیست­شناسی خرداد ۹۰ نسبت به خرداد ۸۱ می­باشد.

(( اینجا فقط تکه ای از متن درج شده است. برای خرید متن کامل فایل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. ))

ارزیابی کمی آزمون بر طبق مدل­های IRT
تحلیل ویژگی­های روان­سنجی سوالات دو درس ادبیات­فارسی و زیست­شناسی طبق مدل IRT نشان داد که دو مفروضه تک­بعدی بودن و استقلال موضعی در آن دو برقرار است. همچنین در هر دو درس، آزمون خی­دو نشان داد که مدل دو پارامتری نسبت به مدل یک پارامتری برازش بهتری با داده ­ها دارد.
در درس ادبیات­فارسی، در مدل یک پارامتری در سطح ۰۵/۰، ۱۸ سوال و در مدل دو پارامتری، ۴
سوال با مدل برازش نداشتند. به دلیل برازش بهتر مدل دو پارامتری با داده ­ها بهتر است سوالات ۱۵، ۴۶، ۴۹ و ۵۰ به دلیل عدم برازش با مدل، از آزمون حذف شوند. در درس زیست­شناسی، در سطح ۰۵/۰ در مدل یک پارامتری ، ۳۳ سوال و در مدل دو پارامتری، ۱۰ سوال (۱ج، ۹الف، ۱۷ب، ۱۹ب، ۱۹ج، b21، ۲۳ب، ۲۵ج، ۲۶ب، a28) با مدل برازش نداشتند که به دلیل برازش بهتر مدل دو پارامتری با داده ­ها، بهتر است این سوالات از آزمون حذف شوند.
مدل یک پارامتری : میانگین دشواری سوالات دروس مورد مطالعه نشان می­دهد که سوالات از دشواری متوسطی برخوردارند.
مدل دو پارامتری : با توجه به میانگین دشواری و قدرت تشخیص سوالات در دروس ادبیات ­
فارسی (۶۹/۰- ، ۰۳/۱) و زیست­شناسی (۰۹/۰- ، ۹۶/۰)، در کل می­توان گفت؛ سوالات ادبیات­فارسی دشواری متوسط متمایل به آسانی و سوالات زیست­شناسی دشواری متوسطی داشتند و به ترتیب دروس، از قدرت تشخیص خیلی بالا و بالایی برخوردارند و در تفکیک آزمودنی­های قوی و ضعیف موفق عمل کرده ­اند.
از طریق بررسی توزیع توانایی آزمودنی­ها و هیستوگرام آن، کمینه و بیشینه نمره توانایی در درس
ادبیات­فارسی (۷۷/۲-، ۱۶/۲) و در درس زیست­شناسی (۰۶/۳- ، ۷۴/۲) مشخص گردید. میانگین توانایی دختران و پسران در درس ادبیات­فارسی(۳۱/۰ ،۳۱/۰-) و در درس زیست­شناسی(۳۲/۰ ، ۲۹/۰-) بدست آمد که بیانگر عملکرد بهتر دختران در هر دو درس می­باشد. همچنین، در هر دو درس پراکندگی در توزیع توانایی پسران بیشتر از دختران بود.
بررسی تابع آگاهی آزمون نشان داد که بیشینه مقدار آگاهی در دروس ادبیات­فارسی و زیست­­ ­
شناسی به­ترتیب در سطوح توانایی(۷/۰- ، ۱/۰) رخ داده است. می­توان گفت: در درس ادبیات­فارسی، توانایی
افراد متوسط رو به پایین در مقایسه با افراد قوی­تر با دقت بیشتری برآورد می­ شود. همچنین، در درس زیست­شناسی،توانایی افرادی که در محدوده­ توانایی متوسطی قرار دارند در مقایسه با سایر افراد، با خطا­ی
کمتری برآورد می­ شود.
با توجه به اینکه میانگین و انحراف استاندارد نمرات آزمون ادبیات­فارسی به ترتیب ۱۹/۱۳ و ۸۰/۴
است، نمره­ی ملاک ۸۳/۹ معادل نقطه ی تتا ۷/۰- می­باشد. اگر نمره­ی ۸۳/۹ به عنوان نمره­ی ملاک انتخاب شود، خطای کمتری در تصمیم ­گیری راجع به قبولی یا رد آزمودنی­ها خواهیم داشت. بیشترین میزان آگاهی­دهندگی آزمون در دامنه­ توانایی (۳/۰- ، ۱-) قرار دارد که معادل دامنه­ نمرات (۷۵/۱۱ ، ۳۹/۸) است. از آنجا که نمره­ی ملاک ۱۰ به عنوان نمره­ی قبولی در نظام آموزش و پرورش در این دامنه قرار می­گیرد و فاصله­ی بسیار کمی با نمره­ی ملاک پیشنهادی ۸۳/۹ دارد، بنابراین به­ طور قابل قبولی می­توان به نتایج آزمون اعتماد کرد. همچنین، طبق نمره­ی ملاک (۸۳/۹)، ۱۷/۷۵ درصد و طبق نمره­ی ملاک (۱۰)، ۸۳/۷۴ درصد افراد در این آزمون قبولند.
همچنین در درس زیست­شناسی، با توجه به اینکه میانگین و انحراف استاندارد نمرات این آزمون به ترتیب ۹۷/۹ و ۱۲/۵ می باشد، نمره ی ملاک ۴۸/۱۰ معادل سطح توانایی ۱/۰ می باشد. اگر نمره­ی ۴۸/۱۰ به عنوان نمره­ی ملاک انتخاب شود، خطای کمتری در تصمیم ­گیری راجع به قبولی یا رد آزمودنی­ها خواهیم داشت. بیشترین میزان آگاهی­دهندگی آزمون در دامنه­ توانایی (۵/۰ ، ۴/۰-) قرار دارد که معادل دامنه­ نمرات (۵۳/۱۲ ، ۹۲/۷) است. از آنجا که نمره­ی ملاک ۱۰ به عنوان نمره­ی قبولی در نظام آموزش و پرورش در این دامنه قرار می­گیرد و تقریباً ۵/۰ نمره با نمره­ی ملاک پیشنهادی ۴۸/۱۰ فاصله دارد، بنابراین به طور قابل قبولی می­توان به نتایج آزمون اعتماد کرد. همچنین، طبق نمره­ی ملاک (۴۸/۱۰)، ۱۷/۴۵ درصد و طبق نمره­ی ملاک (۱۰)، ۱۷/۴۷ درصد افراد در این آزمون قبولند.
هر چند عملکرد دانش ­آموزان در درس زیست­شناسی نامناسب بوده است، اما سوالات این درس
از نظر ویژگی­های روان­سنجی(شاخص دشواری و ضریب تمیز) با ملاک­های علمی طراحی سوال و آزمون­سازی انطباق دارد. پایین بودن میانگین درس زیست­شناسی از نمره ملاک می ­تواند به دلایل مختلفی از جمله برنامه نامناسب آموزشی، عدم تلاش و یا انگیزه پایین آزمودنی­ها، نامناسب بودن شیوه­ تدریس و … باشد.
انتظار می رود به منظور تفکیک افراد مسلط از غیر مسلط، آگاهی آزمون در اطراف نمره­ی ملاک
به مقدار زیادی قله­ای بوده و از بیشترین میزان دقت در اندازه ­گیری توانایی افراد برخوردار باشد. با توجه به اینکه حداکثر میزان آگاهی­بخشی در دو آزمون ادبیات­فارسی و زیست­شناسی در فاصله­ی بسیار نزدیکی به نمره­ی ملاک ۱۰ قرار دارد، می­توان گفت که این اصل در دو آزمون مذکور رعایت شده است.
کمبود یا فقدان سوالاتی که به طور مناسب با سطح خاصی از توانایی انطباق داشته باشند، می ­تواند
اندازه ­گیری در آن سطح را با مشکل مواجه سازد. با توجه به اینکه دو آزمون ادبیات­فارسی و زیست­شناسی، در سطوح بالا و پایین توانایی از میزان آگاهی ناچیزی برخوردارند، پیشنهاد می­ شود جهت برآورد دقیق توانایی آزمودنی­های قوی و ضعیف، تعدادی سوال دشوار و آسان با قدرت تشخیص بالا به آزمون اضافه یا جایگزین دیگر سوالات شود.
آزمون ادبیات فارسی فاقد سوالات دشوار است و ۱۴ سوال از ۱۷ سوال این آزمون که آسان
محسوب می­شوند در نیمه­ی اول آزمون قرار دارد. آزمون زیست­شناسی نیز با سوالات آسان آغاز می­ شود، هر چند که سوالات آسان کمی دارد. می­توان نتیجه گرفت که اصل ترتیب سوالات از ساده به مشکل در دو آزمون مذکور به نسبت رعایت شده است. همانطور که سیف (۱۳۹۱) بیان کرده است؛ وقتی یک آزمون با سوالات آسان آغاز می­ شود، موجب افزایش اعتماد به نفس آزمودنی­ها می­ شود، به­طوریکه افزایش کارایی آن­ها را در عملکرد روی سوالات پیچیده بعدی به دنبال خواهد داشت.
با توجه به مقادیر برآورد شده پارامتر­های سوال و پارامتر توانایی و همچنین مقادیر برآورد شده
آگاهی سوالات و آزمون­ها، می­توان زیرمجموعه­ای از سوالات را برای اهداف و نمونه­های خاصی از آزمودنی­ها، برای آزمون­های آینده انتخاب نمود که این امر به ایجاد بانک سوالات استاندارد ادبیات­فارسی و زیست­شناسی کمک خواهد نمود.
به منظور بررسی میزان توافق دو مدل کلاسیک و IRT در تشخیص سوالات مناسب و نامناسب، از
پارامتر تشخیص استفاده شد.
جدول ۵-۱ : میزان توافق دو مدل کلاسیک و IRT در تعیین سوالات مناسب و نامناسب
از نظر قدرت تشخیص برای آزمون ادبیات فارسی

IRT

سوال
مناسب
نامناسب

CTT

مناسب

۶۰

۱

نامناسب

موضوعات: بدون موضوع  لینک ثابت


فرم در حال بارگذاری ...