(۲-۱۱)
این روش به دنبال این است که حداکثر مقدار همه‌ی سؤالات موجود در خزانه، کمتر از مقدار r باشد. مقدار r حداکثر نرخ مطلوب استفاده از سؤال است.
؛ احتمال انتخاب یک سؤال به‌عنوان بهترین سؤال آزمون.
؛ احتمال اجرای یک سؤال به‌ شرط انتخاب سؤال.
؛ احتمال اینکه یک سؤال اجرا شود. بنابراین،

(( اینجا فقط تکه ای از متن درج شده است. برای خرید متن کامل فایل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. ))

به هریک از سؤالات موجود در خزانه یک پارامتر کنترل مواجهه، یعنی، اختصاص داده می‌شود. این پارامتر از طریق مجموعه‌ای از شبیه‌سازی‌ها با بهره گرفتن از یک طرح آزمون انطباقی که قبلاً ساخته شده و آزمودنی‌های شبیه‌سازی شده‌‌ای که از توزیع مورد نظر توانایی نمونه‌گیری شدند، تعیین می‌شود. پس از هر شبیه‌سازی، نسبت دفعاتی که هر سؤال به‌عنوان بهترین سؤال انتخاب می‌شود، ، و نسبت تعداد دفعاتی که هر سؤال اجرا می‌شود، ، به‌طور جداگانه‌ای محاسبه می‌شود. سپس، ، برای چرخش بعدی بر اساس معادله‌ی (۲-۱۲) محاسبه می‌شود:
(۲-۱۲)
شبیه‌سازی و اصلاحات تا جایی ادامه می‌یابد که روش ثابت شود و حداکثر مقدار مشاهده شده برای همه‌ی سؤالات تقریباً برابر با مقدار مطلوب r شود. البته، تضمینی وجود ندارد که سرانجام این روش با ثبات شود و به‌راستی هم این امکان وجود ندارد (وندر لیندن و گلاس ۲۰۰۰).
پارامترهای کنترل مواجهه که در انتخاب سؤال به‌کار می‌روند، هم در طول شبیه‌سازی‌ها و هم بعد از مقادیر پایانی که ساخته شده‌است، به صورت زیر است:
لیستی مرتب شده از سؤالات مورد نظر تشکیل دهید.
مطلوبترین سؤال را در نظر بگیرید.
مطلویترین سؤال را با احتمال اجرا کنید.
اگر مطلوبترین سؤال اجرا نشد، از خزانه‌ی سؤالات باقیمانده برای این آزمودنی حذف شود.
گام ۳ و ۴ برای مطلوبترین سؤال بعدی تکرار شود. و تا جایی که یک سؤال اجرا شود ادامه یابد.
سؤالاتی که در لیست قبل از سؤال اجرا شده پدیدار می‌شوند، سؤالات انتخاب شده درنظر گرفته می‌شود، و سؤالات انتخاب شده بدون جایگزینی، نمونه‌گیری می‌شوند. سؤالاتی که در لیست بعد از سؤال اجرا شده ظاهر می‌شود، برای بررسی‌های بعدی به خزانه برگردانده می‌شوند. بنابراین روش سیمپسون و هتر می‌تواند به عنوان روش جایگزینی نسبی[۱۳۷] درنظر گرفته شود. اگر طول لیست منظم‌شده در گام اول خیلی بزرگ باشد و اگر ایجاد اعداد تصادفی در گام سوم با بدشانسی همراه شود، تعداد قابل توجهی از سؤالات ممکن است، برای یک آزمودنی از خزانه حذف شود. با این وجود، اگر طول تست انطباقی برابر با n باشد، باید حداقل n سؤال در خزانه وجود داشته باشد که پارامتر کنترل مواجهه‌ آن برابر با یک باشد. اگر این تعداد سؤال وجود نداشت، بنابراین، ممکن است برای برخی از آزمودنی‌ها برای اجرای یک آزمون انطباقی کامل سؤالات کافی در خزانه وجود نداشته‌باشد. در مواقعی که n مورد از چنین سؤالاتی در پایان چرخش وجود ندارد، سیمپسون و هتر، روش معقولانه‌ای پیشنهاد می‌کنند، به‌طوری‌که مقادیر پارامترهای کنترل مواجهه را منظم می‌کنند و بزرگترین n را برابر با یک قرار می‌دهند. این روش باعث می‌شود که نرخ مواجهه سؤالاتی که کم‌ترین محبوبیت را دارند، افزایش یابد (وندر لیندن و گلاس، ۲۰۰۰؛ هتر و سیمپسون، ۱۹۹۷).
مزیت روش سیمپسون و هتر این است که کنترل مستقیمی روی احتمال اینکه یک سؤال اجرا شود، ، در جمعیت مورد نظر آزمودنی‌ها را بدست می‌آورد. با این وجود، شبیه‌سازی‌ها باید مقادیری از ، را برای هر سؤال به‌دست آورند. به‌دست آوردن این مقادیر برای خزانه‌هایی با ساختار پیچیده، زمان‌بر می‌باشد. اگر یک خزانه‌ی سؤالی با اضافه‌شدن یا حذف شدن یک سؤال تغییر یابد، یا اگر توزیع توانایی‌های جامعه‌ی هدف تغییر بابد، شبیه‌سازی‌ها باید برای خزانه‌ی جدید و یا جامعه‌ی هدف جدید تکرار شود تا کنترل مواجهه پیوسته را برای تضمین کند ( استوکینگ، ۱۹۹۳؛ هتر و سیمپسون، ۱۹۹۷؛ وندرلیندن و گلاس، ۲۰۰۰). بعلاوه، اگر ساختار خزانه‌ی سؤال تطابق مناسبی با ساختار ویژگی‌های آزمون نداشته باشد، روش سیمپسون و هتر ممکن است دچار واگرایی شود، و این امکان وجود ندارد که مقادیر با ثباتی از برای هر سؤال در خزانه به‌دست آید (استوکینگ، ۱۹۹۳).
تعادل محتوایی آزمون
امنیت آزمون‌ها و سؤالات در CAT به کنترل مواجهه و یا محدودیت‌هایی که روی فراوانی اجرای آزمون در میان آزمودنی‌ها قرار می‌گیرد، مربوط است،. مفهوم کنترل مواجهه‌ سؤال با مفهوم برقرای قیود محتوایی رابطه‌ی بالایی دارد.
آزمون‌های متعارف غیر انطباقی، معمولاً با توجه به یک طرح یا الگوی پیش ساخته‌ای طراحی می‌شوند، در این الگوها مشخص می‌شود که چه تعداد سؤال از هر حوزه‌ی محتوایی در آزمون قرار گیرد. هم در آزمون‌های غیر انطباقی و هم انطباقی، بهترین سؤال، سؤالی نیست که دارای حداکثر آگاهی در برآورد توانایی باشد، بلکه محتوای سؤال از لحاظ اهمیت با میزان آگاهی سؤال برابری می‌کند. از این‌رو، ایجاد تعادل محتوایی سؤال از طزیق الگوی طراحی آزمون به دو هدف کلی کمک می‌کند؛ اول این‌که، این الگو به این فرض کمک می‌کند که آزمون شواهد روایی محتوا و سازه‌ را نشان می‌دهد. دوم اینکه، الگوی محتوایی به طراح کمک می‌کند تا مطمئن شود که فرم‌های دیگری از همان آزمون تقریباً با یکدیگر موازی هستند و احتمال این‌که هر فرم ترکیب مشابهی از مهارت و دانش را اندازه‌ بگیرد را افزایش می‌دهد. الگوهای ساخته شده برای آزمون‌های غیر انطباقی برای CAT هم قابل استفاده هستند. در این طراحی باید این نکته رعایت شود که سطح دشواری سؤالاتی با حوزه‌های محتوایی متفاوت باید مشابه هم باشد (پارشال، اسپری، کالن و دیوی، ۲۰۰۲).
چندین رویکرد ممکن برای ایجاد تعادل محتوایی وجود دارد. در رویکرد خزانه‌ی سؤال مجزا[۱۳۸]، خزانه‌ی سؤال می‌تواند به چندین خزانه‌ی سؤال تک بعدی تقسیم شود و CAT های مجزایی از هرکدام اجرا شود. در رویکرد فهرست[۱۳۹]، جداول آگاهی مجزایی می‌توانند ایجاد شوند و یکی درمیان بر اساس طرحی استفاده شوند. در رویکرد انتخاب بهینه[۱۴۰]، یک تابع جبرانی یا الگوریتم برنامه‌نویسی عدد صحیح برای انتخاب یک تست بهینه به کار می‌رود که هم ویژگی‌های آماری و هم محتوایی را متعادل می‌کند (پارشال، اسپری، کالن و دیوی، ۲۰۰۲).
در رایج‌ترین شکل تعادل محتوایی CAT تعداد یا نسبت‌های مربوط به سؤالات در هر حوزه‌ی محتوایی به دامنه‌ی معینی مقید می‌شوند (استوکینگ و سوآنسون، ۱۹۹۳). با این وجود، متعادل کردن نسبت‌های سؤالاتی که در طول اجرای CAT ارائه می‌شوند، لزوماً تأثیری که هر حوزه‌ی محتوایی در تعیین برآورد نهایی توانایی دارد را متعادل نمی‌کند. برآوردهای توانایی از تعداد سؤالاتی که از یک حوزه‌ی محتوایی انتخاب می‌شود، تأثیر نمی‌بخشند، بلکه تا اندازه‌ای به‌وسیله‌ی مقدار آگاهی که این سؤالات برای برآورد توانایی ایجاد می‌کنند، تأثیر می‌گیرد. اگر آزمونی برای آزمودنی‌هایی با توانایی بالا اجرا شود که نیمی از سؤالات‌اش از حوزه‌های محتوایی آسان باشند، این سؤالات تأثیر اندکی روی میزان آگاهی کل آزمون در برآورد توانایی نهایی این آزمودنی‌ها ایجاد می‌کند. از آنجا که، سؤالات غیر آگاهی‌دهنده تأثیر خیلی کمی روی برآورد توانایی دارند، حوزه‌های محتوایی آسان خودبه‌خود از نمره‌ی آزمون این افراد خارج می‌شوند (پارشال، اسپری، کالن و دیوی، ۲۰۰۲). بنابراین، از آنجا که متعادل کردن تعداد یا نسبت‌های سؤالاتی که اجرا می‌شوند، بی اثر می‌باشد، سگال[۱۴۱] و دیوی (۱۹۹۵)، الگوریتم‌هایی را ایجاد کردند که مقدار آگاهی به‌دست آمده از هر حوزه‌ی محتوایی را متعادل کند. نسبت‌های آگاهی به‌دست آمده از هر حوزه‌ی محتوایی لزوماً ثابت نیست، بلکه می‌تواند در سطوح متفاوت توانایی متفاوت باشد (سگال و دیوی، ۱۹۹۵).
مولفه‌ی خزانه‌ی سؤال، به عنوان یک بخش جداگانه به تفضیل شرح داده می‌شود:
خزانه­ی سؤال
یکی از مولفه‌های جالب توجه مرتبط به CAT، که مطالب محدودی در مورد آن وجود دارد، مولفه‌ی خزانه سؤال می‌باشد. با ‌این‌وجود، ویژگی‌های جذاب روان سنجی CAT، در صورتی تحقق می‌یابد که سؤالات آزمونی که برای اجرا به کار می‌روند مناسب باشند. این مجموعه از سؤالات معمولاً خزانه‌ی سؤال نامیده می‌شود (ریکیسی، ۲۰۱۰). یک خزانه‌ی سؤال بهینه باید براساس مولفه‌های دیگر CATیعنی، طول آزمون، توزیع مورد انتظار جامعه‌ی آزمودنی، برآورد توانایی و شیوه‌ی انتخاب سؤال، نرخ‌های همپوشی و مواجهه هدف سؤال تعیین شود (برگستروم و لانز، ۱۹۹۹).
طراحی خزانه‌ی سؤال و ارتباط آن با مولفه‌های CAT
پارشال، دیوی و نرینگ (۱۹۹۸) نشان دادند که سه هدف اغلب متضاد انتخاب سؤال در سنجش انطباقی کامپیوتری وجود دارد. ابتدا، انتخاب سؤال باید دقت اندازه‌گیری را از طریق انتخاب سؤالی که آگاهی را بیشینه کند یا دقت پسین را برای سطح توانایی آزمودنی بیشینه کند، افزایش دهد. دوم، انتخاب سؤال باید از امنیت خزانه‌ی سؤال از طریق محدود کردن میزان مواجهه سؤالات محافظت کند. سوم، انتخاب سؤال باید تضمین کند که آزمودنی‌ها، آزمونی با تعادل محتوایی مناسب دریافت خواهند کرد. استوکینگ و سوآنسون (۱۹۹۸)، هدف چهارمی را به این لیست اضافه کردند؛ هدف چهارم بیان می‌کند که انتخاب سؤال باید همچنین استفاده از سؤال را به حداکثر برساند، تا جایی که همه‌ی سؤالات در خزانه استفاده شوند، بدین وسیله این اطمینان ایجاد می‌شود که صرفه‌جویی مناسبی برای ساخت سؤال صورت گرفته‌است. استوکینگ و لوئیس (۲۰۰۰)، بیان کردند که مسئله‌ی انتخاب سؤال به صورت بادبادکی می‌باشد که به هر طرف آن فشار وارد شود، طرف دیگر آن متورم شود.
خزانه‌ی سؤالی که به‌طور بهینه طراحی شده ‌باشد، به دنبال بهترین سازش بین اهداف متعارض است. خزانه‌ی سؤال باید دارای تعداد کافی از سؤالات با کیفیت بالا باشد تا بتواند چندین هزار خرده آزمون همپوش از سؤالات ایجاد کند. البته این قضیه تا حدودی بر اساس توزیع آزمودنی‌ها و تعداد آزمودنی‌هایی که خزانه‌ی سؤال برای آنها به کار می‌رود، تعیین می‌شود. زمانی که در سنجش انطباقی امنیت سؤال مهم باشد، چنانچه تعداد آزمودنی‌هایی که آزمون روی آنها اجرا می‌شود، زیاد باشد، باید سؤالات بیشتری در خزانه قرار گیرند. شیوه‌ی انتخاب سؤال در سنجش انطباقی به این صورت است که سؤالاتی انتخاب می‌شود که سطح دشواری‌شان تقریباً با برآورد توانایی آزمودنی‌ها مطابقت داشته باشند، بنابراین، این انتظار وجود دارد که سؤالات خزانه داری توزیع دشواری مشابه با توزیع توانایی آزمودنی‌ها باشند. با این ‌وجود بهتر است که خزانه‌ی سؤال، سؤالاتی با دامنه‌ی گسترده‌ای از سطوح دشواری برای جمعیت مورد نظر باشد تا به CAT اجازه دهد سطوح توانایی را برای دامنه‌ی گسترده‌ای از آزمودنی‌ها برآورد کند (یوری[۱۴۲] ، ۱۹۷۷).
طول آزمون وابستگی بسیار نزدیکی به قاعده‌ی اتمام آزمون در CAT دارد، همچنین نقش مهمی در تعیین تعداد سؤالات مورد نیاز در خزانه‌ی سؤال بازی می‌کند. برای آزمونی با طول ثابت، اگر آزمون‌ها برای افراد طوری تهیه شوند که سؤالات همپوش نداشته باشند، تعداد سؤالات در خزانه باید دقیقاً برابر با تعداد سؤالات در هر فرم ضرب در تعداد آزمودنی‌ها باشد. ولی در واقع، سؤالات می‌توانند با درنظر گرفتن محدودیت‌های امنیتی معین، به‌طور تکراری نیز مورد استفاده قرار گیرند. حتی با سؤالات همپوش، این انتظار وجود دارد که سؤالات بیشتری برای طراحی آزمون CAT وجود دارد، بنابراین سؤالات بیشتری در یک خزانه مورد نیاز است. استوکینگ (۱۹۹۴)، پیشنهاد می‌کند که تعداد سؤالات در خزانه‌ی سؤال باید ۱۲ برابر طول آزمون باشد (استوکینگ، ۱۹۹۴). وای[۱۴۳]پیشنهاد می‌کند که، برای آزمون‌هایی مانند کسب گواهی‌نامه، اندازه‌ی خزانه‌ی سؤال ۶ تا ۸ برابر طول آزمون انطباقی باشد (وای، ۱۹۹۸). در صورتی که، طول آزمون در CAT متغیر باشد، معمولاً به سؤالات کمتری برای آزمون‌های مجزا نیاز داریم. در این مورد، تعداد سؤالات مورد نیاز برای یک خزانه‌ی سؤال با توزیع تعداد آزمودنی‌ها در هر سطح توانایی همبستگی دارد (استوکینگ، ۱۹۹۴).
با توجه به الگوهای یکسان سؤال-پاسخ، روش‌های متفاوت برآورد، برآوردهای توانایی اندکی متفاوت ایجاد می‌کند، و به نوبه‌ی خود روی انتخاب بهترین سؤال مناسب تاثیر می‌گذارد. همچنین قواعد متفاوت انتخاب سؤال، از قبیل انتخاب سؤالی که آگاهی را بیشینه کند یا واریانس پسین در برآورد توانایی را کمینه کند، ممکن است سؤالات متفاوتی به‌عنوان مناسب‌ترین سؤال برای آزمودنی انتخاب کند. هر دو موقعیت باعث می‌شود که سؤال متفاوتی استفاده شود و بنابراین سؤالات متفاوتی در خزانه‌ی سؤال بهینه مورد نیاز خواهد داشت (گو و ریکیسی، ۲۰۰۷).
شرایط تعادل محتوایی نیز ترکیب‌های متفاوتی از سؤالات را در یک خزانه‌ی سؤال ایجاد می‌کند. برای مثال، اگر برای طراحی یک آزمون CAT به یک آزمون ۴۰ سؤالی ریاضی نیاز داشته ‌باشیم، یعنی به ۲۰ سؤال استدلال عددی و ۲۰ سؤال حلّ مسئله نیاز باشد. به همین دلیل خزانه‌ی سؤال بهینه باید شامل تعداد مشابهی از سؤالات برای هر دو حوزه‌ی محتوایی باشد. هدف طراح خزانه‌ی سؤال باید این باشد که تعداد کافی سؤال در هر حوزه‌ی محتوایی موردنظر ایجاد کند، تا هر یک از آزمون‌ها را با پوشش محتوایی متعادل شده‌ای را بسازد (گو و ریکیسی، ۲۰۰۷؛ پارشال، اسپری، کالن و دیوی، ۲۰۰۲).
بعلاوه، مراقبت از خزانه‌ی سؤال باید ادامه یابد، تا جایی که مطمئن شویم که خزانه شامل سؤالات مناسبی است که نرخ بیش مواجهه و کم مواجهه را در صورتی‌که دقت آزمون برقرار است، کاهش دهد. سؤالی که زیادتر مورد استفاده قرار می‌گیرد، از نظر امنیتی مشکل ایجاد می‌کند، زیرا بیشتر آزمودنی‌ها سؤال یکسانی را دریافت می‌کنند، و به احتمال زیادی سؤال برای عموم فاش می‌شود. در مقابل سؤالی که کم استفاده می‌شود، به‌طور بالقوه، هزینه‌های طراحی سؤال را افزایش می‌دهد. بنابراین باید تعادلی بین کارایی آزمون و کنترل مواجهه سؤال برقرار شود. به عبارت دیگر سؤالی باید انتخاب شود که دقت و کارایی آزمون را با رعایت محدودیت‌های امنیتی به حداکثر برساند، این کار رمز بهینه‌سازی موفق می‌باشد. خزانه‌ی سؤالی که به‌طور بهینه طراحی شده ‌است باید بتواند همزمان که کنترل مواجهه را برقرار می‌کند، کاهش خیلی کمی در کارایی و دقت برآورد توانایی ایجاد کند(گو و ریکیسی، ۲۰۰۷).
رویکردهای موجود در طراحی خزانه‌ی سؤال
رویکرد اول: رویکرد برنامه‌نویسی ریاضی یا برنامه‌نویسی اعداد صحیح
این رویکرد توسط ولدکمپ و وندر لیندن (۲۰۰۰) برای طراحی خزانه‌ی سؤال ایجاد شده است، این رویکرد از روش برنامه‌نویسی ریاضی برای طراحی خزانه‌ی سؤال استفاده می‌کند. از این رویکرد برای سرهم کردن هم آزمون‌های انطباقی و هم آزمون‌های غیر انطباقی، امّا بهینه استفاده می‌گردد (وندرلیندن، a 2005). این روش جزء روش‌های سرهم کردن بهینه‌ی تست است که تعمیمی از رویکرد برن‌بام می‌باشد. این روش‌ها به طراحان تست اجازه می‌دهد تا مجموعه‌ای از تست‌ها را با توجه به لیستی از ویژگی‌ها و اهداف، از مجموعه‌ی بزرگتر خزانه‌ی سؤال، سرهم کنند. تلاش‌های اولیه این روش به برن‌بام (۱۹۶۸) برمی‌گردد. در اواسط دهه ۱۹۸۰، روش برن‌بام به عنوان یک مسئله‌ی بهینه‌سازی ترکیبی یا برنامه‎‌نویسی خطی ۰-۱، تعریف شد. ولی از آنجا که عملیاتی کردن این روش‌ها در آن سال‌ها به دلیل دردسترس نبودن الگوریتم‌ها و نرم‌افزارهای مورد نیاز امکان پذیر نبود، پیشرفت زیادی نکرد. امروزه با پیشرفت نرم افزارهای مخصوص جبر خطی امکان عملیاتی کردن این روش برقرار شده است (وندرلیندن، b 2005). در این رویکرد، CAT از طریق رویکرد تست سایه[۱۴۴] (STA)، اجرا می‌شود (وندرلیندن، ریس[۱۴۵]، ۱۹۸۸) یعنی تست از طریق برنامه‌نویسی عدد صحیح خطی دو ارزشی[۱۴۶] یا برنامه‌نویسی ۱-۰ سرهم می‌شود. در این رویکرد ویژگی‌های تست بر اساس یک تابع هدف[۱۴۷] که در ارتباط با مجموعه‌ای از قیود[۱۴۸] خاص بیشینه می‌شود، محقق می‌گردد (وندرلیندن، b 2005). مزیت این روش این است که ما را قادر می‌کند تا ویژگی‌های پیچیده‌ی آزمون را مدل یابی کنیم. برای یک بار قیود آزمون تعیین می‌شود و به قیود عددی تبدیل می‌شود. در این رویکرد ابتدا مسئله‌ی سرهم کردن تست، به عنوان یک مسئله‌ی بهینه‌سازی ریاضی[۱۴۹] با بهره گرفتن از متغیرهای تصمیم[۱۵۰] فرمول‌بندی می‌شوند. بنابراین در این رویکرد، ویژگی‌ها یا صفات تست، مهمترین اصل در فرمول‌بندی تست است. سپس، بر اساس قیود و اهداف معینی، تست سرهم می‌شود (وندرلیندن b 2005).
استفاده از روش برنامه‌نویسی خطی با کار بوکویی-تمینگا[۱۵۱](۱۹۸۷) آغاز شد. بوکویی-تیمینگا (۱۹۹۱)، از روش برنامه‌نویسی اعداد صحیح برای محاسبه‌ی تعداد سؤالات مورد نیاز برای فرم‌هایی از آزمون که می‌خواهد در آینده مورد استفاده قرار گیرد، استفاده کرد. و از یک رویکرد متوالی که تابع آگاهی آزمون (TIF) را بر اساس مدل لوجستیک یک پارامتری (مدل راش) به‌ حداکثر می‌رساند، استفاده ‌کرد. نتایج او برای اصلاح ترکیب یک بانک سؤال موجود به‌کار رفت. سپس، به طور دقیق‌تری آریل، ولدکمپ و وندر لیندن (۱۹۹۸)، روش‌های ساخت خزانه‌ی سؤال چرخشی که بعضی از آنها بر مبنای هدف طراحی با روش برنامه‌نویسی قرار گرفتند را توسعه دادند. ولدکمپ و وندرلیندن (۱۹۹۹)، پنچ گام برای طراحی یک طرح بهینه برای خزانه‌ی سؤال CAT با روش برنامه‌نویسی ریاضی یا خطی توصیف کردند:
مجموعه‌ای از ویژگی‌های آزمون CAT تحلیل می‌شود و همه‌ی صفات سؤال به همراه ویژگی‌های محتوایی و آماری شان تعیین می‌شود.
با در نظرگرفتن ویژگی‌های سؤالات، مدل برنامه‌نویسی اعداد صحیح برای سرهم کردن تست‌های سایه در شبیه‌سازی CAT فرمول‌بندی می‌شوند.
جامعه‌ی آزمودنی‌ها تعیین می‌شود و برای مثال بر اساس داده‌های گذشته، برآورد توزیع توانایی‌شان مشخص می‌شود.
شبیه‌سازی CAT با بهره گرفتن از مدل برنامه‌نویسی اعداد صحیح برای تست‌های سایه و محرک‌های نمونه‌گیری شده از توزیع توانایی، انجام ‌می‌گیرد. فراوانی سؤالات از تعداد دفعاتی که سؤالات از خانه‌های جدول طبقه‌بندی شده استفاده می‌شوند، بدست می‌آید.
طرح نهایی از این فراوانی‌ها بدست می‌آید. تنظیم این فراوانی‌ها، الگوی بهینه‌ی نرخ مواجهه‌ سؤال را ایجاد می‌کند.
وندرلیندن، b 2005، مجموعه‌ی این صفات، قیود و اهداف را طبقه‌بندی و معرفی کرد.
طبقه‌‌بندی صفات
در طبقه‌بندی صفات سؤال یا آزمون، دو طبقه ارائه می‌شود. نوع صفات و سطح صفات. تشخیص و تعیین درست نوع و سطح یک صفت با اهمیت است، زیرا به طراح کمک می‌کند تا تست را به دقت مدل یابی کند.
الف).نوع صفت یا خصیصه[۱۵۲]
انواع صفات عبارتند از:
صفات کمّی[۱۵۳]: نمونه‌هایی از صفات کمّی عبارتند از؛ تعداد کلمات، زمان‌های مورد انتظار پاسخ، فراوانی استفاده از محرک‌ها یا سؤالات قبلی، اعتبار، آماره‌هایی از قبیل مقادیر p سؤال، آگاهی سؤال و شاخص‌های DIF سؤالات. ویژگی مشترک همه‌ی صفات کمّی این است که، این صفات مقادیر عددی به خود اختصاص می‌دهند. این مقادیر می‌توانند عدد حقیقی[۱۵۴] (برای مثال، زمان پاسخ و آگاهی سؤال) یا عدد صحیح (تعداد کلمات) باشند. نوع اعداد، نقش زیادی در فرمول‌بندی یک صفت کمّی ندارد.
صفات طبقه‌ای[۱۵۵]: نمونه‎هایی از صفات طبقه‌ای عبارتند از؛ طبقه یا حوزه‌ی محتوایی، چهارچوب و فورمت پاسخ، سطح شناختی (دانش، به‌کاربستن و …)، استفاده از اطلاعات کمکی برای پاسخ به سؤال (نمودار، جدول)، عملیات ذهنی مورد نیاز برای حلّ یک سؤال و نویسنده یا طراح سؤال. ویژگی مشترک همه‌ی صفات طبقه‌ای این است که، این صفات خزانه‌ی سؤال را به زیرمجموعه‌هایی از سؤالات با صفات یکسان تقسیم‌بندی می‌کنند. برای مثال، مجموعه‌ی سؤالات در زمینه‌ی زیست شناختی، یا مجموعه‌ای که در بردارنده‌ی سؤالات چهارگزینه‎ای است.
صفت منطقی[۱۵۶]: این صفات از صفات کمّی و طبقه‌ای متفاوت هستند. زیرا آنها صفات یک سؤال را نشان نمی‌دهند، بلکه خصیصه‌های جفتی، سه‌تایی و غیره‌ی سؤالات می‌باشند. خصایص منطقی شامل روابط ورود و خروج بین سؤالات می‌باشند. نمونه‌هایی از روابط خروج مواقعی پیش می‌آید که دو یا سه سؤال نتوانند همزمان با یکدیگر در یک آزمون قرار گیرند، به دلیل اینکه، یک سؤال راهنمای حلّ سؤال یا سؤالات دیگر می‌باشد، به این سؤالات دشمن[۱۵۷] یا متضاد می‌گویند. روابط ورود زمانی مطرح می‌شود که سؤالات به مجموعه‌ای یکسانی از محرک‌ها تعلق داشته باشند، به طوری‌که انتخاب یک سؤال، انتخاب سؤال دیگری را نیز در پی داشته‌باشد.
ب). سطح صفات
مجموعه‌ی صفات در سطوح زیر قرار می‌گیرند. البته سطح صفت در ارتباط با نوع صفت، تفسیر خواهد شد.
سطح سؤال: نمونه‌های آن شامل، میزان آگاهی سؤال، تعداد کلمات و سطح شناختی سؤال و … می‌باشد. ترکیب چند صفت از سؤالات، صفات سطح بالاتر را تشکیل می‌دهند.

موضوعات: بدون موضوع  لینک ثابت


فرم در حال بارگذاری ...