- Анализ заданий (item analysis)
-
Осн. цель А. з. — предоставить информ. о том, насколько адекватно функционируют составляющие тест задания (или пункты). Эта информ. может затем использоваться для повышения надежности и валидности теста путем редактирования или удаления слабых заданий. А. з. теста достижений может тж предоставлять диагностическую информ. о том, что знают и чего не знают экзаменуемые, и потому быть основой планирования обучения и пересмотра учеб. программ.
Информ., получаемая в рез-те А. з., м. б. рациональной (оценочной) или эмпирической (статистической). Рациональный А. з. предполагает тщательное изучение каждого задания для определения того, является ли его содержание точным, соотв. спецификациям к тесту, свободным от культурных или др. предубеждений и отвечающим стандартным требованиям, к-рые предъявляются к составлению тестовых заданий. Этот подход характерен для А. з. критериальных тестов достижений, но может применяться и к тестам, осн. на статистических нормах.
Эмпирический А. з. состоит в вычислении одной или неск. статистических мер функционирования задания, включая индекс трудности задания, индекс различительной способности (валидности) задания и ряд мер функционирования дистракторов. Индекс трудности (p) задания рассчитывается довольно просто — как доля тестируемых, давших правильный ответ на данное задание. Оптимальный индекс трудности варьирует в зависимости от цели теста и типа задания.
Процедура определения индекса способности задания различать испытуемых на основе получения ими различных оценок по критериальной переменной зависит от характера критерия и типа теста. Типичными внутренними критериями для теста достижений являются суммарные показатели по этому тесту, к-рые ранжируются и делятся на верхнюю (U) и нижнюю (L) группы. В случае, если тест ориентирован на статистические нормы, эти две группы обычно состоят из испытуемых, представляющих верхние 27% и нижние 27% распределения суммарных показателей по данному тесту. Затем для каждого задания по формуле D = рU — pL рассчитывается индекс различительной способности (D), где рU и рL — доли испытуемых, правильно выполнивших данное задание, в верхней и нижней группах соответственно. При внешнем критерии, таком как оценки выполнения работы или школьные отметки, индекс различительной способности задания рассчитывается по формуле для точечно-бисериального коэффициента корреляции (rpb) между оценкой выполнения задания (0 или 1) и оценками критериального континуума. Очевидно, что чем ближе или D или rpb к 1,00, тем более валидным является данное задание как дискриминатор между высокими и низкими показателями по выбранному критерию. В зависимости от размера группы, по рез-там тестирования к-рой вычисляются индексы D или rpb, уже такая их величина, как 0,20, может оказаться достаточной для сохранения заданий в тесте. Следует, однако, заметить, что отбор заданий на основе D, в общем, приводит к созданию внутренне согласованного, однородного теста. В противоположность этому отбор заданий на основе rpb обычно будет давать менее однородный, но зато более валидный для предсказания внешнего критерия тест.
Определение различительной силы заданий критериального теста требует неск. большего объема работы. У. Дж. Пофам описывает два метода: а) определение претестовых — посттестовых различий и б) определение различий между обученной и необученной группами.
Несмотря на то что А. з. в тесте с множественным выбором ответов фокусируется на индексах трудности и различительной способности отдельных заданий, ответы на неправильные варианты выбора (дистракторы) тж можно исследовать. В целом каждый дистрактор должен быть равно привлекательным для экзаменуемых, к-рые не знают ответа на данное задание. Кроме того, отношение числа экзаменуемых в верхней группе (по критерию) к числу экзаменуемых в нижней группе должно быть примерно равным для всех дистракторов.
См. также Методы эмпирического исследования, Конструирование теста
Л. Р. Айкен
.