Надежность психологического теста

Надёжностью называется один из критериев качества теста, его устойчивость по отношению к погрешностям измерения. Различают два вида надёжности - надёжность как устойчивость и надёжность как внутреннюю согласованность.

Содержание

1 Надёжность как устойчивость
2 Надёжность как внутренняя согласованность
3 См. также
- 3.1 Надежность и валидность
4 Литература

Надёжность как устойчивость

Устойчивость результатов теста или ретестовая надежность (англ - test-retest reliability) – возможность получения одинаковых результатов у испытуемых в различных случаях.

Устойчивость определяется с помощью повторного тестирования (ретеста):

В данном методе предлагается провести несколько замеров с некоторым промежутком времени (от недели до года) одним и тем же тестом. Если корреляция между результатами различных замеров будет высокой, следовательно, тест достаточно надежный. Наименьшим удовлетворительным значением для ретестовой надежности является 0,7. Однако надежность не всех тестов можно проверять этим методом, так как оцениваемое качество, явление или эффект могут быть сами по себе нестабильны (например, наше настроение, которое может меняться от одного замера к следующему). Еще один недостаток повторного тестирования – это эффект привыкания. Испытуемые уже знакомы с этим тестом, а может быть, даже помнят большую часть своих ответов после предыдущего заполнения.

В связи с выше сказанным возможно исследование надежности психодиагностических методик с использованием параллельных форм, при которых конструируются эквивалентные или параллельные наборы заданий. Получается, что испытуемые выполняют совершенно другой тест при аналогичных условиях. Однако, имеются трудности в доказательстве того, что обе формы являются действительно эквивалентными. Несмотря на это, на практике параллельные формы тестов оказываются полезными в установлении надежности тестов.

Надёжность как внутренняя согласованность

Внутренняя согласованность(англ. - self-consistent) определяется связью каждого конкретного элемента теста с общим результатом, тем, насколько каждый элемент входит в противоречие с остальными, насколько каждый отдельный вопрос измеряет признак, на который направлен весь тест. Чаще всего тесты, разрабатываются таким образом, чтобы у них была высокая степень внутренней согласованности, а связи с тем, что если одна переменная измеряется частью теста, то тогда в других частях, если они не согласованы с первой, эта же переменная измеряться не может. Таким образом, чтобы тест был валидным, необходимо, чтобы он был согласован.

Однако существует и противоположная точка зрения. Кэттелл говорит о том, что высокая внутренняя согласованность на самом деле является противоположностью валидности: каждый вопрос должен затрагивать меньшую область или иметь более узкое значение, чем критерий, подвергающийся измерению. Если все вопросы являются согласованными в высокой степени, они сильно коррелируют, и, следовательно, надежный тест будет измерять только лишь сравнительно "узкую" переменную с малыми отклонениями. По рассуждениям Кэттелла, максимум валидности существует, когда все задания теста не коррелируют друг с другом, а каждое из них имеет положительную корреляцию с критерием. Однако, такой тест будет характеризоваться низкой надежностью по внутренней согласованности.

Для проверки внутренней согласованности применяются:

Метод расщепления или метод автономных частей
Метод эквивалентных бланков
Альфа Кронбаха

Метод расщепления (Split-half reliability)

Этот метод заключается в расщеплении/разделении теста на две равные части (например, четные и нечетные вопросы, первая и вторая половина), а затем находится корреляция между ними. Если корреляция высокая, тест можно считать надежным.

Метод эквивалентных бланков

МЭБ состоит в применении двух сопоставимых друг с другом форм теста для большой выборки (например, формы L и M для измерения в шкале интеллекта Стэнфорда-Бине) Результаты, полученные при выполнении двух форм, сравнивают и высчитывают корреляцию. Если коэффициент корреляции высокий, следовательно, тест надежен. Недостаток этого метода в том, что он подразумевает такой длительный и трудоемкий процесс, как создание двух эквивалентных форм.

Альфа Кронбаха

В этом методе, предложенном Ли Кронбахом, сравнивается разброс каждого элемента с общим разбросом всей шкалы. Если разброс результатов теста меньше, чем разброс результатов для каждого отдельного вопроса, следовательно, каждый отдельный вопрос направлен на исследование одного и того же признака, свойства или явления. Они вырабатывают значение, которое можно считать истинным. Если такое значение выработать нельзя, то есть получается случайный разброс при ответе на вопросы, тест не надежен и коэффициент альфа Кронбаха будет равен 0. Если же все вопросы измеряют один и тот же признак, то тест надежен и коэффициент альфа Кронбаха в этом случае будет равен 1.

$α$ Кронбаха определяется как

${ { {N} \over{N-1} } \left( { { \sigma^{2}_{X} - \sum_{i=1}^N{\sigma^{2}_{Y_i}}} \over{\sigma^{2}_{X}} } \right) }$ ,

где $N$ - число элементов в шкале, $\sigma^{2}_{X}$ - дисперсия общего тестового балла, и $\sigma^{2}_{Y_i}$ - дисперсия элемента $i$ .

См. также

Помимо надежности тестов, есть так же надежность наблюдения – межнаблюдательская надежность. МН – это процент совпадения результатов наблюдения экспертов друг с другом.

Надежность и валидность

Надежность показывает, что результаты проводимого исследования близки к истине, а валидность показывает, что результаты действительно относятся к тому явлению, которое изучается исследователем. Валидное исследование автоматически является надежным, однако обратное следствие не обязательно. Надежное исследование может и не быть валидным.

Литература

Пол Клайн. "Справочное руководство по конструированию тестов", Киев, 1994.

Wikimedia Foundation. 2010.

Игры ⚽ Нужно решить контрольную?

Полезное

Смотреть что такое "Надежность психологического теста" в других словарях:

Надёжность психологического теста — Надёжностью называется один из критериев качества теста, его устойчивость по отношению к погрешностям измерения. Различают два вида надёжности надёжность как устойчивость и надёжность как внутреннюю согласованность. Содержание 1 Надёжность… … Википедия
надежность — одна из важнейших характеристик методик и тестов психодиагностических один из критериев их качества, относимый к точности измерений психологических. Отражает точность измерения психологического и устойчивость результатов к действию посторонних… … Большая психологическая энциклопедия
НАДЕЖНОСТЬ — одна из важнейших характеристик психодиагностических методик и тестов. Отражает точность психологического измерения и устойчивость результатов к действию посторонних факторов (см. теста надежность) [47, c. 170; 66, c. 207; 67, c. 229; 80, c. 325; … Современный образовательный процесс: основные понятия и термины
Психологическое тестирование — (psychological testing) термин зарубежной психологии, обозначающий процедуру установления и измерения индивидуально психологических отличий [1]. В отечественной психологии чаще употребляется термин «психодиагностическое обследование».… … Википедия
Психологический тест — Психологическое тестирование (раздел Психодиагностики) исследование определённых психологических качеств и свойств личности путем использования психологических тестов. Психологическое тестирование используется при отборе на работу, в… … Википедия
графология — (от греч. grapho пишу, lуgos учение) учение о почерке как разновидности выразительных движений, отражающих психологические свойства и психические состояния пишущего. Идея о связи почерка с душевными качествами человека восходит к античности ( … Большая психологическая энциклопедия
психодиагностика — (от греч. psyche душа и diagnostikos способный распознавать) область психологической науки, разрабатывающая методы выявления и измерения индивидуально психологических особенностей личности. Начавшись с попыток «охватить числом операции ума» (Ф.… … Большая психологическая энциклопедия
тест — (от англ. test проверка) стандартизованная измерительная методика, направленная на выявление скрытого свойства интересующего объекта путем одного или нескольких кратких испытаний (заданий), обладающих максимальной информативностью. Т. существуют… … Большая психологическая энциклопедия
Те́сты психологи́ческие — (англ. test испытание, исследование, проба) стандартизированные системы кратких психологических испытаний (заданий), предназначенные для измерения индивидуальных различий. От обычных проверок Т. п. отличаются теоретической и эмпирической… … Медицинская энциклопедия
Корреляция — (Correlation) Корреляция это статистическая взаимосвязь двух или нескольких случайных величин Понятие корреляции, виды корреляции, коэффициент корреляции, корреляционный анализ, корреляция цен, корреляция валютных пар на Форекс Содержание… … Энциклопедия инвестора

Словари и энциклопедии на Академике

Надежность психологического теста

Содержание

Надёжность как устойчивость

Надёжность как внутренняя согласованность

См. также

Надежность и валидность

Литература

Полезное

Смотреть что такое "Надежность психологического теста" в других словарях:

Поделиться ссылкой на выделенное

Словари и энциклопедии на Академике

Википедия

Надежность психологического теста

Содержание

Надёжность как устойчивость

Надёжность как внутренняя согласованность

См. также

Надежность и валидность

Литература

Полезное

Смотреть что такое "Надежность психологического теста" в других словарях:

Поделиться ссылкой на выделенное

Прямая ссылка: