Охарактеризованы тестовые оценки и методы
их интерпретации. <...> Прежде чем можно будет производить какие-либо измерения
конструкта, необходимо установить определенные правила связи между
конструктом и наблюдаемым поведением, достоверно отражающим данный конструкт. <...> Это потребует разработки инструмента, или «теста»,
для измерения конструкта «социальное доминирование». <...> Рассмотрим для примера три ситуации, в которых присутствует
необходимость измерения психологического конструкта: <...> Так как измерение психологического конструкта всегда носит
косвенный характер и основано на образцах поведения, соответствующего
изучаемому конструкту, всегда существует вероятность, что два теоретика,
говорящих об одном и том же конструкте, могут выбрать разные виды поведения для его операционализации. <...> Статистические концепции
в теории тестов
В образовании и общественных науках статистические данные используются в двух основных целях: для описания и получения выводов. <...> 2.1 приведены частоты, представляющие распределение оценок испытуемых в тесте из 10 заданий. <...> Распределение тестовых оценок (наблюдаемых значений переменной)
может быть описано не только с помощью таблиц частот или гистограмм. <...> Если бы наблюдаемые оценки были 40, 41, 42, то можно вообразить испытуемого с баллом
40,5 на континууме способности, лежащей в основе появления наблюдаемого балла. <...> Это справедливо даже в тех случаях, когда
латентные характеристики измеряются на дискретной шкале для конечной выборки испытуемых. <...> Таким образом, одинаковая доля испытуемых в обоих распределениях будет
иметь результаты тестирования ниже определенного наблюдаемого балла
и z-оценки, соответствующей ему. <...> Например, если переменная
Х – оценка по тесту SAT, то сырые баллы и, следовательно, отклонения оценок будут выражены в виде точек 100-балльной шкалы, тогда как для переменной Y баллы по тесту GPA, сырые оценки и отклонения оценок могут
быть выражены в долях единицы <...>
Введение_в_классическую_и_современную_теорию_тестов__пер._с_англ._.pdf
Линда Крокер , Джеймс Алгина
Введение
в классическую и современную
теорию тестов
Перевод на русский язык
под общей редакцией В.И. Звонникова и М.Б. Челышковой
Москва
Логос
2010
Стр.3
Перевод и издание на русском языке книги Л. Крокер и Дж. Алгины
«Введение в классическую и современную теорию тестов»
осуществлены при поддержке Американских советов
по международному образованию
УДК 159.9.07
ББК 74.26в6
К83
Крокер Л.
К83
Введение в классическую и современную теорию тестов: учебник / Л. Крокер,
Дж. Алгина; под общей ред. В.И. Звонникова и М.Б. Челышковой. – М.: Логос,
2010. – 668 с.
ISBN 978-5-98704-437-5
Раскрыта сущность теории тестов, показаны преемственность и отличия ее
классической и современной версий. Изложено введение в теорию измерений.
Представлены статистические концепции в теории тестирования. Дано введение
в шкалирование, показан процесс конструирования тестов. Раскрыто понятие
надежности в контексте классической концепции истинной оценки и разработки
процедур оценивания справедливости тестов. Освещена проблема валидности
тестов и изложены пути ее решения. Охарактеризованы тестовые оценки и методы
их интерпретации. Каждая глава содержит краткие выводы и упражнения на
закрепление полученного материала и проверку знаний.
Для студентов высших учебных заведений, получающих образование по
педагогическим специальностям и направлениям, а также для слушателей
учреждений повышения квалификации и переподготовки учителей и преподавателей.
Может использоваться в учебном процессе вузов при подготовке
социологов, психологов, экономистов, представителей других областей социальногуманитарных
наук, знания, применяющих тесты для измерения и оценки человеческих
способностей, знаний и качеств, а также явлений и процессов общественной
и культурной жизни. Представляет особый интерес для ученых
и специалистов, занимающихся проблемами измерений.
УДК 159.9.07
ББК 74.26в6
ISBN 978-5-98704-437-5
© Cengage Learning, 2006, 2008
© Найденова Н.Н., Симкин В.Н.,
Челышкова М.Б., перевод, 2010
© Звонников В.И., Челышкова М.Б.,
предисловие к русск. изд., 2010
© Логос, 2010
Стр.4
ОгЛАВЛение
ОгЛАВЛение
Предисловие к русскому изданию ...........................................................................11
Предисловие ..................................................................................................................................17
Раздел I. Введение в теорию измерений ................................................21
глава 1. Что такое теория тестов? ............................................................................23
Проблемы измерений психологических конструктов .........................................................26
Теория тестов как дисциплина .......................................................................................................28
Структура данного учебника ..........................................................................................................34
Выводы ......................................................................................................................................................36
Упражнения .............................................................................................................................................36
глава 2. Статистические концепции в теории тестов ............................38
Тестовые оценки как дискретные переменные для конечных популяций .................38
Описание индивидуальных результатов с помощью z-оценок ........................................46
Бесконечные популяции и непрерывные переменные .......................................................47
Нормальное распределение ............................................................................................................48
Описание связи между двумя переменными ...........................................................................54
Предсказание индивидуальных возможностей выполнения теста ................................64
Выводы ......................................................................................................................................................71
Упражнения .............................................................................................................................................73
глава 3. Введение в шкалирование .........................................................................77
Вещественные числа и шкалы измерения ................................................................................77
Уровни измерительных шкал .........................................................................................................79
Подходы к шкалированию в разработке тестов .....................................................................83
Уровни шкал для субъектно-центрированных измерений ................................................97
Выводы ....................................................................................................................................................101
Упражнения ...........................................................................................................................................102
Стр.5
6
Оглавление
глава 4. Процесс конструирования теста ........................................................105
Определение целей применения тестовой оценки .............................................................106
Определение характеристик поведения для отображения конструкта ......................107
Построение выборки содержания ..............................................................................................108
Подготовка спецификаций тестов .............................................................................................113
Конструирование заданий .............................................................................................................117
Рецензирование ..................................................................................................................................125
Предварительная апробация заданий .......................................................................................127
Следующие шаги................................................................................................................................128
Выводы ....................................................................................................................................................128
Упражнения ...........................................................................................................................................130
глава 5. Тестовые оценки как составные .........................................................133
Схемы оценивания заданий ..........................................................................................................134
Дескриптивная (описательная) статистика для недихотомических
переменных ..........................................................................................................................................135
Дескриптивная статистика для дихотомических переменных ......................................137
Дисперсия составной оценки .......................................................................................................141
Практические приложения для конструирования теста ..................................................145
Выводы ....................................................................................................................................................148
Упражнения ...........................................................................................................................................149
Раздел II. надежность ...................................................................................................151
глава 6. надежность и классическая модель истинной
оценки .................................................................................................................................................153
Классическая модель истинной оценки ..................................................................................155
Показатель надежности и коэффициент надежности .......................................................164
Надежность составных тестовых оценок.................................................................................168
Стандартная ошибка измерения .................................................................................................174
Альтернативные определения истинной оценки и ошибки ...........................................177
Выводы ....................................................................................................................................................181
Упражнения ...........................................................................................................................................183
глава 7. Процедуры для оценивания надежности ..................................186
Процедуры, требующие двух предъявлений теста ..............................................................187
Методы, требующие одноразового предъявления теста ...................................................191
Межрейтерная надежность............................................................................................................203
Факторы, которые влияют на коэффициенты надежности ............................................204
Стр.6
Оглавление
7
Приближенное вычисление истинных оценок ....................................................................208
Надежность разности оценок .......................................................................................................210
Использование оценок ошибки в интерпретации тестового балла .............................213
Сообщение данных по надежности ...........................................................................................216
Выводы ....................................................................................................................................................217
Упражнения ...........................................................................................................................................218
глава 8. Введение в теорию генерализации ................................................223
Г-исследование и Р-исследование .............................................................................................224
Введение коэффициентов генерализации для однофасетных дизайнов ...................227
Вложенный однофасетный дизайн Г-исследования (дизайн 4) ...................................241
Генеральные совокупности с фиксированными фасетами..............................................243
Использование теории генерализации с данными, отличающимися
от субъективных оценок экспертов ...........................................................................................245
Стандартные ошибки измерения для абсолютных и относительных
решений .................................................................................................................................................246
Теория генерализации для двухфасетного дизайна ............................................................251
Выводы ....................................................................................................................................................265
Упражнения ...........................................................................................................................................266
глава 9. Коэффициенты надежности для критериальноориентированных
тестов .................................................................................................269
Использование критериально-ориентированных измерений .......................................270
Теория надежности для приближенного оценивания домен-оценок .........................271
Теория надежности для классификаций по категориям мастерства ...........................275
Точность решения .............................................................................................................................292
Выводы ....................................................................................................................................................294
Упражнения ...........................................................................................................................................296
Раздел III. Валидность ..................................................................................................299
глава 10. Введение в валидность ............................................................................301
Содержательная валидность .........................................................................................................302
Критериально-ориентированная валидизация ....................................................................310
Конструктная валидность ..............................................................................................................319
Пересечение подходов к валидизации .....................................................................................326
Коэффициенты валидности для истинных оценок ............................................................327
Выводы ....................................................................................................................................................329
Упражнения ...........................................................................................................................................331
Стр.7
8
Оглавление
глава 11. Статистические процедуры для прогнозирования
и классификации .....................................................................................................................335
Частная корреляция .........................................................................................................................336
Множественная регрессия .............................................................................................................339
Дискриминантный анализ .............................................................................................................352
Выводы ....................................................................................................................................................360
Упражнения ...........................................................................................................................................361
глава 12. Систематическая ошибка отбора ..................................................365
Основные концепции и понятия ................................................................................................366
Группы большинства и меньшинства .......................................................................................370
Психометрические определения систематической ошибки ...........................................370
Справедливые процедуры отбора ...............................................................................................374
Критика моделей ...............................................................................................................................379
Подход к отбору, связанный с теорией решений .................................................................380
Выводы ....................................................................................................................................................387
Упражнения ...........................................................................................................................................388
глава 13. Факторный анализ ........................................................................................390
Пример с гипотетическими данными .......................................................................................391
Факторы и факторные нагрузки .................................................................................................391
Вращение ..............................................................................................................................................393
Коррелированные факторы ..........................................................................................................396
Число факторов ..................................................................................................................................398
Модель факторного анализа .........................................................................................................399
Общность и уникальность .............................................................................................................400
Пример с реальными данными ....................................................................................................401
Исследовательский и конфирматорный факторный анализ ..........................................410
Выводы ....................................................................................................................................................412
Упражнения ...........................................................................................................................................412
Раздел IV. Анализ заданий в разработке
теста ....................................................................................................................................................415
глава 14. Анализ заданий................................................................................................417
Трудность задания, среднее значение и дисперсия ............................................................418
Дискриминативность (различительная способность) задания .....................................420
Надежность заданий и показатели валидности ....................................................................428
Проведение исследования при анализе заданий .................................................................430
Стр.8
Оглавление
9
Анализ заданий для критериально-ориентированных тестов ........................................441
Выводы ....................................................................................................................................................449
Упражнения ...........................................................................................................................................451
глава 15. Введение в современную теорию тестов ..............................454
Базовые понятия теории IRT .......................................................................................................456
Кривая интегральной функции нормального распределения
(нормальная огива) ...........................................................................................................................463
Связь теории IRT с классической теорией тестов ...............................................................468
Логистические модели ....................................................................................................................471
Приближенное оценивание параметров .................................................................................473
Выбор модели ......................................................................................................................................482
Приложения теории IRT ................................................................................................................484
Выводы ....................................................................................................................................................496
Упражнения ...........................................................................................................................................496
глава 16. Обнаружение заданий, приводящих
к систематическим ошибкам .......................................................................................502
Методы, основанные на современной теории тестов (IRT) ...........................................504
Методы хи-квадрат ...........................................................................................................................512
Преимущества и неудобства различных методов ................................................................524
Выводы ....................................................................................................................................................525
Упражнения ...........................................................................................................................................526
Раздел V. Тестовые оценки и их интерпретация ..........................529
глава 17. Поправка на угадывание и другие методы
оценивания ....................................................................................................................................531
Оценивающая формула ...................................................................................................................532
Поощрение дополнительными вкладами в оценку (кредитами)
за частичные знания .........................................................................................................................539
Выводы ....................................................................................................................................................540
Упражнения ...........................................................................................................................................542
глава 18. Установление стандартов .....................................................................544
Подходы к установлению стандартов .......................................................................................546
Эмпирическое исследование методов установления стандартов .................................553
Практические рекомендации по установлению стандартов ...........................................555
Технические соображения в процедуре установления стандартов ...............................558
Выводы ....................................................................................................................................................568
Упражнения ...........................................................................................................................................570
Стр.9
10
Оглавление
глава 19. нормы и стандартные оценки ...........................................................571
Проведение исследования нормирования ..............................................................................572
Вероятностная выборка ..................................................................................................................573
Описание исследования нормирования в руководстве к тесту .....................................580
Виды нормативных оценок ...........................................................................................................582
Выводы ....................................................................................................................................................598
Упражнения ...........................................................................................................................................600
глава 20. Выравнивание оценок по разным тестам ..............................604
Определение выравнивания .........................................................................................................605
Сбор данных для выравнивания .................................................................................................606
Выравнивание по современной теории тестов (IRT) ........................................................616
Выравнивание истинной оценки ................................................................................................622
Вертикальное выравнивание ........................................................................................................624
Равенство в выравнивании ............................................................................................................629
Выводы ....................................................................................................................................................631
Упражнения ...........................................................................................................................................632
Библиография ............................................................................................................................635
Приложение A .............................................................................................................................652
Приложение B .............................................................................................................................653
Стр.10
Предисловие
Предисловие
В 1914 г. Эдвард Ли Торндайк опубликовал книгу «Теория умственных
и социальных измерений», которая была признана первым учебником по
теории тестов. Работа была встречена с огромным энтузиазмом коллегамипрофессионалами,
и в течение короткого времени изучение теории тестов
стало стандартной составной частью учебного плана подготовки аспирантов
в области психологии и педагогики. В течение последующих шестидесяти
лет ученые расширили, уточнили и дополнили теорию, первоначально
представленную Торндайком. Этот объем знаний, известный как
классическая теория тестов, стал теоретической основой разработки большинства
тестов для определения способностей, учебных достижений, личностных
характеристик и интересов.
Однако за последние двадцать лет теория тестов стремительно продвинулась
вперед, что не отмечено в традиционных учебниках. Этому продвижению
во многом способствовало развитие компьютерных технологий,
позволившее практически применять более сложные математические
и статистические модели к обработке данных тестирования. Увеличение
числа профессионалов, работающих в области психометрики, а также
рост потребности объективного измерения качеств учащихся и клиентов
со стороны государственных служб и образовательных программ способствовали
развитию данной области. Как результат – анализ содержания
последних публикаций в ведущих изданиях по педагогическим и психологическим
измерениям позволяет выявить многие доминирующие темы,
которые появились относительно недавно. Примеры таких тем включают
методы разработки критериально-ориентированных тестов, современную
теорию тестов (IRT), теорию генерализации и психометрические методы
исследования систематической ошибки тестовых заданий. Прочное знание
классической теории тестов становится уже недостаточным для подготовки
студента или практикующего специалиста к чтению современной
профессиональной литературы или к применению содержащейся в ней
информации.
Стр.17