традиционная форма оценивания уровня знаний в форме опроса,
экзамена, проводимого человеком, весьма субъективна.
По мнению К.Ингенкампа3 при использовании пятибалльной
шкалы преподаватель выставляет оценки с разбросом плюс, минус 1
балл, то есть с точностью 20%. Из этого следует, что за одни и те же
знания, испытуемый может быть оценен разными экзаменаторами на
«2», на «3» и на «4». Более того, К.Ингенкамп указывает, что один и
тот же экзаменатор в разные моменты времени, например с
интервалом в 1 месяц, также по разному оценивает один и тот же ответ
(на экспериментах использовались видеозаписи ответов испытуемых).
Ясно, что столь неточный «измерительный прибор», каковым
ВВЕДЕНИЕ
Тестирование учебных достижений является важной
составной частью учебного процесса. Управление учебным процессом,
как известно, является одним из определяющих факторов повышения
его эффективности.
Процесс обучения, согласно Н.Ф.Талызиной1, как один из
видов управления требует циклического (замкнутого) управления,
осуществляемого по принципу «белого ящика». Замкнутость системы
управления обусловлена наличием цепи обратной связи. Н.Ф.Талызина
рассматривает коррекцию процесса усвоения, за счет действия
обратной связи как самостоятельный и важный этап управления.
Коррекция возможна, если есть возможность получения
достоверной, объективной информации о состоянии системы, в том
числе педагогической. В этой связи необходимо отметить важность
диагностичности целей и задач, решаемых системой. Только наличие
диагностичных целей позволяет контролировать состояние процесса
обучения, а следовательно, его коррекцию и оптимизацию.
Согласно В.П.Беспалько2 вариативными характеристиками,
определяющими качество обучения, являются уровень усвоения
деятельности и степень усвоения (автоматизации) деятельности.
Эти величины можно контролировать, то есть достижение
высокого качества обучения является диагностичной целью. Наличие
диагностичных целей позволяет организовать реально действующий
процесс управления обучением.
Достижение высокого качества обучения возможно только
при наличии объективных методов диагностики. К сожалению,
3
является человек, существенно снижает эффективность диагностики
учебного процесса. По этой причине, в качестве контрольноизмерительного
мероприятия выбирается тестирование. Сам процесс
тестирования учебных достижений разбивается на три процесса: 1)
разработка теста;
интерпретация результатов тестирования.
При обработке результатов используется либо классическая
теория тестирования, либо IRT (Item Response Theory), позволяющая
измерять уровень достижений испытуемого в специальных единицах
измерения – логитах.. Итерационные процедуры оптимизации
тестовых заданий позволяют создавать надежные и валидные тесты.
Особо следует отметить тот факт, что IRT позволяет получить
числовые значения уровня достижений испытуемого в логитах на
интервальной шкале. Наличие интервальной шкалы позволяет
использовать мощный аппарат математической статистики для
интерпретации полученных результатов.
Напомним,
что
оценки,
выставляемые
человекомэкзаменатором,
размещены на порядковой шкале, что сильно
ограничивает возможности математической обработки результатов
контроля. Давно критикуемая теоретически и, тем не менее, широко
используемая на практике идея расчета среднего балла как среднего
арифметического не имеет под собой методологических оснований. По
оценкам, например, из школьного классного журнала можно
определить моду или медиану. Полученную медиану можно, если
угодно, трактовать как средний балл, но надо ясно отдавать себе отчет
в том, что это не среднее арифметическое всех оценок, выставленных в
журнале.
Тестирование же лишено подобных недостатков, поскольку,
при правильном применении, дает результаты на интервальной шкале.
Помимо достоверности тесты обладают и высокой степенью
4
2) процедура тестирования; 3) обработка и
Стр.3