Анализ статистических методов, используемых при разработке теста диагностики индивидуального прогресса

Материалы » Особенности статистической оценки качества теста диагностики индивидуального прогресса учащихся общеобразовательной школы » Анализ статистических методов, используемых при разработке теста диагностики индивидуального прогресса

Страница 1

Диагностический комплект для мониторинга индивидуального прогресса учащихся школы апробировался на 10 пилотных площадках, расположенных в Самарской области, республики Чувашия, городах Томск, Москва, Красноярск. Апробация основывалась на трех тестовых срезах, которые проводились в 2003-2005 годах. В каждом тестировании участвовало около 2700 учащихся 2-4 и 6-9 классах.

Задача первого среза заключалась в первичном опробовании массива разработанных тестовых заданий. Поэтому на этом этапе статистические методы не использовались.

Задачей второго и третьего срезов являлось как получение данных об учащихся, так и статистическое подтверждение качества тестовых задач.

Для проведения соответствующего анализа были отобраны данные двукратного выполнения одного и того же набора заданий одними и теми же учащимися. То есть, по сути, была применена процедура повторного тестирования и сопоставления результатов двух идентичных срезов. При этом, для сохранения возможности сравнения данных, полученных на разном предметном материале (математика, физика и т.д.), из выборки исключались учащиеся, которые выполняли тест не полностью (например, решали задания по математике, но не решали по физике).

В итоге общая выборка испытуемых составила 4106 человек, из них 734 человека – учащиеся начальной школы и 3372 – учащиеся основной школы.

Напомним, что нас будет интересовать тест по математике в основной школе, в апробации которого участвовало 1140 учеников.

Решая вопрос о валидности теста, авторы исходили из того, что в данном случае говорить о содержательной валидности не имеет смысла, поскольку измеряемый объект (компетентность) на сегодня не имеет устоявшегося общепринятого описания. В то же время, поскольку в основу построения тестового инструмента положена специально разработанная для данного проекта теоретическая схема, желательна проверка ее адекватности. В литературе такого рода валидность теста называется конструктной, или концептуальной. Для проверки конструктной валидности авторами было сформулировано несколько гипотез относительно возможных результатов тестирования, которые были подвергнуты эмпирической проверке. Рассмотрим их:

Уровни заданий положительно связаны с мерой их статистической трудности.

Тестируемый параметр (мера опосредствования) имеет тенденцию прогрессировать и повторное тестирование (при достаточном временном интервале) должно фиксировать прирост результатов.

Результаты тестирования по разным предметам специфичны и не должны сильно коррелировать между собой.

Результаты тестирования с помощью данного инструмента не должны сильно коррелировать с данными классических тестов умственного развития типа ШТУР.

При проверке первые две гипотезы являлись основными, вторые две – вспомогательными. Для проверки гипотез вычислялся ряд первичных характеристик для теста. Главной целью статистической обработки на данном этапе было подтверждение или опровержение гипотез для проверки конструктной валидности.

Для проверки третьей и четвертой гипотез вычислялся коэффициент корреляции между достижениями по разным предметам, который показал, что корреляция является незначительной. Это означает, что школьные достижения предметно специфичны, и для получения полной картины продвижения ребенка необходимо учитывать весь набор основных предметов.

Страницы: 1 2 3 4 5

Новые статьи:

Современый процесс обучения
Учение осуществляется как четко управляемый процесс, так как изучаемый материал разбивается на мелкие, легко усваиваемые дозы. Они последовательно предъявляются ученику для усвоения. После изучения каждой дозы следует проверка степени усвоения. Доза усвоена - переходят к следующей. Это и есть " ...

Психолого-педагогические проблемы развития мышления и личности учащихся в условиях информатизации образования
Необходимость широкого внедрения средств информатизации в общественную практику ставит ряд проблем, связанных, в частности, с оптимизацией систем "человек - компьютер". В этом случае требуется учет компонентов человеческого фактора, таких, как личностные особенности и характеристики мышле ...

Характеристика детей с ОНР
Специальные исследования детей с ОНР показали клиническое разнообразие проявлений общего недоразвития речи. Схематично их можно разделить на три основных группы. У детей первой группы имеют место признаки лишь общего недоразвития речи, без других выраженных нарушений нервно-психической деятельности ...

Copyright © 2014-2021 - All Rights Reserved - www.probest.site