RSS    

   Дипломная работа: Особенности статистической оценки качества теста диагностики индивидуального прогресса учащихся общеобразовательной школы

2.  Сумма квадратов отклонений от средней арифметической оценки . Вычисляется по формуле

,

для рассматриваемого примера .

3.  Дисперсия тестовых результатов . Вычисляется по формуле


,

для нашего примера .

4.  Стандартное отклонение по тесту . Находится как корень из дисперсии

.

В нашем случае

5.  Коэффициент корреляции . Существует несколько формул для вычисления коэффициента корреляции, и все они используются в разных статистических методах оценки качества педагогического теста. Мы будем рассматривать эти формулы в процессе анализа методов.

6.  Коэффициент надежности . Аналогично, как и с коэффициентом корреляции, в каждом методе используют разные формулы для вычисления коэффициента надежности. Рассмотрим их в процессе анализа методов.

Расчет перечисленных показателей также составляет основу методики количественной оценки качества педагогического теста. Как уже отмечалось раньше, с их помощью оцениваются валидность, надежность и дифференцирующая способность, которые являются основными характеристиками качества педагогического теста.

Мы рассмотрели 11 статистических показателей (5 первичных и 6 вторичных), которые используются в классической теории тестирования. Эти показатели мы будем использовать при анализе методов оценки качества педагогического теста. В следующем параграфе мы рассмотрим методы оценки основных характеристик (валидность, надежность, дифференцирующая способность) качества педагогического теста, учитывая рассмотренные выше первичные и вторичные показатели.

§2.2 МЕТОДЫ СТАТИСТИЧЕСКОЙ ОЦЕНКИ КАЧЕСТВА ТЕСТА

Методы оценки основных характеристик теста состоят из двух частей:

A.  Вычисление некоторой величины или характеристики;

B.  Интерпретация полученного результата, в соответствии с нормой. Норма определяется согласно специфике теста.

Как правило, прежде чем применять методы статистической обработки к тестовым заданиям, сначала используют описательную статистику, которая заключается в вычислении статистических показателей. Рассмотрим их.

Первый из них  - среднее отклонение достижений испытуемых. Далее рассчитываем три взаимосвязанных показателя:

1.    - сумма квадратов отклонений от средней арифметической оценки.

2.   - дисперсия.

3.   - стандартное отклонение по тесту.

По величине  можно судить о доверительном интервале достижений испытуемых. В окрестности    находится большинство достижений группы. Дисперсия тестовых результатов показывает интервал (меру разброса), в котором находятся все полученные баллы испытуемых, включая стандартное отклонение по тесту и ошибку измерения. По величине стандартного отклонения можно судить о статистическом характере распределения результатов [21]. Если средний тестовый балл равен , а , то в интервале  находятся баллы, набранные большинством тестируемых.

Рассмотрим некоторые классические методы оценки основных характеристик теста (валидность, надежность, дискриминативность).

2.2.1 Методы оценки валидности

Напомним, что валидность в теории тестирования означает соответствие формы и содержания теста тому, что он должен оценивать или измерять по замыслу его создателей [21]. Из анализа литературы [4,14,17,20,21] мы выделили два метода оценки валидности. Рассмотрим их.

Метод 1. Вычисляется коэффициент корреляции каждого тестового задания с суммой индивидуальных тестовых баллов испытуемых, который показывает, насколько Валино данное задание отличает слабых от сильных.

А. Коэффициент корреляции   рассчитывается по формуле [14]:

,

где - средний арифметический балл испытуемых, успешно выполнивших -е задание теста, - средний арифметический балл испытуемых, не справившихся с -м заданием,  - стандартное отклонение по -му заданию, - стандартное отклонение по всему тесту.

В. Значение коэффициента корреляции интерпретируется следующим образом:

·  0,7 – 1 – связь очень сильная;

·  0,5 – 0,7 – средняя;

·  0,3 – 0,5 – слабая.

Метод 2.  Также как и в предыдущем методе вычисляется коэффициент корреляции, который показывает силу (интенсивность) линейной связи заданий между собой.

А. Коэффициент корреляции вычисляется по формуле Пирсона [21]:

,

где  и  - сумма квадратов отклонений по заданиям  и ,  и  - количество правильных ответов на то и другое задание соответственно;

- сумма попарных произведений тестовых баллов, полученных по каждому из заданий.

В. В случае положительной корреляции, можно говорить о линейной зависимости между заданиями (чем больше учащихся решат задание j, тем больше решат и задание k). Если коэффициент корреляции высокий, то задания взаимозаменяемы. Отрицательная корреляция свидетельствует об обратной линейной связи. В случае нулевой корреляции такого рода зависимость отсутствует [21].

Вывод: оба метода заключаются в вычислении коэффициента корреляции. Первый метод вычисляет коэффициент корреляции каждого тестового задания с суммой индивидуальных тестовых баллов испытуемых, второй –  корреляцию между заданиями.

2.3 МЕТОДЫ ОЦЕНКИ НАДЕЖНОСТИ

Как уже говорилось выше, надежность теста характеризует степень устойчивости результатов тестирования каждого испытуемого. Методы оценки надежности заключаются в вычислении коэффициента надежности разными способами.

Метод 1 – метод половинного деления. Тест делится на две равные части и подсчитывается сумма баллов, набранных испытуемыми по каждой из половин. Полученные величины коррелируются между собой по формуле Пирсона [21]. Полученный коэффициент  показывает надежность теста при коррелировании его половин, он говорит о внутренней состоятельности теста.

А. Коэффициент надежности теста вычисляется по формуле Спирмана-Брауна [21]:

,

где - коэффициент надежности теста по двум половинам.

В. Значение коэффициента надежности в этом методе интерпретируется следующим образом: если коэффициент надежности принимает значение от 0,8 до 1, то надежность хорошая, от 0,5 до 0,8 – удовлетворительная и менее 0,5 – неудовлетворительная.

2-й метод – метод подсчета средней корреляции заданий теста.

А. Надежность этим методом вычисляется по формуле [21]:

 ,

где  - средняя корреляция,  - сумма средних значений в корреляционной таблице [21, стр.13, табл.2],  - общее число заданий.

В. Результаты вычисления в этом методе интерпретируются также как и в предыдущем.

3-й метод.

А. Коэффициент надежности вычисляется по формуле Кюдера-Ричардсона [20]:

 ,

где - число заданий в тесте, - сумма дисперсий заданий теста, - дисперсия.

Страницы: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13


Новости


Быстрый поиск

Группа вКонтакте: новости

Пока нет

Новости в Twitter и Facebook

                   

Новости

© 2010.