Статистика в обработке материалов психологических исследований
6-й столбец показывает построчные разности между значениями х 2-го столбца и средним арифметическим "х.
7-й столбец -- квадрат этих разностей.
8-й столбец показывает построчные произведения значений 4-го и 7-го столбцов. Суммирование величин этого столбца дает итог, не-обходимый для вычисления среднеквадратического отклонения.
Включение буквы f, означающей, насколько часто встречалась та или другая величина, ничего не изменяет в формулах среднего ариф-метического и среднеквадратического отклонения. Поэтому формулы
" х = ?х/ n = ?f *х/ n
Как и формулы вполне тождественны.
у = ?? (х - " х )2 / n = v?f * (х - " х )2 / n
Остается показать, как вычисляются по формулам среднее арифме-тическое и среднеквадратическое отклонение. Обратимся к величи-нам, полученным в табл. 1:
" х = 6150/50 = 123
При составлении табл. 1 это число было заранее вычислено, без него нельзя было бы получить числовые значения 6, 7 и 8-го столбцов таблицы.
у = ?10368/50 = ?207,3 = 14,4
При обработке изучаемого ряда оказалось возможным применение параметрического метода; визуально можно заметить, что распределе-ние численностей приближается к нормальному.
Нормальное распределение обладает некоторыми весьма полезны-ми для исследователя свойствами. Так, в границах "х ± у находится примерно 68 % всего ряда или всей выборки. В границах "х ± 2у нахо-дится примерно 95 %, а в границах "х ± 3у - 99,7 % выборки. В практи-ке исследований часто берут границы "х ± 2/3у. В этих границах при нормальном распределении будут находиться 50 % выборки; распре-деление это симметрично, поэтому 25 % окажутся ниже, а 25 % выше гра-ниц "х ± 2/3у. Все эти расчеты не требуют никакой дополнительной проверки при условии, что изучаемый ряд имеет нормальное распре-деление, а число элементов в нем велико, порядка нескольких сотен или тысяч.
Для рассматриваемого примера необходимо также вычислить ко-эффициент вариации по формуле:
V = у/ "х ·100 %.
В примере, который был рассмотрен выше,
V = 14,4/123 ·100% = 11,7%.
Выполнив все эти вычисления, психолог может представить инфор-мацию об изучении двигательной скорости с помощью примененной методики в шестых классах. Согласно результатам изучения в шестых классах, получены:
· среднее арифметическое -- 123;
· среднеквадратическое отклонение -- 14,4;
· коэффициент вариации -- 11,7 %.
Если значения изучаемого признака измерены в порядковой шкале, то в качестве меры центральной тенденции выступает медиана, а ха-рактеристикой диапазона варьирования выступает среднее кварталь-ное отклонение.
Вот пример.
После проведения диагностических испытаний уровня умственного развития учеников шестого класса все полученные данные были упоря-дочены, т. е. расположены в последовательности от меньшей величины к большей. Испытания проходили 18 учащихся. Буквами обозначены уча-щиеся, числами -- полученные ими баллы по тесту, столбцы под буква-ми R -- ранги (табл. 2).
Процедура ранжирования состоит в следующем. Все числа ряда в их последовательности получают по своим порядковым местам присва-иваемые им ранги. Если какие-нибудь числа повторяются, то всем по-вторяющимся числам присваивается один и тот же ранг -- средний из общей суммы занятых этими числами мест. Так, числу «28» в изучаемом ряду присвоен ранг «2». Затем следуют трижды повторяющиеся числа «39». На них приходятся занятые ими ранговые места «3», «4», «5». По-этому этим числам присваивается один и тот же средний ранг, в данном случае -- «4». Поскольку места до 5 включительно заняты, то следующее число получает ранг «6» и т. д.
Таблица 2
Ранжирование результатов
Учащиеся | Баллы по тесту | Ранг (R) | Учащиеся | Баллы по тесту | Ранг (R) | |
А | 25 | 1 | К | 68 | 10 | |
Б | 28 | 2 | Л | 69 | 11,5 | |
В | 39 | 4 | м | 69 | 11,5 | |
Г | 39 | 4 | н | 70 | 14,5 | |
д | 39 | 4 | О | 70 | 14,5 | |
Е | 45 | 6 | п | 70 | 14,5 | |
Ж | 50 | 7 | р | 70 | 14,5 | |
3 | 52 | 8,5 | с | 74 | 17,5 | |
И | 52 | 8,5 | т | 74 | 17,5 |
При обработке ряда, не имеющего признаков нормального распре-деления, иначе -- непараметрического ряда, -- для величины, которая выражала бы его центральную тенденцию, более всего пригодна меди-ана, т. е. величина, расположенная в середине ряда. Ее определяют по срединному рангу по формуле.
Медиана ряда определяется по ранговой медиане:
MeR = (n +1)/2
где n -- число членов ряда.
Возьмем, к примеру, ряд в семь членов: 3-5-6-7-9-10-11.
Проранжировав этот ряд, имеем:
1-2-3-4-5-6-7.
Ранговая медиана
MeR = (7 + 1)/2 = 4 ,
дает медиану рассматриваемого ряда Me = 7.
Возьмем ряд в восемь членов: 3-5-6-7-9-10-11-12.
Проранжировав этот ряд, имеем:
1-2-3-4-5-6-7-8.
Ранговая медиана в этом ряду равна:
MeR = (8+1)/2 = 4,5
Этому рангу соответствует середина между двумя величинами, име-ющими ранг 4 и ранг 5, т. е. между 7 и 9. Медиана этого ряда равна:
Me = (7 + 9)/2 =8
Следует обратить внимание на то, что величины 8 в составе ряда пет, но таково значение медианы этого ряда.
Вернемся к изучаемому ряду. Он состоит из 18 членов. Его ранго-вая медиана равна:
MeR = (18+1)/2= 9,5.
Она расположится между 9-й и 10-й величиной ряда. 9-я величина ряда - 52, 10-я величина ряда - 68. Медиана занимает срединное ме-сто между этими величинами, следовательно:
Me = (52 + 68)/2 = 60
По обе стороны от этой величины находится по 50% величин ряда. Характеристику распределения численностей в непараметрическом ряду можно получить из отношения его квартилей. Квартилью назы-вается величина, отграничивающая 1/4 всех величин ряда. Квартиль первая - ее обозначение Q1- вычисляется по формуле:
Q1 = R1 + Rn/2(лев) / 2
Это полусумма первого и последнего рангов первой, левой от меди-аны половины ряда; квартиль третья, обозначаемая Q3, вычисляется, по формуле:
Q3 = Rn/2 + Rn/2(прав) / 2
т. е. как полусумма первого и последнего рангов второй, правой от ме-дианы половины ряда. Берутся порядковые значения рангов по их пос-ледовательности в ряду. В обрабатываемом ряду
Q1 = (1+9)/2 = 5, Q3 = (10+18)/2 = 14
Рангу 5 в этом ряду соответствует величина 39, а рангу 14 - вели-чина 70.
Для характеристики распределения в непараметрическом ряду вы-числяется среднее квартальное отклонение, обозначаемое Q.
Формула для Q такова:
Q = (Q3 - Q1)/2
В обрабатываемом ряду Q3 = 70, a Q1 = 39, следовательно:
Q = (70 - 39)/2 =15,5.
Были рассмотрены статистическая обработка параметрического ряда ("х и у) и статистическая обработка непараметрического ряда (Me и Q). Параметрический ряд относится к шкале интервалов, непараметричес-кий -- к шкале порядка. Но встречаются также ряды, относящиеся к шкале наименований. Наиболее краткая, но малоинформативная ха-рактеристика такого ряда может быть получена с помощью моды -- величины в ряду, имеющей наибольшую численность из числа п -- чле-нов ряда. Следует заметить, что моду можно лишь условно считать вы-ражением центральной тенденции в ряду, относящемуся к шкале наи-менований. Она выражает наиболее типичную величину ряда.
Рассмотрим пример, где речь идет об участниках некой конференции; в их числе 3 англичанина, 2 датчанина, 5 немцев, 1 русский и 2 фран-цуза. Мода в данном ряду приходится на участников конференции -- немцев. Число членов ряда -- 13, а мода Мо = 5.