Метод расчета критерия Вилкоксона

Сейчас мы переходим к ознакомлению со следующим непараметрическим критерием. Он называется критерий Вилкоксона в честь ученого, который его разработал (иногда его фамилию переводят с английского как Уилкоксон).

Данный критерий  называют «ранговым» критерием потому, что он опирается на расчет рангов, которые присваиваются  полученным в эксперименте данным. Критерий Вилкоксона применяется обычно для сравнения двух рядов данных, которые не подчиняются закону нормального распределения, а проявляют себя как непрерывно возрастающие функции. При этом сравнению подлежат не сами данные, а степень быстроты их возрастания, иными словами, сравниваются  «скорости» (интенсивности) возрастания величин показателей в одной и в другой группах.

Подобного рода задача может быть поставлена, например, в эксперименте, где изучаются две методики  обучения профессиональному английскому языку. Такой профессиональный английский «жаргон»  используют пилотами в радиопереговорах с зарубежными авиадиспетчерами.

В первой  методике расширения словарного запаса у пилотов используются традиционный способ обучения – учебные занятия, а во второй методике применяется нетрадиционный способ – игровые занятия. Насколько интенсивно идет прирост словарного запаса при обучении по первой и второй методике, отражают два ряда (группы) данных. Быстрота нарастания показателей словарного запаса может иметь свою специфику в каждом ряду данных. Например, если показатели в одной группе данных меняются быстро, т.е. возрастают сразу на большое количество единиц, а в другой группе данных наблюдается медленный рост показателей, то можно говорить о достоверных различиях в эффективности обучения между двумя методиками.

Далее в таблице отражены темпы возрастания словарного запаса, т.е. количества активно используемых пилотами слов от занятия к занятию.

Номера занятий Словарный запас при 1-й методике Словарный запас при 2-й методике Разницы между словарн. запасами
1 3 5 +2
2 5 8 +3
3 9 10 +1
4 13 11 -2
5 15 16 +1
6 18 17 -1
7 21 20 -1
8 23 25 +2
9 28 25 -3
10 30 31 +1

Существует две формулы для критерия Вилкоксона: одна используется для малых  по численности выборок, а другая – для больших по численности выборок. Мы последовательно рассмотрим обе формулы.

Формула критерия Вилкоксона для малых выборок: Т=∑Rредк. знака

Здесь показатель критерия Т определяется как сумма рангов редкого знака. Чтобы вычислить данную величину на материале рассматриваемого примера с расширением словарного запаса у пилотов, необходимо проделать сначала следующие процедуры:

  1. вычислить разницу между парами значений (соответствующими одному и тому же занятию) в разных методиках, т.е. вычесть из значений второй графы значения первой графы в таблице;
  2. все полученные разницы (они представлены  со знаками «+» или «-» в третьей графе) выписать в отдельную строку, но без знаков;
  3. проставить первоначальные ранги для выписанных разниц по мере возрастания их величин, а затем заново присвоить ранги с учетом того, что некоторые разницы повторяются (значит, они должны иметь один и тот же ранг) – для этого определяется средний арифметический ранг для подгруппы одинаковых разниц.

Выполнение данных процедур показано ниже: в верхней строке выписаны величины разниц без знаков, во второй строке им присвоены первичные ранги, а в нижней строке им присвоены уже окончательные ранги, где одинаковые величины разниц имеют теперь и одинаковые ранги.

1 1 1 1 1 2 2 2 3 3
1-й ранг 2-й ранг 3-й ранг 4-й ранг 5-й ранг 6-й ранг 7-й ранг 8-й ранг 9-й ранг 10-й ранг
3-й ранг 3-й ранг 3-й ранг 3-й ранг 3-й ранг 7-й ранг 7-й ранг 7-й ранг 9,5-й ранг 9,5-й ранг

Теперь надо определить, какой знак среди разниц является более редким. Из таблицы, где разницы записаны со своими знаками, видно, что знак «-» встречается реже, чем знак «+»: четыре минуса, а плюсов – шесть. Следовательно, далее нам нужно посчитать сумму рангов, которая приходится на разницы с редким знаком «-».  В число таких разниц попали следующие величины разниц: -1 (6-е занятие), еще раз -1 (7-е занятие), -2 (4-е занятие) и -3 (9-е занятие). Эти разницы получили согласно процедуре ранжирования такие ранги: 3-й ранг, еще один 3-й ранг, 7-й ранг и 9,5 ранг. Сумма данных рангов составляет 22,5 –это и есть величина критерия Вилкоксона для малых групп данных, т.е сумма рангов редкого знака «-». Достоверные различия будут иметь место лишь в том случае, если Тэксп ≤ Ткрит. Как и для других критериев предусмотрены два критических значения: один уровень значимости составляет р=0,05 (то есть 5% уровень ошибочности вывода о достоверных различиях), а другой уровень значимости составляет р=0,01 (то есть 1% ошибочности вывода о достоверных различиях между данными).

Из ниже приведенной таблицы критических значений видно, что для 10 сравниваемых пар (n=10) Ткрит равно 10 при р=0,05 и равно 5 при р=0,01.

Тэксп оказалось больше этих величин, значит, различия недостоверные.

Таблица критических значений критерия Вилкоксона для малых выборок.

Число сравниваемых пар (n) Уровень значимости (р) Число сравниваемых пар (n) Уровень значимости (р)
0,05 0,01 0,05 0,01
5 0 28 130 101
6 2 29 140 110
7 3 0 30 151 120
8 5 1 31 163 130
9 8 3 32 175 140
10 10 5 33 187 151
11 13 7 34 200 162
12 17 9 35 213 173
13 21 12 36 227 185
14 25 15 37 241 198
15 30 19 38 256 211
16 35 23 39 271 224
17 41 27 40 186 238
18 47 32 41 302 252
19 53 37 42 319 266
20 60 43 43 336 281
21 67 49 44 353 296
22 75 55 45 371 312
23 83 62 46 389 328
24 91 69 47 407 345
25 100 76 48 426 362
26 110 84 49 446 379
27 119 92 50 466 397

Однако в статистических программах, которые предназначены для обсчета больших выборок, используют не выше указанная формула, а ее модифицированный вариант.  Данный модифицированный вариант критерия Вилкоксона разработали ученые Манн и Уитни для больших выборок. Причем в этой новой формуле рассмотренный выше показатель – сумма рангов редкого знака, — тоже применяется, но только в качестве одного из составных элементов большой формулы. Формула критерия Вилкоксона для больших выборок по сути является универсальной и может применяться в том числе и выборкам среднего размера. Она выглядит так:

19

В данной формуле показатель n означает количество сравниваемых пар значений двух групп (пары, между которыми вычисляются разницы). Эта же формула заложена и  в программу SPSS. Но произведем расчет экспериментального значения критерия по данной формуле вручную, а затем уже в компьютерной программе.

Итак, в эксперименте по сравнению эффективности двух методик для обучения пилотов словарному запасу мы посчитали, что сумма рангов редкого знака «плюс» составила ∑Rредк. знака= 22,5, а количество сравниваемых пар n=10. Подставим эти цифры в формулу критерия:

Тэксп = [22,5 – (10·11):4] : √ (10∙11·21) : 24= 5: 9,8= 0,51

Критическое значение для данное критерия (если берутся средние или большие по численности группы) является единственным и соответствует числу Ткрит =1,96. Чтобы иметь основание говорить о наличии достоверных различий при сравнении темпов возрастания значений в двух группах данных, необходимо, чтобы Тэксп ≥ Ткрит. Здесь действует обратное правило в соотношении экспериментального и критического значения, чем в ситуации с малыми группами! Полученные экспериментальные значения сравниваются по модулю.

Поскольку полученное экспериментальное значение меньше критического значения 1,96 для данного критерия, следовательно, нельзя говорить о наличии достоверных различий между традиционной и игровой методиками расширения английских запаса у пилотов. Как видим, выводы о достоверности совпали, хотя мы сравнивали по двум разным формулам (для малых и больших групп данных). Разберем пример с вычислением этого критерия в программе SPSS.

Предположим, мы наблюдали за соревнованиями двух групп эрудитов на интеллектуальном шоу. За каждый правильный ответ  с учетом  сложности вопроса каждая группа получала определенное количество баллов. Судья производил  суммирование баллов,  полученных за каждый вопрос, и наблюдал темп прироста общей суммы баллов отдельно в первой и второй группах. Чтобы сделать судейство более справедливым, он задался вопросом: можно ли считать темп набора (роста суммы) баллов в двух группах одинаковым? Будучи уже ознакомленными с критерием Вилкоксона, вы вполне можете дать ответ на поставленный судьей вопрос.

Сейчас вам раздали таблицу, где напечатаны данные двух групп по мере возрастания сумм баллов, которые накапливались по ходу игры за выдачу правильных ответов.

1 гр. 4 9 12 16 19 21 24 33 37 38 44
2 гр. 5 7 13 15 20 24 26 32 36 41 43

Рассмотрим, как делается расчет критерия Вилкоксона с помощью программы SPSS. Входим в программу известным способом. Набираем в базе данных сами «сырые»  значения (не разницы и не ранги!), которые были получены в каждой группе, таким образом, формируются две переменные. Программа сама рассчитывает разницы, присваивает им ранги, выбирает редкий знак, подсчитывает сумму рангов редкого знака и выполняет все остальные расчеты согласно формуле.

Для этого нажимаем команду Analyze, в представленном меню действий выбираем строку, где написано Nonparametric tests, после чего появится список критериев, где надо нажать на строку «2 Related Samples». В появившемся окне следует проверить, активирована ли позиция, в которой указана фамилия Wilcoxon (там должна высвечиваться точка), далее указать путем выбора из списка, с какими переменными произвести расчет критерия.

В примере с эрудитами расчеты в SPSS дали следующие показатели:

z (что соответствует обозначению Тэксп) =  — 0,778, sig= 0,436

Здесь следует добавить, что под таблицей с показателем критерия (z) приводятся комментарии, обозначенные буквами «а» и «в». Буквой «а» обозначена та тенденция, которая встречалась редко, т.е. тенденция редкого знака — она учитывалась при расчете показателя критерия Вилкоксона. Буквой «в» обозначается противоположная тенденция (по отношению к редкой), иными словами, доминирующая тенденция. Напомним, что Критерий Вилкоксона, хотя и опирается в расчетах на выраженность редкой тенденции, тем не менее, оценивает достоверность преобладания именно доминирующей тенденции, т.е. тенденции популярного знака, который фигурировал среди разниц, полученных при попарном вычитании V2 — V1. В этой связи вывод по критерию Вилкоксона делается по тенденции, обозначенной буквой «в», а не буквой «а», где указано, на базе каких рангов (положительных или отрицательных) производился расчет данного критерия.

В рассмотренном примере расчеты делались на базе отрицательных рангов, о чем говорится в комментарии под буквой «а». Следовательно, сам критерий надо рассматривать применительно к противоположной тенденции – к положительной (она соответствует «в»).

Если при вычитании из второй переменной первой переменной в большинстве пар получаются в основном знаки «+», значит, 2-я переменная нарастает круче. Но насколько достоверна эта тенденция указывает величина полученного критерия. Поскольку она оказалась меньше критического значения, равного 1,96, то делается вывод об отсутствии достоверных различий  между темпами нарастания данных в двух сравниваемых группах. Этот вывод подтверждается и тем фактом, что уровень ошибочности гипотезы о достоверных различиях составляет 43,6%, — такую гипотезу принять нельзя. Значит, принимаем гипотезу об отсутствии достоверных различий между темпами нарастания результатов в группах участников шоу.

Вы можете оставить комментарий, или ссылку на Ваш сайт.

Оставить комментарий

Вы должны быть авторизованы, чтобы разместить комментарий.