Расчет критерия хи-квадрат (Chi-Square test) часть 2

По окончании расчетов откроется окно «OutPut». (Если это окно не открывается в течение 2-х секунд, значит, оно уже было открыто ранее и сейчас находится в свернутом состоянии. Следовательно, его надо вызнать через ярлык SPSS, представленный в самом низу экрана.)

Результаты расчетов будут представлены в виде двух таблиц. В первой таблице будет показано, какие коды использовались для обозначения качественных характеристик, сколько раз эти коды встретились в первой группе данных (Observed N), сколько раз они встретились или ожидались во второй группе данных (Expected N), а также разница между этими частотами. Если количество наблюдений в первой группе совпадает с количеством наблюдений во второй группе, то в колонке (Expected N) Вы увидите те значения, которые сами вводили в окошко «Values», в ином случае вероятности будут рассчитаны программой с учетом введенных пропорций.

VAR00001
Observed N Expected N Residual
1,00 7 6,0 1,0
2,00 8 10,0 -2,0
3,00 9 8,0 1,0
4,00 6 10,0 -4,0
5,00 7 5,0 2,0
6,00 9 7,0 2,0
Total 46

Величина критерия хи-вкадрат будет представлена во второй таблице на строке Chi-Square. Данную величину необходимо сравнить с критическим значением критерия, которое указано в специальной справочной таблице, имеющейся в учебниках и справочниках по статистике.

Чтобы выбрать из таблицы нужное для сравнения критическое значение, необходимо сначала найти строку, где указана подходящая вам степень свободы выборки. Поскольку степень свободы выборки равна количеству объектов анализа за минусом единицы, поэтому в рассматриваемом примере, где использовались 6 качественных характеристик мебели, степень свободы составила число 5. Выбрав строку с числом 5, в таблице критических значений нужно взять значение, которое стоит в графе, обозначенной как Р0,05. Величина 0,05 означает, что после сравнения с приведенным в этой графе критическим значением, вы сделаете вывод, где ошибочность не будет превышать 5%. Если Вам нужен вывод, где ошибочность не будет превышать 1%, тогда возьмите критическое значение из соседней графы, обозначенной как Р0,01.

Критическое значение для Р0,05 оказалось равным величине 11,1. Теперь обратимся к следующей таблице SPSS и сравним, превысило ли эту величину рассчитанное экспериментальное значение критерия, которое составило 3,663.

Test Statistics
VAR00001
Chi-Square 3,663a
df 5
Asymp. Sig. ,599

a. 0 cells (,0%) have expected frequencies less than 5. The minimum expected cell frequency is 5,0.

Как видим, экспериментальное значение не превысило критического значения, такой результат не позволяет сделать вывод о наличии достоверных различий между двумя группами данных. Вывод о наличии достоверных различий можно сделать только в том случае, если экспериментально рассчитанное значение критерия будет равно или превысит критическое значение, взятое из статистической таблицы. Такое решающее правило применимо к критерию хи-вадрат и еще ко многим критериям, однако не абсолютно не ко всем критериям (в частности, иной принцип оценки действует для так называемых «знаковых» критериев).

Как уже отмечалось при интерпретации других критериев (Колмогорова — Смирнова и Стьюдента), оценку достоверности различий между группами можно проводить и с помощью показателя, который называется «уровень значимости». Данный показатель является чрезвычайно важным показателем для всех методов статистики, поэтому умение его интерпретировать дает ключ к пониманию сути результатов любой статистической обработки данных!

Если кратко изложить суть показателя «уровня значимости», то можно сказать, что он показывает то, насколько можно доверять выводу о наличии достоверных различий, иными словами, насколько ошибочным может оказаться такой вывод. Если ошибочность вывода составляет всего 5%, это означает, что только 5% данных не подтверждают гипотезу о наличии достоверных различий, а остальные 95% данных свидетельствуют в пользу наличия достоверных различий между распределениями или группами данных. При таком раскладе данных вполне возможно принять гипотезу о наличии различий и признать ее достоверной, т.е. надежной.

Уровень значимости (достоверности) гипотезы обычно обозначается в книгах по статистике буквой «р», но в статистических пакетах его принято обозначать тремя буквами «sig» (это сокращение от слова «significance» — «значимость»). Величина уровня значимости выражается обычно не в процентах, а в долях от целого (от единицы): например, пяти процентный уровень ошибочности вывода будет обозначаться как sig=0,05.

Еще лучше, когда уровень ошибочности оказывается равным sig=0,01, что указывает на 1% данных, которые не согласуются с гипотезой о наличии достоверных различий, при этом 99% данных подтверждают эту гипотезу, следовательно, вывод о достоверных различиях будет очень надежным или, как говорят, высоко достоверным.

В тех случаях, когда рассчитанный в SPSS показатель уровня значимости (Sig) превышает величину р=0,05, тогда нельзя делать вывод о наличии достоверных различий между сравниваемыми распределениями или группами данных.

Решающее правило при построении вывода о достоверности различий можно выразить следующим образом:

  • если sig получился равным или меньше, чем 0,05, то делается вывод о наличии достоверных различий, что записывается в отчете или публикации как р≤ 0,05* (и помечается одной звездочкой);
  • если sig получился равным или меньше, чем 0,01, то делается вывод о наличии высоко достоверных различий, что записывается в отчете или публикации как р≤ 0,01**(и помечается двумя звездочками);
  • если sig получился больше 0,05, то делается вывод об отсутствии достоверных различий и наличии только тенденции в различиях данных двух групп, что записывается в отчете или публикации как р> 0,05;
  • если sig получился больше 0,95, то делается вывод о достоверном отсутствии различий между данными двух групп, что записывается в отчете или публикации как р>0,95*(и помечается одной звездочкой);
  • если sig получился больше 0,99, то делается вывод о высоко достоверном отсутствии различий между данными двух групп, что записывается в отчете или публикации как р>0,99**(и помечается двумя звездочками).

В рассмотренном выше примере величина Sig, указанная в нижней части второй таблицы, оказалась на уровне 0,599, что гораздо больше величины 0,05 (р>0,05). Это дает основание говорить о том, что процент ошибочности вывода о наличии достоверных различий – достаточно велик, т.к. он составляет около 60%, следовательно, вывод о наличии достоверных различий справедлив всего лишь на 40% и его не следует принимать как надежный вывод.

При сравнении экспериментального и критического значений критерия пришлось отвергнуть вывод о наличии достоверных различий и признать лишь наличие тенденции в различии результатов двух групп. Как видим, этот вывод и заключение, сделанное на основе оценки уровня значимости критерия, полностью совпадают.

Если перейти к рассмотренному примеру, то следует констатировать, что в оценках мебельной продукции двух фирм наблюдаются лишь небольшие различия и их нельзя признать достоверными (надежными) с точки зрения статистики, т.к. положительные и отрицательные оценки фигурируют примерно одинаково часто в каждой группе данных.

Более подробно об интерпретации результатов с использованием показателя «уровня значимости» Вы сможете прочитать в материале, посвященном критерию Колмогорова — Смирнова.

Вы можете оставить комментарий, или ссылку на Ваш сайт.

Оставить комментарий

Вы должны быть авторизованы, чтобы разместить комментарий.