Метод расчета t-критерия Стьюдента

Т критерий Стьюдента.

Критерий Стьюдента применяется в том случае, когда требуется дать ответ: отличаются ли достоверно, т.е. надежно, результаты одной группы от результатов другой группы.

В дисперсионном анализе наравне с F-критерием применяется и другой критерий, который называется t-критерий Стьюдента. Суть данного критерия заключается в том, что оценивается степень расхождения средних арифметических показателей двух групп данных (М1 и М2)относительно дисперсии σ2, т.е разброса индивидуальных данных, рассчитанной применительно к этим двум группам, где количество членов соответствует  N1 и N2.

Формула расчета t- критерия имеет следующий вид:

T критерий Стьюдента метод расчетаНо эта формула используется в том случае, когда выборки примерно равны по численности. В случае, когда выборки отличаются по своим размерам, применяется другая – более сложная формула расчета критерия:

16

где N1 и N2 соответствуют количеству членов 1-й и 2-й групп испытуемых.

Критерий Стьюдента относится к группе параметрических критериев, т.к. в своих расчетах опирается на «параметры» распределения (средние арифметические величины и дисперсии). А поскольку «параметры», или описательные статистики (если речь идет о малых выборках) адекватны только для сравнения нормальных распределений, то и критерий Стьюдента применяют обычно для оценки достоверности различий между двумя группами данных, где имеет место нормальное распределение или близкое к нему.

Данный критерий имеет одну отличительную особенность от F-критерия: t-критерий предназначен для сравнения только двух групп, в то время как F-критерий может использоваться для сравнения сразу нескольких групп. Но принцип анализа результатов расчета t-критерия сохраняется тем же: требуется сравнить экспериментально рассчитанное значение критерия с его критическим значением, взятым из таблицы, приведенной ниже.

Таблица

Таблица

На прошлом занятии, посвященном F-критерию, было подробно рассказано, как надо выбирать критическое значение для сравнения его с экспериментальным, и что такое степень свободы выборки. Поэтому кратко заметим лишь, что сначала определяется степень свободы выборки (это число испытуемых, уменьшенное на единицу), а затем на этой строке берется значение, стоящее в графе под цифрой 0,05 или 0,01, которые указывают вероятность ошибки в выводе (Вы сами выбираете приемлемый для Вас  уровень ошибки: либо 5% , либо 1% уровень).

Закончив рассмотрение теоретической части занятия, перейдем непосредственно к его практической части и попробуем выполнить расчет F и  t критериев на конкретном примере. Затем посмотрим, как это можно выполнить с помощью компьютерной программы SPSS.

Еще в середине ХХ века, когда о психосоматических заболеваниях  мало что знали,  один американский врач, служивший на военной подводной лодке, обратил внимание на такую закономерность: к нему чаще обращались по поводу своих телесных (соматических) заболеваний те матросы, у которых в жизни происходили какие-то стрессовые события.  Врач решил изучить, действительно ли существует устойчивая связь между психическими потрясениями и телесными заболеваниями.  Он начал с того, что разработал специальную анкету для выявления количества стрессов у матросов. Вам раздали эту анкету для ознакомления. Сила стресса выражалась в определенном количестве баллов, те пункты, где  стресс носил положительный характер, были помечены  звездочками.

Анкета

Изменения, происходящие в жизни Сила стресса Изменения, происходящие в жизни Сила стресса
Семья Переход в новое учебное заведение 20
Смерть супруга (супруги) 100 Изменение места жительства 20
Развод 73 Серьезное изменение в характере развлечений 19
Крупная размолвка супругов 65 Серьезное изменение в отношении к религии 19
Смерть близкого родственника 63 Серьезное нарушение привычного распорядка дня 16
Женитьба* 50 Серьезное ухудшение в характере питания 15
Примирение после крупной ссоры* 45 Отпуск* 13
Серьезное изменение в отношениях членов семьи 44 Новогодние каникулы 12
Беременность жены* 40 Незначительные правонарушения 11
Рождение ребенка* 39 Работа
Ревность к супругу (супруге) 35 Увольнение с работы 47
Сын или дочь покидают отчий дом 29 Уход на пенсию 45
Трудности в отношениях с родственниками жены или мужа 29 Серьезные изменения состояния дел на работе 39
Жена поступает на работу или заканчивает работать 26 Изменение вида деятельности 36
Серьезные изменения в отношениях с общими друзьями 15 Повышение по службе* 29
Человек Трудности в отношениях с начальством 23
Заключение в тюрьму 63 Серьезные изменения в условиях работы 20
Серьезная рана или болезнь 53 Финансовые вопросы
Смерть близкого друга 37 Серьезное ухудшение финансового состояния 38
Выдающийся личный успех* 28 Заклад имущества на большую сумму денег 31
Начало или завершение учебы* 26 Лишение права выкупа закладной 30
Серьезное ухудшение в условиях жизни 25 Временная невозможность погасить  кредит 17
Серьезный пересмотр личных привычек 24

Обратите внимание, что каждому виду стресса врач приписал определенный балл, который, по его мнению, соответствует силе влияния данного стресс-фактора на психику человека. После того, как каждый матрос заполнял анкету, подсчитывалось количество «стрессовых» баллов, которые он по ней набрал. Весь континуум значений, полученных по анкетным данным, врач разделил на 4 группы:

1-ая группа – стресс практически отсутствует;

2-ая группа – стресс присутствует в малой степени;

3-ья группа – стресс выражен на среднем уровне;

4-ая группа – стресс выражен в большой степени.

Далее врач уравнял все четыре группы, взятые для исследования, по численности, включив  по 10 человек в группу, и выписал, какое количество раз обращался к нему за медицинской помощью каждый матрос. Получились четыре таблицы с количеством обращений. Когда он посчитал, сколько в среднем было обращений в той или иной группе, то оказалось следующее:

в 1-ой группе  среднее число обращений  к врачу – 1 раз;

во 2-ой группе – 2 раза;

в 3-ей группе – 3 раза;

в 4-ой группе – 4 раза.

Итак, число обращений с телесными заболеваниями возрастало по мере повышения уровня жизненного стресса. Но с точки зрения обыденного мышления может показаться, что нет существенной разницы между числом обращений первой и второй группы или даже третьей группы к врачу.

Врач столкнулся с проблемой: как доказать, что эти различия существенны и носят устойчивый характер. Если бы он владел методом дисперсионного анализа, он  смог бы научным путем доказать или опровергнуть свою гипотезу о влиянии психического состояния на телесное здоровье человека, но он им не владел. Его гипотезу научным путем доказали позднее другие ученые. В отличие от этого врача вы уже познакомились с данным методом статистики и поэтому вполне можете решить подобного рода задачу.

Для решения вам потребуется рассчитать два вида несмещенных дисперсий, которые, как известно, опираются на величины отклонений (deviation — d) точечных значений, т.е. конкретных результатов (Х) от средних арифметических (М). Только заметим, что при расчете внутригрупповой дисперсии (WG) в роли среднего арифметического выступает М, полученная в конкретной группе, поэтому отклонения внутри групп должны считаться от различных по величине средних арифметических, поскольку М в группах отличаются между собой. Для наглядности построим таблицы, где отразим: 1) средние арифметические значения в группах (М1.2,3,4) ,т.е. усредненное число обращений к врачу в данной группе, и 2) все отклонения (dхWG) конкретных результатов (Х), которые представляют собой число обращений к врачу, — от среднего арифметического по группе.

Таблица

Таблица

Когда отклонения результатов от средних в каждой группе указаны в таблице, несложно возвести каждое отклонение в квадрат, просуммировать эти квадраты и разделить сумму на число степеней свободы испытуемых – в итоге получим несмещенную внутригрупповую дисперсию.

Теперь необходимо сделать расчет другого вида дисперсии – межгрупповой (BG). Для этого сначала определяем, чему равно общее среднее арифметическое для всех четырех групп М0= (1+2+3+4):4=2,5. Далее нужно посчитать отклонения каждого среднего арифметического, принадлежащего отдельной группе, от  М0, возвести все отклонения в квадрат, сложить квадраты и разделить на число степеней свободы групп.

Итак, мы имеем две величины дисперсий, значит, можем подставить их в формулу F-критерия и произвести его расчет:

Fэксп= 16,67 / 0,78 = 21,37

Посмотрим по таблице критические значения данного критерия (если K=3, а  k=36). Из двух предлагаемых критических значений (с пометкой р=0,05 и р=0,01) выберем более высокое, потому что оно обеспечивает более безошибочное заключение о достоверности различий (на уровне 1% ошибки). Это значение составляет Fкрит= 4,38 (при р=0,01). Сравним его с Fэксп и увидим, что экспериментально полученное значение F значительно превысило критическое  значение даже при минимальном уровне ошибке (1%), следовательно, вывод о достоверности различий между четырьмя группами вполне правомерен и надежен.

Если бы мы имели дело только с двумя какими-то группами из четырех, то их можно было бы сравнить еще и по t-критерию Стьюдента, формула которого была приведена выше. Затем нужно было бы воспользоваться таблицей для t-критерия (она имеется на том же листочке, что и таблица F- критерия, только ниже), выбрать уровень значимости р=0,01 или р=0,05 и определить, превышает ли  полученное tэксп величину tкрит, чтобы сделать вывод о достоверности различий.

Попробуем теперь сделать расчеты F и t критериев на компьютере с помощью программы SPSS. Для этого сначала потребуется собрать какой-то экспериментальный материал. Проведем с вами тест под названием «Рефлекс на время» и сравним затем данные вашей группы с данными, полученными на авиадиспетчерах, чтобы определить, существенно ли вы отличаетесь по «чувству времени» от авиадиспетчеров.

Тест будет проводиться с каждым студентом индивидуально. Послушайте инструкцию к тесту. Инструкция: «Тест оценивает способность правильно определять интервалы времени, опираясь на свое  внутреннее чувство времени. Я буду включать секундомер, но вы не будете видеть, как течет время на секундомере, вы можете вести лишь мысленный отсчет времени. По истечении 15 секунд после включения секундомера, когда я скажу «Начали», вы должны отсчитать 15 секунд и сказать «Стоп», чтобы я остановила секундомер. Затем я сообщу, на сколько точно вы отмерили 15-ти секундный интервал времени: ваша ошибка может быть равно 0, либо какому-то числу со знаком «+» или  «-». Запомните свой результатов для составления общей по группе таблицы данных. Прежде, чем мы приступим к тестированию, необходимо сделать небольшую тренировку. Сейчас я включу секундомер и буду вслух отсчитывать секунды в течение 15 секунд. Затем я снова включу секундомер, но уже обозначу лишь конец 15-ти секундного интервала. После этого начнутся тестовые испытания, когда конец 15-ти секундного интервала будете обозначать вы сами словом «Стоп». Если вопросов нет, то приготовьтесь считать секунды вместе со мной по секундомеру. Итак, начали!».

Завершив тестирование, заносим в таблицу полученные результаты. В эту таблицу записываем также данные авиадиспетчеров, чтобы сделать сравнение данных двух групп на предмет их достоверных различий с помощью компьютерной программы SPSS.

Неточности в оценке времени студентами Неточности в оценке времени авиадиспетчерами
-1 -2
0 -2
-1 -1
-2 -1
+1 -1
+1 0
+1 0
0 0
-1 0
+1 0
-1 +1
-2 +1
+1 +1
0 +1
+1 +2

Вызываем программу на компьютере тем же способом, что и раньше. Оказываемся в базе данных. Набираем в графе под символом V1 ваши результаты тестирования (вводим первую графу подготовленной таблицы), потом во вторую графу базы данных под символом V2 вводим данные авиадиспетчеров. Далее нажимаем на команду Analyze над таблицей. В представленном меню выбираем строку Compare Means, что означает процедуру сравнения средних арифметических. После этого появится дополнительное меню тех критериев, по которым можно произвести сравнение средних. В данном списке нужно выбрать строку — One way ANOVA, если нам нужно посчитать по F-критерию. Если же нам нужно сделать расчет t –критерия Стьюдента, тогда следует выбрать из этого перечня строку с надписью  Related Samples T-test.

Предположим, вы выбрали One way ANOVA. Вам будет предъявлено окно, где требуется указать (путем выбора из списка высветившихся в окне переменных), какую переменную взять программе в качестве «фактора» — это основная переменная, с которой будут сравниваться другие. Для этого нужно сначала выделить подходящую переменную в списке на левом поле (V1) и нажать стрелочку вправо рядом с окошком, где написано слово «Factor», переменная переместится туда. Затем нужно переставить таким же образом  вторую переменную в окошко под словом «depended», что означает зависимая переменная. После чего нажать на ОК, чтобы закрыть окно.

Программа через несколько секунд выдаст результат, где будет написана величина F-критерия и уровень значимости различий между группами (sig).

F = 0,417; sig = 0,714

Теперь следует сравнить рассчитанное значение Fэксп с критическим значением F. Подробно процедура такого сравнения была рассмотрена на предыдущем занятии. Для этого следует обратиться к специальной статистической таблице, приведенной ранее.

Выбираем критическое значение, которое стоит в статистической таблице для данного критерия на строке с со степенью свободы k = 14. Мы видим, что оно составляет 4,96 или 4,91, значит, наше значение не превысило критическое, что не позволяет нам сделать вывод о достоверности различий между студентами и авиадиспетчерами в плане чувства времени.

Заметим, что программа SPSS показывает и такую величину, как степень свободы для числа испытуемых, причем берет это число применительно к самой малочисленной из двух групп (от этого порог критического значения возрастает, но возрастает при этом и надежность вывода) – в этом специфика методического приема под названием One way ANOVA, что в переводе означает «один из путей  анализа вариативности». Отметим и еще одну специфику этой программы: степень свободы обозначается не традиционно (буквой k), как это имеет место в статистических таблицах, а двумя буквами «df» — это сокращение  слов «degree of freedom», т.е. «степень свободы».

Благодаря расчетам One way ANOVA оценить достоверность различий между группами можно и не прибегая к таблице: просто проанализировать величину sig, которая говорит о том, в какой мере ваш вывод о достоверности различий будет ошибочным (при данном Fэксп). Как отмечалось ранее, допустимо делать вывод о наличии достоверных различий только при значимости (sig) менее 0,05. В остальных случаях различия считаются не достоверными, т.е. данные двух групп мало чем отличаются друг от друга.

Возможен такой случай, когда программа не выполняет расчет F-критерия. Это может происходить по причине отсутствия нормального распределения в распределении данных, тогда, безусловно, следует обратиться к расчету t –критерия, который рассчитывается в любом случае, но его надежность выше именно для нормальных распределений.

Для этого потребуется выбрать в меню команд вместо One way  ANOVA строку, где стоят слова Paried Samples t-test. Далее необходимо выбрать из списка те две переменные, которые будут подлежать сравнению. На экране после расчетов будут выданы нужные показатели: величина tэксп (знак при этом не учитывается), число степеней свободы – df, уровень значимости различий — sig.

tэксп = — 0,180; sig = 0,860

Поскольку sig оказался на уровне 0,86, то этот факт указывает на то, что вывод о наличии достоверных различий ошибочен на 86%. Значит, такой вывод принимать нельзя, поскольку приемлемым уровнем ошибочности вывода, когда он может быть принят, является 5% уровень ошибочности и ниже, т.е. р <0,05. Следовательно, в этом случае нельзя сделать вывод о наличии достоверных различий между двумя группами данных.

Можно проверить данный вывод и другим путем. Возьмем экспериментальное значение критерия Стьюдента, равное 0,180, и сравним его с критическим значением, взятым из таблицы на строке, где указана степень свободы выборки — 14. Критическое значение при уровне значимости 0,05 (т.е. допускаем 5% уровень ошибочности вывода) — составило 2,23. Следовательно, экспериментальное значение критерия не превысило критического значения, а это не дает нам права делать вывод о наличии достоверных различий. Как видим, оба вывода, сделанные разными путями, — совпали.

Важно отметить, что знак, стоящий перед экспериментальным значением критерия (в данном случае знак «минус»), не учитывается при сравнении с критическим значением: сравнение идет по модулю. А знак указывает лишь на тот факт, что среднее арифметическое значение во второй группу данных оказалось выше, чем в первой группе данных.

Вы можете оставить комментарий, или ссылку на Ваш сайт.
Как сделать ремонт автомобиля своими руками как проверить насос автономки вебасто Здесь вы найдете видео по ремонту авто.

Оставить комментарий

Вы должны быть авторизованы, чтобы разместить комментарий.