Метод расчета тау-критерия для выделения артефактов

Остановимся в заключительной части занятия на одном важном аспекте нормирования результатов. Как было показано выше, оценка нормальности распределения важна, прежде всего, для изучения вопроса о возможности нормирования результатов. Но бывают случаи, когда большая часть данных подчиняется закону нормального распределения и только какое-нибудь одно или два значения выбиваются из общей картины, т.е. отстоят слишком далеко от основного массива данных. Такое случается, если в ходе эксперимента были зафиксированы не естественные проявления изучаемого признака, а какие-то искусственные помехи или ошибочные измерения. Эти искусственные факты называются в науке «артефактами». Они способны существенно исказить форму частотного распределения (растянуть его к концам) и за счет этого изменится одна из главных характеристик распределения – величина среднего квадратичного отклонения. Сравнивать такое искаженное распределение с нормальным просто некорректно, т.к. оно заведомо является не нормальным.

В этой связи при обнаружении того, что какие-то значения сильно отклоняются от общей массы данных в сторону слишком низких или слишком высоких значений, целесообразно произвести проверку на предмет отнесения их к артефактам (искусственным отклонениям) и исключить их в этом случае. Это сделает распределение более истинным, включающим только реальные проявления изучаемого признака.

Обычно артефакты  выглядят как слишком большие или слишком маленькие значения среди остальной совокупности результатов. Поэтому если все результаты выстроить в ряд по мере их возрастания, то артефакты обычно оказываются в самых крайних точках такого распределения. В этой связи целесообразно анализировать, принадлежат ли данной совокупности результатов  именно крайние значения (первое и последнее) или же они являются инородными точками искусственного происхождения.

Подобного рода вопросы могут возникать, например, при измерении кожно-гальванической реакции (КГР) на полиграфе, который иногда используют как «детектор лжи». Дело в том, что электроды, наложенные на поверхность руки испытуемого для измерения КГР очень чувствительны не только к  изменениям сопротивления кожи, но и к перемещению руки. Поэтому если испытуемый неожиданно сдвинул руку (от чихания или от вздрагивания при громком звуке), то это отразится на величине показателя КГР  — он сильно увеличится. Построив после эксперимента распределение данных, мы увидим, что одно значение будет сильно отличаться от остальных по величине и будет далеко отстоять на графике от всей остальной массы результатов. Таким значением окажется как  раз то, что появилось по причине  случайного сдвига руки. Оно не отражает истинного значения КГР на тот момент времени, можно сказать, что артефакт «маскирует»  истинное значение, поэтому его следует убрать. Вместе с ним пропадет, конечно, и одно истинное значение, но зато не исказятся общие по группе статистические показатели (М, σ и другие), а это — важнее.

Для того, чтобы определить, принадлежит какое-то крайнее значение выборке, либо оно является отдельно стоящим артефактом, существует специальный критерий под названием тау-критерий, он обозначается греческой буквой «τ». Поскольку этот критерий направлен на проверку первого (самого маленького) члена в группе данных и последнего (самого большого) члена в этой группе, он включает две формулы, где  «τ1» относится к первому члену, а «τk» относится к последнему (конечному) члену, т.к. количество членов в выборке равно k:

3

Произведем расчет тау-критерия на одном примере.

Как мы уже отмечали, измерение КГР таит в себе опасность зафиксировать артефакт, поэтому необходимо проверять, все ли показатели, полученные с помощью КГР (например, показатели работоспособности), действительно являются истинными, т.е. принадлежат изучаемой характеристике. Предположим, мы получили некоторые показатели работоспособности, которые упорядочили по мере возрастания:

-0,93       -0,38     -0,24    -0,16  …………. +0,12    +0,14     +0,15     +0,43

Проверим сначала  принадлежность первого члена данной выборке, а затем последнего:

4

Получив экспериментальные значения τ-критерия, сравним их с критическими значениями, которые приведены в статистической таблице данного критерия.

Таблица 3
Значения тау- критерия  (τ) для 1% уровня значимости р=0,01

k τ k τ k τ k τ
4 0,991 11 0,566 17 0,460 24 0,401
5 0,916 12 0,541 18 0,449 25 0,395
6 0,805 13 0,520 19 0,439 26 0,391
7 0,740 14 0,502 20 0,430 27 0,388
8 0,683 15 0,486 21 0,421 28 0,386
9 0,635 16 0,472 22 0,414 29 0,385
10 0,597     23 0,407 30 0,384

В таблице нужную строку критических значений надо выбирать с учетом количества членов выборки (k) — это значит, что мы берем общее количество анализируемых данных (результатов). Допустим, в нашем примере было получено 24 результата, тогда критическое значение на соответствующей строке таблице равно 0,401 – с ним мы и будем сравнивать полученные  экспериментальные значения τ1 и τk. Чтобы сказать, что тот или иной  крайний член существенно отличается от остальных значений группы, т.е. является артефактом, необходимо, чтобы экспериментальное значение превысило критическое (как во многих критериях).

Как видим, экспериментальное значение для первого члена (τ1=0,5) превысило критическое значение, равное 0,4, следовательно, такой результат, как (-0,93) не принадлежит выборке, и его можно исключить из дальнейшего анализа (оно – артефакт). Экспериментальное значение для последнего члена (τk=0,35) не превысило критического значения, поэтому его нельзя отбросить и считать артефактом.

В заключение заметим, что при расчетах τ-критерия необходимо подставлять в формулу проверяемое значение результата вместе с его знаком (плюсом или минусом)!  Хотя в ряде статистических критериев знак не учитывается при сравнении с критическими значениями (в частности, для критерия Стьюдента и критерия Вилкоксона).

Вы можете оставить комментарий, или ссылку на Ваш сайт.
Выполнена врезка замков в металлические двери , специалисты советуют закрывать на два замка.

Оставить комментарий

Вы должны быть авторизованы, чтобы разместить комментарий.