Расчет описательных статистик (Descriptive Statistics)

Описательные статистики – это основные математические параметры, которыми можно описать имеющееся распределение данных, если оно носит характер близкий к нормальному распределению, т.е. имеет вид «колоколообразной» кривой.

В число описательных статистик входят такие показатели, как:

  • среднее арифметическое значение величин, представленных в конкретной переменной;
  • стандартное отклонение (среднее квадратичное отклонение, отражающее степень разброса данных вокруг величины среднего арифметического значения);
  • максимальное значение в континууме результатов переменной;
  • минимальное значение в континууме результатов переменной.

Для начала обработки данных по этому методу необходимо сначала нажать команду «Analyze», расположенную над таблицей базы данных, затем выбрать курсором из предложенного меню методов анализа строку Descriptive Statistics, а далее  из уточняющего списка – строку Descriptives.

Выбор нужного метода обработки данных из меню методов

Выбор нужного метода обработки данных из меню методов

Окно для выбора нужных для анализа переменных из предложенного списка переменных, взятого автоматически из базы данных

Окно для выбора нужных для анализа переменных из предложенного списка переменных, взятого автоматически из базы данных

После этого откроется окно, где потребуется отобрать из списка номера тех переменных, для которых будет производиться расчет статистик.

В левом окошке (в квадрате, расположенном в левой части открывшегося окна) сначала выдается весь список переменных, которые фигурируют в базе данных. Вы должны выбрать и перевести в правое окошко те из них, для которых будут рассчитываться описательные статистики. Например, сначала появились 2 переменные, а  Вы хотели бы выбрать только первую из них. Тогда Вы наводите курсор на первую строку, где стоит VAR 00001,а затем нажимаете стрелку, указывающую вправо, и тогда данная переменная переместиться в правое окно. Поместив таким образом все необходимые переменные в правое окошко,  Вы можете нажать кнопку «OК» в нижней части общего окна, после чего начнется процесс обработки данных.

По истечении нескольких секунд на экране сменится картинка и появится окно «OutPut» с результатами расчетов описательных статистик. (Если окно не откроется в течение 2-х секунд, значит, оно находится в свернутом виде и его можно открыть через вкладку SPSS, расположенную в панели задач, самой нижней части экрана).

Результаты расчетов описательных статистик будут представлены в виде таблицы.

Descriptive Statistics
N Minimum Maximum Mean Std. Deviation
VAR00001 4 23,00 78,00 48,7500 22,60347
Valid N (listwise) 4

В  выданной таблице будет указано:

  • VAR  — номер обработанной переменной (столбца с набором данных);
  • N  —  количество рассмотренных случаев;
  • Minimum – минимальное значение в выборке данных;
  • Maximum – максимальное значение в выборке данных;
  • Mean – среднее арифметическое значение;
  • Std. Deviation – стандартное отклонение (среднее квадратичное отклонение, т.е. величина сигмы — σ).

Термин «стандартное отклонение» применяется к большой по размеру выборке (генеральной совокупности), но по сути он идентичен понятию «среднее квадратичное отклонение», которое обозначается как величина сигмы – σ и применяется к  малочисленным выборкам. Величина сигмы показывает, насколько далеко в среднем отклоняются точечные значения в выборке от величины среднего арифметического значения. При большой величине сигмы разброс будет широким, а при малом значении – узком. Поскольку всё распределение (весь его размах влево и вправо от среднего) обычно укладывается в 6 сигм, то зону средних величин можно очертить, добавив к величине среднего арифметического значения М + 1 σ. Однако следует помнить, что описательные статистики (или как их еще называют «параметры» распределения, когда речь идет о генеральной совокупности) применяются для описания особенностей нормального распределения данных или распределения, близкого к нормальному.

Например, в данном случае зона средних значений будет определяться следующим образом: 48,75 + 22,60 ,т.е. средняя зона будет начинаться от значения 26,15 и простираться до 71,35.

Это важно знать для процедуры нормирования результатов, чтобы выделить среди всего континуума полученных данных зоны высоких средних и низких значений (в частности при нормировании психологических тестов).

Но если имеющееся у Вас распределение данных не подчиняется закону нормального распределения, что можно оценить с помощью критерия Колмогорова – Смирнова, тогда расчет зон средних, высоких и низких  должен осуществляться по иной статистической процедуре. Эта процедура предполагает расчет критических перцентилей или как еще называют эту процедуру — метод «нормирования по перцентильной кривой».

За более подробными разъяснениями по интерпретации результатов, полученных по этому и другим методам статистики, обращайтесь здесь же на сайте в раздел: «Популярное изложение методов статистической обработки данных».

Если Вам  необходимо скопировать полученную таблицу результатов, то Вы должны воспользоваться правой клавиши «мыши» и выбрать команду «Copy» и традиционным способом перенести её в другой файл (в Word или Excel) через команду «Вставить».

После завершения работы с окном выданных результатов (OutPut) можно  вернуться к начальной таблице базы данных (Data Set) путем вызова его из числа свернутых окон (навести курсор на ярлык SPSS в нижней части страницы).

Вы можете оставить комментарий, или ссылку на Ваш сайт.

Оставить комментарий

Вы должны быть авторизованы, чтобы разместить комментарий.