Глава 9. Статистические характеристики

Глава 9. Статистические характеристики

1. Статистические характеристики

Статистические характеристики


Статистические характеристики вычисляются в основном для переменных, относящихся к интервальной шкале. Для этого используются следующие четыре команды меню.


Analyze (Анализ) Descriptive Statistics (Дескриптивные статистики) Descriptives.., (Описательная статистика). Analyze (Анализ) Descriptive Statistics (Дескриптивные статистики) Frequencies... (Частоты). Analyze (Анализ) Descriptive Statistics (Дескриптивные статистики) Explore... (Исследовать)Analyze (Анализ) Reports (Отчеты)Case summaries... (Итоги по наблюдениям)


Создание частотных таблиц рассматривается в главе 6, а исследование данных — в главе 10.


В нижеследующей таблице приведен обзор характеристик, рассчитываемых в SPSS. В меню Descriptives... можно также провести стандартизацию переменных (z-преобразование).


Характе- ристика


Descrip-tives


Frequen- cies


Explore


Case summaries


Среднее значение


X


X


X


X


Сумма


X


X


X


Медиана


X


X


X


Групповая медиана


X


X


Квартиль


X


Процеитиль


X


X


Мода


X


Стандартное отклонение


X


X


X


X


Стандартная ошибка


X


X


X


X


Дисперсия


X


X


X


X


Минимум


X


X


X


X


Максимум


X


X


X


X


Размах


X


X


X


X


Межквартильная широта


X


Эксцесс (вариация)


X


X


X



Асимметрия


X


X


X


X


Стандартная ошибка эксцесса


X


X


X


X


Стандартная ошибка асимметрии


X


X


X


X


Доверительный интервал


X


Гармоническое среднее


X


Геометрическое среднее


X


М-оценка (Хампеля)


X


Выброс


X


Усеченное среднее


X


Статистические характеристики, которые задаются в меню Case summaries, можно также вычислить раздельно по категориям группирующих переменных, относящихся к номинальной или порядковой шкале.


В качестве примера для этой и следующей главы мы рассмотрим исследование, относящееся к области медицины — анализ действия двух различных лекарств (с вымышленными названиями альфасан и бетасан) на снижение кровяного давления у гипертоников. Эти данные хранятся в файле hyper.sav, содержащем 174 наблюдения и значения следующих переменных:


nr


Номер пациента


med


Лекарство (1 = альфасан, 2 = бетасан)


g


Пол (1 = мужской, 2 = женский)


а


Возраст, лет


gr


Рост, см


gew


Вес, кг


rrs0


Систолическое кровяное давление, исходное значение


rrs1


то же, через 1 месяц


rrs6


то же, через 6 месяцев


rrs12


то же, через 12 месяцев


rrd0


Диастолическое кровяное давление, исходное значение


rrd1


то же, через 1 месяц


rrd6


то же, через 6 месяцев


rrd12


то же, через 12 месяцев


chol0


Холестерин, исходное значение


chol1


то же, через 1 месяц


chol6


то же, через 6 месяцев


chol12


то же, через 12 месяцев


bz0


Сахар в крови, исходное значение


bz1


то же, через 1 месяц


bz6


то же, через 6 месяцев


bz12


то же, через 12 месяцев


ak


Возрастной класс (1 = до 55 лет, 2 = 56-65 лет, 3 = 66-75 лет, 4 = более 75)

9.1 Описательная статистика

9.1 Описательная статистика


Для ознакомления с характеристиками описательной статистики рассмотрим переменную а, отражающую возраст.

  •  Загрузите файл hyper, sav и выберите команды меню Analyze (Анализ) Descriptive Statistics (Дескриптивные статистики) Descriptives... (Описательная статистика) Откроется диалоговое окно Descriptives.


Рис. 9.1: Диалоговое окно Descriptives

  •  Перенесите переменную а в список тестируемых переменных, и щелкните на кнопке Options... (Параметры).

Здесь можно задать вычисление следующих статистических характеристик:

  •  Среднего значения,

  •  Суммы,

  •  Стандартного отклонения,

  •  Стандартной ошибки,

  •  Дисперсии,

  •  Минимума,

  •  Максимума,

  •  Размаха,

  •  Эксцесса (вариации),

  •  Асимметрии.

  •  Установите флажки для вывода следующих характеристик: Mean (Среднее значение), Minimum (Минимум), Maximum (Максимум) и S.E. mean (Стандартная ошибка).

Если анализируется несколько переменных, можно также задать последовательность вывода:

  •  в порядке возрастания средних значений,

  •  в порядке убывания средних значений,

  •  по алфавиту (по именам переменных),

  •  согласно списку выбранных целевых переменных.

По умолчанию выбран последний вариант. Если имеется только одна переменная, как в данном примере, порядок не имеет значения.

  •  Пометив желаемые характеристики, щелкните на кнопке Continue... (Далее). В главном диалоговом окне укажите, чтобы стандартизованные значения были сохранены в новой переменной открытого файла данных, для чего установите флажок Save standardized values as variables.

  •  Запустите вычисление, щелкнув на кнопке ОК. Результат будет показан в окне просмотра:

Descriptive Statistics (Описательная статистика)


N


Minimum


Maximum


Mean


Statistic


Statistic


Statistic


Statistic


Std. Error

Statistic

Возраст


174


36


87


62,11


,88


Valid N (listvise) (Допустимых значений (по списку))


174


О значении отдельных характеристик описательной статистики можно прочесть в главе 6.


Видно, что в файле данных появилась новая переменная za. Она содержит нормированные значения переменной а (Возраст). По умолчанию к имени исходной переменной спереди дописывается буква z. При этом стандартизация (z-преобразование) значения х выполняется по формуле


Здесь m — среднее значение переменной, a s — стандартное отклонение.


Проведение стандартизации переменных может быть целесообразным при использовании некоторых статистических методов. Его также можно выполнять в тех случаях, когда несколько переменных, которые имеют различный размах или отличаются на порядки по значению, должны быть приведены к общему показателю. В подобной ситуации сначала необходимо провести стандартизацию этих переменных, а затем, путем усреднения, вывести общее значение из полученных стандартизованых значений (z-зна-чений).

1.gif

Изображение: 

9.2 Сводка наблюдений

9.2 Сводка наблюдений


Этот пункт меню позволяет как выводить значения переменных по наблюдениям, так и вычислять статистические характеристики.


Первую из этих возможностей мы рассмотрели в разделе 4.7; сейчас мы опишем вычисление статистических характеристик. В качестве примера снова выберем файл hyper.sav.

  •  Загрузите файл hyper.sav и выберите команды меню Analyze (Анализ) Reports (Отчеты) Case summaries... (Сводка наблюдений)

Откроется диалоговое окно Summarize Cases (Вывести сводку наблюдений) (см. рис. 9.2).

  •  Перенесите переменную а в правый список и снимите флажок Display Cases (Показывать наблюдения).

  •  Щелкните на кнопке Statistics... (Статистика). Откроется диалоговое окно Summary Report: Statistics (Сводка: Статистика) (см. рис. 9.3).

  •  Выберите в списке вычисление среднего значения (Mean), медианы (Median), гармонического среднего (Harmonic Mean) и геометрического среднего (Geometric Mean).

  •  Кнопка Options... позволяет задать заголовок для сводной таблицы и способ обработки пропущенных значений.


Рис. 9.2: Диалоговое окно Summarize Cases



Рис. 9.3: Диалоговое окно Summary Report: Statistics


В окне просмотра будут показаны следующие результаты:


Case Processing Summary (Обработанные наблюдения)


Cases (Случаи)


Included (Включенные)


Excluded (Исключенные)


Total (Всего)


N


Percent


N


Percent


N


Percent


Возраст


174


100,0%


0


,0%


174


100,0%


Case Summaries (Сводка наблюдений)


Возраст


Mean


Median


Harmonic Mean


Geometric


Mean


62,11


63,00


59,80


60,98


Описательные характеристики можно также вычислить раздельно по категориям группирующей переменной.

  •  Выберите в качестве тестируемой переменной chol0, а в качестве группирующей переменной — g.

  •  Задайте вычисление среднего значения, стандартного отклонения, стандартной ошибки среднего (Std. Error of Mean) и медианы.

В окне просмотра будут показаны следующие результаты:


Case Processing Summary


Cases


Included


Excluded


Total


N


Percent


N


Percent


N


Percent


Холестерин, исходный * Пол


174


100,0%


0


,0%


174


100,0%


Case Summaries


Холестерин, исходный


Пол


Mean


Std. Deviation


Std. Error Mean


Median


мужской


228,95


54,63


7,11


216,00


женский


241,54


46,19


4,31


241,00


Total


237,27


49,42


3,75


234,50


О настройках, предназначенных для вывода значений по наблюдениям см. раздел 4.8. Раздельное вычисление по категориям группирующей переменной можно также выполнить при помощи команд меню Analyze (Анализ) Compare Means (Сравнение средних) Means... (Средние). Analyze (Анализ) Reports (Отчеты) OLAP Cubes... (OLAP-кубы)


Здесь доступны те же характеристики, что и в меню Case summaries...


Метод вычисления в форме OLAP-кубов (Online Analytical Processing) впервые появился в версии 9 SPSS. Он отличается тем, что таблицы, получающиеся при разбиении по группирующим переменным, можно активировать, пользуясь мобильными таблицами.

3.gif

Изображение: 

4.gif

Изображение: