14.6 Отдельный тест по критерию хи-квадрат

14.6 Отдельный тест по критерию хи-квадрат


С помощью этого теста проверяют, насколько значительно отличаются друг от друга наблюдаемые и ожидаемые частоты переменных, относящихся к номинальной шкале. Как правило, при этом ожидаемая частота подчиняется равномерному распределения; однако в SPSS существует возможность задать соответствующие пропорции.


Одним из примеров ожидаемого равномерного распределения частот являются кости. Предположим, Вы бросили один игральную кость 3000 раз и получили следующее частоты для выпавших очков.


Число очков


Частота


Число очков


Частота


1


511


4


498


2


472


5


513


3


572


6


434


Исходя из предположения об идеальности игральную кость (равной вероятности выпадения любого числа очков), ожидаемая частота для каждого из выпавших чисел составит 3000 / 6 = 500. Необходимо проверить, значимо ли отличаются наблюдаемые частоты от ожидаемых. Данные, а именно переменные augen (число очков) и n (частота), находятся в файле wuerfel.sav. Последнюю переменную следует применить в качестве весовой переменной.

  •  Откройте файл wuerfel.sav.

  •  Сначала выберите в меню Data (Данные) Weight Case (Взвесить наблюдения)

  •  Переменную n объявите частотной (см. гл. 8.7), выберите в меню Analyze (Анализ) Nonparametric Tests (Непараметрические тесты) Chi-Square (Хи-квадрат) Откроется диалоговое окно Chi-Square Test (Тест хи-квадрат) (см. рис. 14.6).

  •  Перенесите переменную augen в поле тестируемых переменных.

Если Вы, как в рассматриваемом примере, хотите подвергнуть анализу все категории тестируемых переменных, то оставьте в разделе Expected range (Ожидаемый диапазон) включённой опцию Get from Data (Из исходных данных); в противном случае у Вас есть возможность ограничить вовлекаемые категории посредством ввода нижней и верхней границ. Так как ожидаемые частоты одинаковы для всех категорий (была принята гипотеза о равномерном распределении), то эта предварительная установка остаётся в силе.


После нажатия кнопки Опции... у Вас появится возможность организовать вывод характеристик дескриптивной статистики и квартилей (что в данном случае является абсолютно бессмысленным).

  •  Запустите расчёт путём нажатия ОК.

В окне просмотра появятся следующие результаты:


Augenzahl (Число очков)


Observed N (Наблюдаемое N)


Expected N (Ожидаемое N)


Residuals (остатки)


1


511


500,0


11,0


2


472


500,0


-28,0


3


572


500,0


72,0


4


498


500,0


-2,0


5


513


500,0


13,0


6


434


500,0


-66,0


Total (Сумма)


3000


Test Statistics (Статистика теста)


Augenzahl (Число)


Chi-Square (Хи-квадрат) а


21,236


Df


5


Asymp. Sig. (Статистическая значимость)


,001


a. 0 cells (,0%) have expected frequencies less than 5. The minimum expected cell frequency is 500,0. (В 0 ячеек (,0%) ожидаемая частота имеет значение менее 5. Минимальная ожидаемая частота в одной ячейке равна 500,0.)


Получилось очень значимое значение критерия хи-квадрат (р = 0,001). В рассматриваемом случае желателен вывод не абсолютных, а стандартизированных остатков, определяемых по формуле:

 

Рис. 14.6: Диалоговое окно СЫ-Square Test (Хи-квадрат-тест)


(см. гл. 11.1). При помощи основополагающего правила, приведенного в главе 8.7.2, можно точно определить те категории, для которых наблюдается значительное отклонение наблюдаемых частот от ожидаемых:


Стандартизированные остатки >= 2,0 указывают на значительное, >= 2,6 на очень значительное и >= 3,3 на сверх значительное отклонение. Если следовать этому правилу, то в экспериментах с игральной костью наблюдается очень значимое превышение количества выпадений 3 очков и очень, очень значимое занижение количества выпадений 6 очков.


Во втором примере, который принадлежит к области ботаники, нужно проверить не равномерное распределение, а наличие распределения подчиняющегося заданному соотношению.


Потомки трёх сортов бобовой культуры были разделены на три типа, которые находятся в соотношении между собой как 1:2:1. Во время некоторого эксперимента, проведенного с сотней таких потомков тип 1 появился 29 раз, тип 2 — 44 раза и тип 3 — 27 раз. Необходимо исследовать значительно ли отклоняется полученное распределение от теоретического распределения 1:2:1.


Данные находятся в файле bohnen.sav, причём переменная typ соответствует типу, а переменная n частоте.

  •  Откройте файл bohnen.sav.

  •  Сначала действуйте так же, как в первом примере, и взвесьте наблюдения с частотной переменной n.

  •  В диалоговом окне Chi-Square Test (тест Хи-квадрат) присвойте переменной typ статус тестируемой переменной.

  •  В поле Expected values (Ожидаемые значения) активируйте в этот раз опцию Values (Значения). Введите числа 1, 2 и 1 в предусмотренное для этого поле, и щёлкните дополнительно на кнопке Add (Добавить).

  •  Запустите расчёт путём нажатия ОК. В окне просмотра появятся следующие результаты:

Тур (Тип)


Observed N (Наблюдаемое N)


Expected N (Ожидаемое N )


Residual (Остаток)


1


29


25,0


4,0


2


44


50,0


-6,0


3


27


25,0


2,0


Total (Сумма)


100


Test Statistics (Статистика теста)


Тур (Тип)


Chi-Square (Хи-квадрат) а


1,520


Of


2


Asymp. Sig. (Статистическая значимость)


,468


а. 0 cells (,0%) have expected frequencies less than 5. The minimum expected cell frequency is 25,0. (В 0 ячеек (,0%) ожидаемая частота имеет значение менее 5. Минимальная ожидаемая частота в одной ячейке равна 25,0.)


Ожидаемые частоты выстроены в соответствии с заданным соотношением. На сей раз значимого отклонения наблюдаемых частот от ожидаемых не наблюдается (р = 0,468).

6.gif

Изображение: 

7.gif

Изображение: