14.6 Отдельный тест по критерию хи-квадрат
С помощью этого теста проверяют, насколько значительно отличаются друг от друга наблюдаемые и ожидаемые частоты переменных, относящихся к номинальной шкале. Как правило, при этом ожидаемая частота подчиняется равномерному распределения; однако в SPSS существует возможность задать соответствующие пропорции.
Одним из примеров ожидаемого равномерного распределения частот являются кости. Предположим, Вы бросили один игральную кость 3000 раз и получили следующее частоты для выпавших очков.
Число очков | Частота | Число очков | Частота |
1 | 511 | 4 | 498 |
2 | 472 | 5 | 513 |
3 | 572 | 6 | 434 |
Исходя из предположения об идеальности игральную кость (равной вероятности выпадения любого числа очков), ожидаемая частота для каждого из выпавших чисел составит 3000 / 6 = 500. Необходимо проверить, значимо ли отличаются наблюдаемые частоты от ожидаемых. Данные, а именно переменные augen (число очков) и n (частота), находятся в файле wuerfel.sav. Последнюю переменную следует применить в качестве весовой переменной.
Откройте файл wuerfel.sav.
Сначала выберите в меню Data (Данные) Weight Case (Взвесить наблюдения)
Переменную n объявите частотной (см. гл. 8.7), выберите в меню Analyze (Анализ) Nonparametric Tests (Непараметрические тесты) Chi-Square (Хи-квадрат) Откроется диалоговое окно Chi-Square Test (Тест хи-квадрат) (см. рис. 14.6).
Перенесите переменную augen в поле тестируемых переменных.
Если Вы, как в рассматриваемом примере, хотите подвергнуть анализу все категории тестируемых переменных, то оставьте в разделе Expected range (Ожидаемый диапазон) включённой опцию Get from Data (Из исходных данных); в противном случае у Вас есть возможность ограничить вовлекаемые категории посредством ввода нижней и верхней границ. Так как ожидаемые частоты одинаковы для всех категорий (была принята гипотеза о равномерном распределении), то эта предварительная установка остаётся в силе.
После нажатия кнопки Опции... у Вас появится возможность организовать вывод характеристик дескриптивной статистики и квартилей (что в данном случае является абсолютно бессмысленным).
Запустите расчёт путём нажатия ОК.
В окне просмотра появятся следующие результаты:
Augenzahl (Число очков)
Observed N (Наблюдаемое N) | Expected N (Ожидаемое N) | Residuals (остатки) | |
1 | 511 | 500,0 | 11,0 |
2 | 472 | 500,0 | -28,0 |
3 | 572 | 500,0 | 72,0 |
4 | 498 | 500,0 | -2,0 |
5 | 513 | 500,0 | 13,0 |
6 | 434 | 500,0 | -66,0 |
Total (Сумма) | 3000 |
Test Statistics (Статистика теста)
Augenzahl (Число) | |
Chi-Square (Хи-квадрат) а | 21,236 |
Df | 5 |
Asymp. Sig. (Статистическая значимость) | ,001 |
a. 0 cells (,0%) have expected frequencies less than 5. The minimum expected cell frequency is 500,0. (В 0 ячеек (,0%) ожидаемая частота имеет значение менее 5. Минимальная ожидаемая частота в одной ячейке равна 500,0.)
Получилось очень значимое значение критерия хи-квадрат (р = 0,001). В рассматриваемом случае желателен вывод не абсолютных, а стандартизированных остатков, определяемых по формуле:
Рис. 14.6: Диалоговое окно СЫ-Square Test (Хи-квадрат-тест)
(см. гл. 11.1). При помощи основополагающего правила, приведенного в главе 8.7.2, можно точно определить те категории, для которых наблюдается значительное отклонение наблюдаемых частот от ожидаемых:
Стандартизированные остатки >= 2,0 указывают на значительное, >= 2,6 на очень значительное и >= 3,3 на сверх значительное отклонение. Если следовать этому правилу, то в экспериментах с игральной костью наблюдается очень значимое превышение количества выпадений 3 очков и очень, очень значимое занижение количества выпадений 6 очков.
Во втором примере, который принадлежит к области ботаники, нужно проверить не равномерное распределение, а наличие распределения подчиняющегося заданному соотношению.
Потомки трёх сортов бобовой культуры были разделены на три типа, которые находятся в соотношении между собой как 1:2:1. Во время некоторого эксперимента, проведенного с сотней таких потомков тип 1 появился 29 раз, тип 2 — 44 раза и тип 3 — 27 раз. Необходимо исследовать значительно ли отклоняется полученное распределение от теоретического распределения 1:2:1.
Данные находятся в файле bohnen.sav, причём переменная typ соответствует типу, а переменная n частоте.
Откройте файл bohnen.sav.
Сначала действуйте так же, как в первом примере, и взвесьте наблюдения с частотной переменной n.
В диалоговом окне Chi-Square Test (тест Хи-квадрат) присвойте переменной typ статус тестируемой переменной.
В поле Expected values (Ожидаемые значения) активируйте в этот раз опцию Values (Значения). Введите числа 1, 2 и 1 в предусмотренное для этого поле, и щёлкните дополнительно на кнопке Add (Добавить).
Запустите расчёт путём нажатия ОК. В окне просмотра появятся следующие результаты:
Тур (Тип)
Observed N (Наблюдаемое N) | Expected N (Ожидаемое N ) | Residual (Остаток) | |
1 | 29 | 25,0 | 4,0 |
2 | 44 | 50,0 | -6,0 |
3 | 27 | 25,0 | 2,0 |
Total (Сумма) | 100 |
Test Statistics (Статистика теста)
Тур (Тип) | |
Chi-Square (Хи-квадрат) а | 1,520 |
Of | 2 |
Asymp. Sig. (Статистическая значимость) | ,468 |
а. 0 cells (,0%) have expected frequencies less than 5. The minimum expected cell frequency is 25,0. (В 0 ячеек (,0%) ожидаемая частота имеет значение менее 5. Минимальная ожидаемая частота в одной ячейке равна 25,0.)
Ожидаемые частоты выстроены в соответствии с заданным соотношением. На сей раз значимого отклонения наблюдаемых частот от ожидаемых не наблюдается (р = 0,468).