19.2 Пример из области социологии
Изложенный метод будет проиллюстрирован на примере анкеты, составленной в Институте Социологии Университета Марбург. На основе этой анкеты на двух гессенских металлургических предприятиях было произведено исследование отношения к иностранцам. Опрашиваемым предложили высказать свое отношение к следующим пятнадцати положениям:
1. Необходимо улучшить интеграцию иностранцев.
2. Необходимо мягче относиться к беженцам.
3. Деньги Германии должны быть потрачены на нужды страны.
4. Германия — это не служба социальной помощи для всего мира.
5. Необходимо стараться налаживать хорошие отношения друг с другом.
6. Права беженцев следует ограничить.
7. Немцы станут меньшинством.
8. Право беженцев необходимо охранять во всей Европе.
9. Враждебность к иностранцам наносит вред экономике Германии.
10. Сначала необходимо создать нормальные жилищные условия для немцев.
11. Мы ведь тоже практически везде являемся иностранцами.
12. Мультикультура означает мультикриминал.
13. В лодке нет свободных мест.
14. Иностранцы вон.
15. Интеграция иностранцев — это убийство нации.
Оценки ставились по семибальной шкале: от полного несогласия (1) до полного согласия (7). Результаты опроса для 90 человек хранятся в файле ausland.sav в переменных а1-а15.
Откройте файл ausland.sav. В файле Вы заметите несколько дополнительных переменных, о которых мы расскажем позже.
Выберите в меню Analyze (Анализ) Data Reduction (Сокращение объема данных) Factor... (Факторный анализ)
Откроется диалоговое окно Factor Analysis (Факторный анализ) (см. рис. 19.1).
Рис. 19.1: Диалоговое окно Factor Analysis (Факторный анализ)
Переменные a1-a15 поместите в поле тестируемых переменных и ознакомьтесь с возможностями, предлагаемыми различными кнопками этого диалогового меню.
После щелчка по кнопке Descriptive Statistics (Дескриптивные статистики) оставьте вывод первичных результатов, которые включают в себя первичные относительные дисперсии простых факторов, собственные значения и процентные доли объяснённой дисперсии. Довольно часто бывает необходим также вывод одномерных статистик и корреляционных коэффициентов.
С помощью кнопки Extraction... (Отбор) Вы можете выбрать метод отбора; оставьте здесь анализ главных компонентов, установленный по умолчанию. Количество отобранных в этом случае факторов приравнивается к числу собственных значений, превосходящих единицу. У Вас также есть возможность собственноручно указать это количество. Так как неповёрнутое факторное решение, предоставляет малозначимую информацию, предотвратите его вывод щелчком на соответствующей опции.
Выключатель Rotation... (Вращение) позволяет выбрать метод вращения. Активируйте метод варимакса и оставьте активированным вывод повёрнутой матрицы факторов. Далее вы можете организовать вывод факторных нагрузок в графическом виде, в котором первые три фактора будут представлены в трёхмерном пространстве; в случае наличия только двух факторов в слое приводится только одно изображение.
Если Вы хотите найти значения факторов и сохранить их в виде дополнительных переменных задействуйте выключатель Scores... (Значения) и отметьте Save as variables (Сохранить как переменные). По умолчанию установлен регрессионный метод. Выключатель Options... (Опции) предназначен для обработки пропущенных значений. Здесь обеспечивается возможность заменить пропущенные значения средними значениями соответствующих переменных.
Для проведения расчётов щёлкните на ОК.
В окне обзора появятся результаты. Сначала приводятся первичные статистики:
Total Variance Explained
(Объяснённая суммарная дисперсия) | ||||||
Compo-nent (Компо-ненты) | Initial Eigenvalues (Первичные собственные значения) | Rotation Sums of Squared Loadings (Повёрнутые суммы квадратов нагрузок) | ||||
Total (Сумма) | % of Variance (% диспе-рсии) | Cumulative % (Сово-купный %) | Total (Сум-ма) | % of Variance (% дис-персии) | Cumu-lative % (Сово-купный %) | |
1 | 5,146 | 34,308 | 34,308 | 3,466 | 23,105 | 23,105 |
2 | 1,945 | 12,970 | 47,278 | 2,536 | 16,907 | 40,013 |
3 | 1,415 | 9,433 | 56,711 | 2,505 | 16,698 | 56,711 |
4 | ,990 | 6,601 | 63,312 | |||
5 | ,936 | 6,238 | 69,550 | |||
6 | ,760 | 5,068 | 74,617 | |||
7 | ,693 | 4,622 | 79,240 | |||
8 | ,612 | 4,083 | 83,323 | |||
9 | ,529 | 3,529 | 86,852 | |||
10 | ,473 | 3,151 | 90,004 | |||
11 | ,433 | 2,889 | 92,893 | |||
12 | ,339 | 2,262 | 95,1555 | |||
13 | ,301 | 2,007 | 97,161 | |||
14 | ,245 | 1,635 | 98,797 | |||
15 | ,181 | 1,203 | 100,000 |
Extraction Method: Principal Component Analysis (Метод отбора: Анализ главных компонентов).
По таблице можно увидеть, что три собственных фактора имеют значения превосходящие единицу. Следовательно для анализа отобрано только три фактора. Первый фактор объясняет 34,308 % суммарной дисперсии, второй фактор 12,97 % и третий фактор 9,433 %. Так как мы запретили вывод неповернутой матрицы факторов, то далее приводится повёрнутая матрица (см. следующую таблицу).
При факторном анализе постоянно появляются сообщения об ошибках, — так нам жаловался один пользователь, — например 2,56Е-02 и т.п. Действительно такой формат вывода в глазах непосвященного пользователя очень портит картину всей таблицы. Это, так называемый, Е-формат, знакомый всем программистам по языку Фортран (Fortran), где буква Е соответствует 10 в некоторой степени; для числа 2,5Е-02 можно было бы записать и 0,0256. Во втором примере (гл. 19.3) мы покажем Вам, как выходить из такой ситуации.
Rotated Component Matrix a
(Повёрнутая матрица компонентов) | |||
Component (Компонент) | |||
1 | 2 | 3 | |
А1 | -,466 | ,628 | -,191 |
А2 | -,141 | ,657 | ,215 |
A3 | ,327 | -,153 | ,711 |
А4 | ,533 | -,106 | ,394 |
А5 | -,362 | ,783 | 4.52Е-02 |
А6 | -1.2Е-02 | -3.8Е-02 | ,763 |
А7 | ,525 | 3.58Е-02 | ,543 |
А8 | -,117 | ,719 | -,267 |
А9 | 2.56Е-02 | ,551 | -8.8Е-02 |
А10 | ,252 | -9.5Е-02 | ,685 |
А11 | ,125 | ,392 | -,292 |
А12 | ,802 | -,199 | ,108 |
А13 | ,685 | -,110 | ,465 |
А14 | ,837 | -,144 | -2.5Е-02 |
А15 | ,725 | -4.8Е-02 | ,144 |
Extraction Method: Principal Component Analysis ((Метод отбора: Анализ главных компонентов).
Rotation Method: Varimax with Kaiser Normalization (Метод вращения: Варимакс с нормализацией Кайзера),
a. Rotation converged in 8 iterations (Вращение осуществлено за 8 итераций).
Здесь начинается самая интересная часть факторного анализа: Вы должны попытаться объяснить отобранные факторы. Для этого возьмите в руки карандаш и в каждой строке повёрнутой факторной матрицы отметьте ту факторную нагрузку, которая имеет наибольшее абсолютное значение.
Как уже было сказано, эти факторные нагрузки следует понимать как корреляционные коэффициенты между переменными и факторами. Так переменная a1 сильнее всего коррелирует с фактором 2, а именно, величина корреляции составляет 0,628, переменная а2 также сильнее всего коррелирует с фактором 2 (0,657), переменная же а3 коррелирует сильнее всего с фактором 3 (0,711) и т.д. В большинстве случаев включение отдельной переменной в один фактор, осуществляемое на основе коэффициентов корреляции, является однозначным. В исключительных случаях, к примеру, как в ситуации с переменной а7, переменная может относиться к двум факторам одновременно. Могут быть также и переменные, в нашем примере a11, которыми нельзя нагрузить ни один из отобранных факторов.
Если поступить так, как изложено выше, то варианты мнений, указанные вначале рассмотрения примера, можно отнести в следующем порядке к трём факторам:
Фактор 1:
Германия — это не служба социальной помощи для всего мира.
Немцы станут меньшинством.
Мультикультура означает мультикриминал.
В лодке нет свободных мест.
Иностранцы вон.
Интеграция иностранцев — это убийство нации.
Фактор 2
Необходимо улучшить интеграцию иностранцев.
Необходимо мягче относиться к беженцам.
Необходимо стараться налаживать хорошие отношения друг с другом.
Права беженцев необходимо охранять во всей Европе.
Враждебность к иностранцам наносит вред экономике Германии.
Мы ведь тоже практически везде являемся иностранцами.
Фактор 3
Деньги Германии должны быть потрачены на нужды страны.
Права беженцев следует ограничить.
Немцы станут меньшинством.
Сначала необходимо создать нормальные жилищные условия для немцев.
Из-за равных по величине нагрузок, как для фактора 3, так и для фактора 1, положение "Немцы станут меньшинством" включено в оба фактора. Теперь мы подошли к последнему и решающему шагу факторного анализа: необходимо обнаружить и описать смысловую связь факторов. В рассматриваемом примере это можно сделать без особых усилий.
Первый фактор, и это очевидно, собрал все положения, враждебно настроенные по отношению к иностранцам. На основании позитивных корреляционных коэффициентов участвующих переменных с фактором и принимая во внимание полярность значений переменных (большое значение означает полное согласие) большое значение фактора означает высокую враждебность к иностранцам.
Во второй фактор входят те положения, которые указывают на дружелюбное отношение к иностранцам. Большое значение фактора означает здесь доброжелательное отношение к иностранцам.
Во второй фактор вошли точки зрения, соответствующие осторожному отношению к иностранцам; в противоположность к первому фактору это не враждебные точки зрения, а по большей части социальные страхи (деньги, жильё в первую очередь для немцев и т.д.). Большое значение фактора указывает здесь на высокую степень социального сомнения.
В соответствии с порядком изложения эти три фактора можно кратко охарактеризовать при помощи следующих выражений: Враждебная позиция, Доброжелательная позиция и Социальные страхи. Однако столь явно, как в приведенном примере факторы удаётся объяснить не всегда. Если нет возможности провести вербальное объяснение факторов, то факторный анализ можно считать неудавшимся.
Значения факторов
Поскольку мы пожелали произвести расчёт значений факторов, то в соответствии с тремя отобранными факторам были сгенерированы три новые переменные, на-
званные fac1_1, fac2_1 и fac3_1, которые содержат вычисленные значения факторов. Если Вы просмотрите текущий файл после поведения факторного анализа, то сможете увидеть имеющие нормализованные значения факторов. По каждому из отобранных фактору для каждого опрошенного было рассчитано специальное факторное значение. Факторное значение, как правило, лежит в пределах —3 до +3.
Рассмотрим факторную переменную fac1_1. Она включает следующие элементарные переменные: а4, а12, а13, а14 и а15. В качестве метки для этого фактора мы выбрали выражение: "Враждебная позиция". Большое положительное значение фактора означает одобрение элементарных переменных, то есть положений, входящих в этот фактор. Одобрение элементарных переменных, относящихся к первому фактору, тождественно ярко выраженным расистским взглядам. Для подтверждения этого факта рассмотрим два примера. Наблюдение 4 характеризуется очень низким факторным значением в переменной fac1_1. Оно равно —2,00455. В данном случае можно сделать заключение о том, что здесь не наблюдается расистская направленность или она очень слаба. Соответственно этому ведут себя и отдельные значения элементарных переменных (а4 = 2, а13 = 1, а14 = 1, а15 = 1). Наблюдение 17, в отличие от наблюдения 4, характеризуется очень высоким положительным значением фактора, который равен 3,14801. Основываясь на этом значении, мы можем исходить из того, что здесь явно заметна экстремально-расистская позиция. Соответственно этому ведут себя и отдельные значения элементарных переменных (а4 = 7, а13 = 7, а14 = 7, а15 = 7).
Рассмотрим факторную переменную fac2_1. К ней относятся элементарные переменные: a1, a2, а5, а8, а9 и a11. В качестве метки для этого фактора мы выбрали выражение: "Доброжелательная позиция". Большое положительное значение фактора означает полное согласие. Полное согласие соответствует дружелюбному отношению к иностранцам. И здесь рассмотрим два выборочных примера. Наблюдение 17 характеризуется очень малым значением фактора, которое составляет —3,32632. Основываясь на значении этого фактора можно сделать вывод, что едва ли в этом случае присутствует доброжелательное отношение к иностранцам. Соответственным образом ведут себя и отдельные значения элементарных переменных (a1 = 1, а2 = 1, а5 = 1, а8 = 2, а9 = 4, a11 = 6). В наблюдении 17 и следовало ожидать низкого значения фактора, так как здесь наблюдается высокое положительное факторное значение для факторной переменной fac1_1. В таком случае говорят, что существует отчётливая консистенция. По сравнению с предыдущим наблюдением, наблюдение 6 характеризуется очень высоким положительным значением факторной переменной fac2_1. Оно равно 1,23438. Исходя из значения фактора, можно сделать вывод, что существует сильное дружелюбное отношение к иностранцам. Соответственным образом ведут себя и отдельные значения элементарных переменных (a1 = 7, а2 = 7, а5 = 7, а8 = 7, а9 = 7, a11 = 7).
В заключение рассмотрим факторную переменную fac3_1. К ней относятся элементарные переменные аЗ, а6, а7 и а10. В качестве метки для этого фактора мы выбрали выражение: "Социальные страхи". Большое положительное значение фактора означает одобрение элементарных переменных. Одобрение элементарных переменных тождественно ярко выраженным социальным страхам. Рассмотрим для доказательства этого факта два примера. Наблюдение 5 характеризуется очень низким значением факторной переменной fac3_1. Оно равно —1,66369. В этом случае наблюдаются очень слабые социальные страхи и едва ли на основании социальных страхов можно наблюдать враждебное отношение к иностранцам. Соответственно этому ведут себя и отдельные значения элементарных переменных (аЗ = 5, аб = 2, а7 = 2, а 10 = 1). Наблюдение 43 в отличие от наблюдения 5 характеризуется очень высоким положительным факторным значением. Оно равно 1,93125. В этом случае наблюдаются очень сильные социальные страхи. Соответственным образом ведут себя и отдельные значения элементарных переменных (аЗ = 7, аб = 7, а7 = 7, а 10 = 7). В файле ausland.sav находятся ещё несколько дополнительных переменных, а именно:
| Удовлетворённость собственным местом в экономических отношениях (1 = да, 2 = нет) |
| Год рождения (1 = 1935-1949, 2 = 1941-1950, 3 = 1951-1960, 4 = 1961-1970) |
| Пол (1 = мужской, 2 = женский) |
| Социально-политическая активность (1 = да, 2 = нет) |
| Занимаемая должность (1 = рабочий, 2 = специалист, 3 = служащий) |
Эти переменные можно использовать для того, чтобы устанавливать связи для факторных значений. Самым распространённым методом для этого является разбиение факторных значений на четыре группы процентилей (см. гл. 8.6.2). Покажем это на примере первого факторного значения (переменная facl_l).
Выберите в меню Transform (Трансформировать) Rank Cases... (Создать иерархию наблюдений)
Откроется диалоговое окно Rank Cases (Создать иерархию наблюдений).
Переменную fac1_1 перенесите в список тестируемых переменных.
Щёлкните на выключателе Rank Types... (Типы иерархии), деактивируйте установленную по умолчанию опцию Rank (Ранг) и активируйте опцию Fractional rank as % (Дробный ранг как процентили). Оставьте установленное по умолчанию количество групп равное 4.
Подтвердите свой выбор нажатием на Continue (Далее) и затем на ОК.
Будет создана переменная nfac1_1, которая содержит значения 1 до 4 с примерно равномерной частотой.
Перейдите в редактор данных и измените имя переменной nfac1_1 на более удобное имя ausfeind, в поле метки наберите Враждебное отношение и значениям присвойте следующие метки: 1 = отсутствует, 2 = слабое, 3 = сильное и 4 = очень сильное. Теперь создадим таблицу сопряженности для новой переменной и переменной stellung (Занимаемая должность).
Выберите в меню Analyze (Анализ) Descriptive Statistics (Дескриптивные статистики) Crosstabs... (Таблицы сопряженности)
В диалоговом окне Crosstabs (Таблицы сопряженности) переменную stellung поместите в поле строк, а переменную ausfeind в поле столбцов и через выключатель Cells... (Ячейки) сделайте дополнительно запрос на вывод процентных значений по строкам.
В окне просмотра появится следующая таблица сопряженности.
berufliche Stellung * fremdenfeindliche Einstellung Crosstabulation
(Занимаемая должность * Враждебное отношение Таблица сопряженности ) | |||||||
| fremdenfeindliche Einstellung (Враждебное отношение) | Total (Сум-ма) | |||||
keine (отсу-тствует) | swach (сла- бое) | stark (силь-ное) | sehr stark (очень силь- ное) | ||||
beru-fliche Ste- llung (Зани-маемая дол-жность) | Arbe- iter (Рабо-чий) | Count (Коли-чество) | 6 | 7 | 7 | 11 | 31 |
% within berufliche Stellung (% от Зани-маемой долж-ности) | 19,4% | 22,6% | 22,6% | 35,5% | 100,0% | ||
Facha-rbeiter (Специ-алист) | Count (Коли-чество) | 5 | 7 | 7 | 8 | 27 | |
% within beru-fliche Stellung (% от Зани-маемой долж-ности) | 18,5% | 25,9% | 25,9% | 29,6% | 100,0% | ||
Anges-tellte (Служа-щий) | Count (Коли-чество) | 10 | 9 | 8 | 3 | 30 | |
% within beru-fliche Stellung (% от Зани-маемой долж-ности) | 33,3% | 30,0% | 26,7% | 10,0% | 100,0% | ||
Total (сумма) |
| Count (Коли-чество) | 21 | 23 | 22 | 22 | 88 |
% within beru-fliche Stellung (% от Зани-маемой долж-ности) | 23,9% | 26,1% | 25,0% | 25,0% | 100,0% |
Враждебное отношение к иностранцам у рабочих и специалистов выражено ярче, чем у служащих. Однако тест по критерию Хи-квадрат демонстрирует о незначимом различии.
Попытайтесь найти связи между другими факторными значениями и переменными.