7.4 Разделение наблюдений на группы

7.4 Разделение наблюдений на группы


В SPSS можно выполнять анализ данных раздельно по группам. Группой в этом контексте называется определенное количество наблюдений с одинаковыми значениями признаков. Чтобы можно было производить обработку по группам, файл должен быть отсортирован по группирующим переменным. Такой переменной может быть, например, переменная sex. В этом случае все переменные со значением признака 1 (женский) образуют одну группу, а все переменные со значением признака 2 (мужской) — другую группу. С каждой группой можно проводить определенные операции, например, выполнять частотный анализ. При этом частотный анализ проводится раздельно для признаков мужской и женский. В SPSS такое разделение на группы можно выполнять автоматически. Рассмотрим следующий пример, основанный на опросе студентов об их психическом состоянии и социальном положении:


Проведем частотный анализ переменной psyche (психическое состояние) раздельно для всех изучаемых специальностей. В соответствии со значениями переменной fach (специальность) у нас образуются 9 групп (1 = Юриспруденция, 2 = Экономика, 3 = Гуманитарные науки, 4 = Психология и т.д.). В этом случае файл данных studium.sav должен быть сначала отсортирован по переменной fach. Поступите следующим образом:

  •  Загрузите файл studium.sav в редактор данных.

  •  Выберите в меню команды Data (Данные) Split File... (Разделить файл) Откроется диалоговое окно Split File.


Рис. 7.7: Диалоговое окно Split File


По умолчанию разделение на группы не предполагается. Если выбрать пункт Organize output by groups (Разделить вывод на группы), мы получим вывод результатов по каждой группе отдельно. Эти группы должны быть определены в поле Groups based on (Группы, созданные на основе) на базе соответствующих переменных.


Еще одну возможность предоставляет опция Compare Groups (Сравнить группы). Она организует вывод таким образом, что можно визуально сравнить разные группы друг с другом. Но сначала мы рассмотрим раздельный вывод.

  •  Выберите опцию Organize output by groups. Для раздельного выполнения операций по группам необходимо, чтобы файл данных был предварительно отсортирован по этим группирующим переменным. По этой причине опция Sort the file by grouping variables (Сортировать файл по группирующим переменным) выбрана по умолчанию.

  •  Перенесите переменную fach в поле Groups based on. Если выбирается несколько группирующих переменных, то последовательность, в которой они стоят в списке, определяет порядок или приоритет сортировки.

  •  Щелкните на кнопке ОК. Файл studium.sav будет отсортирован по переменной fach, то есть разбит на группы в соответствии с ее значениями. Сообщение File split on (Разделение файла включено) в строке состояния внизу окна SPSS информирует об активации режиме разделения.

  •  Выполните частотный анализ переменной psyche.

Вы получите следующий результат (ниже для экономии места показаны частотные таблицы только для специальностей Юриспруденция и Естественные науки).


Специальность = Юриспруденция


Статистика(а)


Психическое состояние


N Valid


 Missing


22


0


а. Специальность = Юриспруденция


Психическое состояние(а)


Frequency


Percent


Valid Percent


Cumulative Percent


Valid


Крайне неустойчивое


2


9,1


9,1


9,1


Неустойчивое


5


22,7


22,7


31,8


Устойчивое


12


54,5


54,5


86,4


Очень устойчивое


3


13,6


13,6


100,0

Total  22 100,0 100,0

Спциальность = юриспруденция


Специальность = Естественные науки


Статистика(а)


N Valid 


Missing


18


1


а. Специальность = Естественные науки


Психическое состояние(а)


Frequency


Percent


Valid Percent


Cumulative Percent


Valid


Крайне неустойчивое


1


5,3


5,6


5,6


Неустойчивое


4


21,1


22,2


27,8


Устойчивое


11


57,9


61,1


88.9


Очень устойчивое


2


10,5


11,1


100,0


Всего


18


94,7


100,0


Missing


нет данных


1


5,3


Всего


19


100,0


а. Специальность = Естественные науки


Как видно, результаты частотного анализа переменной psyche выводятся раздельно по специальностям студентов.

  •  Теперь выберите другой пункт — Compare groups (Сравнить группы).

  •  Снова выполните частотный анализ переменной psyche. Вы получите следующую результирующую таблицу:

Психическое состояние


Специальность




Frequency


Percent


Valid Percent


Cumulative Percent


Юриспру- денция


Valid


Крайне неустойчивое


2


9,1


9,1


9,1



Неустойчивое


5


22,7


22,7


31,8



Устойчивое


12


54,5


54,5


86,4



Очень устойчивое


3


13,6


13,6


100,0



Всего


22


100,0


100,0



Экономика


Valid


Крайне неустойчивое


1


5,3


5,6


5,6



Неустойчивое


4


21,1


22,2


27,8



Устойчивое


11


57,9


61,1


88,9



Очень устойчивое


2


10,5


11,1


100,0



Всего


18


94,7


100,0



Missing


нет данных


1


5,3




Total


19


100,0





Гуманитар- ные науки


Valid


Крайне неустойчивое


10


40,0


40,0


40,0



Неустойчивое


14


56,0


56,0


96,0



Устойчивое


1


4,0


4,0


100,0



Всего


25


100,0


100,0



Психология


Valid


Крайне неустойчивое


3


27,3


27,3


27,3



Неустойчивое


6


54,5


54,5


81,8



Устойчивое


2


18,2


18,2


100,0



Всего


11


100,0


100,0



Теология


Valid


Крайне неустойчивое


2


22,2


22,2


22,2



Неустойчивое


5


55,6


55,6


77,8



Устойчивое


2


22,2


22,2


100,0



Всего


9


100,0


100,0



Медицина


Valid


Крайне неустойчивое


1


10,0


10,0


10,0



Неустойчивое


3


30,0


30,0


40,0



Устойчивое


5


50,0


50,0


90,0



Очень устойчивое


1


10,0


10,0


100,0



Всего


10


100,0


100,0



Естествен- ные науки


Valid


Неустойчивое


3


33,3


33,3


33,3



Устойчивое


6


66,7


66,7


100,0



Всего


9


100,0


100,0



Техника


Valid


Крайне неустойчивое


1


50,0


50,0


50,0



Устойчивое


1


50,0


50,0


100,0



Всего


2


100,0


100,0



Прочие


Valid


Устойчивое


1


100,0


100,0


100,0


Учтите, что файл данных останется разделенным на подгруппы, пока вы не деактивируете соответствующие опции. Для этого поступите следующим образом: 

  •  Выберите в меню команды Data (Данные) Split File... (Разделить файл)

  •  В диалоговом окне Split File выберите опцию Analyze all cases, do not create groups (Анализировать все наблюдения, не создавать группы). Теперь разделение файла убрано.

  •  Если требуется дополнительно убрать сортировку по специальностям, выберите в меню следующие команды Data (Данные) Sort Cases... (Сортировать наблюдения)

  •  Перенесите переменную fragebnr (код анкеты) в список переменных сортировки и подтвердите операцию кнопкой ОК. Данные будут отсортированы в исходном порядке — по номерам анкет.

На этом мы заканчиваем обзор возможностей отбора данных в SPSS и переходим к изучению средств модификации данных.

7.gif

Изображение: