Глава 3. Подготовка данных

Глава 3. Подготовка данных

1. Подготовка данных

Подготовка данных


В этой главе мы на небольшом примере опишем процесс подготовки данных. За основу мы возьмем вымышленный опрос — так называемый "воскресный вопрос", который студенты, изучающие политологию в Марбургском университете, задавали избирателям:


"За кого бы вы голосовали, если бы в воскресенье были выборы в бундестаг?" С помощью следующей анкеты был проведен телефонный опрос 30 человек. Мы ограничили количество респондентов, чтобы избавить вас от ввода слишком большого количества данных.



После заполнения анкет, их следует подготовить для ввода данных в компьютер и обработки с помощью программы SPSS для Windows.

1.gif

Изображение: 

3.1 Кодирование и кодировочная таблица

3.1 Кодирование и кодировочная таблица


Для того чтобы полученные данные можно было обработать, прежде всего следует создать кодировочную таблицу. Кодировочная таблица устанавливает соответствие между отдельными вопросам анкеты и переменными. используемыми при компьютерной обработке данных. Например, пункту анкеты "Пол" может быть поставлена в соответствие переменная sex.


Переменные — это ячейки памяти, в которые можно записывать значения, введенные с клавиатуры. Мы выбрали для переменной имя sex, так как имена переменных в SPSS для Windows могут содержать до восьми символов. Другое, более подробное имя было бы слишком длинным. Имена переменных могут состоять из букв латинского алфавита, цифр и специальных символов; причем первым символом имени должна быть буква.


Переменные могут принимать различные значения. Переменная sex может иметь два возможных значения: "женский" и "мужской". Кодировочная таблица определяет кодовые числа, соответствующие отдельным значениям переменных; например, значению "женский" может соответствовать цифра "1", а значению "мужской" — "2".


Подитожим задачи, которые решаются при составлении кодировочной таблицы:

  •  Кодировочная таблица устанавливает соответствие между отдельным вопросам анкеты и переменными.

  • " Кодировочная таблица устанавливает соответствие между возможным значениями переменных и кодовыми числами.

Для нашей анкеты мы можем составить следующую кодировочную таблицу. Она приводится в самой анкете.


2.gif

Изображение: 

3.2 Матрица данных

3.2 Матрица данных


Предположим, что 30 анкет были заполнены следующим образом:


fragebnr


Sex


age


party


1


W-001


женский


45


ХДС/ХСС


2


W-002


мужской


22


СДПГ


3


W-003


мужской


19


сдпг


4


W-004


женский


42


ХДС/ХСС


5


W-005


мужской


34


Зеленые/Союз 90


6


W-006


женский


72


сдп


7


W-007


мужской


38


СДПГ


8


W-008


женский


56


СДПГ


9


W-009


мужской


61


ХДС/ХСС


10


W-010


женский


77


ХДС/ХСС


11


W-01 1


женский


23


Зеленые/Союз 90


12


W-012


мужской


67


Республиканцы


13


W-013


мужской


79


Прочие


14


W-01 4


женский


26


СДПГ


15


W-01 5


мужской


59


ХДС/ХСС


16


O-001


женский


34


Зеленые/Союз 90


17


O-002


мужской


18


Республиканцы


18


O-003


женский


44


ХДС/ХСС


19


O-004


мужской


68


ХДС/ХСС


20


O-005


женский


33


пдс


21


O-006


мужской


66


ХДС/ХСС


22


O-007


женский


22


нет данных


23


O-008


мужской


нет данных


СДПГ


24


O-009


женский


67


СДПГ


25


O-010


мужской


33


сдп


26


O-011


мужской


44


ХДС/ХСС


27


O-012


женский


22


СДПГ


28


O-013


женский


19


Прочие


29


O-014


женский


55


ХДС/ХСС


30


O-015


мужской


39


СДПГ


Приведенная выше таблица называется матрицей данных. Данные, предназначенные для обработки в SPSS для Windows, должны быть представлены в виде такой матрицы. Матрица данных состоит из определенного числа строк и столбцов. Строки и столбцы образуют прямоугольную таблицу. При этом каждая строка соответствует одной анкете, а каждый столбец — одной переменной. Так как в нашем небольшом опросе участвовало 30 респондентов, матрица содержит 30 строк. Каждая строка включает четыре столбца для переменных fragebnr, sex, age и party.


Мы предполагаем, что опрос проводился как в старых, так и в новых федеральных землях. Опрашивающие должны были отмечать это с помощью буквы перед номером анкеты. Буква "W" с дефисом должна была обозначать старые федеральные земли (West), а буква "О" — новые (Ost). Например, W-001 означает первую анкету, которая была заполнена в старых федеральных землях, а О-005 — пятую анкету, которая была заполнена в новых федеральных землях.

3.3 Запуск SPSS

3.3 Запуск SPSS


Начнем с ввода данных для небольшого примера анализа.

  •  Запустите SPSS для Windows, дважды щелкнув левой кнопкой мыши на значке SPSS.

Откроется редактор данных SPSS (см. рис. 3.1).


Редактор данных — это одно из многих окон SPSS. Здесь можно вводить новые данные или загружать существующие из файлов данных с помощью команд меню File (Файл) Open... (Открыть...)


Так как при запуске SPSS ни один файл данных еще не загружен, в заголовке редак тора данных стоит "Untitled" (Без имени). Над изображением таблицы в редакторе данных имеются строка меню и панель символов.

3.4 Редактор данных

3.4 Редактор данных


Сейчас с помощью редактора данных мы создадим файл данных. Редактор данных это приложение, напоминающее электронную таблицу. Под электронной таблицей подразумевается рабочий лист, разделенный на строки и столбцы, который позволяет про сто и эффективно вводить данные. Отдельные строки таблицы соответствуют отдельным наблюдениям. Например, при обработке данных опроса одна строка содержит данные одного респондента. Отдельные столбцы соответствуют отдельным переменным. При обработке данных наблюдений анкеты в одной переменной хранятся ответы на отдельный вопрос. Отдельные ячейки таблицы содержат значения переменных для каждого отдельного наблюдения; в каждой ячейке хранится одно значение переменной.


Рис. 3.1: Редактор данных: просмотр данных

3.gif

Изображение: 

3.4.1 Определение переменных

3.4.1 Определение переменных


Начнем с определения переменных. Переменную можно определить следующим образом:

  •  В редакторе данных дважды щелкните на ячейке с надписью var или щелкните на ярлычке Variable view (Просмотр переменных) на нижнем краю таблицы.

В обоих случаях вы перейдете в режим просмотра переменных, который обеспечивает редактор данных (см. рис. 3.2). Здесь мы можем последовательно, строка за строкой определить необходимые переменные.


Имя переменной


Чтобы задать имя переменной, поступите следующим образом:

  •  Введите в текстовом поле Name (Имя) выбранное имя переменной. В нашем примере мы сначала определим переменную fragebnr. Для этого введите в поле Name текст "fragebnr".

При выборе имени переменной следует соблюдать определенные правила:

  •  Имена переменных могут содержать буквы латинского алфавита и цифры. Кроме того, допускаются специальные символы _ (подчеркивание), . (точка), а также символы @ и #. Не разрешаются, например, пробелы, знаки других алфавитов и специальные символы, такие как !, ?," и *.

  •  Имя переменной должно начинаться с буквы.

  •  Последний символ имени не может быть точкой или знаком подчеркивания (_).

  •  Длина имени переменной не должна превышать восьми символов.


Рис. 3.2: Редактор данных: просмотр переменных

  •  Имена переменных нечувствительны к регистру, то есть прописные и строчные буквы не различаются.

Примеры допустимых имен переменных:


budget99


gender


zarplata


quest_13


var3_1_2


Примеры недопустимых имен переменных:


1nа1


Имя начинается не с буквы


Assignment


Имя длиннее 8 символов


Прибыль


Имя содержит символы другого алфавита


State 94


Имя содержит пробел


None!


Символ "!" не разрешается

  •  Нажмите на клавишу <Таb>, чтобы подтвердить ввод и перейти к установке типа переменной.

Тип переменной


Как видно из электронной таблицы, вновь созданные в SPSS переменные по умолчанию являются численными с максимальной длиной восемь знаков, причем дробная часть состоит из двух знаков (формат F8.2).


• Если требуется изменить тип переменной, щелкните в ячейке на кнопке с тремя точками:


Откроется диалоговое окно Define Variable Type (Определение типа переменной).



Рис. 3.3: Диалоговое окно Define Variable Type (для численной переменной)


В SPSS существуют следующие типы переменных:


Numeric (Численный)


К допустимым значениям относятся цифры, перед которыми стоит знак плюс или минус и десятичный разделитель. Знак плюс перед числом, в отличие от минуса, не отображается. В текстовом поле Length (Длина) задается максимальное количество знаков, включая позицию для десятичного разделителя. В текстовом поле Decimals (Десятичные разряды) вводится количество отображаемых знаков дробной части.


Comma (Запятая)


К допустимым значениям относятся цифры, перед которыми стоит знак плюс или минус, точка, как десятичный разделитель и одна или несколько запятых в качестве разделителей групп разрядов. Если запятые опускаются при вводе, они вставляются автоматически. Длина такой переменной равна максимальному количеству знаков, включая десятичный разделитель и запятые между группами разрядов.


Dot (Точка)


К допустимым значениям относятся цифры, перед которыми стоит знак плюс или минус, запятая, как десятичный разделитель и одна или несколько точек в качестве разделителей групп разрядов. Если точки опускаются при вводе, они вставляются автоматически.


Scientific notation (Экспоненциальное представление)


При вводе данных разрешаются все допустимые численные значения, включая экспоненциальное представление, о котором свидетельствует содержащаяся в числе буква Е или D, а также знак плюс или минус.


Date (Дата)


Допустимые значения — дата и/или время.


Dollar (Доллар)


К допустимым значениям относятся: знак доллара, точка, как десятичный разделитель и запятые, как разделители групп разрядов. Если знак доллара или запятые опускаются при вводе, они вставляются автоматически.


Special currency (Специальная валюта)


Пользователь может задавать собственные форматы валюты. В поле Length в этом случае задается максимальное количество знаков, включая все знаки, заданные пользователем. Обозначение валюты при вводе не указывается; оно вставляется автоматически.


String (Строка)


Строка символов. К допустимым значениям относятся: буквы, цифры и специальные символы. Различаются короткие и длинные строковые переменные. Короткие строковые переменные могут содержать не более восьми знаков. В большинстве процедур SPSS применение длинных строковых переменных ограничивается или вообще не допускается.


При вводе и выводе данных надо учитывать следующие особенности:

  •  Численные форматы: В численных форматах десятичным разделителем может быть либо точка, либо запятая. Тип десятичного разделителя зависит от настроек диалогового окна Язык и стандарты (Regional Settings) на панели управления Windows. Точное значение переменной хранится внутри программы, а Редактор данных отображает на экране лишь заданное число десятичных разрядов. Значения, которые имеют больше десятичных разрядов, округляются. Для вычислений применяется точное значение.

  •  Строковые форматы: В длинных строковых переменных значения дополняются пробелами до максимальной длины. Например, в строковой переменной длины 10 значение "SPSS" хранится внутри программы как "SPSS

  •  Форматы даты и времени: В форматах даты в качестве разделителей между значениями дня, месяца и числа могут применяться косая черта, дефис, пробел, запятая или точка. Можно выбрать один из нескольких форматов даты (dd-mm-yyyy, dd-mmm-yy, mm/dd/yyyy и т.д.). Дата в формате dd-mmm-yy отображается с разделителем-дефисом и сокращением названия месяца из трех букв. Дата в форматах dd/mm/yy и mm/dd/yy отображается с разделителем-косой чертой и номером месяца вместо названия.

  •  Всего доступно 27 различных форматов даты и времени, которые отображаются в разворачивающемся списке. В форматах времени в качестве разделителей между значениями часов, минут и секунд могут использоваться двоеточие, точка или пробел.

  •  Специальная валюта: Форматы отображения валюты ССА, ССВ, ССС, CCD и ССЕ задаются с помощью вкладки Currency (Валюта), которая открывается командой меню Edit (Правка) Options... (Параметры...)

  •  Установите для переменной fragebnr тип String и длину пять символов и щелкните на кнопке ОК.


Рис. 3.4: Диалоговое окно Define Variable Type (для строковой переменной).


Переменная fragebnr получила строковый тип. С такими переменными нельзя выполнять никаких вычислительных операций, но можно проводить, например, подсчеты повторяемости. Кроме того, становится возможным ввод букв, например, "W" для старых федеральных земель и "О" — для новых. Мы выбрали длину пять символов, чтобы можно было кодировать до 999 анкет для обеих групп земель. В этом случае для анкет в старых федеральных землях можно будет задавать номера анкет от "W-001" до "W-999", а для новых федеральных земель — от "О-001" до "О-999".

  •  Нажмите клавишу <ТаЬ>, чтобы перейти к установке формата столбца. 

Формат столбца (Width)

  •  Для переменной fragebnr задано число позиций в столбце, равное "5". Это значение следует из длины переменной, указанной в диалоге Define Variable Type.

  •  Чтобы изменить этот формат представления переменной, перенесенный из диалога Define Variable Type, щелкните на кнопке лифта:

  •  В этом случае выбранное значение ширины подтверждается клавишей <Таb>. 

Десятичные разряды (Decimals)

  •  Так как переменная fragebnr является строковой, для нее задано количество десятичных разрядов "0". Увеличение или уменьшение этого значения, определенного настройкой в диалоге Define Variable Type, также производится при помощи кнопки лифта: Подтвердите значение "0", нажав клавишу <Таb>.

Метка переменной (Label)

Метка переменной — это название, позволяющая описать переменную более подробно. Метка переменной может содержать до 256 символов. В метках переменных различаются прописные и строчные буквы. Они отображаются в том виде, в каком были введены. Для переменной fragebnr введите в качестве метки в поле Variable label текст "Номер анкеты".


Метки значений (Values)


Метки значений — это название, позволяющее более подробно описать возможные значения переменной. Так, например, в случае переменной sex можно задать метку "женский" для значения "1" и метку "мужской" для значения "2". Подтвердите настройку по умолчанию None (Нет) клавишей <Таb>. Впрочем, ввод данных также можно подтвердить клавишей <Enter>.


Пропущенные значения (Missing values)


В SPSS допускаются два вида пропущенных значений:

  •  Пропущенные значения, определяемые системой (System-defined missing values): Если в матрице данных есть незаполненные численные ячейки, система SPSS самостоятельно идентифицирует их как пропущенные значения. Этот факт отображается в матрице данных с помощью запятой (,).

  • Пропущенные значения, задаваемые пользователем ( User-defined missing values): Если в определенных случаях у переменных отсутствуют значения, например, если на вопрос не был дан ответ, ответ неизвестен, или существуют другие причины, пользователь может с помощью кнопки Missing объявить эти значения как пропущенные. Пропущенные значения можно исключить из последующих вычислений. В нашем примере пропущенным значением, определяемым пользователем мы объявим вариант ответа "0" (нет данных) для переменной sex.

  •  Подтвердите настройку по умолчанию None (Нет) клавишей <Enter>.

Столбцы (Columns)


Поле Columns определяет ширину, которую будет иметь в таблице данный столбец при отображении значений. Ширину столбца также можно изменить непосредственно в окне редактора данных. Для этого поместите указатель мыши на разделитель между двумя заголовками столбцов с именами переменных. Вид указателя изменится. Появившаяся двойная стрелка указывает, что соответствующий столбец можно расширить или сузить путем перетаскивания.

  •  Подтвердите настройку по умолчанию "8" клавишей <Enter>.

Выравнивание (Alignment)


Здесь можно задать вид выравнивания значений, т.е. определить, как они будут отображаться в таблице. Возможные виды выравнивания — "Right" (по правому краю), "Left" (no левому краю) и "Center" (по центру). Чтобы задать вид выравнивания, щелкните на кнопке

  •  Подтвердите настройку по умолчанию Right клавишей <Enter>.

Шкала измерения (Measure)


Здесь можно задать шкалу переменной, которая может быть номинальной (шкала наименований), порядковой или метрической (см. главу 5.1.1). По умолчанию принимается метрическая шкала измерения. Правда, это различие имеет значение только при создании интерактивных графиков, где номинальная и порядковая шкала измерений объединяются в "категориальный" тип.


Если вы загружаете файлы, созданные в предыдущих версиях SPSS, или шкала измерений не определяется явно, SPSS вначале автоматически предполагает метрическую шкалу. Однако если соответствующая переменная имеет метки значений или принимает менее 24 различных значений, то задается порядковая шкала.

  •  Подтвердите настройку по умолчанию Nominal (шкала наименований) клавишей <Таb>. Затем снова поместите курсор в поле Name, чтобы начать объявление следующей переменной.

Теперь мы займемся определением переменной sex.

  •  Введите в поле Name текст "sex" и подтвердите ввод нажатием на клавишу <Enter> или <Таb>.

  •  Чтобы задать тип переменной, щелкните в поле Туре на кнопке с тремя точками. Откроется диалоговое окно Define Variable Type (Определение типа переменной). Примите предлагаемую настройку Numeric (Численный) и установите длину "1" и количество десятичных разрядов "0", так как в этой переменной будут храниться только значения 1, 2 или 0. Подтвердите настройку кнопкой ОК и перейдите к следующему полю клавишей <Таb>.

  •  Для формата столбца примите без изменений предлагаемые значения формата "1" и количества десятичных разрядов "0". На этом этапе можно было бы изменить сделанные ранее настройки.

  •  Для метки переменной задайте текст "Пол".

  •  Щелкните в поле Value Labels на кнопке . Откроется диалоговое окно Define Value Labels (Определение меток значений).


Рис. 3.5: Диалоговое окно Define Value Labels


Метки значений определяются следующим образом:

  •  Вначале введите в поле Value (Значение) число "1". Нажмите клавишу <Таb>.

  •  Введите в поле Value label (Метка значения) текст "женский".

  •  Щелкните на кнопке Add (Добавить). Метка значения будет добавлена в список. Для этой цели можно также нажать комбинацию клавиш <Alt>+<h>.

  •  Повторите эти действия для значений "2" — "мужской" и "0" — "нет данных". Максимально допустимая длина метки значения составляет 60 знаков.

Результат ввода всех значений в диалоговом окне показан на рис. 3.6.



Рис. 3.6: Заполненное диалоговое окно Define Value Labels (Определение меток значений)

  •  Подтвердите введенные данные кнопкой ОК, а затем — клавишей <ТаЬ>.

  •  Чтобы задать пропущенные значения, щелкните в поле Missing на кнопке с тремя точками . Откроется диалоговое окно Define Missing Values (Определение пропущенных значений).


Рис. 3.7: Диалоговое окно Define Missing Values


По умолчанию предлагается вариант No missing values (Нет пропущенных значений), то есть все значения в настоящее время рассматриваются как допустимые.

  •  Щелкните на пункте Discrete missing values (Отдельные пропущенные значения). Для одной переменной нужно задать до трех пользовательских пропущенных значений. Введите значение "О".

Существует еще один вариант:

  •  Range and one optional Discrete missing value (Диапазон и единичное отсутствующее значение): при выборе этого варианта все значения в диапазоне от Minimum (Наименьшее значение) до Maximum (Наибольшее значение) включительно объявляются как пропущенные. Кроме того, можно объявить как отсутствующее еще одно значение вне этого диапазона.

К сожалению, при сборе данных, как правило, не удается избежать пропущенных значений. Во многих статистических методах, прежде всего одномерных, учет пропущенных значений не составляет проблемы, так как кроме соответствующего уменьшения количества наблюдений не нужно вносить никаких дополнительных изменений в расчетный метод. Однако при двумерном, а тем более при многомерном анализе пропущенные значения в списках переменных создают более значительные проблемы, так как одного-единственного отсутствующего значения достаточно, чтобы сделать всю выборку непригодной для анализа. Впрочем, для многих методов анализа SPSS предлагает выход из такой ситуации.

  •  Подтвердите выбор пропущенных значений для переменной sex кнопкой ОК.

  •  В полях Columns и Alignment примите настройки, предлагаемые по умолчанию.

  •  В поле Measure щелкните на кнопке — откроется список с тремя возможными шкалами измерения:

  •  Измените первоначальную настройку Scale (Метрическая) на Nominal (Номинальная) и нажмите клавишу <Таb>.

Теперь мы займемся определением переменной age.

  •  Введите в поле Name текст "age" и подтвердите ввод.

  •  Чтобы задать тип переменной, щелкните в поле Туре на кнопке с тремя точками .Откроется диалоговое окно Define Variable Type. Примите предлагаемую настройку Numeric и установите длину "2" (мы предполагаем, что все респонденты не старше 99 лет) и количество десятичных разрядов "0". Подтвердите настройку кнопкой ОК и перейдите к следующему полю клавишей <Таb>.

  •  В полях Column format и Decimals примите настройки, предлагаемые по умолчанию.

  •  Для метки переменной введите текст "Возраст", а для меток значений примите предлагаемую настройку None, нажав <Enter>.

  •  Чтобы задать пропущенные значения, щелкните в поле Missing values на кнопке с тремя точками . Откроется диалоговое окно Define Missing Values. По умолчанию предлагается вариант No missing values (Нет пропущенных значений), то есть все значения рассматриваются как допустимые. Введите единичное отсутствующее значение "0" и закройте диалоговое окно кнопкой ОК.

  •  Примите предлагаемые настройки "8" в поле Columns, "Right" в поле Alignment и "Scale" в поле Measure.

Создание маски данных мы завершаем объявлением переменной party.

  •  Введите в поле Name текст "party" и подтвердите ввод нажатием клавиши <Таb>.

  •  Чтобы задать тип переменной, щелкните в поле Туре на кнопке с тремя точками. Откроется диалоговое окно Define Variable Type. Примите предлагаемую настройку Numeric и установите длину "1" и количество десятичных разрядов "0", так как в этой переменной будут храниться только значения от 1 до 7 и 0 как отсутствующее значение. Подтвердите настройку кнопкой ОК и перейдите к следующему полю клавишей <Таb>.

  •  Для формата столбца примите значение "1" и количество десятичных разрядов "0".

  •  Для метки переменной задайте текст "Партия".

  •  Щелкните в поле Value labeb на кнопке .Откроется диалоговое окно Define Value Labels (см. рис. 3.5).

  •  Вначале введите в поле Value (Значение) число "1". Нажмите клавишу <Таb>.

  •  Введите в поле Value label (Метка значения) текст "ХДС/ХСС".

  •  Щелкните на кнопке Add (Добавить). Метка значения будет добавлена в список.

  •  Повторите эти действия для значений "2" — "СДП", "3" — "СЕПГ", 4 — "Зеленые/ Союз90", 5 — "ПДС", 6 — "Республиканцы", "7" — "Прочие" и "0" — "Нет данных".

Результат ввода всех значений в диалоговом окне показан на рис. 3.8.



Рис. 3.8: Заполненное диалоговое окно Define Value Labels для переменной party

  •  Подтвердите введенные данные кнопкой О К, а затем — клавишей <Таb>.

  •  Чтобы задать пропущенные значения, щелкните в поле Missing на кнопке с тремя точками . Откроется диалоговое окно Define Missing Values. Щелкните на пункте Discrete missing values и задайте значение "0".

  •  Подтвердите выбор пропущенных значений для переменной party кнопкой ОК и нажмите клавишу <Таb>.

  •  В полях Columns и Alignment примите настройки, предлагаемые по умолчанию.

  •  В поле Measure щелкните на кнопке с тремя точками и выберите вариант Nominal.

4.gif

Изображение: 

6.gif

Изображение: 

7.gif

Изображение: 

11.gif

Изображение: 

12.gif

Изображение: 

13.gif

Изображение: 

15.gif

Изображение: 

19.gif

Изображение: 

3.4.2 Ввод данных

3.4.2 Ввод данных


Приступим ко вводу данных:


fragebnr


sex


age


party


1


W-001


1


45


1


2


W-002


2


22


3


3


W-003


2


19


3


4


W-004


1


42


1


5


W-005


2


. 34


4


6


W-006


1


72


2


7


W-007


2


38


3


8


W-008


1


56


3


9


W-009


2


61


1


10


W-010


1


77


1


11


W-011


1


23


4


12


W-012


2


67


6


13


W-013


2


79


7


14


W-014


1


26


3


15


W-015


2


59


1


16


О-001


1


34


4


17


О-002


2


18


6


18


О-00З


1


44


1


19


О-004


2


68


1


20


О-005


1


33


5


21


О-006


2


66


1


22


О-007


1


22


0


23


О-008


2


0


3


24


О-009


1


67


3


25


О-010


2


33


2


26


0-011


2


44


1


27


О-012


1


22


3


28


О-013


1


19


7


29


О-014


1


55


1


30


0-01 5


2


39


3


Данные можно вводить по отдельным наблюдениям (строкам) или по отдельным переменным (столбцам). Действуйте следующим образом:

  •  Щелкните на ячейке в левом верхнем углу. Вокруг ячейки появится рамка. Таким образом эта ячейка обозначается как активная.

  •  Введите значение, в нашем примере это "W-001". Это значение отобразится в редакторе ячеек в верхней части окна редактора данных.

  •  Нажмите клавишу <Таb>. Значение из редактора ячеек отобразится в ячейке.

В следующих таблицах показано, каким клавишам в редакторе данных соответствует какая функция. Здесь, как и далее, мы предполагаем, что активизирована таблица просмотра данных.


Позиционирование


Клавиша


Функция


<Таb> или <стрелка вправо>


Перемещает курсор на ячейку вправо.


<Enter> или <стрелка вниз>


Перемещает курсор на ячейку вниз.


<стрелка вверх>


Перемещает курсор на ячейку вверх.


<Shift> <Tab> или <стрелка влево>


Перемещает курсор на ячейку влево, т.е. в предыдущее поле.


<Ноте>


Перемещает курсор в первую ячейку строки или случая.


<End>


Перемещает курсор в последнюю ячейку случая.


<Ctrl> <стрелка вверх>


Перемещает курсор в первый случай столбца.


<Ctrl> <стрелка вниз>


Перемещает курсор в последний случай столбца.


<Ctrl> <Home>


Перемещает курсор в первую ячейку первого случая.


<Ctrl> <End>


Перемещает курсор в последнюю ячейку последнего случая.


<Page Up>


Прокручивает таблицу на одну страницу вверх.


<Page Down>


Прокручивает таблицу на одну страницу вниз.


Выделение


<Shift> <пробел>


Выделяет всю строку.


<Ctri> <пробел>


Выделяет весь столбец.


<Shift> <клавиши со стрелками>


Выделение области случаев и переменных. Также можно щелкнуть мышью и перетянуть ее из верхнего левого угла области в нижний правый угол.


Редактирование


F2


Переключает в режим редактирования. Следующее нажатие <F2> отключает режим редактирования.


<стрелка вправо>


Переместить позицию редактирования в ячейке вправо на один знак.


<стрелка влево>


Переместить позицию редактирования в ячейке влево на один знак.


<Ноте>


Перейти в начало значения ячейки.


<End>


Перейти в конец значения ячейки.

3.5 Сохранение файла данных

3.5 Сохранение файла данных


Сейчас мы сохраним созданный файл данных. Поступите следующим образом:

  •  Выберите в меню команды File (Файл) Save as... (Сохранить как...) Откроется диалоговое окно Save Data as (Сохранить данные как).

По умолчанию SPSS сохраняет файл данных в текущем каталоге с расширением .sav. 

Если вы следовали указаниям по инсталляции и задали рабочий каталог \SPSSBOOK, он будет предлагаться по умолчанию.

  •  Задайте имя файла, соответствующее соглашению об именах в DOS. Для рассматриваемого примера мы предлагаем имя файла "btwahl.sav". Расширение .sav SPSS присваивает файлам данных по умолчанию. Поэтому расширение .sav вводить необязательно.


Рис. 3.9: Диалоговое окно Save Data as

22.gif

Изображение: 

3.6 Копирование описаний переменных

3.6 Копирование описаний переменных


В исследовании на тему "Здоровье и питание", в частности, проводится опрос о предпочитаемых диетах. Респонденты должны ответить, насколько к ним относится одно из следующих высказываний.


Я предпочитаю следующую диету


Да, конечно


Да


Частично


В малой степени


Нет


вегетарианскую


X


X


X


X


X


биодинамическую


X


X


X


X


X


с низким содержанием животных белков


X


X


X


X


X


фаст-фуд


X


X


X


X


X


с учетом калорийности


X


X


X


X


X


сытную


X


X


X


X


X


дешевую


X


X


X


X


X


Так как в этом случае описания семи переменных в матрице данных почти одинаковы, можно сэкономить время, просто перенеся параметры описания первой переменной на остальные шесть. Для этого поступите следующим образом.

  •  Активизируйте вид данных редактора данных, введите в поле Name текст "vegetar" и подтвердите ввод нажатием клавиши <Таb>.

  •  Чтобы задать тип переменной, щелкните в поле Туре на кнопке с тремя точками Откроется диалоговое окно Define Variable Type. Примите предлагаемую настройку Numeric и установите длину 1 и количество десятичных разрядов I) , так как в этой переменной будут храниться только значения от 1 до 5 и 0 как отсутствующее значение. Подтвердите настройку кнопкой ОК и перейдите к следующему полю клавишей <Таb>.

  •  Для формата столбца примите значение "1" и количество десятичных разрядов "0".

  •  Для метки переменной задайте текст "вегетарианская".

  •  Щелкните в поле Values на кнопке Откроется диалоговое окно Define Value Labels.

  •  Вначале введите в поле Value число "1". Нажмите клавишу <Таb>.

  •  Введите в поле Label текст "да, конечно".

  •  Щелкните на кнопке Add. Метка значения будет добавлена в список.

  •  Повторите эти действия для значений "2" — "да", "3" — "частично", "4" — "в малой степени", "5" — "нет" и "0" — "нет данных".

  •  Подтвердите введенные данные кнопкой ОК, а затем — клавишей <Таb>.

  •  Чтобы задать пропущенные значения, щелкните в поле Missing на кнопке с тремя точками . Откроется диалоговое окно Define Missing Values. Щелкните на пункте Discrete missing values и задайте значение 0 .

  •  Подтвердите выбор пропущенных значений для переменной vegetar кнопкой ОК и нажмите клавишу <Таb>.

  •  В полях Columns, Alignment и Measure примите настройки, предлагаемые по умолчанию.

  •  Поместите курсор в ячейку с номером 1, т.е. в начало первой строки, и нажмите левую кнопку мыши. Параметры описания первой переменной будут выделены (см. рис. 3.10).


Рис. 3.10: Выделенное описание переменной

  •  Выберите в меню команды Edit (Правка) Сору (Копировать)

  •  Поместите курсор в ячейку с номером 2, т.е. в начало второй строки, и нажмите левую кнопку мыши — будет выделена вторая строка.

  •  Выберите в меню команды Edit (Правка) Paste (Вставить) 

Параметры объявления первой переменной будут скопированы во вторую строку.



Рис. 3.11: Скопированные параметры описания .переменной

  •  Далее измените предлагаемое имя переменной var0000l на biolog и повторите эти действия для всех остальных переменных.

  •  После пометки и копирования описания переменной, когда выделена вторая строка для вставки описания, вместо команд Edit Paste можно также использовать команду меню Edit Paste variables... (Вставить переменные) Откроется диалоговое окно Paste Variables.


Рис. 3.12: Диалоговое окно Paste Variables

  •  Замените предлагаемое имя vege на новое имя biolog и щелкните на кнопке ОК.

Диалоговое окно Paste Variables (см. рис. 3.12) дает возможность указать количество новых переменных. Если задать здесь число 6, параметры объявления переменной vegetar можно будет перенести на все остальные переменные за одну операцию. В этом случает таблица будет выглядеть так:



Рис. 3.13: Таблица после вставки нескольких переменных


Нам остается только заменить имена переменных vege I — vege6 на желаемые, например, biolog, lowprot, fastfood, calbal, rich и cheap, и все переменные шкалы "Предпочтения в питании" будут объявлены.

26.gif

Изображение: 

27.gif

Изображение: 

28.gif

Изображение: 

29.gif

Изображение: 

3.7 Завершение сеанса работы

3.7 Завершение сеанса работы


Сейчас мы завершим наш сеанс работы с SPSS. 

  •  Выберите в меню команды File (Файл) Exit (Выход) 

Для каждого из открытых окон SPSS спрашивает, надо ли сохранить его содержимое. Если щелкнуть на кнопке "Yes" (Да) или нажать <Enter>, SPSS открывает специальное диалоговое окно, в котором надо указать тип сохраняемого файла (файл данных, вывода или синтаксиса).


Так как у нас было открыто только окно редактора данных и мы уже сохранили его содержимое в разделе 3.5, программа ничего не запрашивает и просто закрывается.