Практика показывает, что в настоящее время многие российские компании, занима­ющиеся проведением маркетинговых исследований, а также отделы маркетинга


Скачать 2.43 Mb.
Название Практика показывает, что в настоящее время многие российские компании, занима­ющиеся проведением маркетинговых исследований, а также отделы маркетинга
страница 3/16
Тип Документы
rykovodstvo.ru > Руководство эксплуатация > Документы
1   2   3   4   5   6   7   8   9   ...   16

1.4.1.2. Ввод данных в SPSS при помощи Data Entry
Данная программа призвана упростить ввод данных в SPSS. При работе с ней ге­нерируются пользовательские формы, содержащие поля анкеты, куда и вводятся данные. Модуль SPSS Data Entry Builder позволяет создавать формы и правила для их заполнения, а модуль SPSS Data Entry Station — вводить анкеты в компью­тер в распределенном режиме (то есть с нескольких компьютеров одновременно). Детальное описание работы с программой Data Entry выходит за рамки настоящего пособия. Отметим лишь, что данная программа является самостоятельным при­ложением Microsoft Windows и не входит в комплект поставки SPSS. Кроме того, программные продукты SPSS достаточно дороги для большинства российских ком­паний, и поэтому рассматриваемый способ ввода данных не получил должного распространения в нашей стране.


Рис. 1.11. Диалоговое окно Database Wizard, шаг 2 из б

1.4.1.3. Ручной ввод данных в SPSS
Ручной ввод наиболее эффективен при малых размерах выборки, а также для до­стижения некоторых специфических целей (например, при вводе ранжированных списков в ходе расчета корреляции Спирмана; см. раздел 4.2.1). Как и в случае использования программы Data Entry, существует возможность распределенного ввода анкет с несколькими операторами. Когда все операторы закончат ввод своей части анкет, полученные базы данных сливаются в одну при помощи меню SPSS Data ► Merge files, в котором следует выбрать объект добавления анкеты (Add Cases) или переменных (Add Variables).
1.4.2. Кодирование переменных
После того как в файл SPSS помещена таблица с данными по исследованию, сле­дует перейти к очередному этапу формирования базы данных — кодированию пе­ременных.

Если данные вводились в SPSS методом импорта, вы увидите только имена пере­менных и их значения. В этом случае кодирование переменных является обяза­тельным шагом и должно проводиться сразу после процедуры импорта. Если для

ввода данных в SPSS использовалась программа Data Entry, все переменные и их значения окажутся, скорее всего, уже закодированными (на этапе генерирования пользовательских форм). При ручном вводе картина может быть такой, как при импорте данных из других источников (если вы предварительно не производили кодирование), либо аналогичной использованию Data Entry. Тем не менее, неза­висимо от способа ввода, на этапе кодирования необходимо произвести ревизию имеющихся переменных и меток их значений — чтобы удостовериться, что в буду­щем при проведении статистического анализа все используемые величины будут названы осмысленными именами.

Основное рабочее окно SPSS (см. рис. 1.1) содержит специальные вкладки для перемещения между видом файла данных (Data View) и таблицы переменных (Variable View). Кодирование переменных осуществляется на вкладке Variable View. Общий вид окна программы после щелчка на вкладке Variable View показан на рис. 1.121.




Рис. 1.12. Окно SPSS Data Editor, вкладка Variable View


Если в данную таблицу ввести какую-либо переменную (поле Name), все осталь­ные ее поля будут заполнены автоматически значениями по умолчанию. После импорта данных из другой программы все полученные переменные будут пред­ставлены также значениями по умолчанию (сохранятся только имена переменных). Рассмотрим более детально структуру таблицы Variable View.

Первое поле таблицы Name предназначено для ввода имени переменной, которое должно состоять только из латинских букв и цифр; имя переменной не может на­чинаться с цифры. При импорте данных из другого источника данное поле запол­няется теми значениями, которые были указаны в исходной базе данных. Все ос­тальные поля рассматриваемой таблицы заполняются программой автоматически, причем SPSS сама определяет, к какому типу относится та или иная переменная, а в качестве меток дублирует имена переменных.

Поле Туре служит для указания типа переменной. Установленный по умолчанию тип Numeric можно изменить, установив курсор в данную ячейку и щелкнув на по­явившейся кнопке со значком .... Доступные типы переменных представлены на рис. 1.13. Для некоторых из них (например, Numeric) необходимо задать количе­ство используемых разрядов (или букв — для текстовых переменных) и цифр пос­ле запятой, а для других (например, Date) — шаблон, по которому отражаются зна­чения.




Рис. 1.13. Диалоговое окно Variable Type

Поле Width служит для указания количества разрядов (для числовых переменных) или букв (для текстовых переменных), если они не были указаны в диалоговом окне указания типа переменной. Следующее поле Decimals позволяет указать ко­личество цифр после запятой для числовых переменных.

Поле Label служит для задания метки переменной. Данное поле важно, так как именно указанные в нем значения появляются на графиках и в таблицах при про­ведении всех видов статистического анализа. В анкетах, используемых при прове­дении маркетинговых исследований, содержатся как одновариантные вопросы (рес­понденты могут указать только один вариант ответа), так и многовариантные (респонденты могут указать несколько вариантов ответа). При этом если однова­риантные вопросы обычно представляются одной переменной, которая может при­нимать столько значений, сколько имеется вариантов ответа, то многовариантные вопросы, как правило, кодируются количеством одновариантных переменных, рав­ным числу вариантов ответа. Каждая такая одновариантная переменная всегда при­нимает только два значения (дихотомии) — отмечено/не отмечено, которые коди­руются соответственно двумя цифрами (обычно 1 и 0). Более подробно схема работы с многовариантными переменными описана в разделе 2.2, мы отметим лишь способ кодирования различных переменных.

Так, при кодировании одновариантных переменных поле Label используется для указания формулировки вопроса анкеты (варианты ответа кодируются в другом поле). При кодировании многовариантных переменных, представленных вариантами ответа, формулировка самого вопроса не отражается в рассматриваемой таб­лице: кодируются только варианты ответа (дихотомические переменные).

Приведем пример. У нас есть одновариантный вопрос Укажите пол респондента — это формулировка данного вопроса, и она отражается в поле Label, а переменной присваивается имя по принципу ql. Формулировка многовариантного вопроса Что для Вас наиболее важно при выборе велосипеда? не будет фигурировать в таблице Variable View. Вместо нее будет указан набор одновариантных дихотомических пе­ременных (по числу вариантов ответа). В поле Label будут указаны названия вари­антов ответа, а в поле Name — имена переменных, кодирующие каждый из вариан­тов ответа (например, переменная q2_l — Цена велосипеда; q2_2 — Качество велосипеда и т. д.).

П
оле Values предназначено для указания вариантов ответа в одновариантных во­просах. Общий вид соответствующего диалогового окна представлен на рис. 1.14. Данное поле не заполняется для многовариантных переменных. В окне Value Labels в поле Value указываются числовые коды вариантов ответа, а в поле Value Label — вербальные формулировки вариантов ответа. При задании меток необходимо пред­лагать разумные варианты ответов, учитывая, что впоследствии именно эти назва­ния (в том же виде) будут фигурировать на графиках и в аналитических таблицах. Например, вариант ответа на вопрос о половой принадлежности респондента сле­дует называть не Мужской или Женский, а Мужчины или Женщины. Также при наиме­новании переменных и вариантов ответа следует избавляться от лишних слов, как то: предлоги в начале предложения, междометия, вводные слова. Это, с одной сто­роны, позволит сократить само название, что в дальнейшем облегчит его восприя­тие, а с другой стороны, избавит таблицы и диаграммы от массы ненужной инфор­мации. Итак, наша основная рекомендация при наименовании переменных — формализация названий.


Рис. 1.14. Диалоговое окно Value Labels


Поле Missing используется редко, так как не несет существенной смысловой на­грузки. В нем можно указать, какие коды следует исключить из анализа (присвоить им статус System Missing). По умолчанию все отсутствующие значения (пропу­щенные одновариантные вопросы или неотмеченные варианты ответа многовари­антных вопросов) представляются в SPSS как System Missing и отражаются для числовых переменных символом,.

Также при помощи поля Missing можно наглядно продемонстрировать разницу между различными типами пропущенных значений — типа «user missing» (значе­ния, специально пропущенные исследователем) и типа «system missing» (значения, которые в принципе должны были присутствовать, но которых не оказалось в базе данных в связи с причинами случайного характера, — в том числе и динами­чески, не меняя структуры базы данных. Предположим, что для исследования нам нужны только люди с доходом свыше $ 500. Тогда в начале анкеты мы зададим респондентам фильтрационный вопрос (закрытый): Укажите Ваш примерный сред­немесячный доход в расчете на 1 члена семьи. При этом респондент может выбрать один из пяти вариантов ответа:

1. до $500;

2. от $ 500 до $ 1000;

3. от $1000 до $1500;

4. свыше $1500;

5. отказываюсь отвечать.

Очевидно, что для дальнейшего анализа нам подходят только те респонденты, ко­торые указали варианты ответа 2-4. Теперь эти три варианта ответа, которые не­обходимы нам для построения линейных и перекрестных распределений, мы за­носим в поле Values, а оставшиеся два — 1 и 5 — в поле Missing. Два последние варианта исключаются из дальнейшего анализа и будут представляться как значе­ние System Missing. Впоследствии, если мы захотим, например, построить общее линейное распределение по всему фильтрационному вопросу (включая все кате­гории), нужно будет просто убрать два пропущенных (в терминологии SPSS — User Missing) значения из поля Missing и добавить их в поле Values. Поле Columns служит для указания ширины столбца при отображении переменной в окне Data View. Следующее поле Align предназначено для выбора выравнивания значений переменной в столбце: по правому краю (Right), по левому краю (Left) или по центру (Center).

Поле Measure является для SPSS единственной возможностью определить тип шкалы имеющихся переменных: номинальная (Nominal), порядковая (Ordinal) или интервальная (Scale). Как показано далее в разделе 2.5 «Статистический анализ данных», важно знать, к какому типу шкалы относится та или иная переменная в базе данных. От этого во многом зависит выбор используемой статистической про­цедуры. Ниже приведена краткая характеристика трех типов шкалы переменных, используемых в SPSS.

1. Номинальные переменные (Nominal) могут принимать дискретные, не связан­ные друг с другом значения. Вопросы анкеты, кодируемые номинальными пе­ременными, могут быть как закрытыми (с вариантами ответов), так и открыты­ми (с текстовым полем вместо прямого указания вариантов ответа). Например, вопрос анкеты Каких производителей мясных полуфабрикатов Вы знаете? с вариан­тами ответа Царицыно, Черкизовский, Браво и Другое будет закодирован в базе данных SPSS номинальной переменной, так как между вариантами ответа на данный вопрос не существует логического порядка, это просто названия ком­паний-производителей.

2. Особое место среди номинальных переменных занимают переменные, являю­щиеся вариантами ответа на многовариантные вопросы или имеющие только два варианта ответа. Тип шкалы данных переменных называется дихотомиче­ским (Dichotomous). Данным переменным в SPSS отводится особая роль, так

как их варианты ответа могут рассматриваться в статистических процедурах как вероятность выбора одной категории или не выбора другой. В качестве вопросов анкеты дихотомические переменные могут кодировать как открытые, так и закрытые вопросы.

3. Порядковые переменные (Ordinal) кодируют такие закрытые вопросы, вари­анты ответа на которые подчиняются логическому числовому порядку. То есть варианты ответа на такие вопросы представляют собой связанные между собой группы значений. Например, вопрос Как часто Вы покупаете мясные полуфабрика­ты? с вариантами ответа: Чаще раза в неделю, Примерно раз в неделю и Реже раза в неделю — кодируется переменной с порядковой шкалой.

4. Интервальными (Scale) являются переменные, не имеющие выделенных кате­горий. Они содержат числовые данные (например, номер анкеты в базе дан­ных) и кодируют чаще всего открытые вопросы. Интервальные переменные (или другие типы переменных, приводимые к интервальному виду) используются практически во всех статистических процедурах. Они являются основным ре­сурсом для SPSS.
1.5. Модификация и отбор данных
Этап модификации и отбора данных объединяет целый ряд процедур, используе­мых для манипуляции с имеющимися данными: условный отбор данных, форми­рование случайной выборки, сортировка данных, перекодирование переменных, вычисление новых переменных и т. д. В настоящем разделе мы рассмотрим наибо­лее часто используемые методы автоматизированного управления переменными и их значениями в базах данных SPSS.
1.5.1. Условный отбор данных и случайная выборка
В настоящем параграфе мы рассмотрим такие методы манипуляций с данными, как отбор респондентов по определенному условию (например, выбор из всей базы данных только анкет мужчин), а также формирование случайной выборки.
1.5.1.1. Отбор анкет по условию
Часто при анализе данных в SPSS возникает необходимость отбора только тех рес­пондентов, которые соответствуют определенным требованиям (например, имеют среднемесячный доход свыше $ 1000). В этом случае используют условный отбор данных. Соответствующее диалоговое окно вызывается при помощи меню Data ► Select Cases.

Как вы видите на рис. 1.15,.это диалоговое окно не только позволяет осуществлять условный отбор данных, но и разрешает многие другие манипуляции. При прове­дении маркетинговых исследований наиболее часто применяются только два па­раметра: If condition is specified (Условный отбор данных) и Random sample of cases (Формирование случайной выборки). По умолчанию установлен параметр All cases, что означает выбор всех без исключения респондентов.


Рис. 1.15. Диалоговое окно Select Cases

Выберите параметр If condition is specified и щелкните на кнопке If. Откроется но­вое диалоговое окно Select Cases: If, позволяющее задать условие, согласно которо­му будет производиться отбор респондентов (рис. 1.16). Основная рекомендация относительно работы с данным диалоговым окном — заключайте все уравнения (название переменной и ее значение) в круглые скобки. Соблюдение данного тре­бования весьма полезно при составлении длинных последовательностей условий.


Рис.1.16. Диалоговое окно Select Cases: If

В табл. 1.3 представлена расшифровка всех логических и арифметических операн­дов, используемых при составлении условных выражений. Такие же операнды используются и в других диалоговых окнах, описываемых в разделе 1.5. Это стан­дартные операнды для составления логических выражений.

Необходимо отметить, что все логические операторы, кроме = и ~=, применимы только для числовых переменных (не для текстовых).

Помимо представленных стандартных логических операторов, существуют специ­альные предустановленные функции (область Functions) — при щелчке правой кнопкой мыши на любой из них появляется описание соответствующей функции.
Таблица 1.3. Стандартные логические операторы, используемые в SPSS

Арифметические

Логические

Оператор

Значение

Оператор

Значение

+

Сложение (x + y)

<

меньше (x < y)

-

вычисление (x - y)

>

больше (x > y)

*

умножение (x * y)

<=

меньше или равно (x <= y)

/

деление (x / y)

>=

больше или равно (x >= y)

**

возведение в степень (x ** y)

=

равно (x = y)

()

приоритет вычислений

~=

не равно (x ~ y)

|

или (x | y)

&

и (x & y)

~

отрицание (~ x)








В приведенном примере мы выбрали все анкеты, полученные от респондентов, являющихся мужчинами (вопрос q37, вариант ответа 1) в возрасте от 26 до 30 лет (вопрос q39, вариант ответа 2). Щелкнув на кнопке Continue и завершив операцию при помощи щелчка на кнопке 0К в главном диалоговом окне, мы увидим, что рес­понденты, не соответствующие данному условию, оказались исключенными из рассмотрения (их номера перечеркнуты). Можно не только временно исключить из рассмотрения респондентов, не подходящих под определенное условие, но и полностью удалить такие нерелевантные анкеты из базы данных SPSS. Для этого в диалоговом окне Select cases (рис. 1.15) необходимо заменить выбранный по умол­чанию параметр Filtered (в области Unselected Cases Are) на Deleted.
1.5.1.2. Отбор анкет случайным образом
Иногда при обработке данных маркетинговых исследований возникает необходи­мость отбора респондентов не по конкретному условию, а случайным образом (то есть формирование случайной выборки). Эта возможность весьма полезна для уменьшения размера исходной выборки — например, для выполнения статисти­ческих процедур, предъявляющих повышенные требования к вычислительным ресурсам компьютера. Также случайная выборка применяется при проверке кор­ректности работы некоторых статистических процедур (например, факторного анализа): сначала процедура проводится для общей выборки, а затем — для слу­чайной выборки из n-го количества респондентов.

Для формирования случайных выборок в диалоговом окне Select Cases, (см. рис. 1.15) предусмотрен параметр Random sample of cases. Выберите этот параметр и щелкни­те на кнопке Sample. Открывшееся диалоговое окно (рис. 1.17) содержит два спо­соба формирования случайной выборки: с указанием доли респондентов, которых необходимо отобрать из исходной выборки (Approximately), либо с указанием кон­кретного количества респондентов, которое необходимо отобрать (Exactly). При этом в последнем случае необходимо также указать в поле from the first ... cases количество респондентов, из которого следует осуществить выбор. Для формиро­вания случайной выборки из общего числа опрошенных в данном поле следует указать совокупный размер выборки.

В нашем случае мы случайным образом отобрали 50 % респондентов из исходной выборки.



Рис. 1.17. Диалоговое окно Select Cases: Random Sample


1.5.2. Сортировка и группировка данных
Сортировка и группировка данных — наиболее часто применяющиеся операции с данными. Причем эти операции могут производиться как перед началом прове­дения статистического анализа, так и на других этапах работы.

1.5.2.1. Сортировка файла данных SPSS

При помощи функции сортировки в SPSS можно упорядочить значения перемен­ных по одному или нескольким ключевым полям анкеты. Вызов диалогового окна сортировки осуществляется последовательностью меню Data ► Sort Cases.



Рис. 1.18. Диалоговое окно Sort Cases


Как указано на рис. 1.18, левый список содержит все доступные в текущей базе данных переменные. В область Sort by помещаются переменные, по которым сле­дует произвести сортировку. Порядок следования переменных в данной области соответствует порядку сортировки, то есть сначала сортировка происходит по пер­вой переменной, затем — по второй и т. д. Группа переключателей Sort Order позво­ляет выбрать направление сортировки: по возрастанию (Ascending) или убыванию (Descending). При этом для каждой переменной можно выбрать свой тип сортировки.

В нашем случае мы отсортировали базу данных по возрастанию номера анкеты.
1.5.2.2. Группировка значений переменных
SPSS позволяет автоматически разделять значения интервальных переменных на заданное число групп. Разделение производится на основании процентилей, то есть образующиеся группы содержат примерно одинаковое количество значений. Ре­зультатом работы этой процедуры является новая порядковая переменная, кото­рая содержит столько категорий, сколько было указано групп. Диалоговое окно группировки данных вызывается при помощи меню Transform ► Categorize Variables (рис. 1.19). В область Create Categories for переносятся переменные, значения которых необходимо сгруппировать. Поле Number of categories служит для указали числа групп.



Рис. 1.19. Диалоговое окно Categorize Variables

В нашем примере мы разделили выборку по номеру анкеты на четыре примерно равных доли — по 25 %.
1.5.3. Перекодирование переменных
Перекодирование переменных служит для трансформации значений переменных с созданием или без создания новых переменных, а также для автоматического кодирования текстовых переменных для преобразования их к числовому виду.

1.5.3.1. Перекодирование внутри одной переменной
Рекомендуется производить перекодирование значений многовариантных пе­ременных (точнее, наборов дихотомий, как было показано в разделе 1.4.2) сразу после создания базы данных. При этом все пропущенные значения (вариант не отмечено) в таких вопросах следует перекодировать из System Missing в нули. В дальнейшем это позволит использовать данные дихотомические переменные (уже с двумя вариантами ответа: 0 и 1) при проведении статистического анализа (например, при построении перекрестных распределений). Альтернативой обра­ботки многовариантных переменных является формирование серии полноцен­ных одновариантных переменных путем кодирования всех возможных взаимо­действий между вариантами ответа на многовариантный вопрос. Очевидно, что такая методика подходит только для вопросов с небольшим количеством вари­антов ответа.

Перекодирование может осуществляться как внутри одной уже существующей переменной, так и с созданием новой переменной, содержащей перекодированные значения. В последнем случае исходная переменная будет содержать неперекодированные значения, а вновь созданная — перекодированные значения.

Рассмотрим методику перекодирования внутри одной существующей переменной (без создания новой). В качестве примера возьмем случай с многовариантным воп­росом Где Вы обычно покупаете кетчуп?, у которого есть четыре варианта ответа:

1. q2_l — рынки;

2. q2_2 — магазины;

3. q2_3 — палатки;

4. q2_4 — другое.

При этом выбор респондентом данных пунктов закодирован в базе данных как 1, а отсутствие выбора — значением System Missing (отражается символом,). Про­изведем перекодирование отсутствующих значений System Missing в нули.

Вызов диалогового окна перекодировки внутри одной переменной осуществляет­ся при помощи меню Transform ► Recode ► Into Same Variables. Открывшееся диало­говое окно, как и большинство других окон SPSS, в левой области содержит спи­сок всех доступных переменных, а в правой (имеющей метку Variables) — место для помещения перекодируемых переменных. Необходимо особо подчеркнуть, что за один цикл использования диалогового окна Recode into Same Variables можно пе­рекодировать сколько угодно переменных, но только одними и теми же кодами. Иными словами, нельзя в одной переменной нули заменить на единицы, а в дру­гой — шестерки на строки Шесть. Для этого придется сначала перекодировать пер­вую переменную (нули на единицы), а затем вновь вернуться в диалоговое окно Recode into Same Variables, щелкнуть на кнопке Reset и затем ввести данные для пе­рекодировки другой переменной.

В
нашем случае мы собираемся перекодировать четыре переменные, имеющие одинаковые унарные шкалы, состоящие всего из одного значения 1. Поэтому в описываемом диалоговом окне можно ввести их одновременно в область Variables (рис. 1.20).


Рис. 1.20. Диалоговое окно Recode into Same Variables

При щелчке на кнопке If вызывается диалоговое окно, по внешнему виду и по функ­циям аналогичное окну Select Cases: If, представленному на рис. 1.16. Из этого окна молено производить перекодирование переменных, помещенных в область Variables, не для всех респондентов, а только для конкретных групп (например, только для мужчин).

В нашем случае мы не будем ставить никаких условий. Щелкните на кнопке Old and New Values, которая открывает диалоговое окно, позволяющее задать перекоди­руемые значения (рис. 1.21). Это окно разделено на две части. В левой можно ука­зать, какие конкретно значения подлежат перекодировке, а в правой — в какие зна­чения они будут перекодированы. Чтобы указать конкретное значение для перекодировки, введите исходное значение в левое поле Value, а конечное значе­ние — в правое поле Value.

Для специальных значений System Missing есть специальный одноименный пара­метр. В нашем примере в левой области диалогового окна выберите пункт System Missing, а в правой — в поле Value введите 0. Далее щелкните на кнопке Add, чтобы добавить указанное сочетание в список перекодировки. (Необходимо особо отме­тить, что значения, не указанные в списке перекодировки, оставляются неизменны.)




Рис. 1.21. Диалоговое окно Old and New Values

После того как были указаны все необходимые варианты перекодирования (в на­шем случае — только один), следует закрыть окно щелчком на кнопке Continue и запустить процедуру перекодирования кнопкой ОК. В исходной базе данных SPSS все значения System Missing в переменных q2_l - q2_4 будут перекодированы в ну­ли, единицы при этом сохранятся.
1.5.3.2. Перекодирование с образованием новых переменных
Рассмотрим теперь другой случай перекодирования переменных, в результате ко­торого исходная переменная остается неизменной, а перекодированные значения отражаются в новой переменной. Данная процедура осуществляется при помощи меню Transform ► Recode ► Into Different Variables. Диалоговое окно Recode into Different Variables (рис. 1.22) аналогично окну Recode into Same Variables (рис. 1.20), только добавлена дополнительная область Output Variable, предназначенная для указания имени (Name) и метки (Label) вновь создаваемой переменной, которая будет содер­жать перекодированные значения.

В качестве примера мы взяли переменную ql6, содержащую ответы на вопрос от­носительно частоты покупок респондентами плавленого сыра. При этом опрошен­ные должны были выбрать один из восьми вариантов:

1. каждый день;

2. 3-4 раза в неделю;

3. 1-2 раза в неделю;

4. 1-2 раза в месяц;

5. реже 1 раза в месяц;

6. 1 раз в полгола:

7. 1 раз в год;

8. затрудняюсь ответить.

После перекодирования мы должны получить переменную ql6_rec, в которой ин­тервалы 1,2 и 3 будут объединены в группу с кодом 1 (Частые покупатели); интерва­лы 4, 5, 6 и 7 — в группу с кодом 2 (Редкие покупатели); а интервал 8 — в значения System Missing.



Рис. 1.22. Диалоговое окно Recode into Different Variables

Введите в соответствующие поля название и метку новой переменной. Обратите внимание, что в описываемом диалоговом окне также есть кнопка условного отбо­ра данных If. Откройте диалоговое окно Old and New Values, щелкнув на одноимен­ной кнопке (рис. 1.23).



Рис. 1.23. Диалоговое окно Old and New Values

Это окно напоминает окно, представленное на рис. 1.21, но в нем также содержатся некоторые дополнительные полезные инструменты. По умолчанию значения исход­ной переменной, не указанные в списке перекодировки, не попадают в новую пере­менную. Изменить данное условие по умолчанию можно при помощи параметра Сору old value(s). Также появилась возможность конвертации числовых значений в стро­ковые (параметр Output variables are strings). При этом изменится тип всей новой пе­ременной; следовательно, все исходные значения должны быть перекодированы как

строковые. Существует и обратная возможность — конвертации строковых значе­ний, похожих на цифры, в числовой вид (например, «5» в 5). Данная возможность реализуется при помощи параметра Convert numeric strings to numbers.

В нашем случае мы при помощи параметра Range перекодировали значения исход­ной переменной — от 1 до 3 — в 1, от 4 до 7 — в 2, а значение 8 — в System Missing. После щелчков в соответствующих диалоговых окнах на кнопах Continue и ОК бу­дет создана новая переменная ql6_rec, содержащая перекодированные по указан­ной схеме значения переменной ql6.

1.5.3.3. Автоматическое перекодирование
Данная процедура предназначена для автоматического кодирования полей анке­ты числовыми значениями типа индекс. В маркетинговых исследованиях эта про­цедура применяется в основном для текстовых полей в тех случаях, когда в анкете есть либо открытые вопросы (являющиеся текстовыми переменными в базе дан­ных), либо варианты ответа Другое с дополнительным полем для указания респон­дентом конкретного варианта.

При выполнении процедуры одинаковые ответы из текстовых полей группируют­ся, и им присваиваются соответствующие коды ответа (например, начиная с 1). Для того чтобы автоматическое перекодирование имело практический смысл, не­обходимо жестко формализовать ответы респондентов в текстовых полях. Если при заполнении анкет допускалась свободная формулировка респондентами сво­их ответов, следует перед вводом анкет в компьютер (или на этапе ввода) пере­формулировать их в соответствии с требованиями формализации. Меньшее количе­ство различных вариантов ответа на открытый вопрос является предпочтительным, так как в дальнейшем при построении распределений большое число категорий трудно читается на графиках и в таблицах. Еще одно существенное требование к ответам респондентов на открытые вопросы — это достаточное количество респон­дентов в каждой группе ответов. Варианты ответов, указанные малым числом оп­рошенных, обычно относятся к варианту Другое.

Диалоговое окно Automatic Recode (рис. 1.24) вызывается при помощи меню Trans­form ► Automatic Recode. В нашем примере мы задавали респондентам вопрос Какие марки глазированных сырков Вы знаете?. После списка основных конкурентов на дан­ном рынке в анкете был вариант ответа Другое (переменная q9_13t), в который за­писывались компании-производители, не вошедшие в данный перечень. Закодиру­ем эти марки числовыми значениями (вместо текстовых полей). Для этого следует перенести из левого списка всех доступных переменных интересующую нас тек­стовую переменную q9_13t в область Variable ► New Name и в соответствующем поле указать новое имя вновь создаваемой числовой переменной q9_13t_n. Затем, что­бы подтвердить преобразование, необходимо щелкнуть на кнопке New Name. В груп­пе переключателей Recode Starting from есть два параметра, позволяющие присво­ить номера вариантам ответа либо по алфавиту, начиная с самого малого значения (Lowest value), либо начиная с конца упорядоченного списка вариантов ответа (Highest value).

После щелчка на кнопке ОК и выполнения указанных преобразований в базе дан­ных будет создана новая числовая переменная (q9_13t_n) с вариантами ответа со­гласно списку перекодировки. Список также выводится SPSS (в окне SPSS Viewer), он показан на рис. 1.25.



Рис. 1.24. Диалоговое окно Automatic Recode




Рис. 1.25. Список перекодировки


Как видно на рисунке, список разделен на три части: слева находятся значения ис­ходной переменной (q9_13t); в среднем столбце расположены коды, под которыми данные текстовые значения представляются в новой переменной (q9_13t_n); пра­вый столбец дублирует левый. Теперь по вновь созданной числовой переменной мож­но строить графики, а также использовать ее в других статистических процедурах.
1.5.4. Вычисление новых переменных
Вычисление новых переменных — весьма полезная возможность SPSS. При помо­щи данной функции можно производить расчеты по формулам любой сложности, задаваемым пользователем.
1.5.4.1. Вычисление новых переменных
Кроме перекодирования переменных, SPSS позволяет создавать новые перемен­ные, содержащие либо совершенно новые значения, либо значения, вычисленные на основании существующих переменных. Таким образом действует процедура Compute Variable, вызываемая при помощи меню Transform ► Compute (рис. 1.26).

В качестве примера мы рассчитаем годовой объем закупок сметаны на основании имеющихся данных о частоте покупок данного продукта в месяц (интервальная переменная q5) и кратности покупок (интервальная переменная q6).



Рис. 1.26. Диалоговое окно Compute Variable


В поле Target Variable мы указали имя вновь создаваемой переменной, которая будет содержать вычисленные для каждого респондента годовые объемы покупок сметаны. Далее щелкните на кнопке Type&Label и укажите метку и ее тип (рис. 1.27). В нашем случае в качестве метки в поле Label мы указали Годовой объем закупок сметаны. Новая переменная будет содержать числовые значения, поэтому мы выбрали тип Numeric.




Рис. 1.27. Диалоговое окно Type and Label

После определения новой переменной в области Numeric Expression следует указать непосредственно рассчитываемое выражение. В нашем случае мы умножаем час­тоту покупок (q5) на кратность покупок (q6) и затем умножаем на 12 месяцев, что­бы получить объем покупок сметаны в год. После запуска процедуры вычисления новой переменной будет создана новая переменная q100, содержащая годовые объ­емы покупок сметаны каждым респондентом в выборке.
1.5.4.2. Подсчет значений переменных
Еще одной полезной возможностью SPSS, не рассмотренной при описании про­цесса модификации и отбора данных, является подсчет значений переменных (как правило, многовариантных).

Приведем пример. Предположим, у нас есть ответы респондентов на многовари­антный вопрос Из каких источников Вы получаете информацию о рынке сантехники? с пятью вариантами ответа:

1. q22_l - газеты;

2. q22_2 — журналы;

3. q22_3 — выставки;

4. q22_4 — Интернет;

5. q22_5 — другие источники.

В результате работы описываемой процедуры мы получим новую переменную q100, в которой для каждого респондента в выборке будет отражаться количество ис­пользуемых источников при поиске информации о рынке сантехники.

Д
иалоговое окно Count Occurrences of Values within Cases, позволяющее выполнить поставленную задачу, открывается при помощи меню Transform ► Count (рис. 1.28). В полях Target Variable и Target Label следует указать соответственно имя вновь со­здаваемой переменной (q100) и ее метку (Количество используемых источников). В об­ласть Numeric Variables помещаются интересующие нас переменные q22_l - q22_5, значения которых необходимо подсчитать.

Рис. 1.28. Диалоговое окно Count Occurrences of Values within Cases


Диалоговое окно Count Occurrences of Values within Cases так же, как и многие другие окна SPSS, содержит кнопку If, позволяющую осуществить расчеты не для всех респондентов в выборке, а только для отдельных групп.

Щелкните на кнопке Define Values. Открывшееся диалоговое окно (рис. 1.29) пред­назначено для указания конкретных значений рассматриваемых переменных, под­лежащих подсчету. Так как у нас есть пять дихотомических переменных, соответ­ствующих вариантам ответа на многовариантный вопрос, мы указали 1 в качестве объекта подсчетов.




Рис. 1.29. Диалоговое окно Values to Count

Запустив процедуру, мы получим новую переменную с результатами расчетов. В дальнейшем мы можем построить по данной переменной линейное распределе­ние (см. раздел 2), чтобы узнать, сколько респондентов используют при поиске сантехники только один, два, три, четыре или пять источников информации.
1.5.5. Коррекция нерепрезентативности выборки
В практике маркетинговых исследований случается, что собранные в ходе опроса данные не соответствуют параметрам генеральной совокупности (то есть являют­ся нерепрезентативными). Такие ситуации возникают, если заложенные перед началом исследования социально-демографические квоты были искажены в ре­зультате нарушения методологии проведения исследования, ошибок в работе ин­тервьюеров или недостаточного контроля проведения полевых работ.

Например, в результате проведения контрольных мероприятий после завершения основных полевых работ были выявлены многочисленные факты некорректного заполнения анкет интервьюерами или даже фальсификация анкет, вследствие чего из итоговой базы данных пришлось удалить некоторую часть анкет. Очевидно, что в этом случае социально-демографические квоты, заложенные в начале исследо­вания и обеспечивающие соответствие параметров выборки параметрам общей генеральной совокупности (репрезентативность), скорее всего, изменятся. Это в свою очередь приведет к тому, что выводы, основанные на результатах проведен­ного опроса, не могут быть отнесены к генеральной совокупности. То есть мы не можем утверждать, что наши выводы действительно отражают мнение реальных потребителей. Исследование фактически теряет свой смысл.

Если полученная выборка является нерепрезентативной, применяется метод кор­рекции параметров выборки путем взвешивания. Приведем пример. Известно, что доля мужчин всего населения России составляет 45,5 %. В результате проведения всероссийского исследования оказалось, что доля мужчин в выборке составляет 72,1 %. Следовательно, полученная выборка является нерепрезентативной. Для устранения ошибки следует провести взвешивание, то есть скорректировать по­лученные значения переменной Пол (dl) на весовой коэффициент. Данный коэф­фициент рассчитывается для каждой социально-демографической группы по сле­дующей формуле:



где — весовой коэффициент; — значение исследуемого параметра в генераль­ной совокупности; — значение исследуемого параметра в выборке.

В нашем случае весовой коэффициент должен рассчитываться для двух социаль­но-демографических групп: мужчин и женщин. (Если у вас большое количество групп, весовой коэффициент следует рассчитывать для каждой группы.) Для муж­чин А будет равна: 45,5 % / 72,1 % ≈0,63. Так как у нас всего две группы, подлежа­щие взвешиванию (мужчины и женщины), то весовой коэффициент для женщин будет рассчитан так: (100 % - 45,5 %) / (100 % - 72,1 %) = 54,5 % / 27,9 « 1,95. (Если у вас большое количество групп, подлежащих взвешиванию, вам нужно знать значения параметров генеральной совокупности для каждой из групп.)

Итак, на первом этапе мы получили весовые коэффициенты, которые помогут нам скорректировать полученную нерепрезентативную выборку. Теперь необходимо создать новую переменную в файле данных SPSS, которая будет содержать для каждого респондента его вес (то есть для мужчин — 0,63, а для женщин — 1,95). Проще всего перекодировать с образованием новой переменной (как было описа­но в разделе 1.5.3.2).

В настоящем пособии мы не описываем важный элемент SPSS — программный синтаксис. Данный элемент является альтернативой использованию диалоговых окон в SPSS. Другими словами, все то, что можно сделать при помощи мыши в диалоговых окнах (и многое другое), можно выполнить посредством программного синтаксиса. В некоторых случаях его использование является предпочтительным. В частности, в нашем примере для создания новой весовой переменной удобнее воспользоваться синтаксисом. Откройте редактор синтаксиса File ► New ► Syntax. На экране появится окно, показанное на рис. 1.30. Введем в нем следующие команды:

if dl=l weight=45.5/72.1 .

if dl=2 weight=54.5/27.9 .

exe .

О
братите внимание, что в синтаксисе SPSS символ, отделяющий целую и дроб­ную части числа, — всегда точка, а не запятая. Также следует внимательно отно­ситься к точкам в конце каждой строки. Эти точки дают понять интерпретатору SPSS, что следует выполнить данную команду. Последовательность символов ехе. на третьей строке запускает процедуру синтаксиса. Рекомендуется использовать не приблизительные значения весовых коэффициентов (0,63 и 1,95), а вычисляе­мые выражения (45.5/72.1 и 54.5/27.9); что обеспечивает точность расчетов. Пос­ле того как вы введете указанные строки в редакторе синтаксиса (см. рис. 1.30), выделите их все (это очень важно) и затем нажмите Ctrl+R или на кнопке ► на панели инструментов окна синтаксиса.

В результате работы процедуры синтаксиса будет создана новая переменная weight, содержащая весовые коэффициенты для каждого респондента. Теперь осталось только провести собственно процедуру взвешивания каждого респондента на его весовой коэффициент. В этом вам поможет диалоговое окно Weight Cases (Data ► Weight Cases). В данном диалоговом окне (рис. 1.31) следует выбрать параметр Weight cases by, затем в левом списке всех доступных переменных выбрать весовую переменную (в нашем случае weight) и перенести ее в поле Frequency variable, при щелч­ке на кнопке ОК база данных будет скорректирована на весовые коэффициенты, и репрезентативность данных будет восстановлена. Для отмены взвешивания сле­дует в данном диалоговом окне установить переключатель в положение Do not weight cases.




Рис. 1.31. Диалоговое окно Weight Cases

Если искажение квот в выборке произошло не только по одной социально-демо­графической переменной, а сразу по нескольким (например, не только по полу, но и по возрасту и уровню образования), следует сначала создать отдельные весовые переменные для каждой из искаженных социально-демографических переменных, а затем создать новую общую весовую переменную, которая будет произведением всех отдельных весовых коэффициентов (то есть для каждого респондента: вес по полу, вес по возрасту, вес по образованию).

При всей кажущейся простоте корректировки репрезентативности при помощи взвешивания следует иметь в виду, что для использования данного метода суще­ствуют серьезные ограничения. Например, часто число респондентов во взвешен­ной базе данных оказывается иным, чем в невзвешенной. Это происходит из-за того, что сумма весовых коэффициентов по всем респондентам не равна общему количеству респондентов. Также нужно весьма осторожно подходить к интерпре­тации статистических тестов по взвешенной базе. Поскольку число респондентов с определенными социально-демографическими характеристиками во взвешенной базе искусственно увеличивается (в нашем случае это доля женщин), рассчитан­ная статистическая значимость является некорректной. Таким образом, взвеши­вание рекомендуется проводить для построения общих (линейных) распределе­ний.

Итак, в главе 1 мы подробно рассмотрели часто используемые в маркетинговых исследованиях методы манипуляции с данными. SPSS содержит массу других до­полнительных возможностей, но в данном пособии мы не стали их приводить, по­скольку на практике эти методы не находят широкого применения.
1   2   3   4   5   6   7   8   9   ...   16

Похожие:

Практика показывает, что в настоящее время многие российские компании, занима­ющиеся проведением маркетинговых исследований, а также отделы маркетинга icon Бенчмаркинг и маркетинговые исследования в разработке стратегий маркетинга
Практика показала необходимость разделения функций отдельных отделов и служб в целях выделения специализированной службы по организации...
Практика показывает, что в настоящее время многие российские компании, занима­ющиеся проведением маркетинговых исследований, а также отделы маркетинга icon Программа дисциплины «Стратегия социальных и маркетинговых исследований»...
Курс «Стратегия социальных и маркетинговых исследований» рассчитан на студентов магистратуры, имеющих квалификацию бакалавра экономики...
Практика показывает, что в настоящее время многие российские компании, занима­ющиеся проведением маркетинговых исследований, а также отделы маркетинга icon Неотложные меры самопомощи и взаимопомощи при сердечном приступе
Помимо этого статистика показывает, что многие больные сами (или их родственники) поздно вызывают врача скорой медицинской помощи,...
Практика показывает, что в настоящее время многие российские компании, занима­ющиеся проведением маркетинговых исследований, а также отделы маркетинга icon План Особенности маркетинга на рынке услуг Характеристика услуг и их классификация
Организация управления маркетингом компании «Аэрофлот – Российские Международные Авиалинии»
Практика показывает, что в настоящее время многие российские компании, занима­ющиеся проведением маркетинговых исследований, а также отделы маркетинга icon Самопомощи и взаимопомощи при развитии острых жизнеугрожающих заболеваний (состояний)
Помимо этого статистика показывает, что многие больные сами (или их родственники) поздно вызывают врача скорой медицинской помощи,...
Практика показывает, что в настоящее время многие российские компании, занима­ющиеся проведением маркетинговых исследований, а также отделы маркетинга icon Комплекс маркетинга Раздел Организация производственного маркетинга...
Систематизация основных рекомендаций по созданию комплекса маркетинговых мероприятий на ООО "Бина"
Практика показывает, что в настоящее время многие российские компании, занима­ющиеся проведением маркетинговых исследований, а также отделы маркетинга icon Власть
Как выяснилось, многие кыргызы недовольны своей жизнью. Это перечеркивает на корню "результаты исследований" ангажированных западных...
Практика показывает, что в настоящее время многие российские компании, занима­ющиеся проведением маркетинговых исследований, а также отделы маркетинга icon Программа дисциплины Теория и практика онлайн исследований для направления...
К. социол н., генеральный директор компании Online Market Intelligence ()
Практика показывает, что в настоящее время многие российские компании, занима­ющиеся проведением маркетинговых исследований, а также отделы маркетинга icon Использование средств маркетинга в антикризисном управлении на транспорте
Данные и многие другие факторы в условиях кризисов, в поисках путей выхода транспортных организаций из трудных ситуаций обусловливают...
Практика показывает, что в настоящее время многие российские компании, занима­ющиеся проведением маркетинговых исследований, а также отделы маркетинга icon Курсовая работа по курсу “Основы маркетинга” Тема «Стратегии маркетинга...
Санкт-Петербургский государственный технологический институт (технический университет)
Практика показывает, что в настоящее время многие российские компании, занима­ющиеся проведением маркетинговых исследований, а также отделы маркетинга icon Система работы с детьми, имеющими задержку речевого развития
Логопедическая практика показывает, что с каждым годом увеличивается количество детей с задержкой речевого развития
Практика показывает, что в настоящее время многие российские компании, занима­ющиеся проведением маркетинговых исследований, а также отделы маркетинга icon Инструкция показания дисплея: Этот будильник off-the-wall показывает...
Примечание: если появится надпись "p m.", то часы показывают время пополудни (дневное). В противном же случае часы показывают время...
Практика показывает, что в настоящее время многие российские компании, занима­ющиеся проведением маркетинговых исследований, а также отделы маркетинга icon Инструкция по сбору суточной порции мочи с консервантом для исследований
Важно! Зафиксировать время начала и время окончания сбора, а также (диурез) итоговый обьем собранного биоматериала
Практика показывает, что в настоящее время многие российские компании, занима­ющиеся проведением маркетинговых исследований, а также отделы маркетинга icon 1 Теоретические аспекты анализа сбытовой политики 8
Многие специалисты по менеджменту определили, что недостаточная эффективность сбытовой деятельности ставит под угрозу существование...
Практика показывает, что в настоящее время многие российские компании, занима­ющиеся проведением маркетинговых исследований, а также отделы маркетинга icon 1. 2Принципы работы erp-системы
Мировая практика последних лет показывает, что эффективное решение подобных задач достигается путем развертывания информационных...
Практика показывает, что в настоящее время многие российские компании, занима­ющиеся проведением маркетинговых исследований, а также отделы маркетинга icon Доклад Тема: Суицид среди несовершеннолетних. «Группы смерти» в социальных сетях
Несмотря на пристальное публичное внимание к проблеме использования социальных сетей для подталкивания детей и подростков к суициду,...

Руководство, инструкция по применению




При копировании материала укажите ссылку © 2024
контакты
rykovodstvo.ru
Поиск