Семинар 2.
ПОЛЬЗОВАТЕЛЬСКИЕ ПЕРЕМЕННЫЕ.
24. Преобразование переменных. Сложные признаки. Объединение по «И», объединение по «ИЛИ». Создать кросс-запрос. Поместим в базу – потребляют пиво. В признаках марки-пьют выбрать 3 марки (выделить с нажатым CTRL). Перетаскивая, нажать CTRL при перемещении в строки (вертикальный %). В появившемся меню выбрать «объединить по ИЛИ», затем – объединить по «И». Сравнить результаты. (Запрос 24).
25. Присоединение признаков к другим признакам, уже выбранным ранее. В базе – «потребители пива». Поместить в строки любые три марки из признака «марки-пьют» (не нажимая CTRL при перетаскивании). Выделить с нажатым CTRL еще две любых марки. Перетаскивая их на уже имеющийся первый признак, нажать в конце CTRL. В появившемся контекстном меню выбрать «Присоединить по И». (Получится признак «маркаА И (маркаВ ИЛИ маркаС)»). Аналогично присоединить те же две марки к третьему признаку (второй оставить без изменения). (Запрос 25).
26. Редактор признаков. Логика «НЕ» (отрицание). Очистить все поля. Поместить в «колонки» переменную «мужской пол». Щелкнуть по ней два раза: откроется окно редактора признаков. В окне редактора заменить в окне «логика» значение на «НЕ». (то есть получен признак «не мужчины»). Кнопка «ОК» – сохранить и закрыть окно редактора. Навести мышь на новый признак, нажать правую кнопку мыши, «копировать». Перейти в закладку «избранное». Нажать кнопку «новая папка». В правом поле нажать кнопку «вставить». Переименовать папку в «учебная».
27. Редактор признаков. Очистить все поля. Поместить в «колонки» переменную «мужской пол». Щелкнуть по ней два раза: откроется окно редактора признаков. В верхнем окне открыть закладку «избранное», найти «возрастные группы», выделить возраст «20-24», перетянуть в окно редактора (к признаку «мужской»). Объединение признаков («мужчины в возрасте 20-24 года). Кнопка «ОК» – сохранить и закрыть окно редактора. Навести мышь на новый признак, нажать правую кнопку мыши, «копировать». Перейти в закладку «избранное». Вставить признак в папку «учебная».
28. Снова открыть окно редактора; щелкая по полю «И», заменить логику на: «ИЛИ», «НЕ (И)», «НЕ (ИЛИ)». Посмотрите, какие признаки при этом получаются. Сохраните их в папке «учебная».
29. Понятие «узел». Поместить в колонки переменную «мужской пол». Щелкнуть по ней 2 раза, откроется редактор признаков. В Избранном открыть «возрастные группы». Выделить 2 группы: 20-24 лет и 25-34 лет. Перетащить в редактор признаков, нажав в конце CTRL. Откроется окно выбора опций: 1) присоединить по И 2) присоединить по ИЛИ 3) Присоединить группой по И. Выбрать опцию 3. Образуется признак «Мужской И (20 - 24 лет ИЛИ 25 - 34 лет)». Две возрастные группы входят здесь в один узел: нажав на +, этот узел в редакторе можно развернуть.
30. К полученному признаку добавить еще переменную дохода: получить переменную «Мужской И (20 - 24 лет ИЛИ 25 - 34 лет) И (20000-25000 руб. ИЛИ 25000-30000 руб. ИЛИ Более 30000 руб.)». В редакторе нажать ОК. Получившийся признак в колонках скопировать и вставить в папку «учебная».
31. Расширить полученную возрастную группу: открыть редактор признаков, и перетащить во второй узел еще возраст «35-44 лет». Получить признак «Мужской И (20 - 24 лет ИЛИ 35 - 44 лет ИЛИ 25 - 34 лет) И (20000-25000 руб. ИЛИ 25000-30000 руб. ИЛИ Более 30000 руб.)». Отредактировать название. Сохранить признак в папке «учебная».
ПЕРЕМЕННЫЕ ОБЪЕМА: СРЕДНИЕ ЗНАЧЕНИЯ И ОБЪЕМ ПОТРЕБЛЕНИЯ.
32. Работа с переменными Volume Metric. Поместить в базу «потребляют пиво». В строки – объем потребления. Поочередно выводя в редактор каждую градацию, посмотрите, как выглядят оцифровки (здесь они не вполне понятны – вероятно, речь идет о бутылках 0,5). То же сделайте для признака «частота»: все значения переводятся к «частота в месяц». Оцифровки можно редактировать (щелкнуть два раза по соотв. полю). Обратите внимание, что «затрудняюсь ответить» также может быть оцифровано.
33. Volume, Average. Помести в базу «потребляют пиво». В признаке «объем» выделить все градации, кроме «нисколько». Перенести их в строки, в конце нажав CTRL. Выбрать «объединить по ИЛИ». В редакторе видно, что получится признак «Затрудняюсь ответить ИЛИ 9 и более литров ИЛИ 7-9 литров ИЛИ 5-7 литров ИЛИ 3-5 литров ИЛИ 1-3 литра ИЛИ 0.5-1 литр ИЛИ Менее 0.5 литра». То есть это все люди, кто потреблял за прошлые 3 мес. пиво. То же сделать для переменной «частота». Вывести статистики: Sample, [000], Volume, Average. Рассчитать отчет. Сохранить «запрос 33». Сохранить этот признак в папке «Избранное-учебная».
Интерпретировать эти цифры нужно следующим образом;
14663 (15895 – по частоте) респондент из выборки пьет пиво хотя бы 1 раз в месяц
24 млн. 962 тыс. (26 млн 914 тыс – по частоте) жителей России пьют пиво хотя бы 1 раз в месяц
Все потребители пива выпивают 141 млн. 823 тыс. литров этой продукции в месяц.
В среднем потребитель пива выпивает 5,68 литра (или бутылок по 0,5???) пива в месяц, и пьет 6,32 раз в месяц.
34. Рассчитать эти же показатели для трех групп потребителей пива (по объему): Heavy, Medium, Light. (В последнюю группу поместить тех, кто пьет меньше 1 л, не брать тех, кто «нисколько»). Сохранить как запрос 34.
35. Переменная типа Numeric. Выделить переменную «возраст Num», перетащить в строки. В возникнувшем меню написать интервал «20-45» - то есть задать возраст 20-45. Рассчитать отчет, интерпретировать статистики: Sample, [000], Volume, Average. Сохранить запрос 35.
36. Средний возраст потребителей по маркам. Поместить в базу «потребляют пиво». В строки – пьют, марки. В колонки – возраст Num , выбрав интервал от 1-100000. Оставить статистики [000], Average. Рассчитать отчет. В колонке Average – получили средний возраст потребителей данной марки. Сохранить запрос 36. (Отсортируйте по возрасту: какую марку пьют самые старые? Самые молодые?).
37. Пересечение оцифровок. Поместить в базу «потребляют пиво». В строки – переменную объем потребления пива, созданную в запросе 33 и сохраненную в папке «избранное-учебная». Поместить в колонки - «возраст Num» , выбрав 25-45. Оставить статистики [000], Average. При попытке рассчитать отчет появится поле «В отчете найдено пересечение признаков с оцифровками». Если выбрать «да» - расчет будет с ошибкой; если «нет» - расчет отменится. Чтобы получить правильное значение, нужно удалить оцифровки. Нас интересует объем потребления данной возрастной группы. Выделяем признак в колонке (возрастная группа 25-45), нажимаем правую кнопку мыши, выбираем опцию «удалить оцифровки». Можно рассчитать отчет. Попробуйте транспонировать таблицу – результат не изменится. Сохранить запрос 37.
НАСТРОЙКИ И ФОРМАТИРОВАНИЕ ЗАПРОСА.
38. Изменение позиции статистик в рядах. Создадим кросс-запрос. Поместим в базу – потребляют пиво. В колонки - возрастные группы (от 16 лет). В ряды - потребление марок пива ("пьют"). Статистики - [000], vert%, horz%. Рассчитать отчет. Нажмем кнопку "статистики в колонки" - получим несколько другой вид представления данных. (Запрос 38).
Нажать кнопку Total. Посмотреть, как интерпретировать цифры. Убрать Total.
Нажать кнопку «позиции статистик». Сохранить запрос 38а.
39. Разные статистики для разных признаков. Поместим в базу – потребляют пиво. В колонки - возраст (num), "мужчины". В ряды - потребление марок пива ("пьют"). Мы хотим для признака возраст вывести статистику "среднее (average)", а для признака "мужчины" - horz%. Выведем сначала статистику horz%. Теперь выделим колонку "возраст", нажмем правую клавишу и выберем статистику ".average". Рассчитать отчет и сохранить запрос (запрос 39). Можно увидеть самую «мужскую» марку, самую «возрастную» марку.
40. В запрос 39 добавить опцию Total, для этой переменной сделать статистику вертикальный%. Сохранить запрос 40. Посмотреть, как отсортировать по убыванию и возрастанию по каждому признаку. (Щелкнув по соответствующей колонке). Кнопка «отмена сортировки». Добавить «авторанг».
41. Сохранить этот же запрос как запрос 41. Убрать Total. Выделить переменную «мужской пол», добавить статистики Vert%, [000], Rank. Статистика Rank позволяет увидеть ранг строки по данным статистики Vert% без осуществления процедуры сортировки, то есть не нарушая исходный порядок признаков.
41а. Транспонирование строк и столбцов. Создадим кросс-запрос. Поместим в базу – возраст старше 16 лет. В колонки - пол. В ряды - уровень образования. Рассчитаем отчет. Нажав на панели кнопку "транспонировать таблицу", поменяем местами строки и столбцы таблицы. Сохраним запрос (запрос 41а). Эта операция годится и для контекст-запросов.
42. Сумма и среднее. Создадим запрос: в базу – потребляют пиво, в ряды - потребляют марки, в колонки - возрастные группы. Статистики - horz%. Рассчитать отчет. Если мы выделим две или более ячеек, то в полях "сумма" и "среднее" отразятся соотвествующие значения суммы этих ячеек и среднее между ними. Сохраним запрос (запрос 42). В запросе 42 скрыть и показать колонки по очереди.
43. Применение фильтра. Создадим запрос: в базу – потребляют пиво, в ряды - потребляют марки, в колонки - пол. Статистики - sample. Рассчитать отчет. Теперь мы можем применить фильтр, чтобы отсекать ненужные для нас значения (например, слишком маленькие выборки). Сначала настроим фильтр: в позицию sample в колонке "от" напишем "1000". Посмотрим, как будет выглядеть таблица, если мы заданный фильтр применим сначала к строкам, затем к столбцам, и к ячейкам. Можно также применять фильтр к "totals" (в колонках и строках). Сохранить запрос (запрос 43).
44. Счетные признаки на основе математических формул. Построим таблицу "Conversion-Retention" (определение силы марки). Для этого нам нужны три стандартных показателя - знание, потребление и лояльность. Построим контекст-запрос. В базе - потребители пива. В строках - марки, в колонках - знают, пьют, чаще всего. Статистика - вертикальный %. рассчитаем отчет. Теперь нажмем правую кнопку мыши, находясь в поле колонок, и выберем значок "формула". Откроется редактор формул. Рассчитаем показатель "coversion" (обращение) - говорящий о том, насколько хорошо марка привлекает к себе новых потребителей. Для этого нужно разделить данные статистики "пьют" (верт.%) разделить на "знают" и умножить на 100%. Аналогично рассчитывается показатель "retention" (удержание) - делим "чаще всего" на "пьют" и умножаем на 100. Сохраним запрос (запрос 44).
Семинар 3.
АНАЛИЗ РЫНКОВ 1.
45а. Индекс целевых групп - это индекс соответствия товарной категории или марки выбранной целевой аудитории. Он обозначает отношение доли целевого сегмента (аудитории) среди потребителей данной товарной категории или марки к доле целевого сегмента (аудитории) в базовой выборке (для товарной категории - "вся Россия", для марки - все потребители данной товарной группы). Индекс соответствия показывает, насколько лучше (качественнее, больше, сильнее, плотнее) целевая аудитория контактировала с товарной категорией или маркой, чем базовая.
Посмотрим, насколько товарная категория "пиво" соответствует мужской аудитории (целевая группа - "мужчины"). Создадим запрос: 2008 год, база - возраст старше 16 лет; строки - потребляют пиво; колонки - "мужчины", горизонтальный %. Рассчитаем запрос, нажмем опцию "всего". Как мы видим, в 2008 г. среди населения городов России старше 16 лет было 44,9% мужчин, а среди потребителей пива - 60,4%. Выберем теперь статистику "Index". Он получился равным 134.
Рассчитанный индекс соответствия мужской аудитории - 134% (= 60,4 / 44,9 *100%), который говорит о том, что мужчины пьют пиво в 1.34 раза чаще, чем население в целом.
Посмотрим, насколько марка "Миллер" соответствует мужской аудитории среди всех потребителей пива. Создадим запрос: 2008 год, база - потребители пива, строки - потребляют пиво и потребляют "Миллер", колонки - "мужчины", горизонтальный %. Как мы видим, в 2008 году среди потребителей пива населения городов России старше 16 лет было 60,4% мужчин, а среди потребителей пива "Миллер" - 52,4% мужчин. Выберем теперь статистику "Index". Он получился равным 87.
Рассчитанный индекс соответствия пива "Миллер" мужской аудитории - 87% (= 52,4 / 60,4 * 100%), что говорит о том, что данная марка - скорее женская (т.е. мужчины пьют "Миллер" в 0,13 (т.е. на 13%) реже, чем все потребители пива в целом).
45b. Индекс целевых групп - пример по регионам. Формирование запроса: база – потребляют пиво, ряды – чаще других марку, колонки – регион. Сформировать отчет, статистики Sample, [000], Vert%, Index, IndexSignif. Опция «значимость индекса». Сохранить запрос (запрос 46). См. интерпретацию значимости индекса в HELP. (+ ПРИЛОЖЕНИЕ К СЕКМИНАРАМ).
46. Преобразование переменных: как построить другой возрастной интервал – взять числовую переменную возраст, выбрать нужные границы (20-35). Сохранить как признак или в папке (избранное).
47. Как сформировать целевую группу: мужчины определенного возраста и образования «Мужчины И Возраст num\Возраст\20-35 И (Высшее)». В колонку поместить признак "мужчины", щелкнуть 2 раза для редактирования, перетащить к признаку "мужчины" возрастной интервал и "высшее образование"; присоединение с "И". Формирование отчета: чаще других потребляют марки пива. Статистики: Index, IndexSignif. Добавить авторанг. Отсортировать по IndexSignif, удалить все марки, где IndexSignif меньше 0,95. Отсортировать по Index. Скрыть все ряды, где индекс меньше 115. Сохранить запрос (запрос 47), экспортировать.
48. Анализ рынка пива города (напр., Екатеринбург). База – потребляют пиво + Екатеринбург. (Потребляют пиво(за 3 мес.) И Екатеринбург). (Поместить в базу потребляют пиво, открыть редактор, добавить Екатеринбург с И, сохранить). Веса – city population. Строки - чаще других потребляют пиво по маркам. Колонки – мужчины, женщины, все старше 16 лет. Статистики: Index, IndexSignif. Сохранить запрос (запрос 48).
49. Рассчитать среднюю частоту и объем потребления пива по полу. Для этого взять за базу потребителей пива; колонки – пол; ряды – создать суммарные признаки "объемы потребления" и "частота". Выделить все градации для "частоты" и перетащить с нажатым "ctrl" в "строки". То же – для объема. Перейти в режим отчета; нажать статистики Horz %, Average, Volume (000). (Запрос 49). Объем – суммарное потребление всех потребителей России, среднее – в среднем на одного потребителя.
50. Построить аналогичные показатели потребления пива по группам частоты heavy, medium, light. (Группы разместить в колонках). Выделить все колонки, нажать правую кнопку, выбрать «удалить оцифровки». нажать статистики Horz %, Average, Volume (000). Рассчитать отчет. Сохранить запрос 50.
АНАЛИЗ РЫНКОВ 2.
51. Анализ трендов. Из запроса 50: оставить общий объем (сгенерированную переменную) в строках (удалить общую частоту). Из колонок удалить группы. Оставить статистику Average. Навести мышь на “TGI 08”, нажать правую клавишу, - редактировать тренд-набор. Выбрать все исследования. Рассчитать отчет (динамика среднего объема потребляемого пива на человека). Сохранить запрос 51.
52. Из запроса 51: транспонировать (перенести объем в колонки). В строки поместить 16+, мужчины, женщины. Рассчитать средний объем потребления по полу в динамике по годам (рассчитать отчет). Перейти в режим графика: нажать значок гистограммы. Выбрать тип графика «линия». Экспортировать. Сохранить документ как «Запрос 52».
29а. Режим "Зум" для кросс-запроса (Пример - тренд запрос). Создадим тренд запрос за годы с 2004 по 2008. В базе - "потребляют пиво". В рядах - потребляют марки пива. В колонках - список городов-милионников. Статистика - Vert %. Рассчитать отчет. Чтобы перевести таблицу в режим "зум", нужно нажать соответствующую кнопку на панели (перед лупой). Список городов отразится в колонке. Чтобы видеть динамику потребления пива по маркам в отдельном городе, нужно найти его в колонке "зум", и выделить. Данные будут пересчитаны от населения каждого выделенного города.
53. Профили сегментов потребителей пива. База – потребители пива. Строки – пьют марки Невское, Жигулевское, Гиннес. Колонки. 1) «пьют в стеклянных бутылках» (объединить 0,33 и 0,5). 2) пьют разливное 3) объединить «2-3 раза в неделю и чаще» 4) в баре, ресторане, кафе 5) темное 6) объединить «более 5 л в мес.». Статистика – Horz %. Рассчитать отчет. Сделать диаграмму “Colomn”. Сохранить как «запрос 53». (трехмерный вид можно сделать в EXCEL, экспортировав таблицу и график).
54. Предпочтения места потребления. Выбрать потребителей пива (база); строки – где потребляют пиво, колонка – все старше 16 лет, социальные классы (индивид.вес). Статистика - Vert %. Посмотреть отчет, сохранить запрос (запрос 54new). Сделать диаграмму (гистограмма - Bar).
55. Знание, потребление, лояльность марок. Запрос в режиме контекста. Выбрать потребителей пива (база), выбрать «знают», «пьют», «чаще всего». Статистика - Vert %. Рассчитать отчет. Сделать авторанг, оставить первые 8 марок по «знают». Построить диаграмму (Column). (Запрос 55new).
56. Позиционирование брендовой группы по параметрам Знание-Потребление (брэнд мэппинг, brand mapping). Преобразовать из запроса 55: показать все признаки (кнопка показать все), скрыть «другая российская» и «другая импортная» марки, скрыть колонку «чаще всего», Перейти в режим «диаграммы» Scatter (2D). Убрать легенду. (Запрос 56).
57. Позиционирование брендовой группы по параметрам Знание-Потребление-Лояльность. Преобразовать из запроса 55: показать все признаки в колонках (кнопка показать все), скрыть «другая российская» и «другая импортная» марки, сделать диаграмму Scatter (3D). Удалить легенду. (Запрос 57new).
58. Позиционирование брендовой группы по двум произвольным параметрам. В базу - потребители пива. В опциях «фильтр» поставим 5% для Vert %. Поместим в «строки» потребителей различных марок пива (останутся только наполненные группы). В колонки – переменные «мужской пол» и «возраст» (количественный). Статистики: первая колонка – индекс, вторая – среднее. Перейти в режим «диаграммы» Scatter (2D). По горизонтали – преобладание мужчин\женщин (100 – одинаково); по вертикали – средний возраст. (Запрос 58new).
59. Позиционирование брендовой группы по трем параметрам. Добавим к предыдущему запросу переменную «социальные классы - класс А (высший)» (в колонки). В настройках отчета переменной "класс А" взять Horz %. Перейти в режим «диаграммы» Scatter (3D). Диаметр кругов показывает долю людей с высшим образованием среди потребителей марки. (Запрос 59new).
60. Сравнительный анализ двух не связанных брендовых групп по трем параметрам. Сравнительный анализ потребителей марок пива и высокой активности медиапотребления по полу, возрасту и семейному доходу. Сделать кросс запрос. Выбрать в базе потребителей пива. Поместить в «строки» марки пива (пьют). Поместить в колонки пол, числовой возраст и оцифрованный признак «личный доход». (Доход перетащить с включенным ctrl, объединить по «или»). Показатели: индекс, среднее, среднее. Рассчитать отчет. оставить верхние 20 марок по доле потребителей (вертикальный % в "Total"). Поместить также в строки активных медиапотребителей (активность медиапотребления - степень активности - высокая). Перерассчитать отчет. Сделать диаграмму Scatter (3D). В диаграмме заскрасить круги «медиактивность» в другой цвет (или экспортировать к эксель и там закрасить). (Запрос 60new).
ВАРИАНТ:
60. Сравнительный анализ двух не связанных брендовых групп по трем параметрам. Сравнительный анализ пользователей мобильных телефонов и посетителей ресторанов быстрого питания по полу, возрасту и семейному доходу. Сделать кросс запрос. Выбрать в базе посетителей ресторанов быстрого питания и пользователей мобильных телефонов в возрасте 16+. Поместить в «строки» марки телефонов и ресторанов (пользуются). Поместить в колонки пол, числовой возраст и оцифрованный признак «доход на члена семьи». (Доход перетащить с включенным ctrl, объединить по «или»). Сделать отчет, показатели индекс (или гориз%), средний, средний. Сделать доп.колонку вертик%, оставить примерно по 10 марок (убрать также опцию «другой»). Свернуть эту колонку. Перейти в режим отчета, затем в режим «диаграммы» Scatter (3D). Можно в самой диаграмме заскрасить круги «телефон» в другой цвет (или экспортировать к эксель и там закрасить). (Запрос 60).
СТАТИСТИКИ.
61. Корреляция. База: женщины старше 16 лет. Строки: питание вне дома – посещают. Колонки – возрастные группы женщин (старше 16 лет). Отчет: в таблице – sample, index, indexsign, corr. Для удобства можно нажать кнопку «статистики в строки». (Запрос 61).
Оставить только группу женщин возраста 20-24 (остальные скрыть). Вернуть статистики в колонки. Добавить вертикальный%. Для этой группы все индексы значимы, sample достаточно большой. Увидеть, что в группе 20-24 лет для опции «другие бары» индекс равен 223, а «кафе» - 169, но корреляции соответственно – 0,093 и 0,136. таким образом, для женщин 20-24 лет более характерно посещение кафе, чем «других баров», хотя индекс привел бы к другому выводу. Еще более свойственно им посещение ресторанов быстрого питания.
|
Женщины 20-24 лет
|
|
Index
|
Corr
|
Пивной бар (16+)
|
244
|
0.119
|
Другие бары
|
223
|
0.093
|
Кафе,кофейни
|
169
|
0.136
|
Ресторан быстрого питания
|
169
|
0.18
|
Вернуть скрытые колонки возрастных групп. Оставить в таблице только столбик corr, построить диаграмму «линии» или "колонки (гистограмма). (Запрос 61а).
62. Значимость. В предыдущем запросе (запрос 61) оставить колонки corr, верт%. Нажать кнопку «значимость» (синяя и красная стрелки). Красно-коричневым выделяется прямая зависимость, голубым – обратная. (Запрос 62). Сравнить со значениями корреляции.
Значимость рассчитывается по формуле Z–Критерия. Это значит, что полученное в ходе вычислений значение по каждому пересечению признаков сравнивается с критической точкой. Существует множество критических точек, каждая из которых говорит об уровне значимости, то есть о вероятности, с которой можно утверждать о наличие или отсутствии связи между признаками. По умолчанию в DataFriend Web установлен уровень значимости, равный 0.05, то есть 95% вероятности, что соответствует Z-значению (значению критической точки, с которой программа производит сравнение результата вычислений) равному 1.96. Z-значение может быть изменено в поле “Z-Величина” (сервис -настройки -документ-рассчет).
Оставить только верт%, включить опцию Totals. Проследить, что значимость связана со сравнением верт% каждого столбца с верт% в колонке Totals.
63. Значимость различий между колонками. В запросе 62 отключить верт%, Totals и включить опцию abc (при помощи правой клавиши мыши). Отключить кнопку «значимость» (выделение цветом).
DataFriend Web может рассчитывать не только статистически значимые различия между колонками признаков и колонкой Totals, но также сравнивать по этому показателю колонки признаков между собой. Отображение статистически значимых различий колонок между собой реализовано в виде отдельно взятой статистики abc. Ее, как и все остальные статистики, можно включить в меню выбора статистик.
Каждая колонка таблицы будет промаркирована буквой. Всего буквенных маркеров в программе предусмотрено 32, то есть в одной таблице можно сравнивать между собой не более 32 колонок. В ячейках пересечения таблицы выведены эти буквы, они означают, что Vert% в этой колонке значимо выше чем в колонке, обозначенной этой буквой.
Проинтерпретировать результат (запрос 63).
64. График Bar 100+. База: женщины старше 16 лет. Строки: посещение мест общественного питания (можно взять из запроса 61). Оставить только колонку Индекс, построить график Bar 100+. (Запрос 64). Посмотреть, что меняется, если выбирать для графика «ряды» или «колонки».
Семинар 4.
АНАЛИЗ РЫНКОВ 3.
65. Тренд-анализ: статистика Delta%. База: старше 16 лет. Строки: потребляют пиво. Тренд 2000-2008 годы, индив.веса. Тренд: вертикальный %, Delta, и Delta%. нажать "статистики в строки" (Запрос 65).
Delta – статистика, показывающая изменение вертикального процента в формате 1.хх. То есть во сколько раз по сравнению с предыдущим периодом повысился или понизился Vert%.
Delta% - статистика, показывающая изменение вертикального процента в формате х.хх. То есть на сколько процентов по сравнению с предыдущим периодом повысился или понизился Vert%. Значимые изменения по сравнению с прошлым годом показаны синими и красными стрелками.
66. Значимость в тренд-анализе. Открыть запрос 65. Добавить в колонки переменную «пол». Оставить только верт%. Нажать кнопки Totals и «значимость».Значимые отличия от суммарных статистик «Все» будут показаны цветом ячеек, значимые отличия от предыдущего периода будут показаны стрелочками.
Посмотреть, как отображается в тренд-анализе команда "total". (Запрос 66).
67. Тренды по маркам. База: потребляют пиво. Строки: пьют-марки. Тренд 2000-2008 годы, индив.веса. Тренд: вертикальный %. См. изменения в составе марок: показаны несуществующие марки показаны знаком Х.
(Запрос 67).
68. Карта трендов. Открыть контекст-запрос. База: потребляют пиво. Строки: знают-марки, пьют-марки. Отсортировать по "знанию", выбрать 5-6 "верхних" строк. Не брать марки, данные по которым есть не за все годы. Тренд 2000-2008 годы, индив.веса. Тренд: вертикальный %. Перейти в раздел графиков, сделать двумерный график "карта трендов". В разделе "данные" можно по очереди оставлять на графике отдельные марки. На графике мы видим, как изменялись с течением времени соотношение "знание-потребление" по выбранным маркам. Вернемся теперь к запросу и добавим в него показатель "чаще всего" (лояльность). рассчитаем отчет и перейдем опять на лист диаграмм. Выбрав тип диаграммы "трехмерная карта трендов" Мы можем увидеть на графике как изменялись уже три параметра: знание, потребление и лояльность. (запрос 68).
69. Объединение волн исследований. DataFriend Web дает возможность пользователю самостоятельно создавать волны исследований путем объединения нескольких волн из списка доступных клиенту исследований. Для создания объединенной волны нужно создать кросс- или контекст запрос. Давайте возьмем в базу потребителей пива, в строки - "марки-пьют", в колонки - уровень образования. Показатели - sample, vert%. Теперь наведем мышь на строку "2008" в отчете и нажмем правую кнопку мыши. В открывшемся меню выбрать "соединение исследований", и добавить 2007 год. Рассчитать отчет, добавить строку и столбец "итого": наш sample потребителей пива - более 32 тыс.чел., что подтверждает объединение волн.
Обратите внимание, что показатели по некоторым маркам показаны красным цветом - это относится к тем маркам, данные о которых были не за оба года, а только за один.
(запрос 69).
70. Ранжирование переменных: Rank. Строки – спорт – занимаюсь или играю сам. Показатели: вертикальный %, Rank. (запрос 70). Нажать кнопки «авторанг», сортировка по верт%; отмена сортировки.
71. Вовлеченность в спорт. Контент-запрос. База – 16+. Найти папку «спорт» - «степень вовлеченности» - перетащить в строки папки «занимаюсь», «ходил смотреть по билетам», «люблю смотреть по ТВ». Вертикальный %. В раздел Зум измерение – мужчины, женщины. Рассчитать отчет. (запрос 71).
72. Функция "объединить по названию признаков".
В случае, когда в разных папках находятся признаки с одинаковыми названиями, появляется дополнительная опция объединения. Она называется «Объединить по названию признака» и отображается в меню объединения. Функция «Объединить по названию признака» объединяет с логикой ИЛИ признаки с одинаковыми именами из различных папок каталога. Для создания таких сложных признаков нужно:
- Выделить несколько папок в левой части каталога (в правой части откроется их содержимое). Это можно сделать при помощи стандартных кнопок выделения Ctrl или Shift.
- В правой части выделить те признаки, которые необходимо объединить (они должны присутствовать во всех выделенных папках).
- Перетащить их в запрос с зажатым CTRL (стандартная процедура объединения, описанная в разделе «Объединение нескольких признаков с помощью клавиши Ctrl»).
- Из меню объединения выбрать пункт «Объединить по названию признака по ИЛИ».
Посчитать по видам спорта степень суммарной вовлеченности. Кросс-запрос. В колонки – «пол», в базу – «16+». Найти папку «спорт», «степень вовлеченности», в ЛЕВОМ окне каталога выделить три подпапки «занимаюсь», «смотрю по билетам», «смотрю по ТВ». В Правой части каталога выделить 3-4 любых вида спорта. Перетащить с нажатым CTRL в строки; в выпадающем окне выбрать «объединить по названию признаков через ИЛИ». Статистика – вертикальный %. Отчет: по полу и возрасту – какая доля каждой группы занимается или смотрит соответствующий вид спорта. (Запрос 72).
73. Высказывания. Кросс-запрос. База – 16+. Создать контекст-запрос. Из каждой папки «согласен» и т.д. выбрать папку «полный список» и последовательно поместить в колонки. Получится таблица, где по строкам – высказывания, а по колонкам везде «полный список», хотя реально это согласен - не согласен. В окно зум-измерение поместить мужчины, женщины. Рассчитать отчет. (Запрос 73).
74. Использование вероятности. Исследование 2008, индивидуальные веса. База – Москва. В окне Общего Каталога переходим в тематический раздел "Радио\Москва\Частота". Входим в папку "Евpопа Плюс". Выделяем частотную линейку от одного до семи дней в неделю и, с нажатой клавишей Ctrl, перетаскиваем выделенные признаки в строки. В появившемся меню выбираем пункт "Объединить по ИЛИ". В Редакторе признаков помечаем опцию "Использовать как вероятность" для каждого значения оцифровки. То же – для «Русского радио», «авторадио». В отчете – [000] – вероятное количество слушателей в произвольный день недели. В колонки – «пол». См. также выборку и верт.%, а также totals). (Запрос 74).
(Обратите внимание на значение оцифровок , находящихся в поле "Оцифровка" Редактора признаков. Признаку "7 дней в неделю" соответствует значение 1, признаку "6 дней в неделю" соответствует значение 0.857, то есть шесть седьмых, и так далее. При расчете запроса будут отбираться респонденты, слушавшие "Евpопа Плюс" один и более дней в неделю. И каждый из них, помимо веса, будет умножаться на соответствующий коэффициент, говорящий с какой вероятностью этот респондент слушал данную радиостанцию в произвольный день недели. Если он слушает "Европу Плюс" три дня в неделю, то вероятность того, что данный респондент слушал ее например в среду, будет равна три седьмых, то есть 0.429. Таким образом, в тысячах мы увидим вероятное количество слушателей радиостанции в произвольный день недели.)
75. Функция “Count”. Посчитать потребителей только 1 марки пива; 2х марок; 3х марок; 4х и более марок. База – потребляют пиво; колонки – пол и возрастные группы. В строки перетащить (сначала выделив) потребителей всех марок пива кроме "другая российская" и "другая импортная" марка, с нажатым "ctrl", Выбрать «объединить по ИЛИ». Сделать двойной щелчок, в "редакторе признаков" заменить «объединить по ИЛИ» на функцию «count» (двойной щелчок по типу объединения признаков). При выборе функции «count» откроется диалоговое окно, в котором нужно набрать «1». Заменить название получившегося признака на «пиво кол-во марок: 1». Закрыть окно редактора. Сделать такую же операцию для «2». То же для «3». То же для «4 и более», задав интервал для «count» «4-100». (Либо - скопировать получившуюся переменную; заменить количество марок и название). Статистика – вертикальный %. (Запрос 75).
76. Функция «AverageCount». Построение переменной «Среднее количество потребляемых марок». Потребители пива – база, строки – регионы. Выбрать "потребляют" марки, выделить все марки, перетащить с нажатым "ctrl" в окно "колонки" (объединить по «ИЛИ»). Нажать "редактор признаков" и выбрать Average Count. Заменить название признака на «количество марок». Статистики – верт.% и «Average». См. также функцию «total». В отчете: получаем распределение потребителей по регионам, + среднее количество потребляемых марок в каждом регионе. (запрос 76).
77. Репертуарная карта рынка. Создать репертуарную карту рынка потребителей по маркам пива. База – потребители пива, ряды – марки (потребляют), колонки – 1-й признак – среднее количество потребляемых марок (см. п.76), 2-й признак – "все (или 16+)" (переименовать его в «доля потребителей»). Построить отчет – в 1-й колонке оставить статистику Average, во второй – вертикальный %. Оставить верхние 30 марок по доле потребителей, построить диаграмму Scatter (2D). (Запрос 77).
МНОГОМЕРНЫЕ СТАТИСТИЧЕСКИЕ МЕТОДЫ.
78. Анализ соответствий.
Выбрать исследование 2008, индивидуальные веса. База – 16+. Колонки – проведение свободного времени, бывали за полгода; строки – книги, покупатели по жанрам. Выбрать в меню «вставить - анализ - анализ соответствий». (Запрос 74).
В режиме "диаграмма" оставить только "режим отображения - положительно зависимые".
Перейти в режим «статистика». Характеристика «гистограмма». проинтерпретировать оси. Посмотреть результаты взаимосвязи строк и столбцов.
79. Анализ соответствий (пример из help). База – 16+. Колонки – возрастные группы (с 16), мужчины, женщины. Строки – виды занятий спортом. Анализ соответствий (запрос 79).
80. Кластерный анализ.
Кластерный анализ является отдельным видом запроса и добавляется в виде новой закладки в окне запросов. Новая закладка кластерного анализа добавляется при помощи кнопки «Вставить» - «Анализ» - «Кластерный анализ».
Первым шагом в работе с кластерным анализом в программе DataFriend Web является заполнение признаками из каталога списков для кластеризации. На этом этапе пользователь задает параметры, на основе которых будет проведен факторный, а затем и кластерный анализы. Пользователь должен заполнить два списка:
- Фильтр – ограничитель генеральной совокупности (аналог базового признака в кросс\контекст запросах). В этот список можно положить только один признак (как простой, так и сложный, составной). Все инструменты объединения признаков, действующие в других типах запроса, работают для этого списка. Если в список «Фильтр» не положить не одного признака, то программа будет работать по всей выборке выбранной волны.
- Список переменных – в этот список необходимо положить те признаки, на основе которых будет произведен отбор объясняющих факторов и распределение респондентов в ту или иную группу.
Выбрать исследование 2008, индивидуальные веса. Фильтр – потребители крепких алкогольных напитков (водка, настойки). Переменные - частота, объем, что важно при выборе, места потребления напитков.
Выбрать формат признаков.
После заполнения списков признаков, выбора их формата, а также выбора веса в соответствующем окне и нажатия на кнопку «Отчет» программа проведет факторный анализ на заданном распределении признаков, и его результаты представит в виде графика в 2 осях в поле графика. В табличном виде результаты факторного анализа можно увидеть на закладке «Факторные нагрузки». Проинтерпретировать оси. Отобрать самые значимые.
Указать количество кластеров и задать их центры.
Для того, чтобы автоматически сместить центры кластеров максимально возможное количество раз, нужно просто снять галку «Пошаговая» и нажать кнопку "автокоррекция". После создания кластеров, появляется возможность открыть закладку «Статистика». На ней приведены две таблицы: «Центры кластеров» и «Расстояния между кластерными центрами». Проинтерпретировать их.
Для того, чтобы перенести кластеры в кросс-запрос, нужно выделить кластеры, нажать на них правой кнопкой мыши, и, в появившемся меню, выбрать пункт «В кросс». После этого будет создана новая закладка кросс-запроса, в базе которого будет лежать признак из фильтра для кластерного анализа, а в рядах – полученные кластеры.
Перенести кластеры в кросс-запрос. В строки поместить частоту, объем и места потребления.
Проинтерпретировать результаты.
(запрос 80).
Для того, чтобы переименовать кластер, нужно в запросе нажать на него двойным кликом – откроется редактор кластеров.
После переименования кластеров, пользователь может сохранить их в каталоге «Избранное», точно так же, как и обычные признаки.
Созданные и сохранённые в каталоге кластеры, в дальнейшем могут быть использованы в любом запросе, работа с ними ничем не отличается от работы с простыми признаками.
81. Кластерный анализ - пример их "справки". Сделать запрос "кластерный анализ", в список переменных поместить "высказывания о проведении досуга" (согласен и скорее согласен). Рассчитать факторы, оставить 4. Задать 4 кластерных центра (метод полудиагональ), автокоррекция: получили 4 кластера. Поместить их в "кросс-запрос", в строки - теже высказывания. Переименовать кластеры и сохранить в новой папке "избранного" (запрос 81).
Семинар 5.
СТАНДАРТНЫЕ ОТЧЕТЫ И ГРАФИКИ.
ПОСМОТРИТЕ ПРЕЗЕНТАЦИЮ «СТАНДАРТНЫЙ ОТЧЕТ».
С01. Динамика доли потребителей по годам. Открыть исследование 2006 года. Выбрать за базу население 16+; в ряды – признак «потребляют пиво». Выбрать признаки [000], Vert%. Навести мышь на название волны, нажать правую кнопку, выбрать в контекстном меню «редактировать тренд-набор». Выбрать все исследования с 2000-2006. Сформировать отчет (табличный). Экспортировать в Power Point или Excel. Сохранить документ (запрос С01а динамика доли потр табл).
Открыть предыдущий запрос С01. Удалить параметр [000]. Сформировать отчет. Перейти к формированию диаграммы (линия). (Доля потребителей среди населения 16+ упала с 57 до 49 %). Экспортировать диаграмму в Power Point или Excel. Сохранить документ (запрос С01b динамика доли потр граф)
С02. Динамика доли потребителей марок по годам. Открыть исследование 2006. Выбрать за базу «потребляют пиво»., потребителей марок пива –сибирская Корона, Невское, Туборг (ряды). Балтика представлена 4 отдельными видами – объединить их по ИЛИ в признак «Балтика 2006». Затем открыть исследование 2005 года, выбрать марку «Балтика», также поместить в ряды. Выделить в рядах «Балтика» и «Балтика 2006» и сгруппировать их. Посмотреть отчет. Нажимая на (+), можно получить «Балтику» за все годы в одной строке. Сохранить как «запрос С02а динамика по маркам табл ».
Посмотреть отчет (табличный) стрелками помечены значимые изменения. Сделать диаграмму (линии). Добавить легенду. Экспортировать диаграмму. Сохранить как «запрос С02а динамика по маркам диагр».
С03. Региональная структура рынка – потребители пива по регионам. Поместить в базу 16+, в колонки – «потребляют пиво», в ряды – регионы или федеральные округа (из папки «избранное»). Необходимые статистики – [000], Vert%, Horz%, Index. Посмотреть отчет. Отсортировать по горизонтальному % (среди населения выше всего доля потребителей пива на дальнем Востоке). Сохранить запрос (запрос С03а рег структ табл). Экспортировать таблицу.
Открыть запрос С4. Оставить только колонку вертикальный %. Отсортировать (среди потребителей пива выше всего доля Москвы). Перейти к диаграмме «круг» (100%). Экспортировать диаграмму. Сохранить запрос (запрос С03а рег структ диагр).
С04. Частота потребления по полу. База - потребители пива, ряд – частота потребления (в месяц), колонки – все 16+, мужчины, женщины. Затрудняюсь ответить – в конец списка. Объединить «один раз в день» и «чаще 1 раза в день». Просмотреть отчет. Сохранить запрос (запрос С04а_частота потр табл). Перейти в режим графика (Bar 100%), серии в рядах. Сохранить запрос (запрос С04б_частота потр диагр).
С05. То же – для объема потребления, объединить «5 и более литров» (запрос С7). Перейти в режим графика (Bar 100%), серии в рядах.
С06. Диаграмма «потребление марок пива по возрастам» (выбрать исследование 2006 год, база – мужчины-потребители пива, колонки – возрастные группы мужчин с 16 лет, строки – марки пива – потребляют, при этом объединить в одну марку «Балтики», «Клинские», «Очаково»). Статистика – вертикальный %. Посмотреть отчет. Сформировать опцию «total», отсортировать, оставить марки, которые потребляют больше 10% всех мужчин. Сохранить (запрос С06а марки по возрастам табл). Экспортировать таблицу.
Загрузить запрос С06а. Поменять процент на горизонтальный. Оставить марки «амстел», «будвайзер», «пилзнер уркелл», «толстяк», «жигулевское». Посмотреть отчет. (разница в возрастной структуре потребителей марок). Сделать диаграмму (серии в колонках), тип графика – Bar100%. Экспортировать график. Сохранить (запрос С06б марки по возрастам диагр).
С07. Предпочтение типов \мест потребления. Загрузить запрос С04. Удалить строки. В строки вставить «типы пива» (безалкогольное, легкое, обычное, крепкое). Рассчитать отчет. Экспортировать таблицу. Сохранить запрос (запрос С07а тип пива).
То же – для мест потребления. Сохранить запрос (запрос С07б где пили).
С08. Знание-потребление-лояльность. Создать контекст-запрос. Нажать кнопку режима «контекст». База – потребляют пиво. Выбрать 3 любые марки; в колонки – знают, потребляют, «чаще других». Рассчитать отчет. Сделать диаграмму: гисторграмма (column). Экспортировать гистограмму. Сохранить запрос (запрос С08а знают пьют чаще).
Репертуар потребления (репертуар потребления – какая доля лояльных к данной марке потребляет другие марки). Создать кросс-запрос. В колонки – 3 марки из признака «чаще других». В ряды – те же марки, признак «пьют». Вертикальный %. Рассчитать отчет. Экспортировать таблицу. Сохранить запрос (запрос С08б репертуар потребления).
С09. Портрет потребителей. База – потребляют пиво. В строки – мужчины, женщины, возрастные группы. В колонки – потребляют марки «Миллер» и «Охота», «потребляют пиво». Статистики - Вертикальный % и Индекс. Сохранить как (запрос С09 портрет потребителей табл). Посмотреть отчет. Экспортировать таблицу. Убрать «Индекс», убрать «пол», сделать диаграмму по возрастам (Bar 100%).
С10. Аналогично построить портрет потребителей тех же марок по психографическим типам, график "радар" (отсортировать вертикальный %, марка «Охота»). Сохранить (запрос С10б портрет психограф типы диагр).
|