Главная    Интернет-библиотека    Маркетинг    Маркетинговые исследования    Статистическая проверка значимости результатов маркетинговых исследований

Статистическая проверка значимости результатов маркетинговых исследований

Статистическая проверка значимости результатов маркетинговых исследований

Опубликовано в журнале "Маркетинг в России и за рубежом" №1 год - 2005

Бушуева Л.И.

к.э.н., доцент кафедры маркетинга и статистики
Сыктывкарского государственного университета

Центральным лейтмотивом при проведении статистической проверки значимости результатов маркетинговых исследований является желание исследователя распространить выводы, сделанные на основе ограниченного числа наблюдений (выборки), на интересующую его совокупность в целом. Такую совокупность реально существующих объектов наблюдения, из которых тем или иным способом извлекается выборка, в статистике принято называть генеральной совокупностью. Основное правило статистической проверки состоит в том, что математические различия в значениях признаков не доказывают различий статистических. Другими словами, если некоторые показатели отличаются между собой, то это не означает, что эти отличия существенны (статистически значимы). Для принятия управленческих решений на основе выборочных наблюдений исследователь должен быть уверен в том, что сходства или различия выборки с генеральной совокупностью (или между несколькими выборками) неслучайны и не могут быть объяснены ошибкой выборки. Уверенность исследования может основываться на результатах проверки статистических гипотез.

Итак, цель статьи состоит в определении роли статистических гипотез при проверке значимости результатов маркетинговых исследований и принятия управленческих решений на их основе. Поставленная цель обусловила необходимость изучения критериев, используемых для различных задач исследования, а также последовательности проведения проверки и правил принятия решений. Рассмотрим последовательно следующие группы вопросов:

1. Сущность и этапы проведения проверки гипотез.

2. Критерии согласия:
 — критерий для одной выборки;
 — критерий для двух независимых выборок;
— критерий Колмогорова-Смирнова.

3. Критерии для проверки гипотез о средних величинах:
Z — критерий для большой выборки;
t — критерий для малой выборки;
— гипотезы о двух средних.

4. Критерии для проверки гипотез о пропорциях:
Z — критерий для одной выборки;
Z — критерий для двух независимых выборок.

1. Сущность и этапы проведения проверки гипотез

В процессе анализа данных у исследователя регулярно возникает вопрос: достаточно ли значимы результаты исследования? Другими словами, может ли результат объясняться тем, что в выборку попали респонденты, которые не представляют генеральную совокупность в целом? Для ответа на этот вопрос используют статистические гипотезы.

Гипотезы — это предположения или теории, которые исследователь выдвигает относительно некоторых характеристик генеральной совокупности, подлежащей обследованию. Пользуясь статистическими приемами, исследователь пытается установить, существует ли эмпирическое доказательство, подтверждающее выдвинутые гипотезы. Проверка статистических гипотез позволяет рассчитать вероятность наступления какого-либо события. Но в условиях отсутствия полной всесторонней информации (что естественно в случаях использования данных выборки) всегда есть некоторая вероятность и ошибочного заключения. Эту ситуацию можно проиллюстрировать на очень известном в литературе [4, стр. 594] качественном примере. Исследователи решили проверить гипотезу: «беден ли Джон До». Они видят, что он обедает в дешевых ресторанах, живет в районе городских трущоб в разваливающемся доме, одет в поношенную, драную одежду и т.д. Хотя его поведение явно соответствует стилю жизни бедного человека, безоговорочно принять гипотезу о его бедности нельзя. Не исключено, что он в действительности богат, но чрезмерно скареден. Если продолжить сбор информации об этом человеке, то может обнаружиться, что ему принадлежит шестизначный счет в банке. И новые сведения потребуют опровергнуть первоначально выдвинутую гипотезу.

Итак, пользуясь определенными статистическими приемами и правилами, можно установить вероятность принятия ошибочной гипотезы и избежать неправильной интерпретации выборочных данных.

Существует множество различных статистических гипотез и ситуаций, в которых они используются. Подробный обзор по этой тематике представлен в литературе по математической статистике. Мы ограничимся введением в основные понятия, изложением и несколькими иллюстративными примерами использования статистических гипотез в маркетинговых исследованиях, связанными с частотой распределения признаков; средними величинами; пропорциями.

Рассмотрим задачи маркетинговых исследований, которые могут быть решены с помощью перечисленных трех видов гипотез.

Имея дело с эмпирическим распределением, можно предположить, что данному распределению соответствует определенная, характерная для него теоретическая кривая. Выдвинув гипотезу о той или иной форме распределения, исследователи стремятся описать эмпирический ряд с помощью математической модели, выражающей некоторый теоретический закон распределения. Знание формы кривой распределения может быть использовано в различных практических расчетах, прогнозах и т.д., позволяющих получить подсчет количества ответов, соответствующих различным значениям изучаемой переменной, например, каково распределение численности людей, пользующихся определенной торговой маркой, по уровню доходов, или каково соотношение интенсивных, умеренных и случайных потребителей и т.п.

При проведении маркетинговых исследований чаще всего в процессе анализа данных выборочного наблюдения используются:


-

либо средние значения того или иного признака (например, среднемесячная величина расходов семьи на покупку продовольственных товаров составляет 5000 руб.);

-

либо доля единиц обследованной совокупности (респондентов), обладающих тем или иным признаком (например, 70% владельцев мобильных телефонов заинтересовались новым тарифом «Джинс» компании МТС).

 

Однако выборочные средние и доли, как правило, не совпадают с соответствующими показателями генеральной совокупности. Естественно, в таких случаях возникает потребность оценить, случайны или существенны расхождения выборочных средних с генеральной средней величиной и долей. Для оценки значимости расхождений используются гипотезы о средних величинах и о пропорциях.

Но, говоря о различных статистических гипотезах, необходимо отметить, что их возможности связаны не только с сопоставлением данных выборки и генеральной совокупности. Часто ставится задача сравнения результатов двух выборок, в частности сравнения двух выборочных средних или долей. В маркетинговых исследованиях обычно эта задача ставится при проведении эксперимента, который предполагает последовательное прохождение следующих этапов:


-

отбор групп для обследования;

-

создание для этих групп разной обстановки;

-

установление степени значимости различий между группами.

 

Например, с помощью эксперимента могут быть решены следующие задачи:


-

определение влияния ценовой политики на объемы продаж. Объектом тестирования в этом случае могут выступать потребители различных городов и населенных пунктов, специально отобранных для эксперимента. В некоторых населенных пунктах предлагаются новые цены или новая система скидок на товар, а в других — остается прежняя система цен. Цель эксперимента состоит в том, чтобы определить, насколько существенно различаются объемы продаж в населенных пунктах, включенных в эксперимент;

-

определение влияния сервиса на объемы продаж. Группам потребителей предлагается разный сервис: ускоренная или бесплатная доставка, консультации специалиста и др. При этом проверяется, может ли предприятие компенсировать дополнительные услуги с помощью увеличения объема продаж;

-

влияние упаковки на предпочтения потребителей. В этом случае фирма-производитель старается определить предпочтительный вид упаковки, предлагая один и тот же товар в разной упаковке.

 

Таким образом, эксперимент позволяет видеть причину и следствие, а также может быть использован для объяснения результатов выборочных наблюдений.

Приведенные примеры свидетельствуют о широких возможностях использования статистических гипотез для решения маркетинговых задач.

Общая последовательность проверки гипотез включает следующие этапы:

1. Выдвижение гипотезы (нулевой или альтернативной).

Нулевая гипотеза (), называемая также гипотезой «status quo», представляет собой утверждение, в котором исследователь констатирует факт отсутствия каких-либо отличий либо влияний в исходных данных. Она предназначена для определения согласованности исходных данных с выдвинутым предположением. Исследователю необходимо сформулировать нулевую гипотезу так, чтобы отказ от нее приводил к желательному заключению.

Например, предприятие рассматривает возможность разработки нового товара и выведения его на рынок. Для принятия положительного решения необходимо, чтобы объем продаж увеличился на 20%. Выдвинем следующее предположение: объем продаж увеличится менее чем на 20%. Это предположение и называется нулевой гипотезой и обозначается так:

Альтернативная гипотеза () предназначена для определения согласованности данных с нулевой гипотезой и опровергает ее. В нашем примере против нулевой гипотезы можно выдвинуть альтернативную гипотезу вида:

Если данные проверки гипотезы приводят к отказу от нулевой гипотезы, то принимается альтернативная гипотеза, в соответствии с которой можно ожидать увеличения объема продаж на 20%.

2. Выбор соответствующих статистических критериев.

Под статистическим критерием (критерием значимости, иногда — просто тестом) понимается решающее правило, по которому на основе результатов наблюдений (выборки) принимается решение о задаче статистической проверки гипотез.

В таблице 1 представлены наиболее часто используемые критерии для проверки статистических гипотез.

Таблица 1

Статистические критерии для проверки статистических гипотез [6, с. 568]

Область применения

Число подгрупп или выборочных совокупностей

Виды шкал

Критерий

Специальные требования

Примеры

Гипотезы о частоте распределения

Одна

Номинальная

Случайная выборка

Случайны или нет наблюдаемые различия в ответах респондентов

 

Две и более

Номинальная

Случайная выборка, независимые выборки

Случайны или нет различия в численности мужчин и женщин, реагирующих на продвижение товара

 

Одна

Порядковая

Критерий Колмогорова— Смирнова

Случайная выборка, естественный порядок данных

Случайно или нет распределение женщин, отдающих предпочтение определенному цвету туши (от темного до светлого)

Гипотезы о средних величинах

Одна (большая выборка)

Метрическая (интервальная или относительная)

Z — критерий для одной средней

Случайная выборка, n>30

Случайно или нет наблюдаемое различие между выборочной оценкой средней и стандартной или ожидаемой величиной средней

 

Одна (малая выборка)

Метрическая (интервальная или относительная)

t — критерий для одной средней

Случайная выборка, n>30

Пример такой же, но для малой выборки

 

Две (большие выборки)

Метрическая (интервальная или относительная)

Z — критерий для двух средних

Случайная выборка, n>30

Случайно или нет наблюдаемое различие между средними для двух подгрупп (средний доход у мужчин и женщин)

 

Две (малые выборки)

Метрическая (интервальная или относительная)

ANOVA (анализ вариации)

Случайная выборка

Случайна или нет вариация между средними для трех и более подгрупп (средняя величина расходов на развлечения для различных социальных групп)

Гипотезы о пропорциях

Одна (большая выборка)

Метрическая (интервальная или относительная)

Z — критерий для одной пропорции

Случайная выборка, n>30

Случайно или нет различие между выборочной оценкой пропорций и некоторой группой стандартных или ожидаемых оценок (процентом тех, кто собирается купить данный товар)

 

Две (большие выборки)

Метрическая (интервальная или относительная)

Z — критерий для двух пропорций

Случайная выборка, n>30

Случайно или нет наблюдаемое различие между оцениваемыми пропорциями для двух подгрупп (процентом мужчин и женщин, которые имеют высшее образование)

3. Разработка правил принятия решений.

Правила принятия решения необходимы для того, чтобы подтвердить или
опровергнуть нулевую гипотезу. Эти правила в статистике называются «уровнями значимости» (). Они являются показателями качества статистической проверки гипотез и характеризуют вероятность ошибочного заключения. А поскольку всякое решение, принимаемое на основе ограниченного ряда наблюдений, неизбежно сопровождается вероятностью ошибочного решения, важно определить, насколько велика эта вероятность. На практике часто пользуются следующими стандартными значениями () : 0,1; 0,05; 0,01; 0,005; 0,001.

С вероятностью () гипотеза Ho может оказаться отвергнутой, в то время как на самом деле она является справедливой (ошибка первого рода) , или, наоборот, с вероятностью () может быть принята гипотеза в то время, когда она является ошибочной (ошибка второго рода). При фиксированном объеме выборочных данных величину вероятности одной из этих ошибок можно выбирать. В частности, при фиксированном объеме выборки обычно задаются величиной () — вероятности ошибочного отвержения проверяемой гипотезы .

4. Расчет величины статистического критерия.

При осуществлении расчетов необходимо:


-

выбрать соответствующие формулы для расчета статистических критериев;

-

сравнить расчетные величины с критическими значениями статистических критериев;

-

принять решение о нулевой гипотезе: либо она отвергается, либо принимается. Принятие гипотезы не означает, что она является единственно подходящей: просто она не противоречит выборочным данным, однако такими же свойствами могут обладать и другие гипотезы.

 

В каждом конкретном случае использования статистических гипотез количество этапов проверки может варьироваться в зависимости от сложности расчета статистических критериев, но неизменным остается необходимость сравнения полученных расчетных значений с критическими, приведенными либо в специальных справочниках по прикладной статистике и маркетинговым исследованиям, либо в компьютерных статистических программах SPSS, Statistica, SAS и др.

2. Критерии согласия

 — критерий для одной выборки

Для оценки случайности или существенности расхождений между частотами эмпирического и теоретического распределений используется ряд показателей, именуемых критериями согласия. Одним из основных и наиболее распространенных показателей является критерий , предложенный К. Пирсоном:

где

наблюдаемая частота в каждой категории;

 

ожидаемая частота.

 

К. Пирсоном найдено распределение величины  и составлены таблицы, позволяющие определить предельное верхнее значение при заданном уровне значимости и числе степеней свободы, значение которого в общем случае равно количеству наблюдений за вычетом числа ограничений, необходимых для расчета статистической характеристики. Если фактическое значение  меньше табличного, то расхождения между эмпирическими и теоретическими частотами считают случайными, а гипотезу о принятом законе распределения принимают.

Рассмотрим ситуацию, когда менеджеру магазина электронной техники необходимо проверить эффективность трех мероприятий, проводимых в магазине с целью привлечения покупателей. Он хотел бы оценить эффект каждого мероприятия по числу покупателей магазина по следующим данным:

Мероприятие

Месяц

Число покупателей (тыс. чел.)

1

апрель

12,800

2

май

13,100

3

июнь

12,600

Всего

 

38,500

 

Менеджер должен выяснить, существенны ли различия между числом посетителей магазина в различные периоды времени. На этот вопрос позволяет ответить критерий (). Обратимся к последовательности проведения расчета в соответствии с рассмотренным ранее процессом проверки гипотез:

1) выдвигается нулевая и альтернативная гипотезы:


-

: число посетителей магазина во время проведения трех мероприятий одинаковое;

-

: существует значительная разница в численности посетителей магазина во время проводимых мероприятий;

2)

определяется ожидаемое (теоретическое) число посетителей в случае, если нулевая гипотеза верна. Естественно предположить, что численность посетителей должна быть одинакова при условии отсутствия влияния других факторов.

 

Ожидаемое число посетителей можно определить по формуле:

3) рассчитывается величина ():

4) выбирается уровень значимости, для которого будет найдено табличное значение . В приведенном примере число степеней свободы равно 2 (3 – 1). По специальной таблице распределения  [2, с. 761] определяем табличное значение  для  = 0,05 и числа степеней свободы (к – 1) = 2. В нашем случае  = 5,991;

5) сравнивается табличное значение  с расчетным. Так как расчетное значение  больше, чем табличное значение, нулевая гипотеза отвергается. Следовательно, можно сделать вывод с вероятностью 95%, что посетители магазина реагируют на проводимые мероприятия. Однако такая проверка не позволяет ответить на вопрос, насколько эффективность каждого мероприятия отличается от эффективности остальных.

 — критерий для двух независимых выборок

Маркетинговым исследователям часто бывает необходимо определить, существует ли связь между двумя и более переменными. Чтобы сформулировать маркетинговую стратегию, необходимо найти ответ на такие вопросы, как существуют ли различия в группировках мужчин и женщин на активных, умеренных и слабых потребителей или одинакова ли доля респондентов, покупающих и не покупающих данный товар, в группах с низким, средним и высоким доходом. В описанных ситуациях обычно используется  критерий для двух независимых выборок:

где

наблюдаемое число в каждой i-й строке j-й колонки;

 

ожидаемое число в i-й строке j-й колонки.

 

Предположим, что менеджеру необходимо определить природу связи, если она есть, между полом покупателей и частотой посещения магазинов. Исходные данные приведены в таблице 2.

Частота посещения магазинов изучалась в трех категориях:


-

1—5 посещений в месяц — слабые потребители;

-

6—14 посещений — умеренные потребители;

-

15 и более раз — активные потребители.

Таблица 2

Исходные данные для проверки различий между двумя независимыми выборками

Частота посещений магазина

Середина интервала (x)

Мужчины (fm)

Женщины (ff)

Итого

1—5

3

13

41

54

6—14

10

72

63

135

15 и более

17

12

14

26

Итого

*

97

118

215

 

Среднее число посещений магазина мужчинами :

Среднее число посещений магазина женщинами :

Для проведения теста необходимо:

1) сформулировать нулевую и альтернативную гипотезы:


-

: между полом и частотой посещения магазина связи нет;

-

: связь между двумя переменными существенна;

2) определить ожидаемые частоты для каждой группы, попавшей в исследование, используя итоговые данные по соответствующим строкам и столбцам (таблица 3).

Таблица 3

Расчет ожидаемых (теоретических) частот

Частота посещений

Мужчины

Женщины

1—5

(97 ґ 54) : 215 = 24,36

(118 ґ 54) : 215 = 29,64

6—14

(97 ґ 135) : 215 = 60,91

(118 ґ 135) : 215 = 74,09

15 и более

(97 ґ 26) : 215 = 11,73

(118 ґ 26) : 215 = 14,27

 

3) рассчитать теоретическую величину :

4) сравнить табличное значение  с расчетным (теоретическим). Табличное значение  (для уровня значимости 0,05 и (r – 1) х (k – 1) = 2 степеней свободы) равно 5,991 [2, с. 761]. Так как расчетное значение ( = 13,35) больше, чем табличная величина, нулевая гипотеза отвергается, и можно сделать вывод о том, что существуют различия между мужчинами и женщинами по частоте посещения магазина.

Критерий Колмогорова—Смирнова

Критерий Колмогорова—Смирнова предполагает определение эмпирических накопленных частостей (долей) и сравнение их с теоретическими частостями. Он используется в тех случаях, когда исходные данные упорядочены. Точка, в которой два распределения будут иметь максимальное расхождение (по модулю), может быть использована в качестве расчетного критерия, обозначаемого через Dn и определяемого по формуле:

где

накопленные частости (доли) эмпирического распределения;

 

накопленные частости теоретического распределения.

 

Величина , рассчитанная по данным выборки, сравнивается с критическим значением :

где

критерий Колмогорова—Смирнова, соответствующий заданному уровню значимости ;

 

n

размер выборки.

 

Различным значениям  соответствуют различные значения вероятностей. Эти показатели табулированы. При уровне значимости a = 0,05 значение  для большой выборки равно 1,36 [3, т. 2, с. 601]. Как и для показателя , считается вполне допустимым рассматривать расхождения между эмпирическими и теоретическими частотами случайными, если фактическое значение Dn меньше критического значения .

Предположим, производителя красок интересует мнение потребителей о 5 новых оттенках цветов синей краски. Производителю важно знать, отдают ли потребители предпочтение какому-либо из цветов. В ходе обследования были опрошены 1000 респондентов. Результаты приведены в таблице 4.

Таблица 4

Результаты опроса респондентов относительно их предпочтений

Оттенки краски

Число респондентов, предпочитающих данный цвет

Очень светлый

300

Светлый

340

Средний

160

Темный

90

Очень темный

110

 

Задача состоит в том, чтобы определить, случайно ли были отобраны цвета респондентами или приведенные данные характеризуют значительное предпочтение светлых цветов.

Тест Колмогорова—Смирнова включает следующие этапы:

1) Определение нулевой и альтернативной гипотез:

-

: потребители не отдают предпочтение ни одному из оттенков;

-

: предпочтения потребителей существенны;

 

2) расчет теоретических накопленных частостей, соответствующих нулевой гипотезе. Нулевая гипотеза заключается в том, что не существует разницы в предпочтениях потребителей для различных оттенков нового цвета. Если это так, то доля лиц, отдающих предпочтение каждому из оттенков, должна быть равна 1/5 (или 0,2);

3) расчет эмпирических накопленных частостей по данным выборки.

В таблице 5 приведены необходимые для расчета критерия данные.

 Таблица 5

Данные для расчета критерия Колмогорова—Смирнова

Цветовой оттенок

Число респондентов

Частости

Накопленные частости

Теоретические частости

Теоретические накопленные частости

Абсолютная разность

Очень светлый

300

0,3

0,3

0,2

0,2

0,1

Светлый

340

0,34

0,64

0,2

0,4

0,24

Средний

160

0,16

0,8

0,2

0,6

0,2

Темный

90

0,09

0,89

0,2

0,8

0,09

Очень темный

110

0,11

1

0,2

1

0

 

4) выбор уровня значимости .

При уровне значимости  = 0,05 критическое значение  равно 1,36 , следовательно, для большой выборки Dкрит определяется по формуле:

5) определение фактического значения , равного максимальному абсолютному отклонению между теоретическими и эмпирическими частостями.

Наибольшая абсолютная разность равна 0,24, которая и является величиной  по критерию Колмогорова—Смирнова;

6) сравнение расчетного значения  и критического значения . Принятие решения о нулевой гипотезе.

Так как расчетное значение  (0,24) превосходит критическое значение . (0,043), нулевая гипотеза об отсутствии предпочтений отвергается: респонденты предпочитают светлые тона.

3. Критерии для проверки гипотез о средних величинах

Одной из важных проблем в маркетинговых исследованиях является определение средней величины для генеральной совокупности на основе выборочных данных. Соответствующая статистическая проверка гипотезы о средней величине осуществляется с помощью Z-критерия, который используется в случае, если выборка достаточно большая (n  30). Для малой выборки (n < 30) используется t-критерий Стьюдента с (n – 1) степенями свободы (n — объем выборки). Для проверки гипотез о двух и более выборочных средних производится оценка различий между средними величинами.

Z-критерий для большой выборки

Для выводов относительно средней величины в генеральной совокупности на основе данных выборки можно использовать Z-критерий, если соблюдаются два условия:


-

распределение переменной в генеральной совокупности является нормальным;

-

объем выборки достаточно большой.

 

Z-критерий основан на стандартном нормальном распределении и рассчитывается следующим образом:

где

выборочная средняя;

 

генеральная средняя по Но;

 

стандартная ошибка оценки средней величины.

 

При этом средняя ошибка оценки равна:

где

среднее квадратическое отклонение в выборочной совокупности;

 

n

объем выборки.

 

Проиллюстрируем технику расчетов на следующем примере. Одна из стоматологических поликлиник провела обследование 500 пациентов, которых просили сравнить обслуживание в данной поликлинике с другими, функционирующими в этом же городе. Респонденты могли выбрать следующие ответы:

Обслуживание в поликлинике (по сравнению со средним уровнем)

Балл

Гораздо лучше

5

В чем-то лучше

4

Среднее

3

В чем-то хуже

2

Гораздо хуже

1

 

Средний балл, рассчитанный по данным ответов респондентов, оказался равен 3,5, со средним квадратическим отклонением 1,5. Может ли менеджер быть уверен, что в генеральной совокупности средний балл обслуживания будет не ниже 3 (средний балл по используемой шкале).

Для проверки этой гипотезы может быть использован Z-критерий.

Последовательность проверки следующая:

1) выдвижение нулевой и альтернативной гипотез:

-

: M  3 (M — оценка по используемой шкале);

-

: M > 3;

 

2) установление допустимого уровня ошибки выборки (). Для  = 0,05 табличное значение Z-критерия [3, т. 2, с. 492] равно 1,64;

3) выборочное среднее квадратическое отклонение () известно и равно 1.5;

4) расчет стандартной ошибки оценки генеральной средней по формуле:

5) расчет Z-критерия:

6) принятие решения о нулевой гипотезе: нулевая гипотеза может быть отвергнута, так как расчетная величина Z (7,463) больше, чем критическая величина Z = 1,64. Менеджер может быть уверен, что средняя оценка обслуживания в поликлинике выше, чем 3.

t-критерий для малой выборки

Как отмечалось ранее, для небольшого объема выборки (n < 30) гипотеза о средней величине проверяется с помощью t-критерия:

Расчет t-критерия осуществляется аналогично расчету Z-критерия, с той лишь разницей, что при определении среднего квадратического отклонения применяют несколько видоизмененную формулу, а именно, в знаменателе подкоренного выражения используют не величину объема выборки n, а величину (n – 1), т.е. объем выборки уменьшают на 1:

Для того чтобы продемонстрировать применение t-критерия, рассмотрим производителя безалкогольных напитков, который планирует изучить рынок нового безалкогольного напитка.

Случайным образом в городе были отобраны десять магазинов. Им был предложен для продажи в течение определенного промежутка времени новый безалкогольный напиток. Компания рассчитывала на продажу 100 бутылок нового напитка в день в каждом магазине. Только в этом случае ожидаемая прибыль оправдает расходы на продвижение нового товара. Фактические данные об объемах продаж приведены в таблице 6.

Таблица 6

Расчет t-критерия

Номер

Средний объем магазина

Отклонение от продаж в день (бут.)

Квадрат отклонения средней величины

1

87

–12

144

2

96

–3

9

3

105

6

36

4

120

21

441

5

86

–13

169

6

104

5

25

7

115

16

256

8

80

19

361

9

100

1

1

10

97

2

4

Итого

990

*

1446

 

Средний объем продаж за неделю составил 99 бут.

Последовательность процедуры тестирования следующая:

1) выдвижение нулевой и альтернативной гипотез:


-

 : M < 100 бутылок (M — средний объем продаж в магазине за неделю). Напомним, что 100 бутылок — это критический объем продаж, который оправдает все расходы по продвижению;

-

 : M > 100 бутылок;

2) установление допустимого уровня ошибки выборки (). Для  = 0,05 и степенями свободы 10-1=9 табличное (критическое) значение t = 2,2622 [2, с. 763].

3) определение среднего квадратического отклонения () по формуле, приведенной выше. В качестве Xi в данном случае принимается фактический объем продаж в i-м магазине за неделю; — средний объем продаж за неделю; n — количество магазинов.

Используя данные таблицы 6, можно рассчитать :

4) расчет стандартной ошибки для средней ():

5) расчет t-критерия:

6) формулировка выводов. Нулевая гипотеза не может быть отвергнута, так как расчетное значение t меньше, чем критическое значение. Среднее значение объема продаж ниже, чем 100 бутылок (Х = 99), генеральная средняя не превысит 100 бутылок в день. На основе этого теста можно заключить, что широко масштабное продвижение нового безалкогольного напитка было не оправдано.

Гипотезы о двух средних величинах

Менеджеры часто бывают заинтересованы в проверке различий между группами покупателей. Если выборки сформированы случайным образом и данные одной выборки не оказывают влияния на значения другой, то такие выборки считают независимыми. В практическом маркетинге гипотезы о параметрах двух выборок используются для определения значимости различий между потребителями и непотребителями определенной торговой марки, или различий в потреблении между двумя группами людей (мужчин и женщин, городским и сельским населением, людьми с высокими и низкими доходами, холостыми и семейными, работающими и пенсионерами, жителями двух стран и др.).

Для проверки значимости различий используют Z-критерий:

где

разница между средними в первой и второй выборках;

 

разница между средними по нулевой гипотезе;

 

стандартная ошибка различий между двумя средними.

 

При этом рассчитывается исходя из средних квадратических отклонений по отдельным группам:

Например, менеджер одного из магазинов самообслуживания был уверен, что мужчины чаще посещают магазин, чем женщины. Для иллюстрации проверки гипотез о двух средних величинах вернемся к данным о 215 посетителях магазина (таблица 2).

Статистическая проверка гипотезы включает следующие шаги:
1) выдвижение нулевой и альтернативной гипотез:

-

 :  среднее число посещений магазина мужчинами () такое же, или меньше, чем среднее число посещений магазина женщинами (). Другими словами, мужчины реже посещают этот магазин, чем женщины;

-

 :  среднее число посещений магазина мужчинами выше, чем число посещений магазина женщинами;

 

2) определение фактических различий в средних значениях показателей:

9,93 — 8,40 = 1,53;

3) выбор уровня ошибки выборки (). Предположим, что допустимый уровень ошибки выборки в данном случае равен 0.05. Табличное значение Z-критерия для уровня значимости 0,05 равно 1,6449 [3, т. 2, с. 492];
4) расчет стандартной ошибки различий между двумя средними величинами по формуле:

где

среднее квадратическое отклонение по группе мужчин (m);

 

среднее квадратическое по группе женщин (f);

 

размер выборки m;

 

размер выборки f.

 

Среднее квадратическое отклонение составит:


-

для мужчин

 

-

для женщин

 

Итак,  равно:

Заметим, что эта формула используется в тех случаях, когда две выборочные совокупности имеют различные показатели дисперсии;

5) расчет статистики Z-критерия:

6) формулирование выводов. Расчетное значение величины Z = 2,782 больше, чем критическое значение (1,64). Нулевая гипотеза отвергается. Менеджер может сделать вывод с вероятностью 95%, что в среднем мужчины чаще посещают магазины самообслуживания, чем женщины.

4. Критерии для проверки гипотез о пропорциях

Во многих случаях исследователь сталкивается с проблемой оценки различного рода пропорций. Например, при изучении рынка часто возникает интерес к соотношению респондентов, предпочитающих различные марки товаров. Для того чтобы определить, значимы ли различия между пропорциями или эти различия объясняются ошибкой выборки, используются Z-тесты о пропорциях.

Тест о пропорциях в одной выборке

Рассмотренные выше формулы для оценки генеральной средней применимы и для проверки гипотез о пропорциях при установлении доли тех или иных единиц в совокупности. При проверке используется Z-статистика, рассчитываемая по формуле:

где

фактическая пропорция;

 

пропорция по нулевой гипотезе;

 

расчетная стандартная ошибка выборки.

 

При этом расчет стандартной ошибки выборки с использованием P-значения, характерного для нулевой гипотезы, осуществляется с помощью формулы:

где

P

удельный вес клиентов, соответствующий нулевой гипотезе;

 

n

 

размер выборки.

 

В данном случае в числителе подкоренного выражения использован показатель дисперсии альтернативного признака, который равен произведению доли единиц, обладающих данным свойством (Р), на долю единиц, не обладающих данным признаком (1 – P).

Предположим, что обследование 500 счетов клиентов, проведенное сберегательным банком, показало, что 74,29% имеют среднемесячный остаток на счете более 50 000 руб. Если эти данные подтвердятся для генеральной совокупности, то банк разработает специальный пакет услуг для данной группы клиентов. Менеджер хотел бы определить, превышает ли удельный вес таких клиентов 60% в генеральной совокупности, перед тем как разработать этот пакет услуг. Процедура проверки гипотезы о пропорции в генеральной совокупности включает следующие этапы:

1) выдвижение нулевой и альтернативной гипотез:


-

нулевая гипотеза :

-

альтернативная гипотеза : P > 0,60, где P — удельный вес клиентов со среднемесячных остатком выше 50 000 руб.;

 

2) выбор уровня ошибки выборки (). Для  = 0,05 табличное значение Z-критерия равно 1,6449 (3, т. 2, с. 492).

3) расчет стандартной ошибки выборки:

4) расчет Z-статистики:

5) формулирование выводов. Нулевая гипотеза отвергается, так как расчетное значение Z выше, чем критическое значение. Таким образом, можно сделать вывод с вероятностью 95% , что более 60% клиентов имеют ежемесячно остаток на счете более 50 000 руб. Менеджер может представить новый пакет услуг для этой целевой группы.

Тест различий между двумя пропорциями в независимых выборках

Во многих случаях менеджер интересуется различиями между пропорциями в двух различных группах людей, которые заняты определенным родом деятельности, или имеют определенные характеристики.

Для изучения степени различий между пропорциями производится расчет Z-статистики по формуле:

где

разница между наблюдаемыми долями;

 

разница между долями по нулевой гипотезе;

 

расчетная стандартная ошибка разницы между двумя долями.

 

В свою очередь,  рассчитывается по следующей формуле:

где Р — среднее значение пропорции для двух различных групп, рассчитываемое по формуле арифметической взвешенной, где в качестве весов выступает число единиц совокупностей  и , попавших в выборки 1 и 2, соответственно:

Например, менеджер магазина самообслуживания на основании данных проведенного обследования (таблица 2) имеет все основания верить, что удельный вес мужчин, посещающих магазин 15 и более раз в месяц (активные покупатели) в общей численности посетителей-мужчин, выше, чем удельный вес посетителей-женщин.

Процедура проверки выдвинутой гипотезы следующая:
1) выдвижение нулевой и альтернативной гипотез:


-

нулевая гипотеза  :  доля мужчин (), совершающих покупки в магазине 15 и более раз в месяц, такая же или меньше, чем доля женщин (), совершающих покупки с той же частотой;

-

альтернативная гипотеза  :  доля активных покупателей-мужчин выше, чем доля активных покупателей-женщин;

 

2) выбор уровня ошибки выборки (). Для  = 0,05 табличное значение Z-критерия равно 1,6449 [3, т. 2, с. 492];

3) расчетная стандартная ошибка различий между двумя долями рассчитывается по формуле:

где

доля активных покупателей в выборочной совокупности мужчин (m);

 

доля активных покупателей в выборочной совокупности женщин (f);

 

численность мужчин, попавших в выборку;

 

численность женщин, попавших в выборку.

 

Выборочные доли и степень их различия могут быть рассчитаны по данным таблицы 2:
 = 12/97 = 0,1237;
 = 14/118 = 0,1186.
Тогда

4) расчет Z-статистики:

5) принятие решения о нулевой гипотезе. Нулевая гипотеза принимается, так как расчетное значение Z-критерия (0,113) меньше, чем критическое значение Z (1,6449 для  = 0,05). С вероятностью 95% (1 – ) = 0,95 можно сделать вывод, что доля активных покупателей-мужчин такая же, как доля активных покупателей-женщин.

В заключение необходимо заметить, что некоторые исследователи ставят знак равенства между статистической и практической значимостями. Необходимо помнить, что какое-то различие может быть практически важным, но статистически недостаточно важным. Например, допустим 10% риск ошибки, а исследователь принял уровень значимости  = 0,05; таким образом, потенциальная возможность принятия гипотезы осталась нерассмотренной. И наоборот, если объем выборки очень велик, статистическая значимость результата может быть высока, но сам результат может не иметь практического значения. Поэтому исследователям необходимо проявлять осторожность при интерпретации результатов проверки гипотез.

ЛИТЕРАТУРА

1. Голубков Е.П. Маркетинговые исследования: теория, методология и практика. — М.: Финпресс, 1998. Гл. 4., § 4.13.2.2: Статистический вывод; § 4.13.2.3: Анализ различий.
2. Малхотра Н. Маркетинговые исследования и эффективный анализ статистических данных / Пер. с англ. — Киев: ООО «ТИД «ДС», 2002. Гл. 16: Распределение частот, проверка гипотез и построение таблиц сопряженности.
3. Справочник по прикладной статистике: В 2 т.: Пер. с англ./ Под ред. Э. Ллойда, У. Ледермана, С.А. Айвазяна, Ю.Н. Тюрина. — М.: Финансы и статистика, 1990.
4. Черчилль Г.А. Маркетинговые исследования. — СПб: Питер, 2001. Гл. 20: Анализ данных: оценка различий.
5. Aaker, David A. and Day George S. Marketing Research, John Wiley and Sons, 1990. Part 2. Chapter 14: Hypothesis Testing.
6. McDaniel, Carl D. Contemporary marketing research / Carl McDaniel, Roger Gates/ — 2nd ed., 1993. Chapter 16: Data Analysis: Statistical Testing of Differences.

Также по этой теме: