Как «большие данные» освобождают исследования от лишней рутины. Раздел "Международный маркетинг"

Опубликовано в журнале "Маркетинг в России и за рубежом" №3 год - 2014

В данной рубрике представлены статьи, написанные по результатам
исследований, проведенных сотрудниками компании Millward Brown –
ведущего глобального исследовательского агентства, специализирующегося
в области маркетинговых коммуникаций и медиа1.

Рассматривается понятие «большие данные» и их применение в бизнесе и в других сферах общественной жизни. Большие данные снижают действие фактора неопределенности. Первичные рыночные исследования (малые данные) рекомендуется проводить после получения больших данных.

Сегодня все говорят о больших данных (big data). Эти разговоры варьируются от простого определения самого термина «большие данные» до их использования в бизнесе и социальных последствиях нового мира больших данных. Поисковый запрос в Google по словосочетанию «Big Data» дает 1,66 млрд результатов, и я уверен, что это число увеличилось в то время, пока я писал эту статью.

Во всей этой какофонии комментариев есть одна тема, особо горячо обсуждаемая в нашей отрасли: действительно ли большие данные заменят собой традиционные маркетинговые исследования и, возможно, отодвинут первичные исследования в область устаревших методик? Этот вопрос и вправду не лишен актуальности.

Что было до больших данных
Позвольте мне начать с небольшого рассказа. Несколько лет назад я вел занятия в группе исследователей среднего уровня об инновациях в отрасли исследований. Занятия я начал с вопроса: «Когда вы получаете запрос от клиентов с просьбой получить детальную информацию о бренде или коммуникациях, рекомендуете ли вы им что-нибудь кроме проведения нового исследования?» Участники посмотрели на меня озадаченно. Наконец один из них сказал: «Но мы же используем исследования для того, чтобы оценить здоровье бренда и эффект от коммуникаций. Для каждой новой ситуации нам нужен новый набор данных. Так как же мы можем НЕ рекомендовать исследования?»

По материалам Уильяма Пинка (William C. Pink), старшего партнера Creative Analytics в Millward Brown, North America.
(1) Составитель данных материалов – Е.П. Голубков; перевод и адаптация Н.В. Кирилловой.

Это был типичный образ мышления в то время, которое можно назвать «эпохой до больших данных». Какова бы ни была цель исследования (сегментация потребностей пользователей, улучшение таргетинга или оценка воздействия рекламы на здоровье бренда), было разумно предположить, что по каждому случаю нам нужно получить и проанализировать новый набор данных. Но это исходное предположение больше неактуально. В современном мире больших данных почти все можно пассивно наблюдать и контролировать с помощью цифровых технологий. Соответственно у нас есть возможность использовать информационные активы, которые ранее были недоступны (или вообще не существовали), для того чтобы быстро и глубоко проанализировать любую ситуацию.

Нельзя сказать, что большие данные – это какое-то принципиально новое явление. Большие источники данных существуют уже много лет: базы данных по покупкам клиентов, кредитным историям, образу жизни. И в течение многих лет ученые использовали эти данные, чтобы помогать компаниям оценивать риск и прогнозировать будущие потребности клиентов. Однако сегодня ситуация изменилась в двух аспектах: появились более сложные инструменты и методы для анализа и сочетания различных наборов данных, и эти аналитические инструменты дополнены целой лавиной новых источников данных, вызванных переходом на цифровые технологии практически всех методов сбора и измерения данных.

Диапазон доступной информации одновременно и вдохновляет, и пугает исследователей, выросших в структурированной исследовательской среде. Потребительские настроения фиксируются сайтами и всевозможными разновидностями социальных медиа. Факт просмотра рекламы фиксируется не только телевизионными приставками, но и с помощью цифровых тегов и мобильных устройств, общающихся с телевизором.

Поведенческие данные (такие как число звонков, покупательские привычки и покупки) теперь доступны в режиме реального времени. Таким образом, многое из того, что раньше можно было получить с помощью исследований, сегодня можно узнать с помощью источников больших данных. И все эти информационные активы генерируются постоянно, независимо от каких бы то ни было исследовательских процессов. Эти изменения и заставляют нас задаться вопросом: смогут ли большие данные заменить собой классические исследования рынка?

Дело не в данных – дело в вопросах и ответах
Прежде чем заказывать похоронный звон по классическим исследованиям, мы должны напомнить себе, что решающее значение имеет не наличие тех или иных активов данных, а нечто иное. Что именно? Наша способность отвечать на вопросы – вот что. У нового мира больших данных есть одна забавная черта: результаты, полученные на основе новых информационных активов, приводят к появлению еще большего количества вопросов, а на эти вопросы, как правило, лучше всего отвечают традиционные исследования. Таким образом, по мере роста больших данных мы видим параллельный рост наличия и потребности в небольших данных, которые могут дать ответы на вопросы, возникшие из мира больших данных.

Рассмотрим ситуацию: крупный рекламодатель проводит постоянный мониторинг трафика в магазинах и объемов продаж в режиме реального времени. Существующие исследовательские методики (в рамках которых мы опрашиваем участников исследовательских панелей об их мотивациях к покупке и поведении в точках продаж) помогают нам лучше нацелиться на определенные сегменты покупателей. Эти методики могут быть расширены – они могут включать в себя более широкий диапазон активов больших данных, вплоть до того, что большие данные становятся средством пассивного наблюдения, а исследования – методом постоянного узкоцелевого исследования изменений или событий, требующих изучения. Именно так большие данные могут освободить исследования от лишней рутины. Первичные исследования уже не должны фокусироваться на том, что происходит (это сделают большие данные). Вместо этого первичные исследования могут сосредоточиться на объяснении того, почему мы наблюдаем те или иные тенденции или отклонения от тенденций. Исследователь сможет меньше думать о получении данных и больше – о том, как их проанализировать и использовать.

В то же время мы видим, что большие данные позволяют решать одну из наших самых больших проблем – проблему чрезмерно длинных исследований. Изучение самих исследований показало, что чрезмерно раздутые исследовательские инструменты оказывают негативное воздействие на качество данных. Хотя многие специалисты в течение длительного времени признавали наличие этой проблемы, они неизменно отвечали на это фразой: «Но ведь эта информация нужна мне для высшего руководства», и длинные опросы продолжались.

В мире больших данных, где количественные показатели можно получить с помощью пассивного наблюдения, этот вопрос становится спорным. Опять же, давайте вспомним обо всех этих исследованиях, касающихся потребления. Если большие данные дают нам информацию о потреблении с помощью пассивного наблюдения, то с помощью первичных исследований в форме опросов уже не надо собирать такого рода информацию, и мы сможем наконец подкрепить свое понимание коротких опросов не только благими пожеланиями, но и чем-то реальным.

Большие данные нуждаются в нашей помощи
Наконец, «большие» – это лишь одна из характеристик больших данных.

Характеристика «большие» относится к размеру и масштабу данных. Конечно, это основная характеристика, поскольку объем этих данных выходит за рамки всего того, с чем мы работали прежде. Но другие характеристики этих новых потоков данных также важны: они зачастую плохо форматированы, неструктурированы (или в лучшем случае структурированы частично) и полны неопределенности.

Развивающаяся область управления данными, метко названная «анализ сущностей» (entity analytics), призвана решить проблему преодоления шума в больших данных.

Ее задача – проанализировать эти наборы данных и выяснить, сколько наблюдений относятся к одному и тому же человеку, какие наблюдения являются текущими и какие из них пригодны для использования.

Такой вид очистки данных необходим для того, чтобы удалить шум или ошибочные данные при работе с активами больших или небольших данных, но этого недостаточно. Мы также должны создать контекст вокруг активов больших данных на основе нашего предыдущего опыта, аналитики и знания категории. На самом деле многие аналитики указывают на способность управлять неопределенностью, присущей большим данным, как источник конкурентного преимущества, так как она позволяет принимать более эффективные решения.

И вот тут-то первичные исследования не только оказываются освобожденными от рутины благодаря большим данным, но и вносят свой вклад в создание контекста в рамках анализа больших данных.

Примером этого может служить приложение нашей новой, принципиально иной рамочной модели капитала бренда к социальным медиа (речь идет о разработанном в Millward Brown новом подходе к измерению ценности бренда The Meaningfully Different Framework. – Прим. ред.). Эта модель проверена на поведении в рамках конкретных рынков, реализована на стандартной основе, и ее легко применить в других маркетинговых направлениях и информационных системах для поддержки принятия решений. Другими словами, наша модель капитала бренда, опирающаяся на исследования методом опросов (хотя и не только на них), обладает всеми свойствами, необходимыми для преодоления неструктурированного, несвязного и неопределенного характера больших данных.

Рассмотрим данные по потребительским настроениям, предоставляемые социальными медиа. В сыром виде пики и спады потребительских настроений очень часто минимально коррелируют с параметрами капитала бренда и поведения, полученными в оффлайне: в данных просто слишком много шума. Но мы можем уменьшить этот шум, применяя наши модели потребительских оценок, дифференциации брендов, динамики и отличительных черт к сырым данным потребительских настроений – это способ обработки и агрегации данных социальных медиа по этим измерениям.

После того как данные организованы в соответствии с нашей рамочной моделью, выявленные тренды обычно совпадают с параметрами капитала бренда и поведения, полученными в оффлайне. По сути, данные социальных медиа не могут говорить сами за себя. Чтобы использовать их для указанной цели, требуются наш опыт и модели, выстроенные вокруг брендов. Когда социальные медиа дают нам уникальную информацию, выраженную на том языке, который потребители используют для описания брендов, мы должны использовать этот язык при проектировании своих исследований, чтобы сделать первичные исследования более эффективными.

Преимущества освобожденных исследований
Это возвращает нас к тому, что большие данные не столько заменяют исследования, сколько освобождают их. Исследователи будут освобождены от необходимости создавать новое исследование по каждому новому случаю. Постоянно растущие активы больших данных могут быть использованы для разных тем исследований, что позволяет последующим первичным исследованиям углубиться в тему и заполнить имеющиеся пробелы. Исследователи будут освобождены от необходимости полагаться на чрезмерно раздутые опросы. Вместо этого они смогут использовать краткие опросы и сосредоточиться на самых важных параметрах, что повышает качество данных.

Благодаря такому освобождению исследователи смогут использовать свои отработанные принципы и идеи, чтобы добавить точности и смысла активам больших данных, что приведет к появлению новых областей для исследований методом опроса. Этот цикл должен привести к более глубокому пониманию по целому ряду стратегических вопросов и в конечном счете – к движению в сторону того, что всегда должно быть нашей главной целью – информировать и улучшать качество решений, касающихся бренда и коммуникаций.

Используемые источники
1. millwardbrown.com/Libraries/MB_POV_Downloads/Millward_Brown_POV_How_Big_Data_Liberates_Research.sflb.ashx
2. mb-blog.com

14.09.2020

Также по этой теме: