Сегодня поисковые системы помогают анализировать социальные и политические перемены в стране.
В современном интернет-маркетинге используется большое количество инструментов, позволяющих определить целевую аудиторию компании, ее характеристики, предпочтения и прочее. По большому счету, любое маркетинговое исследование во многом базируется на принципах и методах социологического анализа, но применяется в бизнесе, а не в фундаментальных гуманитарных работах.
Вместе с тем, эти инструменты все же можно использовать и в сфере социологии. К сожалению, в Казахстане такого рода методы в политологической и социологической науке почти не используются, тем самым игнорируется серьезный инструмент анализа.
В этой статье будет показано, как можно работать с данными двух популярных поисковых систем на примере исследования языковых изменений в Казахстане.
В 2016 году во время религиозного поста Ораза впервые в бытовом языковом дискурсе появилось слово «ифтар», которое является арабским аналогом традиционного понятия «ауызашар» (разговение). Арабский термин стал появляться на вывесках кафе в Алматы, звучать в речи. Это объективно показывает, что в быту начали сосуществовать два языковых маркера. Это свидетельствует о культурологических изменениях, которые только предстоит исследовать в междисциплинарном дискурсе религиоведения, социологии, этнографии и лингвистики.
1. Google Trends является одним из интернет-сервисов, которым может воспользоваться исследователь. Поисковик Google не только ищет статьи по запросу, но и аккумулирует Big Data, часть из которых доступны всем. Google Trends не показывает количество запросов в абсолютном выражении – узнать, какое количество раз люди искали то или иное слово, невозможно. Механизм работает иначе — чтобы вычислить относительную популярность слова или словосочетания, сервис делит значение показателя в каждой точке на графике на общее количество запросов в указанном регионе и в заданный период времени. Затем полученные данные масштабируются от 0 до 100. Название инструмента полностью соответствует его сути – он показывает только тренды к увеличению или уменьшению. Здесь можно осуществлять сравнительный анализ сразу нескольких слов, а также делать выборку по конкретному региону.
Таким образом, мы можем проанализировать тренды запросов слов «ифтар» и «ауызашар», сравнить их, задав конкретный регион анализа – Казахстан. При этом следует отметить, что работать с запросами нужно тщательно. Люди могут искать один и тот же термин, но писать его по-разному, например, с грамматической ошибкой. Поэтому следует искать все возможные формы написания слова «ауызашар», например, «аузашар» или «ауыз ашар».
При запросе с 2004 по 2016 год максимум значений набрало слов «ауызашар», оно берется за 100. От этого показателя выстраиваются все остальные данные.
Вместе с тем, если смотреть на динамику, то тренды будут следующими:
Эти же данные в форме диаграммы:
В результате можно сделать несколько выводов:
В конкуренции запросов терминов «ифтар» и «ауызашар» (в разных комбинациях) в тренде традиционное обозначение. Если говорить о 2016 годе, то соотношение трендов запросов арабского термина «ифтар» к традиционному казахскому «ауызашар» составляет почти 1:3.
Необычным является всплеск интереса к слову «ифтар» в 2005 году и постепенный спад до нуля в 2008 и 2009 годах. Google Trends не предоставляет статистику до 2005 года, поэтому невозможно судить о том, насколько популярным запрос был ранее. Тем не менее, статистика показывает, что с 2010 года наблюдается устойчивый интерес с постепенным ростом в последние три года.
Пик запросов обоих слов совпадает во времени друг с другом, а также со временем поста (см. диаграмму). Очевидно, это связано с утилитарным интересом – пользователи ищут в сети время начала ауызашара, рецепты, адреса кафе, в которых можно поужинать и т. д.
Также Google Trends дает данные по географии запросов.
Это тренды популярности запроса «ауызашар»:
Здесь отображаются тренды запроса «ауыз ашар». Интересно, что представлены всего четыре региона – это может быть предметом этнографического или лингвистического исследования.
Наиболее любопытной является диаграмма по запросу «ифтар»:
Далее в убывающем порядке идут Кызылординская область (52), Южно-Казахстанская область (48), Восточно-Казахстанская область (28) и Павлодарская (27).
Вместе с тем при использовании подобного инструмента нужно быть осторожным в интерпретации данных, поскольку всегда нужно делать дисклеймеры следующего рода:
Планировщик ключевых слов GoogleAdWords – еще один полезный инструмент, который позволяет детализировать данные. В панели поиска следует выставить максимальный диапазон дат, выбрать источник поиска «Google и поисковые партнеры» и указать назначение таргетинга «Казахстан». В итоге по запросам можно получить следующие данные в пике значений:
Также здесь можно сравнивать данные по городам. Здесь следует помнить об обычных ограничениях – нужно учитывать количество жителей, уровень проникновения интернета, приоритет того или иного поисковика. В связи с этим лучше сравнивать не города как таковые, а запросы внутри конкретных населенных пунктов. Статистика по городам доступна только за июль 2016 года (кол-во запросов):
YandexWordStat принадлежит компании Яндекс. Этот инструмент также позволяет посмотреть помесячный или понедельный срез статистики показов по заданному запросу в абсолютном выражении. Работает таргетирование по конкретной стране/региону. Однако если обратить внимание на предоставляемую статистику, то показатели гораздо ниже, чем у Google. Можно предположить, что этот поисковик не так популярен в Казахстане, но его данными можно воспользоваться, чтобы также увидеть некую тенденцию.
Так, если задать поиск по слову «ифтар», выбрать фильтр «История запросов» и задать регион «Казахстан», мы получим следующие данные в пике значений:
Данные по запросу «ауызашар» в пике значений:
Данные по запросу «ауыз ашар» в пике значений:
Помимо указанных инструментов, статистику предоставляют также компании Rambler и Mail.ru, однако в цели данной публикации не входит демонстрация работы всех служб.
Помимо публичных способов анализа существуют и закрытые. Так, любой сайт собирает обширную статистику, особенно если в него встроена система сбора информации Google Analytics. Если продолжать тему религиоведения, то у сайтов мечетей и церквей Казахстана также есть обширная информация с динамикой численности посетителей, регионов, языка и т. д. Эти данные также могут иметь дополнительные значение в исследовании.
Использованный пример с изменением частоты запроса слов-маркеров показывает как плюсы, так и минусы интернет-инструментов. Очевидно, что они все-таки были разработаны как помощь бизнесу, поэтому в сфере фундаментальных исследований их использование ограничено. Получаемые данные необходимо перепроверять другими инструментами из традиционных наборов социолога или в данном случае филолога.
Тем не менее, использование онлайн-сервисов может стать частью инструментария казахстанского исследования. К сожалению, в Казахстане нет такого мощного инструмента, как база Национального корпуса русского языка, какой создан в России. В результате фундаментальной и кропотливой работы российских ученых в интернете есть библиотека, в которой можно проследить историю любого русского слова – дату первого употребления, источник, динамику. Следует признать, что предложенные здесь методы текстового анализа являются только суррогатом Национального корпуса русского языка.
Чтобы привести пример, как можно работать с интернет-технологиями, был использован анализ употребления слов-маркеров – арабское «ифтар» и казахское «ауызашар». Оба они означают одно и то же, однако динамика запросов показывает возрастающий интерес к арабскому аналогу. Процесс нужно наблюдать в динамике. Возможно, в средне- или долгосрочной перспективе частота использования обоих слов сравняется, а возможно, понятие «ауызашар» начнет вытесняться. Это будет означать многое, в частности, не столько рост интереса к вопросам религии (статистика запросов по «ауызашар» также растет), сколько увеличение влияния арабской формы ислама. Языковые изменения – один из самых верных индикаторов перемен в обществе.
Источник: ИНСТИТУТ МИРОВОЙ ЭКОНОМИКИ И ПОЛИТИКИ
Самый удачный старт-ап мира — на службе ФБР. Скоро в Казахстане