В подавляющем большинстве случаев клиенту предлагается семантическое ядро, ориентированное на одну поисковую систему. При использовании статистики самой популярной поисковой системы особенности и предпочтения более чем 40 % пользователей не берутся в расчёт.
Данное исследование призвано дать ответы на вопросы о схожести портретов пользователей с точки зрения формулирования запросов в поисковых системах, а также возможности обеспечить комплексное продвижение, в рамках нескольких систем, при едином списке запросов. Второй задачей данной работы, является определение наиболее «коммерческой» (ориентированной на покупку товара или услуги) поисковой системы.
Цели и задачи
Целью работы является определение степени схожести структур поисковых запросов к крупнейшим российским поисковым системам (Яндекс, Рамблер, Google). Определение степени схожести с поисковым трафиком российского Интернета, в целом.
Определение поисковой системы, чья пользовательская аудитория, наиболее, нацелена на покупку товара или услуги. Определение процента транзакционных («продающих») запросов от общего числа поисковых запросов к поисковой системе.
Определение процента пересечения поисковых запросов, в исследуемых поисковых системах и принципа формирования семантического ядра исходя из полученных данных.
Провести анализ распределения поисковых запросов по количеству слов, для тематик наиболее важных с коммерческой точки зрения, где значительная часть пользователей нацелена на приобретение товаров или услуг:
- Авто;
- Дом и Семья;
- Компьютеры;
- Медицина;
- Недвижимость;
- Товары;
- Туризм.
Материалы и методы:
В исследовании применялись следующие материалы:
- основным источником данных является система статистики LiveInternet. Статистика основана на данных о пользователях сайтов, страницы которых содержат код счётчика LiveInternet (таблица 1.1).
- для анализа статистики разработан комплекс программных средств, позволяющий:
- собирать информацию о поисковых запросах из статистики счётчика LiveInternet и интерпретировать полученные результаты в виде таблиц и гистограмм;
- анализировать множества поисковых запросов к различным системам и определять подмножества запросов, встречающихся во множестве запросов к каждой поисковой системе;
- составлен список слов маркеров, которым будет характеризоваться принадлежность запроса к числу транзакционных (таблица 1.2).
Таблица 1.1 – База поисковых запросов
Поисковая система |
Количество поисковых фраз |
Запросов пользователей |
Всего запросов |
Доля от общего трафика |
Все |
1273889 |
4626081 |
9221258 |
51% |
Яндекс |
703146 |
1405358 |
3336342 |
42% |
|
535193 |
939930 |
1748298 |
54% |
Rambler |
236194 |
582459 |
713634 |
81% |
Таблица 1.2 – Список слов-маркеров
№ |
Маркер |
1 |
price |
2 |
аренда |
3 |
в аренду |
4 |
арендовать |
5 |
бронировать |
6 |
бронирование |
7 |
в кредит |
8 |
внести |
9 |
в розницу |
10 |
доставка |
11 |
заказ |
12 |
заказать |
13 |
зарегистрировать |
14 |
заявка |
15 |
купить |
16 |
куплю |
17 |
купля |
18 |
магазин |
19 |
оптовый |
20 |
оптом |
21 |
подписаться |
22 |
подписка |
23 |
покупка |
24 |
положить |
25 |
прайс |
26 |
предлагаю |
27 |
предложение |
28 |
преобрести |
29 |
приобрести |
30 |
продается |
31 |
продажа |
32 |
продам |
33 |
продать |
34 |
прокат |
35 |
регистрация |
36 |
розница |
37 |
розничный |
38 |
салон |
39 |
сдать |
40 |
сделка |
41 |
скачать |
42 |
служба |
43 |
снять |
44 |
спрос |
45 |
стоимость |
46 |
услуга |
47 |
цена |
48 |
цены |
Ход исследования
2.1 Распределение поисковых запросов
После сбора статистики были получены данные о распределении поисковых запросов относительно их длин в словах для трёх крупнейших российских поисковых систем и для поискового трафика в русскоязычном Интернете в целом (Таблица 2.1)
Таблица 2.1 – Распределение поисковых запросов относительно длины
Длина поискового запроса (слов) |
Доля запроса, % | |||
Рунет |
Яндекс |
|
Рамблер | |
2 |
25,56 |
28,076 |
27,784 |
30,526 |
3 |
23,18 |
24,261 |
24,226 |
22,683 |
1 |
13,17 |
16,999 |
17,17 |
21,075 |
4 |
14,89 |
14,966 |
15,123 |
13,285 |
5 |
7,88 |
7,82 |
8,054 |
6,592 |
Другие |
7,66 |
7,895 |
7,652 |
5,843 |
Из данных таблицы 2.1 видно, что поисковые запросы группы «Другие» (6 и более слов), составляют малую часть от общего поискового трафика. А также следует отметить, что запросы указанной группы в поисковых системах Яндекс и Google имеют большую долю, чем в поисковой системе Рамблер. Представим данные таблицы 2.1 в виде гистограмм (рисунок 2.1)
Рисунок 2.1 – Распределение поисковых запросов относительно длины
Из рисунка 2.1 видно, что структуры поисковых запросов пользователей поисковых систем Яндекс и Google очень похожи, и значительно отличаются от структуры поисковых запросов в системе Рамблер. Поисковые запросы к системе Рамблер характеризуются преобладанием коротких запросов. Доля одно-, двух- и трёхсловных запросов значительно выше, чем у запросов соответствующей длины, к другим поисковым системам. Следует отметить, что относительно длинные поисковые запросы, длиной 4 и более слов, занимают около трети всего поискового трафика. Если включить в данную группу запросы с длиной в 3 слова, то трафик с этих запросов на сайты составит около 50% от всего поискового трафика.
2.2 Определение транзакционных («продающих») запросов
За аксиому примем то, что поисковый запрос можно считать относящимся к группе транзакционных запросов в том случае, если в него входят слова маркеры (с учётом морфологических изменений слов маркеров). Далее, отфильтровав выборки поисковых запросов по каждой из поисковых систем, выявим долю поисковых запросов транзакционного характера от общего числа поисковых запросов (таблица 2.2)
Таблица 2.2 – Доля транзакционных поисковых запросов от общего числа
Поисковая система |
Транзакционных запросов |
Общее количество поисковых запросов |
Доля транзакционных поисковых запросов |
Рунет |
146886 |
9559757 |
1,54 |
Яндекс |
60896 |
3336342 |
1,83 |
|
23775 |
1748298 |
1,36 |
Рамблер |
21855 |
713634 |
3,06 |
Безусловно, учитываются не все потенциальные транзакционные запросы. Однако, в силу репрезентативности выборки, полученные данные можно считать отражающими общую тенденцию поискового трафика и присутствие в нём транзакционных запросов.
Изучение долей транзакционных запросов в общем трафике поисковых запросов показывает, что аудитория поисковой системы Рамблер наиболее нацелена на приобретение товаров или услуг. При этом процент транзакционных поисковых запросов к поисковой системе Рамблер фактически в 2 раза больше аналогичного процента в поисковых системах Яндекс и Google (рисунок 2.2).
Представим процент транзакционных поисковых запросов в виде круговой диаграммы (рисунок 2.3). Из диаграммы видно, что при условии равенства числа поисковых запросов, поисковая система Рамблер, потенциально, способна генерировать половину всего “продающего” трафика.
Аудитория поисковой системы Google наибольшим образом ориентирована на информационные и навигационные запросы
Рисунок 2.2 – Процент транзакционных запросов во множестве запросов к ПС
Рисунок 2.3 – Процент транзакционных запросов во множестве запросов к ПС
Приведём списки наиболее часто встречающихся слов-маркеров в поисковом трафике каждой исследуемой поисковой системы и в Интернете в целом (таблица 2.3):
Таблица 2.3 – Наиболее популярные слова-маркеры, (процент от всех транзакционных запросов)
№ п/п |
Рунет |
Яндекс |
|
Рамблер |
1 |
магазин (14,72) |
магазин (15,83) |
купить (17,19) |
магазин (17,8) |
2 |
купить (14,29) |
купить (13,77) |
магазин (13) |
продажа (14,11) |
3 |
продажа (13,97) |
продажа (12,26) |
цена (12,1) |
купить (10,94) |
4 |
цена (9,09) |
цена (8,25) |
продажа (10,93) |
цена (8,36) |
5 |
прайс (6,20) |
салон (6,65) |
прайс (7,43) |
салон (7,53) |
6 |
салон (5,77) |
прайс (5,98) |
салон (4,81) |
прайс (6,23) |
7 |
продам (5,31) |
стоимость (5,2) |
продам (4,55) |
продам (4,11) |
8 |
стоимость (4,08) |
продам (4,24) |
стоимость (4,1) |
стоимость (3,81) |
9 |
куплю (3,43) |
куплю (3,14) |
аренда (3,44) |
аренда (3,4) |
10 |
аренда (3,37) |
аренда (3,1) |
заказ (2,41) |
куплю (3,39) |
Данные таблицы 2.3 рекомендуются в качестве слов для составления транзакционных запросов. Которые при условии видимости в поисковых системах, обеспечат наилучший результаты конвертации посетителей в покупатели.
2.3 Пересечение поисковых запросов
На основе анализа пересечений множеств поисковых запросов к различным поисковым системам можно построить гипотезу о сходстве аудиторий. Анализ пересечений проводился с учётом морфологии (запросы «пластиковое окно» и «пластиковые окна», равнозначны). Нами были проанализированы следующие подмножества поисковых запросов:
- Пересечение всех поисковых запросов;
- Пересечение поисковых запросов длиной от 1 до 3 слов, включительно;
- Пересечение поисковых запросов длиной в 1 слово;
- Пересечение поисковых запросов длиной в 2 слова;
- Пересечение поисковых запросов длиной в 3 слова.
Результаты анализа приведены в таблице 2.4.
Таблица 2.4 – Доля пересекающихся поисковых запросов
Поисковые системы |
Анализируемое подмножество поисковых запросов | ||||
Все ПЗ |
Длиной 1-3 слова |
1 слово |
2 слова |
3 слова | |
Рамблер и Яндекс |
8,13 |
12.62 |
22.21 |
13.59 |
7.06 |
Яндекс и Google |
7,51 |
11.82 |
20.84 |
12.84 |
6.68 |
Google и Рамблер |
7,31 |
11.26 |
20.82 |
12.02 |
5.87 |
Яндекс, Рамблер и Google |
3.70 |
6.12 |
6.12 |
6.41 |
2.81 |
Из данных таблицы следует, что наиболее тесно поисковые запросы пересекаются в поисковых системах Яндекс и Рамблер. Однако процент схожести поисковых запросов не столь велик, что говорит о собственной аудитории у каждой из поисковых систем. Так, например, процент пересечения по однословным запросам в среднем составляет около 20 процентов. Т.е., только каждый пятый однословный запрос повторяется в двух поисковых системах. Отчасти это объясняется разной ориентированностью на информацию, например, большая нацеленность на транзакционные запросы пользователей поисковой системы Рамблер (пункт 2.2).
Процент пересечений поисковых запросов в трёх поисковых системах достаточно мал, это говорит о том, что при формировании семантического ядра сайта и при нацеленности на привлечение максимального поискового трафика из нескольких поисковых систем следует пользоваться статистикой каждой поисковой системы в отдельности. Следовательно, оптимальный список поисковых запросов для каждой из поисковых систем может и должен отличаться.
2.4 Распределение запросов в тематиках
Статистика LiveInternet позволяет просматривать список поисковых фраз, по которым пришли пользователи на сайты определённой тематики. Тематика задаётся при регистрации сайта в системе LiveInternet и является единой для всех документов сайта. После сбора статистики и определения долей запросов разной длины был построен ряд гистограмм, отражающий распределение поисковых запросов в конкретных тематиках (рисунок 2.4)
Рисунок 2.4 – Распределение длин поисковых запросов в различных тематиках русскоязычного Интернета
Из диаграммы видно, что наиболее активно одно- и двухсловными запросами пользователи пользуются в тематике «Медицина». Это связано с тем, что пользователь вводит интересующий его диагноз и пытается найти соответствующее описание. Следующей по числу коротких запросов идёт тематика «Авто». Противоположная картина наблюдается в тематике «Недвижимость». Это единственная тематика, в которой большую долю среди поисковых запросов занимают запросы длиной в 3 слова, а на третьем месте по доле от общей массы идут поисковые запросы длиной 4 слова. Причина в том, что пользователей интересует конкретная географическая привязка интересующей недвижимости. Также эта тематика лидирует по количеству длинных низкочастотных запросов, длиной более 6 слов. На первом месте по числу низкочастотных запросов располагается тематика «Компьютеры». Распределение поисковых запросов в этой тематике во многом соответствует распределению поисковых запросов в тематике «Недвижимость», а большое количество низкочастотных запросов определяется тем, что большое количество пользователей достаточно полно описывают проблему или указывают файлы для скачивания.
Тематики «Дом и семья», «Товары» и «Туризм» во многом повторяют общепоисковую тенденцию русскоязычного Интернета.
Выводы и практические рекомендации:
Исследование показало, что поисковые запросы группы «6 и более слов» составляют малую часть от общего поискового трафика. Следует отметить, что относительно длинные поисковые запросы, длиной 4 и более слов, имеют около трети всего поискового трафика. Если включить в данную группу запросы длиной в 3 слова, то количество пользователей с этих запросов на сайты составит около 50% от всего поискового трафика.
Структуры поисковых запросов пользователей систем Яндекс и Google очень похожи, и значительно отличаются от структуры запросов в системе Рамблер. Поисковые запросы к системе Рамблер отличаются преобладанием коротких словосочетаний. Доля одно-, двух- и трёхсловных запросов значительно выше, чем у запросов соответствующей длины, к другим поисковым системам.
Аудитория поисковой системы Рамблер наиболее нацелена на приобретение товаров или услуг. При этом процент транзакционных поисковых запросов к системе Рамблер фактически в 2 раза больше аналогичного процента в системах Яндекс и Google.
Наиболее тесно поисковые запросы пересекаются в системах Яндекс и Рамблер. Однако процент схожести запросов не столь велик, что говорит о собственной аудитории у каждой из систем. Только каждый пятый однословный запрос повторяется в двух системах. Процент пересечения поисковых запросов в трёх исследуемых системах достаточно мал. Следовательно, оптимальный список ключевых слов, для каждой из систем, может и должен отличаться.
Наиболее активно одно- и двухсловными запросами пользователи пользуются в тематиках «Медицина» и «Авто». Противоположная картина наблюдается в тематике «Недвижимость». Это единственная тематика, в которой наибольшую долю среди поисковых запросов занимают запросы длиной в 3 слова. Наибольшее число низкочастотных запросов наблюдается в тематике «Компьютеры». Тематики «Товары», «Дом и семья» и «Туризм» во многом повторяют общепоисковую тенденцию, сложившуюся в русскоязычном Интернете.
Олег Сахно
Евгений Селин
interlabs.ru