Пример кластеризации семантического ядра. Бесплатный сервис кластеризации поисковых запросов от SEOQUICK

Привет, дорогие друзья! С наступившим Новым Годом вас, надеюсь, вы уже отошли от праздников и настроились на боевой лад. У меня для вас новогодний подарок сегодня — очень крутой практический пост. Пост не мой, но более чем достоин появиться на страницах этого блога.

Обзор составлен крутым чуваком по имени Дмитрий Мирошниченко. Дима живет в Волгограде, работает руководителем проектов в местной веб-студии, которая занимается развитием и продвижением собственных проектов. А еще Дима — кандидат наук, а это вам не хухры-мухры!

Всё что написано ниже является моей точкой зрения и основано на моём жизненном опыте. Я не претендую на истину в последней инстанции. Если вы видите какие-то процессы иначе и знаете, как можно решить поставленную задачу эффективнее, крайне желательно не сдерживать себя и написать об этом в комментарии.

Итак, задача: составить семантическое ядро для сайта. Что означает слово «семантическое»? Вот что нам сообщает Википедия. Сема́нтика (от др. -греч. σημαντικός - обозначающий) - раздел лингвистики (в частности, семиотики), изучающий смысловое значение единиц языка. То есть нам нужно выделить смысловые направления для структуры сайта.

Как обычно решается эта задача?

  1. Парсим запросы (вордстат , различные базы, подсказки, сервисы типа спайвордс и семраш , открытые счётчики статистики и другие источники)
  2. Отсеиваем мусор и проверяем частотность
  3. Распределяем запросы на группы
  4. На основе групп делаем структуру сайта и распределяем статьи

Первые два пункта успешно решаем с помощью кейколлектора . Тут особых мук выбора не возникает. Кейколлектор действительно удобный инструмент.

Третья задача самая интересная. Её решение мы и будем рассматривать.

Четвёртая задача решается достаточно тривиально, если третья была качественно реализована.

Исходные данные

Информационный сайт дачной тематики. Раздел «кустарники и деревья». Всего было собрано 562 ключа. Это тренировочный набор данных. Мне было важно сравнить результаты работы разных инструментов.

Для раздела информационного сайта были собраны запросы, убран мусор и расставлена частотность «!» по вордстату больше 30. Нужно их распределить по группам.

Распределять запросы можно вручную и автоматом. Вручную распределяем по смыслу. Тут всё понятно. Для автоматической кластеризации есть много способов. Более подробно рассмотрим для каждого инструмента.

Инструменты, облегчающие ручную кластеризацию запросов

Excel, LibreOffice, OpenOffice

Думаю, тут нет смысла подробно описывать, как работать с этими инструментами.

Достоинства

  • высокая точность обработки — руками всё-таки обрабатываем
  • универсальность — можно учитывать кучу параметров
  • в случае с LibreOffice, OpenOffice — бесплатные

Недостатки

  • в случае с Excel — платный
  • низкая скорость работы — при работе с большими объёмами данных
  • нужно делать бекапы

Google документы

Достоинства

  • аналогично предыдущему пункту
  • онлайн сервис — удобный доступ к документу
  • не нужно делать бекапы
  • бесплатный

Недостатки

  • скорость работы всё также низкая

kg.ppc-panel.ru

Онлайн сервис. Загружаешь запросы, фильтруешь, выделяешь группы.

Работает быстро. Функционал достаточный (кроме сохранения проектов), хороший интерфейс.

Достоинства

  • удобный интерфейс
  • быстро работает
  • наглядность
  • не нужно регистрироваться
  • бесплатный
  • онлайн сервис

Недостатки

  • нельзя сохранять проекты можно, только выгружать уже готовые
  • вытекает из предыдущего — если сервис заглючит, то потеряются все наработки
  • нельзя загружать частотности

Keyword Assistant — cоздание структуры будущего сайта

Ещё один онлайн сервис. Аналогичен предыдущему. Уже можно сохранять проекты.

Достоинства

  • проекты сохраняются
  • хороший и понятный интерфейс
  • можно загружать частотности
  • бесплатный
  • онлайн сервис

Недостатки

  • скорость работы повыше, чем при работе с excel, но всё равно сопоставимая
  • для параноиков — непонятно где хранятся ваши данные

Инструменты для автоматической кластеризации запросов

Группировщик ключевых слов для PPC

Десктопная версия со странной логикой поведения. Подробности по ссылке выше (где скачать, можно найти там же).

Краткое описание работы алгоритма кластеризации:

У нас есть некий набор ключевых слов. Перед составлением индекса, скрипт нормализует все словоформы. На следующем этапе скрипт группировки определяет частоты для всего индекса документа и выстраивает рейтинг. Частоты считаются для каждого слова (после нормализации). Если у нас есть «отдых в тунисе» то скрипт считает частоты для «отдых» и «тунис».

На данном этапе – рейтинг слов выстраивается от наиболее частотных к менее частотным. Зачем это нужно? Чтобы создать основные группы. Скажем так, если слово «египет» встречается чаще чем слово «отель» то поисковый запрос (например, [недорогие отели египта]) включающий слово «отель» будет отнесен к группе «египет» а не наоборот.

Итак, мы сгруппировали слова, но довольно примитивно. Далее – нам нужна более точная группировка.

Более точная группировка означает, что внутри каждой группы скрипт создаст подгруппы и распределит слова между ними.
На данном этапе точно также будет выстраиваться рейтинг слов по частоте. При этом рейтинг будет создаваться только внутри группы, основное слово группы (оно же – название группы) не будет принимать участие в рейтинге. Кроме того, рейтинг слов в группе выстраивается по обратной частотности. Т.е. слово с наименьшей частотностью – первым создаст «свою» подгруппу.

Конечно, создать свои подгруппы могут только те слова, которые встречаются не менее N-раз (задается в настройках скрипта, но обычно это не менее 4-5).

Именно такой подход работает очень эффективно, когда основные группы создаются на основе рейтинга от наиболее частотных слов к наименее частотным, а подгруппы – от наименее частотных к наиболее частотным.

На выходе получаем сгруппированный список.

Достоинства

  • пока бесплатный
  • быстро работает

Недостатки

  • десктопная версия
  • как-то криво сохраняется проект
  • как там удалить что-нибудь?
  • крайне странная логика поведения, откуда в системе слова которых там не было? (видно на скрине)
  • алгоритм не учитывает смысла слов, только общий корень — самый существенный недостаток
  • заявлено огранивение в 1000 ключей
  • нельзя загрузить частотность
  • нужно делать бекапы

Rush Analytics

Онлайн сервис кластеризации запросов на основе выдачи ПС. Точнее кластеризация это только одна из возможностей сервиса. Более подробное описание доступно на сайте.

Кратко об алгоритме работы:

Кластеризация – это автоматическая разбивка ключевых слов на группы.
Как работает технология?
Вы загружаете список ключевых слов, выбираете тип кластеризации – система анализирует ранжирование поисковых систем и с помощью нашего алгоритма разбивает ключевые слова на группы, которые будут отлично ранжироваться в поисковых системах. На выходе Вы получаете ключевые слова разбитые на группы.

Можно выставить силу группировки. Выставляется видимо в попугаях. На выходе excel файлики с выбранной силой группировки. На первой вкладке кластеры. На второй всё, что осталось без кластеров.

Плата снимается только для сгруппированных запросов (максимальное количество).

Напомню, всего 562 запроса. Сколько запросов сгруппировалось для каждого варианта видно в таблице ниже.

Получаем максимальное число сгруппированных запросов 359. Неплохо для автомата. Сколько это стоило?

Получаем, что кластеризация 359 запросов обошлась в 552,5 рубля или чуть больше 1,5 рублей за зарос (хотя цифра группировки за запрос мне совершенно не интересна, но для общей картины пусть будет). Тут нужно уточнить, что кластером считается более двух запросов. Сколько групп получилось так и не придумал, как посчитать.

Теперь посмотрим что там по качеству.

Выберем тестовую группу по черешне. Вот список исходных запросов:

как правильно обрезать черешню валерий чкалов черешня черешня бычье сердце черешня дерево черешневый сад черешня ипуть обрезка молодой черешни обрезка черешни черешня сорта сорта черешни

Получилось два кластера для силы группировки 4 и 5:

Для силы группировки 3, кластер обрезки немного расширен:

Очевидно, что результат так себе.

Если бы я делал вручную, то кластер по сортам выглядел бы примерно так:

черешня бычье сердце черешня ипуть валерий чкалов черешня черешня сорта сорта черешни

Так что алгоритмы явно нужно допиливать.

Достоинства

  • онлайн сервис
  • все проекты сохраняются
  • при регистрации выдают 3000 рублей на счёт (на момент публикации, по моему уже прикрыли такую халяву)
  • худо бедно, но учитывается смысл (а не только общий корень) на основе выдачи поисковиков

Недостатки

  • пока в стадии тестирования (на момент публикации уже вроде нет)
  • платный
  • дорого — хорошо если ядро 500 запросов, а если тысячи и сотни тысяч?
  • всё равно нужно доделывать руками, полного автомата не получается

SEMparser — Структуризация семантики для SEO и контекста

Ещё один онлайн кластеризатор на основе выдачи поисковика.

Как работает (взято с сайта):

Как выглядит внутри:

После автоматической кластеризации появляется окно редактирования, где можно подправить ошибки.

Скачивается excel файлик. На первой вкладке запросы и группы с подробностями.

На второй вкладке только группы.

На третьей вкладке какой-то топ тематики.

Так же можно установить силу группировки. Потестил теже цифры: 3, 4 и 5.

Тут нужно уточнить, что кластер из одного запроса это тоже кластер. И он учитывается. Так что формально получается, что сгруппировалось 100% запросов. А вот сколько получилось групп с запросами 2 и более я тоже не придумал как посчитать.

Так же нужно учитывать, что ценообразование немного другое. Деньги снимаются за все запросы, которые есть в документе. Я купил 600 запросов, что обошлось мне в 288 рублей. Получаем стоимость одного запроса 0,48 копеек. После группировки у меня в системе осталось 38 запросов. В итоге группировка тестовой выборки ключей обошлась в примерно в 270 рублей. Что в два раза ниже, чем в предыдущем сервисе.

Посмотрим, что тут с качеством.

Для всех сил группировки получилось — 4 группы:

валерий чкалов черешня (1/170) валерий чкалов черешня (170) черешня ипуть (5/472) черешня ипуть (159) сорта черешни (134) черешня сорта (92) черешня дерево (44) черешневый сад (43) черешня бычье сердце (1/64) черешня бычье сердце (64) обрезка черешни (3/352) обрезка черешни (226) как правильно обрезать черешню (86) обрезка молодой черешни (40)

Тоже видим, что по смыслу не идеально. Нужно дорабатывать руками.

Достоинства

  • онлайн сервис
  • все проекты сохраняются
  • 50 запросов для теста при регистрации
  • худо бедно учитывает смысл
  • дешевле, чем предыдущий вариант

Недостатки

  • платный
  • алгоритм работает не идеально, нужна ручная коррекция

Just Magic — автоматический подбор семантики для SEO и контекстной рекламы

Интересный сервис на мой взгляд. Дизайн сайта: привет консоль.

Что у них заявлено на сайте:

— Собирать семантику для существующих страниц сайта, сразу правильно привязывая запросы к ним.
— Расширять существующую структуру сайта.
— Предлагать тематическую семантику для новых страниц сайта на основании текущего СЯ.
— Создавать семантику для проектируемого сайта.
— И просто кластеризовать запросы. Включая тематическое разбиение.

Можно посмотреть доклад разработчика на ТопЭксперте:

Вот что мне ответили разработчики про то, как там всё устроено:

Мы решаем сугубо утилитарную задачу — определить какие запросы могут продвигаться на одной странице.

Отсюда и метод решения — мы собираем выдачу ПС по каждому запросу и кластеризацию проводим на ее основании.

Фактически, нам необходимо решить достаточно простую задачу — раскидать запросы по совпадению URL в выдаче, попутно позаботившись, чтобы в один кластер не попали принципиально разные типы запросов. Типы мы выделяем такие:
— Коммерческий/информационный.
— «На морду»/"на внутряк".
— Однословный/2+ словный.
— С маркерами типа контента/без них.

«Маркеры типа контента» — это слова запроса, которые ПС использует для выставления требований к контенту на продвигаемой странице. Например — («отзывы», «видео», «скачать», «фото»).

Поскольку задача определена и набор входных данных довольно прост, то и алгоритм не замысловат. В основном алгоритме системы машинное обучение не используется. Центроиды в текущем алгоритме мы де-факто используем (один из запросов является «центром» кластера, а остальные должны иметь определенную меру схожести с ним). Сейчас используется «жадный» алгоритм их (центров) выделения. Но в этом методе есть определенные недостатки, поэтому в следующей версии алгоритма, которая сейчас внедряется, мы в принципе откажемся от понятия запроса-центра кластера.

Машинное обучение мы тоже используем, но в другом месте — автоматическая генерация запросов-маркеров на основании данных Яндекс.Метрики.

Пока попробовать не удалось. Отправил запрос на тестовый доступ. Сказали у них обновление. Основной функционал стоимостью от 30 000 руб/месяц будет доступен в конце января. Для простых смертных с объёмами поменьше в феврале.

Если всё будет работать, как заявляют, то будет очень круто. Посмотрим.

Достоинства

  • хорошие перспективы
  • онлайн сервис

Недостатки

  • пока нет версии для простых смертных, только месячная подписка
  • попробовать так и не удалось
  • как есть — дорого

SEO intellect — Сервис автоматизации SEO работ

Ещё один онлайн сервис по кластеризации. Заявленный функционал:

Сервис автоматизации SEO работ
● кластеризация запросов
● подбор посадочных страниц
● поиск конкурентов
● помощь в оптимизации контента
● заказ оптимизированных текстов

Мне так и не удалось его заставить работать. Нет никакой справки, никаких подсказок...

Достоинства

  • онлайн

Недостатки

  • так и понял как с ним работать
  • платный

Coolakov.ru — Разбивка ключевых запросов

Описание на сайте:

Сервис позволяет автоматически группировать уже собранные запросы. Разбивка запросов на группы производится на основе схожести топ10 Яндекса.

Про особенности алгоритма ничего найти не удалось.

Для моих 562 запросов получилось 305 групп. В группе минимум один запрос. Посмотрим что там с нашей черешней:

Видно, что группы 73 и 189 можно было бы и объединить… Ну и в остальном тоже понятно. Кластеризация, мягко говоря, не идеальная.

Достоинства

  • онлайн сервис
  • бесплатный

Недостатки

  • Как это скачать? Нет никаких кнопок, чтобы скачать. Можно только скопировать текст.
  • Без регистрации можно работать только с 20-00 до 7-00 по Москве. Зарегистрироваться никак нельзя. Вообще.

s:toolz — профессиональный инструмент кластеризации запросов на основе поисковой выдачи

Очередной сервис кластеризации. Особенность в том, что работает не в автоматическом режиме. Это же его и недостаток.

Порядок работы

Заявленный функционал:

Сервис кластеризации запросов предназначен для быстрой автоматизированной группировки больших списков запросов (ключевых слов для продвижения) в кластеры, которые формируются исходя из выдачи поисковых систем и представлений поисковой системы Яндекс о потребности пользователя.

Запросы из одного кластера необходимо продвигать на 1 страницу.

Отправил бриф. Ответили через два дня. Оказывается, у них заявки в ручном режиме обрабатываются. Пишут, что так больше получают обратной связи. В будущем грозятся сделать всё в автомате.

Сама кластеризация, пишут, длилась меньше минуты. Цитата:

На просчет вашей заявки ушло меньше минуты. Самое большое, что приходилось на данный момент обрабатывать — 55к, расчет шел около 3 часов.

Что пишут про алгоритм работы:

Алгоритм группировки разработан свой. Данные — топ 10 яндекса по каждому запросу. Машинное обучение используем, но для другого функционала, который скоро будет представлен.
Есть проблемы с релевантными страницами в отчете. В индекс поисковика не всегда попадает то, что нужно, особенно, если над проектом еще не работал специалист.
В результате приходится дополнительно обрабатывать результат руками, при определенном кол-ве запросов это уже грустно. Задача в процессе решения.

Кластеризация моих 562 запросов обошлась мне в 309 рублей. Имеем 60 копеек за запрос. Скидок не давали. Да я и не просил.

Теперь посмотрим что там с качеством:

обрезка черешни как правильно обрезать черешню обрезка молодой черешни сорта черешни черешнЯ сорта черешнЯ дерево валерий чкалов черешнЯ черешнЯ бычье сердце черешневый сад черешнЯ ипуть

Снова сорта остались без кластеров.

Достоинства

  • коммуникабельность тех поддержки, ответили на все вопросы
  • онлайн сервис

Недостатки

  • работает не в автоматическом режиме, человеческий фактор портит впечатление
  • платный
  • нужна ручная коррекция кластеров

Mc-Castle.ru — Кластеризатор СЯ

И ещё один сервис. Кластеризует тоже, видимо, по словоформе. Никаких поисковиков.

Результат работы:

Что с этим дальше делать я понять не смог. Как мне разбить по кластерам? Как посмотреть какие запросы попали в один кластер? Ну и если разбивка идёт на основе словоформ, то ни о каком объединении по смыслу речи не идёт.

Достоинства

  • онлайн сервис
  • бесплатный
  • не нужно регистрироваться

Недостатки

  • странный интерфейс
  • алгоритм разбивки на основе словоформ

Key Collector

Почти всем известная программа, кто так или иначе сталкивался со сбором ключей.

Группировка это только маленькая часть того, что она умеет.

Запросы можно сгруппировать по составу фраз, по выдаче поисковиков и в комбинированном режиме. Группировка на основе поиска работает кода собраны данные для KEI. На сбор информации для группировки ушло несколько минут. Сама группировка длилась меньше минуты.

Лучшей группировки удалось добиться со следующими параметрами:

В первом случае сгруппировалось 381 фраза или 68% от общего числа. Во втором случае 403 или 72%, что очень хорошо.

Интересующие нас черешни по сортам (ипуть, бычье сердце...) тоже и не попали к сортам. Были выделены в отдельные группы. Что, в общем, и не удивительно.

Остальные запросы сгруппировалась более или менее. В итоге имеем 72% экономии времени (остальное доделывать руками).

Достоинства

  • понятный интерфейс
  • можно подбирать настройки группировки
  • куча других возможностей по работе с ключами
  • демократичная цена
  • отличная тех поддержка

Недостатки

  • десктопная версия
  • нельзя редактировать получившиеся группы в программе — только в excel
  • для работы нужны антигейт, прокси, аккаунты — с онлайн сервисами таких заморочек нет, они берут эти проблемы на себя
  • нужна ручная коррекция кластеров

МегаЛемма — автоматизация составления семантического ядра и кампаний Яндекс.Директ

Десктопная программы для кластеризации.

Сложно просто взять и работать. Юзабилити хромает.

Жму нормализовать. Он мне выдаёт сообщение, что нужно сохранить проект. А автоматически нельзя сохранить проект? Зачем мне нажимать на кнопку, если это может сделать компьютер?

Не очевидно, что нажать, чтобы запустить процесс разбивки на группы. Оказывается это «частотный анализ».

Парсинг 562 запросов на стандартных настройках в 7 потоков и на 7 прокси занял примерно 10 минут. Ещё минут 5 заняла нормализация.

После нормализации снова непонятно как группировать нужные мне слова. Информацию нашёл на 27 странице руководства. И на том спасибо.

Ведь это же основной функционал программы. Разбивать слова на группы. Почему самая нужная информация находится так далеко? Ну и полезно было бы сделать что-то вроде quick start. Для контекста и для сайтов раздельно. Я понял, там есть различия в работе.

Доводить дело до конца по кластеризции своих запросов тут не захотелось. Основная проблема в расстановке акцентов в интерфейсе программы.

Чисто для кластеризации использовать смысла нет. Думаю, вся мощь программы должна проявиться при полной работе с ключами. Начиная с очистки запросов от мусора и создания стоп слов.

Достоинства

  • есть полноценная демоверсия

Недостатки

  • десктопная программа
  • для работы нужны антигейт и прокси — с онлайн сервисами таких заморочек нет, они берут эти проблемы на себя
  • объединяет на основе словоформ, то есть ни о каких смыслах говорить не приходится
  • юзабилити нужно дорабатывать

«Семён-Ядрён» — формирование семантического ядра сайта на основе поисковых систем

Ещё один удалённый сервис. В последнее время много пиарится.

Опять же с сервисом нужно работать через посредников. То есть через людей. Никакой тебе автоматики.

Нужно сначала подать бриф, потом подождать пока с тобой свяжутся. Согласовываешь детали. Затем оплата.

За бесплатно делать группировку не захотели, но сделали скидку в 50%. В итоге группировка 562 запросов мне обошлась в 350 рублей (без скидки просили 700). Сгруппировать один запрос вышло 60 копеек (или 1,2 рубля без скидок)

Опять же проблемы с юзабилити на сайте. Кнопка «подать бриф» маленкая, белая и незаметная на белом же фоне. Не удержался, простите.

Как и на основе чего делают кластеризацию, говорить отказались. Известно, только, что на основе выдачи ПС.

Результат работы прислали через несколько часов. Помимо самих кластеров прислали ещё 100500 параметров и файлов. Хотя я не просил. В принципе полезная информация для анализа. Но логично было бы разделить: хочешь просто кластеризацию — одна цена, хочешь ещё ништяков — другая. Так как разным клиентам нужна разная информация.

Посмотрим, какие кластеры получились:

обрезка черешни как правильно обрезать черешню обрезка молодой черешни черешня ипуть сорта черешни черешня сорта черешня бычье сердце валерий чкалов черешня черешня дерево черешневый сад

Это уже гораздо лучше! Отдельные сорта попали-таки в кластер по сортам! Правда, Валерий Чкалов потерялся.

Достоинства

  • быстро ответили
  • готовы делать скидки
  • онлайн сервис
  • куча различной доп информации, вплоть до заданий копирайтерам (правда пишут, что задания всё же нужно допиливать индивидуально)

Недостатки

  • есть посредник в виде человека
  • по алгоритмам сплошная коммерческая тайна
  • нужна ручная коррекция кластеров

Итоги

Сводную таблицу по функционалу и стоимости можно посмотреть ниже.

Инструмент Стоимость Алгоритм кластеризации Формат Время работы Стоимость группировки всех запросов Стоимость группировки одного запроса
бесплатно на основе выдачи ПС онлайн несколько минут бесплатно бесплатно
платный на основе выдачи ПС онлайн меньше минуты + два дня 309 р. 60 коп.
платный на основе словоформ онлайн меньше минуты бесплатно бесплатно
1 700 р. на основе словоформ + на основе выдачи ПС десктоп несколько минут
3 000 р. на основе словоформ и лемм десктоп несколько минут
платный на основе выдачи ПС онлайн несколько минут + пару часов 350 р.
(700 р. без скидки)
60 коп.
(1,2 р. без скидки)
Ниже представлены сервисы, не вошедшие в основной обзор в рамках данного поста, но были предложены пользователями в комментариях или представителями сервисов.
Topvisor.ru платный на основе выдачи ПС онлайн ~7-8 мин. на 3000 запросов от 30 коп.

В итоге пока не имеем инструмента, который на полном автомате сгруппирует нужные запросы без ошибок.

Наилучшие результаты показали (судил по сортам черешни) Semparser.ru и Seo-case.com. По стоимости получаем 48 копеек против 1,2 рубля соответственно. Разница почти в три раза. Дополнительная стоимость у Seo-case, я так думаю, за счёт бонусной информации. На следующем месте стоит Кей-Коллектор (так как он почти наверняка есть у человека, который занимается запросами).

Самый основательный подход по кластеризации, на мой взгляд, у ребят из Just-magic.org. Так что как только появится возможность, обязательно потестирую.

Как бы то ни было, работа руками лучше, чем любым сервисом и с этим сложно поспорить. Немного дороже, но намного качественнее.

На этом мега обзор заканчивается, дорогие друзья! Я уверен, вам понравилось, поэтому прошу вас оставить свое мнение в комментариях, а если вам есть, что добавить, то тем более отписывайтесь.

До связи друзья!

Автор : Алексей Чекушин - SEO-Эксперт Kokoc.com (Kokoc Group), создатель сервиса Just-Magic.org

В своей предыдущей статье: « » я назвал кластеризацию одним из основополагающих факторов успеха в продвижении. В этой публикации я подробно разбираю, что такое кластеризация, и как правильно применять её.

Что такое кластеризация?

Это автоматическое объединение запросов в группы, которое решает две важные задачи:

  1. Объединение похожих запросов (с одинаковым «интентом») вне зависимости от их семантической схожести. («интент» = намерение пользователя). Например, запросы «снять квартиру» и «аренда квартир» - выражают одно и то же желание пользователя.
  2. Проверка совместимости продвигаемых запросов: можно ли их продвинуть на одной странице в топ Яндекса одновременно . Т.е. возможно ли подстроить оптимизацию страницы под все эти запросы. Или же какие-то запросы требуют выноса на отдельную страницу.

Из всех существующих сегодня методов наиболее эффективно эти задачи решает, так называемая, «кластеризация по топам », когда запросы сравниваются по количеству одинаковых URL-ов в топ-10 Яндекса.

Теперь поговорим о каждом пункте подробнее.

Объединение запросов с одинаковым интентом

Что такое запросы с одинаковым интентом ? Это разные запросы, в которых человек, на самом деле, ищет одно и то же. Очевидно, что запросы «телевизоры самсунг » и «телевизоры samsung » должны продвигаться на одной странице. Но это - явные вещи.

Однако существуют и куда менее очевидные примеры:

  • «спецодежда» - «рабочая одежда»
  • «ипотека» - «кредит под залог квартиры»
  • «автоломбард» - «кредит под залог авто»

Семантически эти пары совсем не похожи, но фактически обозначают одно и то же. Классические способы поиска таких запросов, обладающих единым интентом (намерением пользователя), основываются на синонимах. Как правило, с этой целью используют словари синонимов или синонимы Яндекса . Однако в обоих методах есть свои серьезные минусы.

Если мы будем пользоваться словарями синонимов, то найдем там весьма странные связи. Например, согласно одному из самых популярных словарей, синонимом к «мобильный телефон» являются:

  • мобила
  • мобильник
  • радиотелефон
  • сотовик
  • сотовый телефон
  • телефон
  • эбонитовый друг

Сотовый телефон - однозначно полезный синоним. А вот «радиотелефон» - совершенно другой тип товара. Ну а кто такой «эбонитовый друг», остается только догадываться.

Второй вариант поиска синонимов - попытаться «выцепить» их из подсветок Яндекса. Но это сопряжено с двумя проблемами:

Во-первых, подсвечиваются не только синонимы, но и другие слова. Например, в подсветку по ключевой фразе «сотовые телефоны» попадает не только синоним «мобильные», но и: «цены», «москва», «купить», «каталог», которые подсвечиваются по другим причинам. В целом, это проблема решаемая, обходные пути есть.

Во-вторых, синонимы в Яндексе являются невзаимными . Например, вхождение «мобильные телефоны» является синонимом к запросу «сотовые телефоны», а в обратном порядке это уже не работает. «Сотовые телефоны» не будет синонимом к «мобильные телефоны», и этот момент становится критически важным. Как понять, что запрос «сотовые телефоны» соотносится с запросом «мобильные телефоны», если слово «сотовые» по нему не подсвечивается?

Наконец, как вы поймете, что запросы «ювелирный магазин», «ювелирные изделия» и «ювелирные украшения» обладают одним интентом, если, с точки зрения Яндекса, они не являются синонимами?

Решение проблемы приходит через кластеризацию запросов по топам. Нахождение в топе одинаковых URL-ов сигнализирует об одинаковом интенте. Вот пример работы кластеризатора just-magic:

Вроде бы, кластеризатор все правильно объединил: «мобильные телефоны» положил в одну группу с «сотовыми», а «ювелирные изделия» — в группу, где присутствует «ювелирный магазин». Почему же тогда «ювелирные украшения» попали в отдельную группу, несмотря на то, что тематика здесь та же (это видно по столбцу «spec-grp»)?

Ответ на этот вопрос приводим в следующей части статьи.

Проверка совместимости продвигаемых запросов

Для продвижения нам не просто нужно собрать на странице похожие запросы, необходимо еще и проверить их совместимость.

В Яндексе нет единой формулы ранжирования под все запросы. Запросы делятся на большое количество типов. И формулы для разных типов запросов часто предъявляют к странице взаимоисключающие требования для попадания в топ. Причем часто визуально эти запросы очень похожи. Например, запросы «смартфон» и «смартфоны». Первый — некоммерческий, геонезависимый. Второй - коммерческий геозависимый. Как видно, в данном случае единственное и множественное число - несовместимы на одной странице!

Если вы вдруг подумали что это логично, то вот другой пример: запросы «ноутбук» и «ноутбуки». Они оба коммерческие и геозависимые и прекрасно совмещаются на одной странице.

Коммерческость и геозависимость - лишь два самых очевидных признака. На самом деле, их намного больше. Например, главную или внутреннюю страницу поиск хочет видеть в топе по запросу. Когда мы не знаем всего многообразия признаков, единственный способ определить возможность совместного продвижения запросов на странице - это посмотреть, есть ли URL-ы, которые одновременно показываются по двум запросам, и подсчитать, сколько их.

Логика здесь следующая:

  • Если по запросам в топе находятся одинаковые URL-ы, значит их можно продвинуть на одной странице.
  • Если по запросам общих URL-ов нет, то мы не знаем, возможно ли продвинуть запросы на одной странице. Скорее всего, это невозможно.

И здесь мы сталкиваемся с вопросом: как именно объединять запросы на основании топов? Я различаю два метода - так называемые, «soft» и «hard» кластеризации.

Следующая картинка наглядно объясняет разницу между ними:

Soft-кластеризация сводится к следующему: для формирования группы берется один «центральный» запрос и все остальные сравниваются с ним по количеству общих URL-ов в топ-10 Яндекса. Если количество общих URL-ов превышает порог - запрос добавляют в группу.

При hard-кластеризации запросы объединяют в группу, только если есть общий для всех запросов набор URL-ов, который показывается по всем этим запросам в топ-10.

Soft-кластеризация дает группы бὸльшего размера, но часто ошибается в определении возможности совместного продвижения запросов на странице.

Классический пример : представим себе, что в качестве «центрального» был выбран запрос, по которому в топе 5 главных и 5 внутренних страниц. К нему могут оказаться привязаны два запроса, у одного из которых в топе 10 «морд», у другого - 10 «внутряков». Очевидно, что из этих трех запросов мы можем продвинуть только два (в зависимости от типа страницы, который выберем - главная или внутренняя). В случае hard-кластеризации появление такой группы невозможно.

Но это все лирика. Перейдем к численным оценкам.

Итак, у нас есть два критерия оценки кластеризации:

  1. Насколько полно собрана группа запросов. То есть, попали ли в неё все запросы, имеющие один и тот же «интент». За 100% возьмем ситуацию, когда все запросы с одним интентом - попали.
  2. Насколько попавшие в группу запросы совместимы между собой. За 100% возьмем ситуацию, когда все попавшие в кластер запросы совместимы между собой.

Ключевой параметр кластеризации - минимальное количество общих URL-ов для образования группы. Это число называют «порогом кластеризации ». Чем он выше - тем точнее получаемые группы, но при этом они закономерно уменьшаются в размерах. Экспериментальным путем было определено, что минимальный рабочий порог для «hard»-кластеризации - 3 URL-а, для «soft» - 4 URL-а. Работать с меньшим числом - нет смысла: слишком много «левых» запросов попадает в группы.

Вот пример результатов для разных порогов для hard-кластеризации:

Используя сервис just-magic.org , мы провели сравнение двух методов кластеризаций на выборках из разных тематик. Ниже представлен сводный график:

Сравнения проводилось для методов «soft» и «hard». Для числа пересекающихся URL-ов от 3-х до 6-ти (это минимальное число общих URL-ов для формирования кластера).

Как видно из графика, hard-кластеризация показывает очень высокую точность уже при пороге в 3 URL-а - 92%. Чтобы читатели статьи понимали, насколько это большая цифра, приведу пример: в исполнении опытного оптимизатора без инструментов точность будет составлять порядка 70%, а если за работу возьмется неопытный специалист, точность не будет превышать 30%. При этом, однако, полнота получается достаточно низкая - всего 40%. Но, опять же, смотря, с чем сравнивать. «Руками» оптимизаторы набирают максимум 20%.

Soft-кластеризация демонстрирует очень хорошие показатели полноты, но точность - «хромает на обе ноги». Приемлемые для продвижение значения получаются только на пороге «5», но при этом полнота падает до 23%.

Означает ли это, что данный метод неприменим? Нет. Все зависит от вашей задачи. Если вы занимаетесь «трафиковым» продвижением, и вам важно вывести на странице как можно больше запросов - неважно каких, то вам подойдет soft-кластеризация. Именно поэтому, когда в январе этого года в сервисе just-magic.org появилась hard-кластеризация, для модуля «маркеры» был сохранен «soft»-режим.

Если же вам важно вывести на странице определенный набор запросов, то ваш выбор однозначен - только hard-кластеризация, только хардкор. Еще один плюс hard-кластеризации состоит в том, что получаемые группы - однозначны. То есть, запросы, оказавшиеся в одной группе по 4 URL-ам, не могут оказаться в разных группах по 3 URL-ам (при использовании soft-кластеризации, такое запросто может быть). Поэтому кластеризатор Just-Magic отображает группы сразу по 3,4,5 и 6 URL-ам.

Стоит отдельно отметить, что если мы хотим в дальнейшем проводить текстовый анализ страницы, то допустимо использовать только hard-кластеризацию. Дело в том, что любой текстовый анализ по группе запросов для страницы очень строго соотносится с качеством этой группы. Только hard-кластеризация обеспечивает группы нужного качества.

Подведем итоги

Итак, какие бонусы дает кластеризация?

Во-первых, это ускорение процесса разбора больших ядер. Раньше на это уходили недели и месяцы работы. С помощью кластеризатора оптимизатор делает это за пару часов.

Во-вторых, это возможность распределить запросы по страницам таким образом, чтобы их было возможно одновременно продвинуть. «Ручной» альтернативы кластеризации здесь нет - даже опытный оптимизатор совершает до 30% ошибочных распределений, если действует «на глазок».

Исходя из второго пункта, становится понятно, что кластеризацию при продвижении нужно использовать всегда . Даже если ядро меньше 100 запросов, сделать правильно распределение запросов по страницам «на глазок» вы не сможете. Исключением могут стать только тематики со сверхнизкой конкуренцией, где кластеризация по топам перестает работать из-за отсутствия в топах релевантных ответов.

Если вы занимаетесь «трафиковым» продвижением, то можете пользоваться как «soft», так и «hard» методами кластеризации. Если же осуществляете «позиционное» продвижение, когда важно вывести в топ все запросы, то подойдёт только метод «hard». Также, с совместим только «hard»-режим.

Используйте кластеризацию в своей работе, и вы обретете счастье и гармонию, а продвигаемые вами запросы гарантированно попадут в топ!

В сегодняшнем выпуске На Доске про семантику и структуризацию ключевых слов для сайта.

О том, что такое кластеризация семантического ядра. Зачем нужно кластеризировать и как это можно сделать.

Про это рассказывает Олег Шестаков , основатель Rush Analytics .

Видео получилось довольно таки объемным. В нем основные нюансы связанные с кластеризацией.

Переходим к просмотру видео:

Фото с доски:

Важно : Если у вас есть вопросы, то смело задавайте их в комментариях. Олег с удовольствием на них ответит.

Расшифровка видео

1. Что такое кластеризация?

Кластеризация по методу подобия топов - это группировка ключевых слов на основе анализа выдачи поисковых систем. Как это происходит?

  • Берем два запроса, например, «блеск для губ» и «купить блеск для губ».
  • Собираем для каждого из запросов поисковую выдачу, сохраняем 10 url из каждой выдачи и проверяем, есть ли общие url в обеих выдачах.
  • Если есть хотя бы 3-5 (в зависимости от точности кластеризации, которую мы зададим), то эти запросы группируются.

2. Зачем делать кластеризацию?

Почему тренд кластеризации на рынке уже около полутора лет? Почему это важно и как это поможет?

  • Экономия времени. Кластеризация - замечательная технология, которая поможет сократить рутину при работе с группировкой семантического ядра. Если обычный специалист по семантическому ядру разбирает 100 000 ключевых слов, отделяя их на группы, порядка 2-3 недель (а то и больше, если сложная семантика), то кластеризатор может это разделить в порядке очереди примерно за час.
  • Позволяет избежать ошибки продвигать разные запросы на одну страницу. В Яндексе есть классификаторы, которые оценивают коммерческие запросы. Например, выдача по информационным запросам и коммерческим - совершенно разная. Запросы «блеск для губ» и «купить блеск для губ» никогда не получится продвинуть на одну страницу.

1) По первому запросу («блеск для губ») стоят сайты информационной тематики (irecommend, Википедия). Под этот запрос нужна информационная страница.

2) По второму запросу («купить блеск для губ») — коммерческие ресурсы, известные интернет-магазины. Под этот запрос нужна коммерческая страница.

То есть под разные запросы нужны разные типы страниц. Частая ошибка отимизатора - когда он продвигает все вместе на одну страницу. Получается так, что половина семантического ядра выходит в ТОП-10, а вторая половина никак не может туда попасть. Кластеризатор позволяет избежать таких ошибок.

Для того чтобы так не происходило, нужно изначально правильно сгруппировать запросы по типам страниц по выдаче.

3. Как кластеризация помогает в продвижении?

  • скорость обработки данных,
  • классификация страниц, под которые делается продвижение.

Если структура сайта сгруппирована и внутренняя оптимизация сделана правильно, то это уже половина дела, если мы говорим о российском рынке. Под западные рынки, естественно, потребуются ссылки. По нашему опыту, где-то 50-60% запросов при правильной кластеризации и правильной текстовой оптимизации просто выходит в ТОП без какого-либо внешнего вмешательства. Для интернет-магазинов либо классифайдов (агрегаторов и порталов) в принципе даже не нужны и тексты.

Кластеризация - залог правильного ранжирования. На данный момент нет смысла бороться с ранжированием поисковой системы, а проще подстроиться под это ранжирование, войти в нужные типы страниц и успешно продвигаться. Сменить парадигму продвижения какой-то тематики - скорее нереально, чем реально.

4. Какие есть методы кластеризации? (Hard/Soft)

Soft — это то, что было описано ранее. Берется маркерный запрос какой-то категории интернет-магазина, к нему привязываются другие запросы, сравнивается выдача. «купить блеск для губ», «купить блеск для губ в москве», «купить блеск для губ цены» — они имеют с главным запросом 4-5 связей.

Эти запросы привязываются. На этом проверка заканчивается, получается кластер ключевых слов и его можно продвигать.

Но есть тематики более конкурентные, например, пластиковые окна. Здесь нужно проверить, чтобы все запросы, которые были привязаны к главному, могли быть продвинуты друг с другом.

Нужно сравнить, есть ли в выдаче по этим запросам

одинаковый url. Сравниваем выдачу не только с главным запросом, но и между собой. И группируем только те запросы, которые могут быть связаны между собой.

Для большинства случаев хватает Soft кластеризации. Это интернет-магазины (не очень конкурентные категории), информационные ресурсы.

5. Кластеризация в Rush Analytics

У нас есть модуль кластеризации и 3 типа кластеризации:

  • По Wordstat. Самый простой и менее затратный по времени с точки зрения оптимизатора метод. Идеально подойдет для ситуаций, когда мы не знаем о структуре сайта практически ничего.

1) В Excel загружаете в одну колонку ключевые слова, в другую - частотность по Wordstat, и отправляете на кластеризацию.

2) Мы сортируем весь список по убыванию: наверху получаются самые частотные слова (обычно самые короткие).

3) Алгоритм работает так: мы берем первое слово, пробуем привязать к нему все остальные слова, группируем. Все, что привязалось, вырезаем, делаем сортировку заново и опять повторяем эту итерацию.

4) Из списка ключевых слов мы получаем набор кластеров.

По маркерам

Подходит для сайтов, где структура определена. Очень хорошо работает в e-commerce (например, интернет-магазины).

1) Мы знаем маркерный запрос (основной запрос страницы или несколько запросов, под которые она продвигается).

2) Мы берем список ключевых слов, в колонке справа единицами отмечаем маркерные запросы, и нулями - все остальные запросы.

3) Мы берем маркерное ключевое слово и пытаемся привязать к нему остальные ключевые слова и сгруппировать в кластеры. Здесь важно, что в этом алгоритме маркерные слова, которые мы пометили единичками, никогда не будут связаны между собой. Мы не будем пытаться их привязать.

Комбинированная кластеризация

Этот алгоритм совмещает в себе два предыдущих

1) Мы загружаем ключевые слова, отмечаем «маркер/не маркер» и частотность.

2) Привязываем к маркерным запросам все слова, которые мы можем привязать.

3) Берем ключевые слова, которые остались не привязанными, и группируем их между собой по Wordstat.

4) Все остальное откинется в «некластеризованные».

5) В итоге - структура, которую мы уже знаем. Также получится автоматическая кластеризация всех остальных ключевых слов, что поможет нам расширить структуру. Все эти типы кластеризации есть в Rush Analytics .

Какие еще есть инструменты на рынке?

Из достойных, кроме Rush Analytics, можно выделить сервис JustMagic, где есть и Hard и Soft кластеризация. Сервис разработал Алексей Чекушин.

Это все, что вам нужно знать о кластеризации, чтобы начать работу по группировке ключевых слов.

Используйте кластеризацию и экономьте свое время. К тому же, люди часто ошибаются, процент ошибок оптимизатора — порядка 15%. Доверьте рутину роботам - не нужно разбирать это руками.

Мнения экспертов

Топвизор - один из самых динамичных инструментов на рынке поискового продвижения. Развиваясь поступательно, команда регулярно наращивает число полезных сервисов для SEO-специалистов.

Один из наиболее интересных модулей - быстрая кластеризация поисковых запросов по принципу схожести SERP’ов.

В Топвизор наша компания перешла не по какой-либо рекомендации. Мы тестировали разные сервисы мониторинга позиций, и подкупила отзывчивость разработчика.

Приятно, когда твои предложения внедряют и делают жизнь и работу легче. И спустя время эта способность выслушать и внедрить не исчезла. Это очень круто!

Давно искал удобный сервис проверки позиций, перепробовал массу! То одно не нравилось, то другое... В Топвизоре все можно настроить под себя, а дополнительные возможности радуют еще больше.

Однозначно мастхэв! Надеюсь, что будет и дальнейшее развитие!

Мы перепробовали множество сервисов-конкурентов и выбрали именно Топвизор за качество. А также за точность и скорость проверки позиций. Теперь все новые инструменты тестируем и внедряем в свой рабочий процесс.

Особенно радует отзывчивость команды сервиса и оперативная реализация идей и пожеланий пользователей.

Когда в очередной раз на Маке я не смог открыть KeyCollector, меня спас Топвизор. Здесь я быстро получил ряд данных по сематнике для одного важного исследования. Также, при необходимости я использую Топвизор для проверки позиций сайтов клиентов, очень удобно.

Создатели сервиса знакомы с потребностями рынка, поэтому делают все возможное для автоматизации множества задач, иногда не очень популярных. Приятный и удобный сервис.

Обязательно должен быть в арсенале оптимизаторов.

Для человека, который построил себе репутацию на семантике, крайне важно всегда получать точные данные; это касается и кластеризации, и съема позиций, и аналитики. Топвизор с первых дней задал высокий уровень работы относительно рынка и каждый день подтверждает своё лидерство.

Помимо удобства и точности инструментов сервиса, хочу отметить отзывчивую работу службы поддержки и руководства!

Меня Топвизор поразил своей продуманностью и многофункциональностью. Столько мелочей учтено заранее. Я часто работаю с интерфейсами самых разных SEO-сервисов, много тестирую, но подобного уровня удобства для пользователя пока не видела больше нигде.

Впечатляет подробная Справка, доброжелательность и оперативность саппорта.

Очень удобно в нем работать – снимать и расширять сем. ядро, делать кластеризацию, контролировать позиции как сайтов, так и страниц в соцсетях и видео, каналов на Youtube, следить за конкурентами, анализировать оптимизацию своего сайта. Цены, как оказалось, очень даже доступные для работы. Из этого сервиса мне точно уходить не хочется.

Топвизором пользуюсь давно - с первых недель существования - с 2013 года. И честно говоря, просто решил протестировать еще один сервис для проверки позиций, т.к. текущий на тот момент постоянно падал и тех.поддержка не отвечала совсем.

А поддержка Топвизора отвечала за 2 минуты даже в твиттере и, что очень порадовало, многие мои предложения по улучшению исполнялись чуть ли не в тот же день.

На момент написания отзыва у меня примерно 270 закрытых тикетов и многие фишки появились с моей легкой руки. Казалось бы, причем тут поддержка в сервисе по проверке позиций? Как оказалось - самая главная часть. потому что любой глюк, любую оплошность исправляют быстро и если лишнего сняли со счета - компенсируют. А что со стабильностью? тоже все отлично (ну за исключением выкатки новых фич). За 3 с лишним года с Топвизором я загружал туда сотню различных проектов с семантическими ядрами от 10 до 5000 запросов и не было почти ни одного раза, чтобы проект не снялся вовремя или что-то случилось с данными.

Топвизор - стабильный и быстрый сервис для работы с семантикой, который делает если не все, то почти все: вордстат, адвордс, подсказки, группировка и кластеризация запросов, отличная и понятная аналитика, интеграция с вебмастером, метрикой, GA. Кроме этого есть куча и маленькая тележка сопутствующих сервисов вроде мониторинг изменений на сайте или бид-менеджер для контекста. Все эти фичи я использую на полную катушку почти в каждом новом проекте.

Если вы выбираете сервис для мониторинга позиций и других задач по SEO, рекомендую присмотреться к Топвизору.

Это целый комплекс полезных инструментов: от проверки позиций со сбором сниппетов и снимков поисковой выдачи до подробного технического анализа сайта. От подбора слов, сбора поисковых подсказок до группировки по релевантности и кластеризации тремя разными методами.

Умеет работать и интегрироваться с Яндекс.Метрикой, Я.Вебмастером, Google Analytics и Google Search Console. Настоящий сервис поисковой аналитики.

Топвизор постоянно и динамично развивается, регулярно появляются новые инструменты и расширяется текущий функционал. Интерфейс удобный, интуитивно понятный и очень хорошо продуманный разработчиками сервиса. Уделите особое внимание подробным справочным материалам по инструментам и возможностям Топвизора. Уверен, что даже у новичков не возникнет проблем и вопросов с работой после прочтения.

Начали использовать Топвизор в сентябре 2014 года, как дублирующий сервис для внутренних инструментов мониторинга и аналитики. Со временем и развитием проекта часть функционала внутренних штук полностью отрабатывается не на нашей стороне.

Используем только модуль позиций, получаем статистику по удобному API, с которым отлично дружит и Power BI/Query для визуализаций готовых отчетов по параметрам количества и динамики запросов в ТОП-3..100+ за нужный период времени.

Удобно, что сервис пользуется документооборотом по безналу через Диадок, а готовые счета за неделю до расчётной даты экономят кучу времени. У Топвизора есть самое важное, что может быть в клиентском сервисе, кроме работы технических вещей - крутая поддержка. Реакция на запросы в течении 5-10 минут, видимое желание помочь и разобраться в проблеме и улучшить функционал. Так у городов России в статистике появились разные цвета на графиках, а в справке - пару дополнительных скриншотов.

Когда есть уже список запросов, это еще не семантическое ядро — надо бы для начала раскидать запросы по страницам, чтобы иметь представление о том, как наполнять сайт. Без хорошей семантики будет очень трудно получать трафик из поиска.

Что такое кластеризация запросов

Кластеризация запросов – это как раз распределение поисковых запросов одной тематики на группы для продвижения посадочной страницы.

Кластеризация включает в себя следующие процессы:

  • группировка запросов в зависимости от намерений пользователя (интента);
  • проверка совместимости ключевых запросов для продвижения на одной странице в топе Яндекса.

Запросы с одинаковым интентом – это разные запросы, через которые человек, по сути, ищет одну и ту же вещь. Очевидным примером служат запросы [ручка Parker] и [ручка Паркер]. Сложнее дело обстоит с такими синонимами как: [настольная лампа] – [ночник], [свидетельство о рождении] – [метрика], [монитор] – [экран]. Трудность заключается в том, что при поиске синонимов ключей через словарь Яндекса, система далеко не всегда предлагает адекватную выборку.

На практике похожие запросы могут обладать уймой разных характеристик, из-за которых их нельзя будет разместить на одной странице. На помощь приходит кластеризация запросов по топам. Кластеризатор находит в топе выдачи поисковой системы одинаковые URL-ы, тем самым сигнализируя о присутствии одинакового интента. Результат работы выражается в следующем:

  • присутствие одинаковых URL-лов в топе по запросам означает возможность их продвижения на одной странице;
  • отсутствие общих URL-лов говорит, с высокой вероятностью, о невозможности такого продвижения.

Зачем нужна кластеризация

С помощью автоматических кластеризаторов можно быстро группировать даже самые большие семантические ядра. Если раньше на разборку ядра уходили недели и месяцы, то благодаря кластеризаторам работа сокращается до пары часов. Большим плюсом кластеризации является распределение запросов по страницам таким образом, чтобы их было возможно одновременно продвинуть. Сложно представить ручной аналог кластеризации высокой точности, так как даже опытный оптимизатор совершает до 30% ошибочных распределений. Из этого следует, что кластеризация ключевых слов необходима практически в любом случае.

Когда я был вебмастером-чайником, я делал сайт, где под каждый запрос была отдельная статья. Конечно же, трафика он не получал — получился только фейл. И это проблема реально многих начинающих — неправильные запросы или неправильная кластеризация.

Методы кластеризации

При группировке запросов возникает неопределенность в методике их объединения на основании топов. На практике выделяют два основных метода: “soft” и “hard” кластеризация.

Soft-кластеризация основывается на формировании группы с одного «центрального» запроса. Всех остальных подвергают сравнению с ним по количеству общих URL-ов в топ-10 Яндекса. Soft-кластеризация формирует группы достаточно большого размера, но часто возникают ошибки в определении возможности совместного продвижения запросов на странице.

Hard-кластеризация характерна объединением запросов в группу, когда есть общий для всех запросов набор URL-ов, который показан по всем этим запросам в топ-10.

Различают два критерия оценки кластеризации:

  1. Полнота – количество запросов в группе, имеющих один и тот же «интент». Если все запросы с одинаковым интентом попали в одну группу, показатель полноты – 100%.
  2. Совместимость запросов между собой, попавших в одну группу. За 100% принимают случай, когда все попавшие в кластер запросы совместимы между собой.

Важную роль играет такой параметр как «порог кластеризации ». Это минимальное количество общих URL-ов для образования группы. Большое число означает высокую точность групп, однако при этом они закономерно уменьшаются в размерах. Опыт использования кластеризаторов семантики показывает, что минимальный рабочий порог для «hard»-кластеризации – 3 URL-а, для «soft» – 4 URL-а.

Даже при пороге в 3 URL-а hard-кластеризация обеспечивает точность выше 90%. Для сравнения: без использования инструментов точность работы опытного оптимизатора, в лучшем случае, составит 70%, а новичка – не более 30%. Несмотря на высокую точность, “hard” метод дает лишь около 40% полноты.

Soft-кластеризация обладает высоким показателем полноты, но существенно проигрывает в точности. Таким образом, “soft” и “hard” методы являются обратно пропорциональными по отношению друг к другу. Использование того или иного метода зависит от целей оптимизационного процесса.

При «трафиковом» продвижении, когда важно вывести на страницу как можно больше любых запросов, лучше подходит soft-кластеризация. Если осуществляется «позиционное» продвижение, то решающее слово за hard’ом.

Также hard-кластеризацию применяют при текстовом анализе страницы. Любой текстовый анализ по группе запросов для страницы довольно строго соотносится с качеством этой группы. Только “hard” метод обеспечивает группы нужного качества.

Как сделать группировку семантического ядра

Я обычно делаю кластеризацию в два этапа. В первом этапе я закидываю ядро в какой-нибудь сервис/программу автоматической кластеризации, а на втором этапе я добиваю ядро вручную. Через Excel. Вот примерно как эти мужичары:

На этих видео в принципе понятно, как делать ручную добивку, а по поводу автоматических кластеризаторов — тут уж каждый выбирает, что ему больше по вкусу.

Semparser

Автоматический группировщик запросов от Топвизора представляет собой альтернативу Rush Analytics и Semparser, причем по интерфейсу похож на последний. Степень группировки и сохранение проекта в Exсel-файл присутствует.

В кластеризаторе Топвизора присутствует операция «перегруппировка». После ее применения количество групп возрастает, а число запросов в них заметно уменьшается. Данная функция пригодится тем, кого не устраивает soft-кластеризация и подойдет хард-вариант.

«Перегруппировка» тут платная, хотя и снимает не больше пары рублей.

Достоинство Топвизора основано на большой скорости группирования. Семантическое ядро в 1000 запросов кластеризатор распределит за считанные минуты. Недостатки: дороговизна группировки и, конечно же, необходимость в ручной правке.

Группировка через Key Collector

Еще один пример автоматического кластеризатора представлен в качестве онлайн-инструмента на сайте coolakov.ru . Разбивка запросов на группы производится на основе схожести топ-10 Яндекса.

Плюс: бесплатный онлайн-сервис.
Минусы: невысокая точность группировки, отсутствие выгрузки в файл.

Поводя итог, можно с уверенностью остановить свой выбор на автоматических кластеризаторах, предлагаемых различными онлайн-сервисами. Но, к сожалению, работа любого кластеризатора требует ручной доработки.

mob_info