Руководство по кластеризации + видео

Еще не зарегистрированы? Попробуйте кластеризацию прямо сейчас!


Дарим 200 рублей на счет чтобы попробовать!

Кластеризация ключевых слов - это автоматизированное распределение запросов на группы на основе выдачи поисковых систем.

Алгоритм кластеризации Rush Analytics соберет ТОП10 URL выдачи Яндекса или Google по каждому вашему ключевому слову, сравнит результаты для каждого ключевого слова и сгруппирует запросы именно так, как они будут успешно продвигаться в поисковых системах, и как будет удобно и логично создавать страницы на сайте.

После обработки запросов, вы получите практически готовую и корректно сформированную, с точки зрения поисковых систем, структуру сайта. А основываясь на данных о частотности по каждой группе ключевых слов, вы сможете легко принять решение о создании дополнительных страниц на сайте.


Ознакомьтесь с видео руководством по функционалу кластеризации


FAQ по кластеризации: самые частые вопросы наших пользователей


Кластеризация – группировка ключевых слов на основе сравнения выдачи поисковых систем. Алгоритм соберет ТОП10 URL по вашим ключевым словам, сравнит результаты для каждого ключевого слова и сгруппирует запросы именно так, как они будут успешно продвигаться в поисковых системах, и как будет удобно и логично создавать страницы на сайте
Вам нужно загрузить в Rush Analytics список ключевых слов и их частотность (любую) или же разметить ключевые слова как главные (маркерные запросы) и все остальные.
Для использования комбинированного алгоритма кластеризации, вам понадобится и частотность и разметка маркеров. Об этом читайте немного ниже.
Точность кластеризации указывает, сколько общих URL должно быть в результатах поиска по двум запросам, чтобы мы объединили эти запросы в группу.
Иными словами - чем больше точность кластеризации (группировки), тем более похожие фразы попадут в одну группу (кластер).
Для большинства тематик будет достаточно точности = 5.
A: В каждой тематике есть свой, необходимый и достаточный порог схожести выдачи, чтобы получить качественное семантическое ядро. Например, при продвижении интернет-магазинов, будет большой проблемой, если при кластеризации запросов ключевые слова "мультиварка Redmond RX500" и "Мультиварка Redmond RX500-1" будут попадать в один кластер - т.к. это разные товары и они должны продвигаться на разные карточки товара. Здесь мы рекомендуем использовать точность = 5
Для инфо-тематик, например, для сайтов скидок или рецептов, такая точность не нужна - здесь задача получить максимальное количество сгруппированных кластеров для написания статей. Для таких сайтов мы рекомендуем точность 3 или 4. А для сайтов в очень конкурентных тематиках, где борьба за ТОП идет в основном по конкурентным ВЧ запросам - мы рекомендуем использовать повышенную точность кластеризации - 6 или 7, а под некластеризованные запросы создавать отдельные страницы.
Нет. Расчет стоимости кластеризации будет по количеству загруженных запросов в проект. Вы можете выбрать хоть все виды точности, дополнительная плата за это не взимается
Если трафик на сайт в основном российский и из Яндекса - оптимально делать кластеризацию по Яндексу, выбрав регион по которому продвигается сайт.
Можно использовать и обе поисковые системы, а потом сравнить результаты. Часто результаты очень похожи между поисковыми системами.
Если вы продвигаете сайт под другие рынки - уже сейчас доступна кластеризация для всех регионов и языков мира по выдаче Google.
В скором времени мы добавим функционал выбора страны и города для кластеризации по выдаче Google.com. Если вам интересен этот функционал - голосуйте в нашем сообществе и он появится значительно быстрее - ссылка на голосование
Да, можно. А иногда даже нужно.
Когда можно объединить два кластера в один?
Нередко такие ключевые слова как "купить мультиварки redmond" и "мультиварки redmond цена" могут попадать в разные кластеры из-за низкого качества выдачи в Яндексе и Google по этим запросам.
В таком случае нужно объединить эти кластеры в один и продвигать на страницу мультиварок redmond. Это вполне нормальная ситуация.
Когда нельзя объединять два кластера в один?
Когда в одном кластере информационные запросы, а в другом коммерческие. Например, кластеры "купить мультиварки redmond" и "обзор мультиварок redmond" нельзя объединять т.к. эти запросы должны принципиально продвигаться на разные страницы.
Я сомневаюсь объединять два кластера или нет, что делать?
Мы подробно рассказываем, что делать в таком случае в этом руководстве.
Потому, что слова из вкладки "Некластеризовано" не нашли себе пару для кластера. К сожалению, не все ключевые слова можно сгруппировать - т.к. не все они связаны между собой.
Мы руководствуемся в первую очередь тем, как ключевые слова будут продвигаться (ранжироваться) и группируем их на основе схожести поисковой выдачи.
К примеру: запросы "мобильный телефон" и "мобильные телефоны" должны продвигаться на разные страницы т.к. один запрос информационный, а второй коммерческий и они никогда не продвинутся на одну страницу.
Что делать с некластеризованными запросами?
Если в списке некластеризованных слов вы найдете ценные для вас ключевые слова - их можно в ручную добавить к уже существующим группам (могли не привязаться из-за плохой выдачи) или же создать под эти слова отдельные страницы на сайте.
Здесь у нас есть два практических совета:
1. Понизить точность кластеризации - в таком случае вы получите более широкие кластеры и больше кластеров из 2-3 слов. Этот метод хорошо подходит для информационных сайтов. Для интернет-магазинов ключевые слова могут попадать в неверные группы при кластеризации по Wordstat
2. Делайте комбинированную кластеризацию:
- Изначально вручную подбирайте маркеры, которые будут основной вашей структуры и которые легко найти: с помощью логических гипотез и посмотрев частотные ключевые слова в вордстате на 1-3 страницах
- Используйте стоп-слова (например: города, по которым вы не продвигаетесь, мусорные слова типа "скачать" "бесплатно", "без смс" при сборе ключевых слов или при создании проекта по кластеризации). Вам в помощь наш новый функционал стоп-слов!
Это поможет поднять процент кластеризованных слов до 45-65%
Подробно о том, как подбирать маркерные ключевые слова и собирать семантику, рекомендуем посмотреть в нашем полном руководстве по подбору семантического ядра
Перед кластеризацией из списка будут исключены все фразы, содержащие стоп-слова. Т.е. мусорные ключевые слова не будут использоваться в кластеризации и будут отброшены еще до начала сравнения запросов.
Рекомендуем использовать данную опцию, если вы загружаете "грязный" список ключевых слов в проект по кластеризации. Функционал помогает сэкономить бюджет на кластеризацию и решает проблему ручной, утомительной очистки стоп-слов в Excel. Предлагаем воспользоваться готовыми списками стоп-слов по гео-запросам и различным тематикам, или создать совой список стоп-слов.

Пошаговый алгоритм работы с сервисом:

  1. Создание проекта. Чтобы создать проект, необходимо перейти во вкладку кластеризация и нажать "Создать новый проект"



  2.  
  3. Шаг первый: Поисковая система и регион.
    Здесь необходимо ввести название проекта (обязательное поле). Можно ввести любое название, часто бывает удобно вводить название сайта, чтобы в будущем легко найти нужный проект.

    Далее мы указываем поисковую систему, по данным которой будет выполняться группировка. Можно выбрать или Яндекс или Google.
    Для Google на данный момент доступны все регионы и языки мира.

  4. Шаг второй: Настройки сбора

    Все о наших алгоритмах кластеризации

    Тип - выбор алгоритма кластеризации.

    У нас есть 3 алгоритма кластеризации:

    • Кластеризация с ручными маркерами
    • Кластеризация по Wordstat
    • Комбинированный алгоритм кластеризации (ручные маркеры + Wordstat)

    Работают они по одному и тому же базовому принципу - сравнению подобия ТОПов поисковых систем, но предназначены для решения несколько различных задач.

    Алгоритм с использование ручных маркеров:

    Данный алгоритм эффективнее всего использовать, когда у вас есть готовая и довольно разветвленная структура сайта (каталога), и вы наперед знаете все маркеры и вам нужно просто понять по каким запросам вы собираетесь продвигать существующие страницы, а задачи расширения структуры сайта не стоит. В таком случае вы берете свои маркеры (названия категорий/страниц), собираете по ним подсказки, размечаете маркеры как 1, собранное облако как 0 и отправляете на кластеризацию. На выходе вы получите готовую семантику для своих категорий, а слова, которые не привязались к вашей структуре останутся некластеризованными.
    Формат загрузки данных: ключевое слово | маркер(1/0) - скачать пример входного файла

    Алгоритм кластеризации по Wordstat

    Этот алгоритм скорее решает обратную алгоритму ручных маркеров задачу: вы еще не знаете структуры своего сайта и не можете выделить маркеры - вы просто собрали Wordstat, подсказки и частотность по подсказкам. Теперь вам нужно структурировать эту семантику, чтобы получить группы запросов под страницы будущего сайта или будущих категорий существующего сайта. В таком случае алгоритм кластеризации по Wordstat подойдет как нельзя лучше, работает он следующим образом.
    Весь список ключевых слов сортируется по убыванию частотности, алгоритм пытается привязать все возможные слова из списка к самому частотному слову и формирует кластер, далее все повторяется итерационно для следующих по частотности ключевых слов.
    Не волнуйтесь за то, что ключевые слова могут при первом проходе алгоритма привязаться к неверному кластеру - мы используем алгоритмы машинного обучения, построенные на бинарных деревьях, чтобы предотвратить это :)
    Формат загрузки данных: ключевое слово | частотность (любая) - скачать пример входного файла

    Комбинированный алгоритм (ручные маркеры + Wordstat) - сочетает подходы двух предыдущих методов.

    Этот алгоритм подходит для задачи одновременного подбора ключевых слов для существующей структуры сайта и ее расширения. Работает он следующим образом: сначала мы пытаемся привязать все возможные запросы к вашим маркерным запросам и формируем готовую структуру, привязанную к вашим маркерам. Далее, все запросы, что не были привязаны к маркерам - сортируются по убыванию частотности и группируются между собой. В результате вы получаете:
    а) Готовую семантику для существующих категорий сайта
    б) Расширение семантики для вашего сайта.
    Мы настоятельно рекомендуем использовать комбинированный алгоритм - он дает наилучший результат.
    Формат загрузки данных: ключевое слово | | маркер(1/0) | частотность - скачать пример входного файла


    Все, что нужно знать про точность кластеризации

    Точность – чем больше точность кластеризации (группировки), тем более похожие фразы попадут в одну группу (кластер).
    Другими словами - данная опция отвечает за то, сколько общих URL нужно в ТОП10 поисковой системы, чтобы ключевые слова попали в один кластер.

    В каждой тематике есть свой, необходимый и достаточный порог схожести выдачи, чтобы получить качественное семантическое ядро. Например при продвижении интернет-магазинов, будет большой проблемой, если при кластеризации запросов ключевые слова "мультиварка Redmond RX500" и "Мультиварка Redmond RX500-1" будут попадать в один кластер - т.к. это разные товары и они должны продвигаться на разные карточки товара. Здесь мы рекомендуем использовать точность = 5
    Для инфо-тематик, например, для сайтов скидок или рецептов, такая точность не нужна - здесь задача получить максимальное количество сгруппированных кластеров для написания статей. Для таких сайтов мы рекомендуем точность 3 или 4. А для сайтов в очень конкурентных тематиках, где борьба за ТОП идет в основном по конкурентным ВЧ запросам - мы рекомендуем использовать повышенную точность кластеризации - 6 или 7, а под некластеризованные запросы создавать отдельные страницы.

    Рекомендуется выбирать варианты 3-6 и по результатам смотреть, какая кластеризация будет обладать достаточной полнотой и точностью для вашей семантики. Чем больше значение точности, тем более мелкие будут группы.

    Другие настройки кластеризации

    Не кластеризовать, если частотность меньше, чем - данная опция позволяет не кластеризовать ключевые слова с частотностью, менее заданной. Это поможет сэкономить бюджет на кластеризацию и избавит вас от ручной чистки низко популярных запросов – такие слова будут помещены во вкладку «Не кластеризовано».

    Определение релевантных URL для кластеров существующего сайта
    Вам достаточно ввести название нужного домена и наши алгоритмы попытаются определить релевантные URL для полученных кластеров.
    Опция работает следующим образом: если по главному (маркерному) запросу ваш сайт уже в ТОП10 - мы покажем этот URL и выделим его зеленым цветом. Иначе - подберем URL для маркерного запроса с помощью оператора site:.

    ВАЖНО: Релевантные URL подбираются для маркерных (главных) запросов кластера и присваиваются всему кластеру (всем ключевым словам кластера).



  5. Шаг третий: «Ключевые слова и цена».
    Загружаем файл с запросами.
    Поддерживаемые форматы: xls, xlsx. Формат ввода данных: запрос;маркер или частотность. Для кластеризации по методу Wordstat + Ручные маркеры формат данных: запрос;маркер;частотность.

    Вводим стоп-слова
    Перед кластеризацией из списка будут исключены фразы, содержащие стоп-слова. Функционал помогает сэкономить бюджет на кластеризацию и решает проблему ручной очистки стоп-слов. Функционал особенно полезен, если вы кластеризуете "грязный", предварительно не очищенный список ключевых слов.

    Предлагаем воспользоваться готовыми списками стоп-слов по гео-запросам и различным тематикам, или создать совой список стоп-слов. И не забываем про "Эксперт опции" - по умолчанию применяется символьное соответствие - т.е. частичное вхождение удалит все слово / словосочетание, если вам надо точное соответствие стоп-слову - выбирайте фразовое соответствие.



  6. Нажимаем "Создать новый проект" - все, ваш проект отправлен на кластеризацию!

Теперь можно отслеживать статус проекта во вкладке "Очередь" или же в списке проектов по кластеризации.
На данный момент в Rush Analytics есть 5 статусов:
В очереди – данные еще не собираются, проект ждет своей очереди на сбор данных
Сбор данных – счетчик показывает, сколько ключевых слов обработано
Кластеринг – данные проекта уже собраны, система просчитывает все необходимые метрики, чтобы предоставить вам результат
На паузе – вы можете вручную поставить проект на паузу, если не уверены, что хотите его собирать. Или же, проект может сам встать на паузу т.к. у вас кончились деньги на балансе.
Готов – проект готов - вы можете посмотреть результаты в веб-интерфейсе или скачать в формате XLSX

Выходной файл кластеризации - описание столбцов

Результат кластеризации в формате XLSX выглядит следующим образом:



  • Запросы, выделенные серым цветом – маркерные запросы - указанные вами вручную, или определенные системой
  • Название кластера – берется название маркерного запроса
  • Размер кластера – количество ключевых слов в группе
  • Частотность ключевых слов – та частотность, которую вы задали в шаге «Ключевые слова». В зависимости от того, какую вы взяли частотность – базовую, в кавычках или с восклицательным знаком, результаты кластеризации могут незначительно отличаться
  • Общая частотность кластера – сумма частотностей всех ключевых слов кластера
  • Совпадений ТОПа– количество общих URL в поисковой выдаче по данному запросу с выдачей по эталонному (маркерному) запросу
  • Подсветки – подсветки с выдачи поисковых систем, собранные по вашему ключевому слову
  • Подсветки для кластера - подсветки без дубликатов, по всем словам данного кластера
  • Top URL - самый видимый в выдаче URL конкурента по всем запросам кластера. Здесь мы оцениваем частоту встречаемости URL конкурентов в выдаче по каждому запросу и позицию каждого URL конкурентов в выдаче
  • Релевантный URL - найденный релевантный URL для кластера, если была выбрана опция "Определять релевантные URL
    Опция работает следующим образом: если по главному (маркерному) запросу ваш сайт уже в ТОП10 - мы покажем этот URL и выделим его зеленым цветом. Иначе - подберем URL для маркерного запроса с помощью оператора site:

Примеры готовых файлов после кластеризации можно посмотреть в нашем портфолио

Далее можно объединять логически связанные группы для построения структуры сайта или раздела.
Рекомендуем ознакомиться с нашим полным руководством по подбору семантического ядра.