Руководство по кластеризации + видео

Редакция от 28 марта 2024 года

    Кластеризация ключевых слов — это автоматизированное распределение запросов на группы на основе выдачи поисковых систем.

    Алгоритм кластеризации Rush Analytics соберет ТОП-10 URL выдачи Яндекса или Google по каждому вашему ключевому слову, сравнит результаты для каждого ключевого слова и сгруппирует запросы именно так, как они будут успешно продвигаться в поисковых системах, и как будет удобно и логично создавать страницы на сайте.

    В Rush Analytics кластеризацию можно провести двумя методами: Soft и Hard

    После обработки запросов, вы получите практически готовую и корректно сформированную, с точки зрения поисковых систем, структуру сайта. А основываясь на данных о частотности по каждой группе ключевых слов, вы сможете легко принять решение о создании дополнительных страниц на сайте.

    Ознакомьтесь с видео руководством по функционалу кластеризации

    FAQ по кластеризации: самые частые вопросы наших пользователей

    • Что такое кластеризация слов? Как это работает?

      Кластеризация – группировка ключевых слов на основе сравнения выдачи поисковых систем. Алгоритм соберет ТОП-10 URL по вашим ключевым словам, сравнит результаты для каждого ключевого слова и сгруппирует запросы именно так, как они будут успешно продвигаться в поисковых системах, и как будет удобно и логично создавать страницы на сайте
    • Какие данные мне нужны для кластеризации (группировки) ключевых слов

      Вам нужно загрузить в Rush Analytics список ключевых слов и их частотность (любую) или же разметить ключевые слова как главные (маркерные запросы) и все остальные.
      Для использования комбинированного алгоритма кластеризации, вам понадобится и частотность ключевых слов, и разметка маркеров. Об этом читайте немного ниже.
    • Что такое точность кластеризации?

      Точность кластеризации указывает, сколько общих URL должно быть в результатах поиска по двум запросам, чтобы мы объединили эти запросы в группу.
      Иными словами — чем больше точность кластеризации (группировки), тем более похожие фразы попадут в одну группу (кластер).
      Для большинства тематик будет достаточно точности = 5.
    • Почему существует несколько вариантов точности кластеризации? Зачем?

      A: В каждой тематике есть свой, необходимый и достаточный порог схожести выдачи, чтобы составить семантическое ядро онлайн. Например, при продвижении интернет-магазинов, будет большой проблемой, если при кластеризации запросов ключевые слова «мультиварка Redmond RX500» и «Мультиварка Redmond RX500-1» будут попадать в один кластер — т.к. это разные товары, и они должны продвигаться на разные карточки товара. Здесь мы рекомендуем использовать точность = 5
      Для инфо-тематик, например, для сайтов скидок или рецептов, такая точность не нужна — здесь задача получить максимальное количество сгруппированных кластеров для написания статей. Для таких сайтов мы рекомендуем точность 3 или 4. А для сайтов в очень конкурентных тематиках, где борьба за ТОП идет в основном по конкурентным ВЧ запросам, мы рекомендуем использовать повышенную точность кластеризации — 6 или 7, а под некластеризованные запросы создавать отдельные страницы.
    • Если я выберу две или более настройки точности в кластеризации, с меня снимут в 2/3/4 раза больше денег?

      Нет. Расчет стоимости кластеризации будет по количеству загруженных запросов в задачу. Вы можете выбрать хоть все виды точности, дополнительная плата за это не взимается
    • Какую поисковую систему лучше выбрать для кластеризации?

      Если трафик на сайт в основном российский и из Яндекса, оптимально делать кластеризацию по Яндексу, выбрав регион, по которому продвигается сайт?
      Можно использовать обе поисковые системы, а потом сравнить результаты. Часто результаты очень похожи между поисковыми системами.
      Если вы продвигаете сайт под другие рынки, уже сейчас доступна кластеризация для всех регионов и языков мира по выдаче Google.
    • Можно ли объединить два кластера в один, если по логике их запросы должны продвигаться на одну страницу?

      Да, можно. А иногда даже нужно.
      Когда можно объединить два кластера в один?
      Нередко такие ключевые слова как «купить мультиварки redmond» и «мультиварки redmond цена» могут попадать в разные кластеры из-за низкого качества выдачи в Яндексе и Google по этим запросам.
      В таком случае нужно объединить эти кластеры в один и продвигать на страницу мультиварок redmond. Это вполне нормальная ситуация.
      Когда нельзя объединять два кластера в один?
      Когда в одном кластере информационные запросы, а в другом коммерческие. Например, кластеры «купить мультиварки redmond» и «обзор мультиварок redmond» нельзя объединять, т.к. эти запросы должны принципиально продвигаться на разные страницы.
      Я сомневаюсь объединять два кластера или нет, что делать?
      Мы подробно рассказываем, что делать в таком случае в этом руководстве.
    • Почему не все ключевые слова кластеризовались?

      Потому, что слова из вкладки «Некластеризовано» не нашли себе пару для кластера. К сожалению, не все ключевые слова можно сгруппировать, т.к. не все они связаны между собой.
      Мы руководствуемся в первую очередь тем, как ключевые слова будут продвигаться (ранжироваться), и группируем их на основе схожести поисковой выдачи.
      К примеру, запросы «мобильный телефон» и «мобильные телефоны» должны продвигаться на разные страницы, т.к. один запрос информационный, а второй коммерческий, и они никогда не продвинутся на одной странице.
      Что делать с некластеризованными запросами?
      Если в списке некластеризованных слов вы найдете ценные для вас ключевые слова, их можно вручную добавить к уже существующим группам (могли не привязаться из-за плохой выдачи) или же создать под эти слова отдельные страницы на сайте.
    • Как увеличить процент кластеризованных ключевых слов?

      Здесь у нас есть два практических совета:
      1. Понизить точность кластеризации — в таком случае вы получите более широкие кластеры и больше кластеров из 2-3 слов. Этот метод хорошо подходит для информационных сайтов. Для интернет-магазинов ключевые слова могут попадать в неверные группы при кластеризации по Wordstat
      2. Делайте комбинированную кластеризацию:
      — Изначально вручную подбирайте маркеры, которые будут основой вашей структуры и которые легко найти: с помощью логических гипотез и, посмотрев частотные ключевые слова в Вордстате на 1-3 страницах
      — Используйте стоп-слова (например, города, по которым вы не продвигаетесь, мусорные слова типа «скачать», «бесплатно», «без смс», при сборе ключевых слов или при создании задачи по кластеризации). Вам в помощь наш новый функционал стоп-слов!
      Это поможет поднять процент кластеризованных слов до 45-65%
      Подробно о том, как подбирать маркерные ключевые слова и собирать семантику, рекомендуем посмотреть в нашем полном руководстве по подбору семантического ядра
    • Как работает функционал стоп-слов в кластеризации?

      Перед кластеризацией из списка будут исключены все фразы, содержащие стоп-слова. Т.е. мусорные ключевые слова не будут использоваться в кластеризации и будут отброшены еще до начала сравнения запросов.
      Рекомендуем использовать данную опцию, если вы загружаете «грязный» список ключевых слов в задачу по кластеризации. Функционал помогает сэкономить бюджет на кластеризацию и решает проблему ручной, утомительной очистки стоп-слов в Excel. Предлагаем воспользоваться готовыми списками стоп-слов по гео-запросам и различным тематикам или создать свой список стоп-слов.

    Пошаговый алгоритм работы с сервисом:

    1. Создание задачи. Чтобы создать задачу и кластеризовать ваши ключевые слова, необходимо перейти в инструмент Кластеризация и нажать «Создать новую задачу»
    2. Шаг первый: Поисковая система и регион.
      Здесь необходимо ввести название задачи (обязательное поле). Можно ввести любое название, часто бывает удобно вводить название сайта, чтобы в будущем легко найти нужную задачу.

      Далее мы указываем поисковую систему, по данным которой будет выполняться группировка. Можно выбрать или Яндекс или Google.
      Для Google на данный момент доступны все регионы и языки мира.
    1. Шаг второй: Настройки сбора

    Все о наших алгоритмах кластеризации

    Метод кластеризации:

    • Soft-кластеризация: в этом методе кластеризации алгоритм определяет центральные (маркерные) запросы и сравнивает с ними все остальные запросы. Алгоритм отлично подходит для кластеризации ключевых слов для трафиковых проектов: интернет-магазины, информационные сайты, сайты услуг с не сильной конкуренцией.
    • Hard-кластеризация: запросы объединяются в группу, только если есть общий для всех запросов набор URL. При этом типе кластеризации группируется меньше ключевых слов, но с очень большой точностью. Идеально подходит для конкурентных высокочастотных запросов.

    Тип — выбор алгоритма кластеризации.

    У нас есть 3 алгоритма кластеризации:

    • Кластеризация с ручными маркерами
    • Кластеризация по Wordstat
    • Комбинированный алгоритм кластеризации (ручные маркеры + Wordstat)

    Работают они по одному и тому же базовому принципу — сравнению подобия ТОПов поисковых систем, но предназначены для решения несколько различных задач.

    Алгоритм с использованием ручных маркеров:

    Данный алгоритм эффективнее всего использовать, когда у вас есть готовая и довольно разветвленная семантическая структура сайта (каталога), и вы наперед знаете все маркеры и вам нужно просто понять по каким запросам вы собираетесь продвигать существующие страницы, а задачи расширения структуры сайта не стоит. В таком случае вы берете свои маркеры (названия категорий/страниц), собираете по ним подсказки Яндекса или Гугла, размечаете маркеры как 1, собранное облако как 0 и отправляете на кластеризацию. На выходе вы получите готовую семантику для своих категорий, а слова, которые не привязались к вашей структуре останутся некластеризованными.
    Формат загрузки данных: ключевое слово | маркер(1/0) — скачать пример входного файла

    Алгоритм кластеризации по Wordstat

    Этот алгоритм скорее решает обратную алгоритму ручных маркеров задачу: вы еще не знаете структуры своего сайта и не можете выделить маркеры — вы просто собрали Wordstat, подсказки и частотность по подсказкам. Теперь вам нужно структурировать эту семантику, чтобы получить группы запросов под страницы будущего сайта или будущих категорий существующего сайта. В таком случае алгоритм кластеризации по Wordstat подойдет как нельзя лучше, работает он следующим образом.
    Весь список ключевых слов сортируется по убыванию частотности, алгоритм пытается привязать все возможные слова из списка к самому частотному слову и формирует кластер, далее все повторяется итерационно для следующих по частотности ключевых слов.
    Не волнуйтесь за то, что ключевые слова могут при первом проходе алгоритма привязаться к неверному кластеру — мы используем алгоритмы машинного обучения, построенные на бинарных деревьях, чтобы предотвратить это 🙂
    Формат загрузки данных: ключевое слово | частотность (любая) — скачать пример входного файла

    Комбинированный алгоритм (ручные маркеры + Wordstat) — сочетает подходы двух предыдущих методов.

    Этот алгоритм подходит для задачи одновременного подбора ключевых слов для существующей структуры сайта и ее расширения. Работает он следующим образом: сначала мы пытаемся привязать все возможные запросы к вашим маркерным запросам и формируем готовую структуру, привязанную к вашим маркерам. Далее, все запросы, что не были привязаны к маркерам — сортируются по убыванию частотности и группируются между собой. В результате вы получаете:
    а) Готовую семантику для существующих категорий сайта
    б) Расширение семантики для вашего сайта.
    Мы настоятельно рекомендуем использовать комбинированный алгоритм — он дает наилучший результат.
    Формат загрузки данных: ключевое слово | | маркер(1/0) | частотность — скачать пример входного файла

    Все, что нужно знать про точность кластеризации

    Точность – чем больше точность кластеризации (группировки), тем более похожие фразы попадут в одну группу (кластер).
    Другими словами — данная опция отвечает за то, сколько общих URL нужно в ТОП10 поисковой системы, чтобы ключевые слова попали в один кластер.

    В каждой тематике есть свой, необходимый и достаточный порог схожести выдачи, чтобы получить качественное семантическое ядро. Например при продвижении интернет-магазинов, будет большой проблемой, если при кластеризации запросов ключевые слова «мультиварка Redmond RX500» и «Мультиварка Redmond RX500-1» будут попадать в один кластер — т.к. это разные товары и они должны продвигаться на разные карточки товара. Здесь мы рекомендуем использовать точность = 5
    Для инфо-тематик, например, для сайтов скидок или рецептов, такая точность не нужна — здесь задача получить максимальное количество сгруппированных кластеров для написания статей. Для таких сайтов мы рекомендуем точность 3 или 4. А для сайтов в очень конкурентных тематиках, где борьба за ТОП идет в основном по конкурентным ВЧ запросам — мы рекомендуем использовать повышенную точность кластеризации — 6 или 7, а под некластеризованные запросы создавать отдельные страницы.

    Рекомендуется выбирать варианты 3-6 и по результатам смотреть, какая кластеризация запросов будет обладать достаточной полнотой и точностью для вашей семантики. Чем больше значение точности, тем более мелкие будут группы.

    Другие настройки кластеризации

    Определение релевантных URL для кластеров существующего сайта
    Вам достаточно ввести название нужного домена и наши алгоритмы попытаются определить релевантные URL для полученных кластеров.
    Опция работает следующим образом: если по главному (маркерному) запросу ваш сайт уже в ТОП10 — мы покажем этот URL и выделим его зеленым цветом. Иначе — подберем URL для маркерного запроса с помощью оператора site:.

    ВАЖНО: Релевантные URL подбираются для маркерных (главных) запросов кластера и присваиваются всему кластеру (всем ключевым словам кластера).

    1. Шаг третий: «Ключевые слова и цена».

    Загружаем файл с запросами.

    Поддерживаемые форматы: xls, xlsx. Отключено форматирование. Формат ввода данных: запрос;маркер или частотность. Для кластеризации по методу Wordstat + Ручные маркеры формат данных: запрос;маркер;частотность.

    1. Вводим стоп-слова

    Перед кластеризацией из списка будут исключены фразы, содержащие стоп-слова. Функционал помогает сэкономить бюджет на кластеризацию и решает проблему ручной очистки стоп-слов. Функционал особенно полезен, если вы кластеризуете «грязный», предварительно не очищенный список ключевых слов.

    Предлагаем воспользоваться готовыми списками стоп-слов по гео-запросам и различным тематикам, или создать свой список стоп-слов. И не забываем про «Эксперт опции» — по умолчанию применяется символьное соответствие — т.е. частичное вхождение удалит все слово / словосочетание, если вам надо точное соответствие стоп-слову — выбирайте фразовое соответствие.

    Нажимаем «Создать новую задачу» — все, ваша задача отправлены на кластеризацию!

    Теперь можно отслеживать статус задачи во вкладке «Очередь» или же в списке задач по кластеризации.
    На данный момент в Rush Analytics есть 5 статусов:
    В очереди – данные еще не собираются, задача ждет своей очереди на сбор данных
    Сбор данных – счетчик показывает, сколько ключевых слов обработано
    Кластеринг – данные задачи уже собраны, система просчитывает все необходимые метрики, чтобы предоставить вам результат
    Готов – задача готов — вы можете посмотреть результаты в веб-интерфейсе или скачать в формате XLSX

    Выходной файл кластеризации — описание столбцов

    Результат кластеризации в формате XLSX выглядит следующим образом:

    • Запросы, выделенные серым цветом – маркерные запросы — указанные вами вручную, или определенные системой
    • Название кластера – берется название маркерного запроса
    • Размер кластера – количество ключевых слов в группе
    • Частотность ключевых слов – та частотность, которую вы задали в шаге «Ключевые слова». В зависимости от того, какую вы взяли частотность – базовую, в кавычках или с восклицательным знаком, результаты кластеризации могут незначительно отличаться
    • Общая частотность кластера – сумма частотностей всех ключевых слов кластера
    • Совпадений ТОПа– количество общих URL в поисковой выдаче по данному запросу с выдачей по эталонному (маркерному) запросу. При выборе Hard-кластеризации эта колонка показывает минимальное количество общих URL в кластере. Она не отображает, сколько общих URL между первым и другими ключевыми словами, как это в Soft-кластеризации.
    • Подсветки – подсветки из выдачи поисковых систем, собранные по вашему ключевому слову
    • Подсветки для кластера — подсветки без дубликатов, по всем словам данного кластера
    • Top URL — самый видимый в выдаче URL конкурента по всем запросам кластера. Здесь мы оцениваем частоту встречаемости URL конкурентов в выдаче по каждому запросу и позицию каждого URL конкурентов в выдаче
    • Релевантный URL — найденный релевантный URL для кластера, если была выбрана опция «Определять релевантные URL
      Опция работает следующим образом: если по главному (маркерному) запросу ваш сайт уже в ТОП10 — мы покажем этот URL и выделим его зеленым цветом. Иначе — подберем URL для маркерного запроса с помощью оператора site:

    Примеры готовых файлов после кластеризации можно посмотреть в нашем портфолио

    Далее можно объединять логически связанные группы для построения структуры сайта или раздела.
    Рекомендуем ознакомиться с нашим полным руководством по подбору семантического ядра.

    Статистика пользователя

    Была ли статья полезной?

    Да, спасибо! 11
    Не совсем 0