Руководство по кластеризации + видео

Редакция от 02 апреля 2024 года

    Кластеризация ключевых слов — это автоматизированное распределение запросов на группы на основе выдачи поисковых систем.

    Алгоритм кластеризации Rush Analytics соберет ТОП10 URL выдачи Яндекса или Google по каждому вашему ключевому слову, сравнит результаты для каждого ключевого слова и сгруппирует запросы именно так, как они будут успешно продвигаться в поисковых системах, и как будет удобно и логично создавать страницы на сайте.

    В Rush Analytics кластеризацию можно провести двумя методами: Soft и Hard

    После обработки запросов, вы получите практически готовую и корректно сформированную, с точки зрения поисковых систем, структуру сайта. А основываясь на данных о частотности по каждой группе ключевых слов, вы сможете легко принять решение о создании дополнительных страниц на сайте.

    Ознакомьтесь с видео руководством по функционалу кластеризации

    FAQ по кластеризации: самые частые вопросы наших пользователей

    • Что такое кластеризация слов? Как это работает?

      Кластеризация – группировка ключевых слов на основе сравнения выдачи поисковых систем. Алгоритм соберет ТОП10 URL по вашим ключевым словам, сравнит результаты для каждого ключевого слова и сгруппирует запросы именно так, как они будут успешно продвигаться в поисковых системах, и как будет удобно и логично создавать страницы на сайте
    • Какие данные мне нужны для кластеризации (группировки) ключевых слов

      Вам нужно загрузить в Rush Analytics список ключевых слов и их частотность (любую) или же разметить ключевые слова как главные (маркерные запросы) и все остальные.
      Для использования комбинированного алгоритма кластеризации, вам понадобится и частотность ключевых слов и разметка маркеров. Об этом читайте немного ниже.
    • Что такое точность кластеризации?

      Точность кластеризации указывает, сколько общих URL должно быть в результатах поиска по двум запросам, чтобы мы объединили эти запросы в группу.
      Иными словами — чем больше точность кластеризации (группировки), тем более похожие фразы попадут в одну группу (кластер).
      Для большинства тематик будет достаточно точности = 5.
    • Почему существует несколько вариантов точности кластеризации? Зачем?

      A: В каждой тематике есть свой, необходимый и достаточный порог схожести выдачи, чтобы составить семантическое ядро онлайн. Например, при продвижении интернет-магазинов, будет большой проблемой, если при кластеризации запросов ключевые слова «мультиварка Redmond RX500» и «Мультиварка Redmond RX500-1» будут попадать в один кластер — т.к. это разные товары и они должны продвигаться на разные карточки товара. Здесь мы рекомендуем использовать точность = 5
      Для инфо-тематик, например, для сайтов скидок или рецептов, такая точность не нужна — здесь задача получить максимальное количество сгруппированных кластеров для написания статей. Для таких сайтов мы рекомендуем точность 3 или 4. А для сайтов в очень конкурентных тематиках, где борьба за ТОП идет в основном по конкурентным ВЧ запросам — мы рекомендуем использовать повышенную точность кластеризации — 6 или 7, а под некластеризованные запросы создавать отдельные страницы.
    • Если я выберу две или более настройки точности в кластеризации, с меня снимут в 2/3/4 раза больше денег?

      Нет. Расчет стоимости кластеризации будет по количеству загруженных запросов в задачу. Вы можете выбрать хоть все виды точности, дополнительная плата за это не взимается
    • Какую поисковую систему лучше выбрать для кластеризации?

      Если трафик на сайт в основном российский и из Яндекса — оптимально делать кластеризацию по Яндексу, выбрав регион по которому продвигается сайт.
      Можно использовать и обе поисковые системы, а потом сравнить результаты. Часто результаты очень похожи между поисковыми системами.
      Если вы продвигаете сайт под другие рынки — уже сейчас доступна кластеризация для всех регионов и языков мира по выдаче Google.
    • Можно ли объединить два кластера в один, если по логике их запросы должны продвигаться на одну страницу?

      Да, можно. А иногда даже нужно.
      Когда можно объединить два кластера в один?
      Нередко такие ключевые слова как «купить мультиварки redmond» и «мультиварки redmond цена» могут попадать в разные кластеры из-за низкого качества выдачи в Яндексе и Google по этим запросам.
      В таком случае нужно объединить эти кластеры в один и продвигать на страницу мультиварок redmond. Это вполне нормальная ситуация.
      Когда нельзя объединять два кластера в один?
      Когда в одном кластере информационные запросы, а в другом коммерческие. Например, кластеры «купить мультиварки redmond» и «обзор мультиварок redmond» нельзя объединять т.к. эти запросы должны принципиально продвигаться на разные страницы.
      Я сомневаюсь объединять два кластера или нет, что делать?
      Мы подробно рассказываем, что делать в таком случае в этом руководстве.
    • Почему не все ключевые слова кластеризовались?

      Потому, что слова из вкладки «Некластеризовано» не нашли себе пару для кластера. К сожалению, не все ключевые слова можно сгруппировать — т.к. не все они связаны между собой.
      Мы руководствуемся в первую очередь тем, как ключевые слова будут продвигаться (ранжироваться) и группируем их на основе схожести поисковой выдачи.
      К примеру: запросы «мобильный телефон» и «мобильные телефоны» должны продвигаться на разные страницы т.к. один запрос информационный, а второй коммерческий и они никогда не продвинутся на одну страницу.
      Что делать с некластеризованными запросами?
      Если в списке некластеризованных слов вы найдете ценные для вас ключевые слова — их можно в ручную добавить к уже существующим группам (могли не привязаться из-за плохой выдачи) или же создать под эти слова отдельные страницы на сайте.
    • Как увеличить процент кластеризованных ключевых слов?

      Здесь у нас есть два практических совета:
      1. Понизить точность кластеризации — в таком случае вы получите более широкие кластеры и больше кластеров из 2-3 слов. Этот метод хорошо подходит для информационных сайтов. Для интернет-магазинов ключевые слова могут попадать в неверные группы при кластеризации по Wordstat
      2. Делайте комбинированную кластеризацию:
      — Изначально вручную подбирайте маркеры, которые будут основной вашей структуры и которые легко найти: с помощью логических гипотез и посмотрев частотные ключевые слова в вордстате на 1-3 страницах
      — Используйте стоп-слова (например: города, по которым вы не продвигаетесь, мусорные слова типа «скачать» «бесплатно», «без смс» при сборе ключевых слов или при создании задачи по кластеризации). Вам в помощь наш новый функционал стоп-слов!
      Это поможет поднять процент кластеризованных слов до 45-65%
      Подробно о том, как подбирать маркерные ключевые слова и собирать семантику, рекомендуем посмотреть в нашем полном руководстве по подбору семантического ядра
    • Как работает функционал стоп-слов в кластеризации?

      Перед кластеризацией из списка будут исключены все фразы, содержащие стоп-слова. Т.е. мусорные ключевые слова не будут использоваться в кластеризации и будут отброшены еще до начала сравнения запросов.
      Рекомендуем использовать данную опцию, если вы загружаете «грязный» список ключевых слов в задачу по кластеризации. Функционал помогает сэкономить бюджет на кластеризацию и решает проблему ручной, утомительной очистки стоп-слов в Excel. Предлагаем воспользоваться готовыми списками стоп-слов по гео-запросам и различным тематикам или создать свой список стоп-слов.

    Пошаговый алгоритм работы с сервисом:

    1. Создание задачи.Чтобы создать задачу и кластеризовать ваши ключевые слова, необходимо перейти во вкладку Кластеризация и нажать «Создать новую задачу»
    2. Шаг первый: Поисковая система и регион.
      Здесь необходимо ввести название задачи (обязательное поле). Можно ввести любое название, часто бывает удобно вводить название сайта, чтобы в будущем легко найти нужную задачу.

      Далее мы указываем поисковую систему, по данным которой будет выполняться группировка. Можно выбрать или Яндекс или Google.
      Для Google на данный момент доступны все регионы и языки мира.
    1. Шаг второй: Настройки сбора

    Все о наших алгоритмах кластеризации

    Метод кластеризации:

    • Soft-кластеризация: в этом методе кластеризации алгоритм определяет центральные (маркерные) запросы и сравнивает с ними все остальные ключи. Алгоритм отлично подходит для кластеризации ключевых слов для трафиковых проектов: интернет-магазины, информационные сайты, сайты услуг с не сильной конкуренцией.
    • Hard-кластеризация: запросы объединяются в группу, только если есть общий для всех запросов набор URL. При этом типе кластеризации группируется меньше ключевых слов, но с очень большой точностью. Идеально подходит для конкурентных высокочастотных запросов.

    Тип — выбор алгоритма кластеризации.

    У нас есть 3 алгоритма кластеризации:

    • Кластеризация с ручными маркерами
    • Кластеризация по частотности
    • Комбинированный алгоритм кластеризации (частотность + ручные маркеры)

    Работают они по одному и тому же базовому принципу — сравнению подобия ТОПов поисковых систем, но предназначены для решения несколько различных задач.

    Алгоритм с использованием ручных маркеров:

    Данный алгоритм эффективнее всего использовать, когда у вас есть готовая и довольно разветвленная семантическая структура сайта (каталога), вы наперед знаете все маркеры, и вам нужно просто понять, по каким запросам вы собираетесь продвигать существующие страницы, а задачи расширения структуры сайта не стоит. В таком случае вы берете свои маркеры (названия категорий/страниц), собираете по ним подсказки Яндекса или Гугла, размечаете маркеры, как 1, собранное облако, как 0, и отправляете на кластеризацию. На выходе вы получите готовую семантику для своих категорий, а слова, которые не привязались к вашей структуре, останутся некластеризованными.
    Формат загрузки данных: ключевое слово | маркер(1/0) — скачать пример входного файла

    Алгоритм кластеризации по Wordstat

    Этот алгоритм, скорее, решает обратную алгоритму ручных маркеров задачу: вы еще не знаете структуры своего сайта и не можете выделить маркеры — вы просто собрали Wordstat, подсказки и частотность по подсказкам. Теперь вам нужно структурировать эту семантику, чтобы получить группы запросов под страницы будущего сайта или будущих категорий существующего сайта. В таком случае алгоритм кластеризации по Wordstat подойдет как нельзя лучше, работает он следующим образом.
    Весь список ключевых слов сортируется по убыванию частотности, далее алгоритм пытается привязать все возможные слова из списка к самому частотному слову и формирует кластер, далее все повторяется итерационно для следующих по частотности ключевых слов.
    Не волнуйтесь за то, что ключевые слова могут при первом проходе алгоритма привязаться к неверному кластеру — мы используем алгоритмы машинного обучения, построенные на бинарных деревьях, чтобы предотвратить это 🙂
    Формат загрузки данных: ключевое слово | частотность (любая) — скачать пример входного файла

    Комбинированный алгоритм (ручные маркеры + Wordstat) — сочетает подходы двух предыдущих методов.

    Этот алгоритм подходит для задачи одновременного подбора ключевых слов для существующей структуры сайта и ее расширения. Работает он следующим образом: сначала мы пытаемся привязать все возможные запросы к вашим маркерным запросам и формируем готовую структуру, привязанную к вашим маркерам. Далее все запросы, что не были привязаны к маркерам, сортируются по убыванию частотности и группируются между собой. В результате вы получаете:
    а) Готовую семантику для существующих категорий сайта
    б) Расширение семантики для вашего сайта.
    Мы настоятельно рекомендуем использовать комбинированный алгоритм — он дает наилучший результат.
    Формат загрузки данных: ключевое слово | | маркер(1/0) | частотность — скачать пример входного файла

    Все, что нужно знать про точность кластеризации

    Точность – чем больше точность кластеризации (группировки), тем более похожие фразы попадут в одну группу (кластер).
    Другими словами — данная опция отвечает за то, сколько общих URL нужно в ТОП10 поисковой системы, чтобы ключевые слова попали в один кластер.

    В каждой тематике есть свой, необходимый и достаточный порог схожести выдачи, чтобы получить качественное семантическое ядро. Например, при продвижении интернет-магазинов будет большой проблемой, если при кластеризации запросов ключевые слова «мультиварка Redmond RX500» и «Мультиварка Redmond RX500-1» будут попадать в один кластер, т.к. это разные товары, и они должны продвигаться на разные карточки товара. Здесь мы рекомендуем использовать точность 5.
    Для инфо-тематик, например, для сайтов скидок или рецептов, такая точность не нужна. Здесь задача получить максимальное количество сгруппированных кластеров для написания статей. Для таких сайтов мы рекомендуем точность 3 или 4. А для сайтов в очень конкурентных тематиках, где борьба за ТОП идет в основном по конкурентным ВЧ запросам, мы рекомендуем использовать повышенную точность кластеризации — 6 или 7, а под некластеризованные запросы создавать отдельные страницы.

    Рекомендуется выбирать варианты 3-6 и по результатам смотреть, какая кластеризация запросов будет обладать достаточной полнотой и точностью для вашей семантики. Чем больше значение точности, тем более мелкие будут группы.

    Другие настройки кластеризации

    Определение релевантных URL для кластеров существующего сайта.
    Вам достаточно ввести название нужного домена, и наши алгоритмы попытаются определить релевантные URL для полученных кластеров.
    Опция работает следующим образом: если по главному (маркерному) запросу ваш сайт уже в ТОП10, мы покажем этот URL и выделим его зеленым цветом. Иначе — подберем URL для маркерного запроса с помощью оператора site:.

    ВАЖНО: Релевантные URL подбираются для маркерных (главных) запросов кластера и присваиваются всему кластеру (всем ключевым словам кластера).

    1. Шаг третий: «Ключевые слова и цена».

    Загружаем файл с запросами.

    Поддерживаемые форматы: xls, xlsx. Отключено форматирование. Для кластеризации по методу «Частотность + Ручные маркеры» формат данных: запрос/маркер/частотность.

    1. Вводим стоп-слова

    Перед кластеризацией из списка будут исключены фразы, содержащие стоп-слова. Функционал помогает сэкономить бюджет на кластеризацию и решает проблему ручной очистки стоп-слов. Функционал особенно полезен, если вы кластеризуете «грязный», предварительно не очищенный список ключевых слов.

    Предлагаем воспользоваться готовыми списками стоп-слов по гео-запросам и различным тематикам или создать свой список стоп-слов. И не забываем про «Эксперт опции» — по умолчанию применяется символьное соответствие, т.е. частичное вхождение удалит все слово / словосочетание. Если вам надо точное соответствие стоп-слову — выбирайте фразовое соответствие.

    Нажимаем «Запустить задачу» — все, ваша задача отправлена на кластеризацию!

    Теперь можно отслеживать статус задачи во вкладке «Очередь» или же в списке задач по кластеризации.
    На данный момент в Rush Analytics есть 4 статуса:
    В очереди – данные еще не собираются, задача ждет своей очереди на сбор данных
    Сбор данных – счетчик показывает, сколько ключевых слов обработано
    Кластеринг – данные задачи уже собраны, система просчитывает все необходимые метрики, чтобы предоставить вам результат
    Готов – задача готова, вы можете посмотреть результаты в веб-интерфейсе или скачать в формате XLSX

    Выходной файл кластеризации — описание столбцов

    Результат кластеризации в формате XLSX выглядит следующим образом:

    • Запросы, выделенные серым цветом – маркерные запросы, указанные вами вручную или определенные системой
    • Название кластера – берется название маркерного запроса
    • Размер кластера – количество ключевых слов в группе
    • Частотность ключевых слов – та частотность, которую вы задали в шаге «Ключевые слова». В зависимости от того, какую вы взяли частотность – базовую, в кавычках или с восклицательным знаком, результаты кластеризации могут незначительно отличаться
    • Общая частотность кластера – сумма частотностей всех ключевых слов кластера
    • Совпадений ТОПа– количество общих URL в поисковой выдаче по данному запросу с выдачей по эталонному (маркерному) запросу. При выборе Hard-кластеризации эта колонка показывает минимальное количество общих URL в кластере. Она не отображает, сколько общих URL между первым и другими ключевыми словами, как это в Soft-кластеризации.
    • Подсветки – подсветки из выдачи поисковых систем, собранные по вашему ключевому слову
    • Подсветки для кластера — подсветки без дубликатов, по всем словам данного кластера
    • Top URL — самый видимый в выдаче URL конкурента по всем запросам кластера. Здесь мы оцениваем частоту встречаемости URL конкурентов в выдаче по каждому запросу и позицию каждого URL конкурентов в выдаче
    • Релевантный URL — найденный релевантный URL для кластера, если была выбрана опция «Определять релевантные URL
      Опция работает следующим образом: если по главному (маркерному) запросу ваш сайт уже в ТОП10, мы покажем этот URL и выделим его зеленым цветом. Иначе — подберем URL для маркерного запроса с помощью оператора site:

    Примеры готовых файлов после кластеризации можно посмотреть в нашем портфолио

    Далее можно объединять логически связанные группы для построения структуры сайта или раздела.
    Рекомендуем ознакомиться с нашим полным руководством по подбору семантического ядра.

    Статистика пользователя

    Была ли статья полезной?

    Да, спасибо! 12
    Не совсем 0