Кластеризация ключевых слов — это автоматизированное распределение запросов на группы на основе выдачи поисковых систем.
Алгоритм кластеризации Rush Analytics соберет ТОП-10 URL выдачи Яндекса или Google по каждому вашему ключевому слову, сравнит результаты для каждого ключевого слова и сгруппирует запросы именно так, как они будут успешно продвигаться в поисковых системах, и как будет удобно и логично создавать страницы на сайте.
В Rush Analytics кластеризацию можно провести двумя методами: Soft и Hard
После обработки запросов, вы получите практически готовую и корректно сформированную, с точки зрения поисковых систем, структуру сайта. А основываясь на данных о частотности по каждой группе ключевых слов, вы сможете легко принять решение о создании дополнительных страниц на сайте.
Ознакомьтесь с видео руководством по функционалу кластеризации
FAQ по кластеризации: самые частые вопросы наших пользователей
Что такое кластеризация слов? Как это работает?
Кластеризация – группировка ключевых слов на основе сравнения выдачи поисковых систем. Алгоритм соберет ТОП-10 URL по вашим ключевым словам, сравнит результаты для каждого ключевого слова и сгруппирует запросы именно так, как они будут успешно продвигаться в поисковых системах, и как будет удобно и логично создавать страницы на сайтеКакие данные мне нужны для кластеризации (группировки) ключевых слов
Вам нужно загрузить в Rush Analytics список ключевых слов и их частотность (любую) или же разметить ключевые слова как главные (маркерные запросы) и все остальные.
Для использования комбинированного алгоритма кластеризации, вам понадобится и частотность ключевых слов, и разметка маркеров. Об этом читайте немного ниже.Что такое точность кластеризации?
Точность кластеризации указывает, сколько общих URL должно быть в результатах поиска по двум запросам, чтобы мы объединили эти запросы в группу.
Иными словами — чем больше точность кластеризации (группировки), тем более похожие фразы попадут в одну группу (кластер).
Для большинства тематик будет достаточно точности = 5.Почему существует несколько вариантов точности кластеризации? Зачем?
A: В каждой тематике есть свой, необходимый и достаточный порог схожести выдачи, чтобы составить семантическое ядро онлайн. Например, при продвижении интернет-магазинов, будет большой проблемой, если при кластеризации запросов ключевые слова «мультиварка Redmond RX500» и «Мультиварка Redmond RX500-1» будут попадать в один кластер — т.к. это разные товары, и они должны продвигаться на разные карточки товара. Здесь мы рекомендуем использовать точность = 5
Для инфо-тематик, например, для сайтов скидок или рецептов, такая точность не нужна — здесь задача получить максимальное количество сгруппированных кластеров для написания статей. Для таких сайтов мы рекомендуем точность 3 или 4. А для сайтов в очень конкурентных тематиках, где борьба за ТОП идет в основном по конкурентным ВЧ запросам, мы рекомендуем использовать повышенную точность кластеризации — 6 или 7, а под некластеризованные запросы создавать отдельные страницы.Если я выберу две или более настройки точности в кластеризации, с меня снимут в 2/3/4 раза больше денег?
Нет. Расчет стоимости кластеризации будет по количеству загруженных запросов в задачу. Вы можете выбрать хоть все виды точности, дополнительная плата за это не взимаетсяКакую поисковую систему лучше выбрать для кластеризации?
Если трафик на сайт в основном российский и из Яндекса, оптимально делать кластеризацию по Яндексу, выбрав регион, по которому продвигается сайт?
Можно использовать обе поисковые системы, а потом сравнить результаты. Часто результаты очень похожи между поисковыми системами.
Если вы продвигаете сайт под другие рынки, уже сейчас доступна кластеризация для всех регионов и языков мира по выдаче Google.Можно ли объединить два кластера в один, если по логике их запросы должны продвигаться на одну страницу?
Да, можно. А иногда даже нужно.
Когда можно объединить два кластера в один?
Нередко такие ключевые слова как «купить мультиварки redmond» и «мультиварки redmond цена» могут попадать в разные кластеры из-за низкого качества выдачи в Яндексе и Google по этим запросам.
В таком случае нужно объединить эти кластеры в один и продвигать на страницу мультиварок redmond. Это вполне нормальная ситуация.
Когда нельзя объединять два кластера в один?
Когда в одном кластере информационные запросы, а в другом коммерческие. Например, кластеры «купить мультиварки redmond» и «обзор мультиварок redmond» нельзя объединять, т.к. эти запросы должны принципиально продвигаться на разные страницы.
Я сомневаюсь объединять два кластера или нет, что делать?
Мы подробно рассказываем, что делать в таком случае в этом руководстве.Почему не все ключевые слова кластеризовались?
Потому, что слова из вкладки «Некластеризовано» не нашли себе пару для кластера. К сожалению, не все ключевые слова можно сгруппировать, т.к. не все они связаны между собой.
Мы руководствуемся в первую очередь тем, как ключевые слова будут продвигаться (ранжироваться), и группируем их на основе схожести поисковой выдачи.
К примеру, запросы «мобильный телефон» и «мобильные телефоны» должны продвигаться на разные страницы, т.к. один запрос информационный, а второй коммерческий, и они никогда не продвинутся на одной странице.
Что делать с некластеризованными запросами?
Если в списке некластеризованных слов вы найдете ценные для вас ключевые слова, их можно вручную добавить к уже существующим группам (могли не привязаться из-за плохой выдачи) или же создать под эти слова отдельные страницы на сайте.Как увеличить процент кластеризованных ключевых слов?
Здесь у нас есть два практических совета:
1. Понизить точность кластеризации — в таком случае вы получите более широкие кластеры и больше кластеров из 2-3 слов. Этот метод хорошо подходит для информационных сайтов. Для интернет-магазинов ключевые слова могут попадать в неверные группы при кластеризации по Wordstat
2. Делайте комбинированную кластеризацию:
— Изначально вручную подбирайте маркеры, которые будут основой вашей структуры и которые легко найти: с помощью логических гипотез и, посмотрев частотные ключевые слова в Вордстате на 1-3 страницах
— Используйте стоп-слова (например, города, по которым вы не продвигаетесь, мусорные слова типа «скачать», «бесплатно», «без смс», при сборе ключевых слов или при создании задачи по кластеризации). Вам в помощь наш новый функционал стоп-слов!
Это поможет поднять процент кластеризованных слов до 45-65%
Подробно о том, как подбирать маркерные ключевые слова и собирать семантику, рекомендуем посмотреть в нашем полном руководстве по подбору семантического ядраКак работает функционал стоп-слов в кластеризации?
Перед кластеризацией из списка будут исключены все фразы, содержащие стоп-слова. Т.е. мусорные ключевые слова не будут использоваться в кластеризации и будут отброшены еще до начала сравнения запросов.
Рекомендуем использовать данную опцию, если вы загружаете «грязный» список ключевых слов в задачу по кластеризации. Функционал помогает сэкономить бюджет на кластеризацию и решает проблему ручной, утомительной очистки стоп-слов в Excel. Предлагаем воспользоваться готовыми списками стоп-слов по гео-запросам и различным тематикам или создать свой список стоп-слов.
Пошаговый алгоритм работы с сервисом:
- Создание задачи. Чтобы создать задачу и кластеризовать ваши ключевые слова, необходимо перейти в инструмент Кластеризация и нажать «Создать новую задачу»
- Шаг первый: Поисковая система и регион.
Здесь необходимо ввести название задачи (обязательное поле). Можно ввести любое название, часто бывает удобно вводить название сайта, чтобы в будущем легко найти нужную задачу.
Далее мы указываем поисковую систему, по данным которой будет выполняться группировка. Можно выбрать или Яндекс или Google.
Для Google на данный момент доступны все регионы и языки мира.
- Шаг второй: Настройки сбора
Все о наших алгоритмах кластеризации
Метод кластеризации:
- Soft-кластеризация: в этом методе кластеризации алгоритм определяет центральные (маркерные) запросы и сравнивает с ними все остальные запросы. Алгоритм отлично подходит для кластеризации ключевых слов для трафиковых проектов: интернет-магазины, информационные сайты, сайты услуг с не сильной конкуренцией.
- Hard-кластеризация: запросы объединяются в группу, только если есть общий для всех запросов набор URL. При этом типе кластеризации группируется меньше ключевых слов, но с очень большой точностью. Идеально подходит для конкурентных высокочастотных запросов.
Тип — выбор алгоритма кластеризации.
У нас есть 3 алгоритма кластеризации:
- Кластеризация с ручными маркерами
- Кластеризация по Wordstat
- Комбинированный алгоритм кластеризации (ручные маркеры + Wordstat)
Работают они по одному и тому же базовому принципу — сравнению подобия ТОПов поисковых систем, но предназначены для решения несколько различных задач.
Алгоритм с использованием ручных маркеров:
Данный алгоритм эффективнее всего использовать, когда у вас есть готовая и довольно разветвленная семантическая структура сайта (каталога), и вы наперед знаете все маркеры и вам нужно просто понять по каким запросам вы собираетесь продвигать существующие страницы, а задачи расширения структуры сайта не стоит. В таком случае вы берете свои маркеры (названия категорий/страниц), собираете по ним подсказки Яндекса или Гугла, размечаете маркеры как 1, собранное облако как 0 и отправляете на кластеризацию. На выходе вы получите готовую семантику для своих категорий, а слова, которые не привязались к вашей структуре останутся некластеризованными.
Формат загрузки данных: ключевое слово | маркер(1/0) — скачать пример входного файла
Алгоритм кластеризации по Wordstat
Этот алгоритм скорее решает обратную алгоритму ручных маркеров задачу: вы еще не знаете структуры своего сайта и не можете выделить маркеры — вы просто собрали Wordstat, подсказки и частотность по подсказкам. Теперь вам нужно структурировать эту семантику, чтобы получить группы запросов под страницы будущего сайта или будущих категорий существующего сайта. В таком случае алгоритм кластеризации по Wordstat подойдет как нельзя лучше, работает он следующим образом.
Весь список ключевых слов сортируется по убыванию частотности, алгоритм пытается привязать все возможные слова из списка к самому частотному слову и формирует кластер, далее все повторяется итерационно для следующих по частотности ключевых слов.
Не волнуйтесь за то, что ключевые слова могут при первом проходе алгоритма привязаться к неверному кластеру — мы используем алгоритмы машинного обучения, построенные на бинарных деревьях, чтобы предотвратить это 🙂
Формат загрузки данных: ключевое слово | частотность (любая) — скачать пример входного файла
Комбинированный алгоритм (ручные маркеры + Wordstat) — сочетает подходы двух предыдущих методов.
Этот алгоритм подходит для задачи одновременного подбора ключевых слов для существующей структуры сайта и ее расширения. Работает он следующим образом: сначала мы пытаемся привязать все возможные запросы к вашим маркерным запросам и формируем готовую структуру, привязанную к вашим маркерам. Далее, все запросы, что не были привязаны к маркерам — сортируются по убыванию частотности и группируются между собой. В результате вы получаете:
а) Готовую семантику для существующих категорий сайта
б) Расширение семантики для вашего сайта.
Мы настоятельно рекомендуем использовать комбинированный алгоритм — он дает наилучший результат.
Формат загрузки данных: ключевое слово | | маркер(1/0) | частотность — скачать пример входного файла
Все, что нужно знать про точность кластеризации
Точность – чем больше точность кластеризации (группировки), тем более похожие фразы попадут в одну группу (кластер).
Другими словами — данная опция отвечает за то, сколько общих URL нужно в ТОП10 поисковой системы, чтобы ключевые слова попали в один кластер.
В каждой тематике есть свой, необходимый и достаточный порог схожести выдачи, чтобы получить качественное семантическое ядро. Например при продвижении интернет-магазинов, будет большой проблемой, если при кластеризации запросов ключевые слова «мультиварка Redmond RX500» и «Мультиварка Redmond RX500-1» будут попадать в один кластер — т.к. это разные товары и они должны продвигаться на разные карточки товара. Здесь мы рекомендуем использовать точность = 5
Для инфо-тематик, например, для сайтов скидок или рецептов, такая точность не нужна — здесь задача получить максимальное количество сгруппированных кластеров для написания статей. Для таких сайтов мы рекомендуем точность 3 или 4. А для сайтов в очень конкурентных тематиках, где борьба за ТОП идет в основном по конкурентным ВЧ запросам — мы рекомендуем использовать повышенную точность кластеризации — 6 или 7, а под некластеризованные запросы создавать отдельные страницы.
Рекомендуется выбирать варианты 3-6 и по результатам смотреть, какая кластеризация запросов будет обладать достаточной полнотой и точностью для вашей семантики. Чем больше значение точности, тем более мелкие будут группы.
Другие настройки кластеризации
Определение релевантных URL для кластеров существующего сайта
Вам достаточно ввести название нужного домена и наши алгоритмы попытаются определить релевантные URL для полученных кластеров.
Опция работает следующим образом: если по главному (маркерному) запросу ваш сайт уже в ТОП10 — мы покажем этот URL и выделим его зеленым цветом. Иначе — подберем URL для маркерного запроса с помощью оператора site:.
ВАЖНО: Релевантные URL подбираются для маркерных (главных) запросов кластера и присваиваются всему кластеру (всем ключевым словам кластера).
- Шаг третий: «Ключевые слова и цена».
Загружаем файл с запросами.
Поддерживаемые форматы: xls, xlsx. Отключено форматирование. Формат ввода данных: запрос;маркер или частотность. Для кластеризации по методу Wordstat + Ручные маркеры формат данных: запрос;маркер;частотность.
- Вводим стоп-слова
Перед кластеризацией из списка будут исключены фразы, содержащие стоп-слова. Функционал помогает сэкономить бюджет на кластеризацию и решает проблему ручной очистки стоп-слов. Функционал особенно полезен, если вы кластеризуете «грязный», предварительно не очищенный список ключевых слов.
Предлагаем воспользоваться готовыми списками стоп-слов по гео-запросам и различным тематикам, или создать свой список стоп-слов. И не забываем про «Эксперт опции» — по умолчанию применяется символьное соответствие — т.е. частичное вхождение удалит все слово / словосочетание, если вам надо точное соответствие стоп-слову — выбирайте фразовое соответствие.
Нажимаем «Создать новую задачу» — все, ваша задача отправлены на кластеризацию!
Теперь можно отслеживать статус задачи во вкладке «Очередь» или же в списке задач по кластеризации.
На данный момент в Rush Analytics есть 5 статусов:
В очереди – данные еще не собираются, задача ждет своей очереди на сбор данных
Сбор данных – счетчик показывает, сколько ключевых слов обработано
Кластеринг – данные задачи уже собраны, система просчитывает все необходимые метрики, чтобы предоставить вам результат
Готов – задача готов — вы можете посмотреть результаты в веб-интерфейсе или скачать в формате XLSX
Выходной файл кластеризации — описание столбцов
Результат кластеризации в формате XLSX выглядит следующим образом:
- Запросы, выделенные серым цветом – маркерные запросы — указанные вами вручную, или определенные системой
- Название кластера – берется название маркерного запроса
- Размер кластера – количество ключевых слов в группе
- Частотность ключевых слов – та частотность, которую вы задали в шаге «Ключевые слова». В зависимости от того, какую вы взяли частотность – базовую, в кавычках или с восклицательным знаком, результаты кластеризации могут незначительно отличаться
- Общая частотность кластера – сумма частотностей всех ключевых слов кластера
- Совпадений ТОПа– количество общих URL в поисковой выдаче по данному запросу с выдачей по эталонному (маркерному) запросу. При выборе Hard-кластеризации эта колонка показывает минимальное количество общих URL в кластере. Она не отображает, сколько общих URL между первым и другими ключевыми словами, как это в Soft-кластеризации.
- Подсветки – подсветки из выдачи поисковых систем, собранные по вашему ключевому слову
- Подсветки для кластера — подсветки без дубликатов, по всем словам данного кластера
- Top URL — самый видимый в выдаче URL конкурента по всем запросам кластера. Здесь мы оцениваем частоту встречаемости URL конкурентов в выдаче по каждому запросу и позицию каждого URL конкурентов в выдаче
- Релевантный URL — найденный релевантный URL для кластера, если была выбрана опция «Определять релевантные URL
Опция работает следующим образом: если по главному (маркерному) запросу ваш сайт уже в ТОП10 — мы покажем этот URL и выделим его зеленым цветом. Иначе — подберем URL для маркерного запроса с помощью оператора site:
Примеры готовых файлов после кластеризации можно посмотреть в нашем портфолио
Далее можно объединять логически связанные группы для построения структуры сайта или раздела.
Рекомендуем ознакомиться с нашим полным руководством по подбору семантического ядра.