Главная / Блог / Полный гайд по семантическому ядру: от сбора ключевых слов до кластеризации
Поделиться

Полный гайд по семантическому ядру: от сбора ключевых слов до кластеризации

Что такое семантическое ядро и как оно влияет на SEO?

Семантическое ядро (СЯ) - это набор ключевых запросов (слов и словосочетаний), по которым необходимо обеспечить видимость сайта в выдаче поисковых систем.

Очень важно, чтобы семантическое ядро состояло из релевантной семантики, которая пользуется спросом в интернете и отвечает на поисковые запросы целевой аудитории (ЦА).

Тщательная работа по созданию семантического ядра - основа успешного SEO, так как поисковые системы все чаще ориентированы на контент. В 2011 году компания Google стала активно двигаться в сторону искусственного интеллекта (ИИ), были разработаны уникальные алгоритмы семантического анализа: 

“Чтобы подобрать страницы, содержащие релевантные сведения, прежде всего необходимо проанализировать значение слов в запросе. Мы разрабатываем языковые модели, позволяющие определять, какие сочетания слов следует искать в индексе. Для этого выполняется ряд действий – от интерпретации орфографических ошибок, до определения типа введенного запроса на основе результатов последних исследований в области понимания естественного языка…

...Затем мы подбираем страницы, содержащие информацию, которая соответствует запросу. Обычно, когда пользователь вводит запрос, наши алгоритмы ищут в индексе подходящие страницы, а также определяют, как часто ключевые слова встречаются на странице и в каких ее разделах (например, в заголовке или основном тексте).

Наши алгоритмы не только сопоставляют ключевые слова, но и определяют, насколько полная информация содержится в предполагаемых результатах поиска. Например, пользователя, указавшего запрос «собаки», вряд ли интересует страница, в которой сотни раз повторяется это слово. Мы стараемся убедиться в том, что та или иная страница содержит сведения по запросу, а не просто дублирует его. Так, алгоритмы Поиска определят, представлен ли на страницах нужный контент, например изображения собак, видео с их участием или список пород. Наконец, пользователю в первую очередь будут показаны страницы на том же языке, на котором введен запрос.

Мы разрабатываем алгоритмы, позволяющие оценивать релевантность страниц, чтобы наиболее подходящие из них показывались первыми.Чтобы предоставлять наиболее актуальную информацию, эти алгоритмы оценивают сотни самых разных факторов – от новизны контента и количества повторов запроса до удобства просмотра страницы.”  (Источник)

Как видим, поисковики не просто индексируют содержимое, а погружаются в реальный смысл слов, поэтому семантическое ядро играет важнейшую роль для SEO, оно позволяет:

  • создать релевантный веб-сайт с учетом популярных запросов пользователей и семантических алгоритмов поисковых систем;
  • обновить структуру уже существующего веб-сайта и определить стратегию его продвижения;
  • равномерно распределить контент по всем страницам сайта (текстовая оптимизация), тем самым увеличив их конверсию;
  • повысить позиции сайта в поисковых системах (видимость) и увеличить трафик (количество посетителей);
  • подготовить группы объявлений для запуска рекламных кампаний;

Как собрать семантическое ядро?

Процесс построения семантического ядра состоит из нескольких этапов:

  1. Подбор маркерных запросов;
  2. Парсинг ключевых слов для сем-ядра по маркерным запросам;
  3. Сбор частотности собранных ключевых слов;
  4. Кластеризация ключевых слов; 

1. Подбор маркерных запросов

Маркерные запросы - это наиболее популярные ключевые слова из вашей тематики, которые полностью характеризуют ваш сайт/продукт/вид деятельности, это своего рода “контрольные точки” - по ним будете создавать и наращивать "каркас" семантического ядра, поэтому нужно тщательно их подбирать. От маркерных запросов зависит полнота семантики, насколько точным и полным будет ваше СЯ.

Есть несколько способов, как подобрать маркерные запросы:

  • Мозговой штурм - соберите все идеи и ассоциации, связанные с тематикой вашего сайта - тематические и околотематические;
  • Анализ конкурентов -  посмотрите выдачу ТОПа по вашей тематике и соберите ключевые слова из Title в сниппетах сайтов-конкурентов - зачастую они содержат самые популярные поисковые запросы, которые можно использовать в качестве маркеров;
  • Названия разделов и категорий сайта - если у вас уже существует сайт, в качестве маркеров можно использовать названия разделов, рубрик, категорий сайта;
  • Яндекс Метрика/Google Search Сonsole - также являются важными источниками ключевых слов. Если есть сайт, в качестве маркерных запросов можете взять наиболее популярные ключевые слова с большим количеством переходов из поисковых систем;

2. Парсинг ключевых слов для семантического ядра

По тщательно отобранным маркерным запросам, мы можем начинать парсить семантику для составления семантического ядра  - рекомендуется собрать как можно больше ключевых слов, фраз и словосочетаний из разных источников, чтобы хорошо охватить тематику. 

Для этого используем инструменты:

  • Сбор Wordstat - собираем ключевые слова из левой и правой колонок базы Яндекс Wordstat по заданным маркерным запросам. Один из лучших источников семантики. Подойдет также для сбора ключевых слов для PPC (Яндекс Директ, Google Ads);
  • Сбор AdWords - собираем ключевые слова из базы Google AdWords по заданным маркерным запросам;
  • Сбор подсказок - собираем LSI-ключевые слова из поисковой выдачи Google/Яндекс. В плане SEO, подсказки очень полезны, так как содержат много синонимов, связанных ключевых слов, включая блоки "Вместе с этим искали" в Google. LSI-подсказки имеют ряд преимуществ: расширяют семантику, разбавляют их, снижая спамность, повышают релевантность текста, позволяют занять позиции в ТОПе. 

Внимание: Перед парсингом, не забывайте про СТОП-СЛОВА - они позволяют сэкономить бюджет и предотвратить попадания в семантику "мусорных", нетематических поисковых запросов. В сервисе Rush Analytics предусмотрен специальный функционал "Стоп-слова", который позволяет добавить как свои, так и уже готовые, разбитые по тематикам, списки стоп-слов, а также фильтрацию по городам  - добавляете свой целевой город, ключевые слова с упоминанием других городов будут автоматически удалены. Подробнее о чистке семантического ядра в отдельной статье "Чистим семантическое ядро от мусора в 2 клика".

После того, как ключевые слова собраны из всех источников - объединяем их в один список в Excel-файл.

3. Сбор частотности ключевых слов

Теперь вам нужно получить статистику для своих ключевых слов - количество показов в поисковой системе. 

  • Если продвижение под Яндекс - переходим в Сбор Wordstat, выбираем опцию “Сбор частотности”, затем выбираем нужный вид частотности Wordstat (общая, “точная”, “!абсолютная”) и импортируем файл со списком ключевых слов, запускаем проект;
  • Если продвижение под Google - переходим в Сбор AdWords и аналогично выбираем опцию сбор частотности, видов частотности здесь нет, AdWords показывает среднюю частотность ключевого слова за 12 месяцев, импортируем файл и запускаем проект;

На выходе получаем таблицу с данными:

Это окончательный список ваших ключевых слов. Теперь нужно получить структуру из этого списка запросов, для этого отправляем их на кластеризацию. 

4. Кластеризация

Кластеризация  (кластерный анализ) - это процедура, которая выполняет обработку запросов, анализирует их и упорядочивает в группы, называемые кластерами. В один кластер попадают только совместимые и похожие по смыслу ключевые слова. 

Кластеризация в Rush Analytics работает по принципу подобия ТОП-ов - анализируется ТОП10 выдача по каждому ключевому слову, затем проверяется наличие общих страниц (URL) в выдаче. Если у запросов набирается минимум 3 общих URL в ТОП10 (точность кластеризации) - они попадают в группу, и значит их можно продвигать вместе на одной странице.

Таким образом все ключевые слова разбиваются по отдельным группам, то есть кластерам, где каждая группа - отдельная страница на сайте. Примечание: коммерческие и информационные запросы всегда попадают в разные группы. Ключевые слова, которые не смогли сгруппироваться, то есть у них не было найдено общих URL в ТОП10 - попадают в папку “Некластеризовано”. Их нужно либо продвигать на отдельных страницах, либо они не смогли сгруппироваться из-за недостаточной полноты семантики - соберите по ним отдельно все связанные ключевые запросы-хвосты и затем кластеризуйте.

У кластеризации по принципу подобия ТОП-ов существует 2 основных метода:

  • SOFT - этот метод ставит перед собой задачу сгруппировать как можно больше ключевых слов в один кластер. В итоге, на выходе получаем мало групп, но большего размера. Такой метод подходит под определенные задачи. Например, у вас инфо-портал или форум, вы готовите статью и нужно собрать как можно больше запросов для получения трафика. У данного метода слабая точность, поэтому в одну группу могут попасть и слабо совместимые ключевые слова; 
  • HARD - данный метод ставит перед собой задачу сгруппировать только 100% совместимые запросы. На выходе получаем больше групп, но меньшего размера. Этот метод подходит для большинства сайтов и тематик, так как гарантирует высокую точность группировки и подходит для дальнейшего текстового анализа.

Также существует еще один метод - "Ручные маркеры". Он подходит для опытных специалистов, и в том случае, когда у вас уже есть структура и вы хотите ее расширить. Принцип прост: нужно подготовить загрузочный Excel-файл с колонками "Ключевое слово | значение". В колонке значение указывается 0 или 1. 1 - значит это маркерный запрос, к нему будут привязываться другие, 0 - не маркер. На выходе вы получите готовую семантику для своих маркеров, а слова, которые не привязались к вашей структуре, останутся некластеризованными. Подробнее о алгоритмах кластеризации>>

На выходе кластеризации получаем удобный файл со сгруппированной и отсортированной по частотности статистикой:

Распределение семантического ядра: внешняя оптимизация сайта

Теперь кластеры нужно проанализировать и распределить по посадочным (целевым) страницам вашего сайта. Если есть похожие по смыслу кластеры - не нужно создавать под них отдельные страницы и тем самым плодить дублированный контент. Отбираем из них самый частотный кластер и его используем. Не пытайтесь также распределить на одной странице сразу несколько кластеров - это не приведет к успеху, придерживайтесь структуры и правила: каждый кластер = отдельному URL на сайте.    

Когда вы уже определились с URL-страниц для своих кластеров, нужно подготовить техническое задание, чтобы распределить ключевые слова с точки зрения SEO-оптимизации. Переходим в инструмент Текстовый Анализатор (ТА) и создаем в нем под каждый кластер отдельный проект. Добавляем ключевые слова и запускаем проект. Текстовый Анализатор проанализирует тексты сайтов-конкурентов из выдачи ТОПа и сгенерирует ТЗ, которые дальше вы можете отправить копирайтеру. 

Отдельно про функционал Текстовый Анализатор мы рассказывали в предыдущих материалах:

  1. Базовое руководство по Текстовому Анализатору
  2. Статья "Работаем с Текстовым Анализатором"
  3. Видеоруководство по Текстовому Анализатору
  4. Вебинар по Текстовому Анализатору

Проверка позиций сайта по семантическому ядру

После того как вы удачно распределили семантическое ядро по посадочным страницам, рекомендую регулярно мониторить позиции сайта по нему. Создаем проект в Проверке позиций и с помощью загрузочного Excel-файла в формате “Запрос | URL | Группа” импортируем ядро. Таким образом, вся структура вашего сайта будет добавлена в проект и вы сможете наблюдать за динамикой сайта в поисковых системах - в мобильной и десктопной выдаче! Подробнее о проверке позиций>>

Классификация семантики 

При сборе семантического ядра, важно учитывать какой тип семантики отвечает вашему сайту. Всю семантику можно поделить на:

  • коммерческая / информационная;
  • геозависимая / геонезависимая;
  • сезонная / несезонная;
  • высококонкурентная / среднеконкурентная / низкоконкурентная;

Коммерческая семантика - это так-называемая "продающая" семантика с целью конвертировать посетителя сайта в потенциального покупателя / клиента. Зачастую в нее входят такие слова как: купить, цена, заказать, продать, обмен и так далее. Их еще называют транзакционными запросами.  

Информационная семантика - это семантика, у которой нет коммерческой цели, основной целью является рассказать о чем-то / ком-то, например о продукте, товаре или персоне и т.д. Это может быть статья, справочная информация, просто текст - но информационного характера.

Геозависимая семантика - это семантика, которая имеет четкую привязку к конкретному населенному пункту. Например, "стоматологический кабинет “Арника” в Москве". И преимущественно - это коммерческая семантика. Такая семантика нацелена на поисковую выдачу по конкретному городу, а значит при сборе семантического ядра необходимо максимально учитывать ключевые слова именно по этому региону - все остальные населенные пункты игнорировать. 

Геонезависимая семантика  - это преимущественно информационная тематика, без привязки к конкретному населенному пункту. Например, новостные сайты, информационные порталы, статейники, аналитические ресурсы и так далее. То есть, это та семантика, которая не привязана к региону. 

Сезонная семантика - та, которая пользуется популярностью в конкретное время года, преимущественно коммерческая тематика. Например, интернет-магазин по продаже меховых изделий или наоборот - летней обуви, сандалей и т.д.  Количество заказчиков зимой резко возрастает, а летом - падает. Это называется сезонность. 

Несезонная семантика - та, которая пользуется спросом независимо от времени года. Большинство инфо-тематик.

Высококонкурентная семантика - очень популярная семантика с широкой аудиторией, а также авторитетными конкурентами в поисковой выдаче. Если у вас высококонкурентная тематика, очень важно отдельно собрать семантику сайтов-конкурентов. Выбиться в ТОП по такой тематике сразу - почти невозможно, продвижение забирает от 3-х и более месяцев. Сбор семантики требует значительного бюджета, так как может насчитывать от 20 до 100 тыс. ключевых слов, с частотностью примерно от 800 показов / месяц.

Среднеконкурентная семантика - популярная семантика, но в меньших масштабах. Семантическое ядро ​​может насчитывать от 5 до 20 тыс. ключевых слов с частоткой от ~ 300 показов / месяц. По ней выбиться в ТОП немного легче, но все равно нужно детально прорабатывать семантику.

Низкоконкурентная семантика - узконишевая тематика, которая пользуется малым спросом. Например, сайты посвященные каким-то отдельным интересам, например "готическая субкультура" или "история древней руси", и так далее. В низкоконкурентных тематиках легко выйти в ТОП, так как мало конкурентных сайтов в поисковой выдаче. Часто, именно низкоконкурентные тематики берут на вооружение SEO-специалисты при разработке нового сайта, и потом постепенно ее выводят на нужное им количество показов с помощью соцсетей, ссылок и др. методов.

Ваша задача заключается в том, чтобы точно определить какой вид семантики отвечает вашему сайту и по ней собрать семантическое ядро. 

Ядра смешанных типов семантики создавать не рекомендуется - запросы могут не правильно сгруппироваться и вы получите, грубо говоря, кривую структуру.  Если же у вас сайт, на котором планирует несколько типов семантики - рекомендую разместить их на разных разделах и собрать отдельное семантическое ядро под каждый. 

Как собрать мультирегиональное семантическое ядро?

Создание семантического ядра под несколько регионов содержит определенные нюансы и есть несколько методов как это реализовать. Приведу наиболее популярные:

Метод поддоменов и подпапок

Если ваша компания имеет представительства, к примеру, в трех городах, а поисковая выдача по каждому городу сильно отличается - рекомендую создать поддомены (или подпапки) и под каждый из них собрать семантическое ядро отдельно:

https://moskava.mywebsite.com/ - поддомены
https://spb.mywebsite.com/
https://ufa.mywebsite.com/

https://mywebsite.com/moskva/ - подпапки
https://mywebsite.com/spb/
https://mywebsite.com/ufa/

Метод создания поддоменов под каждый регион является дорогостоящим, так как для каждого поддомена нужен отдельный контент, но это один из самых эффективных методов в продвижении мультирегионального сайта. Каждый поддомен вы сможете напрямую присвоить отдельному региону в Панели Вебмастера. Яндекс хорошо ранжирует поддомены и рекомендует использовать этот способ. Плюс рекомендую прочитать блог Яндекса - "Региональность: вопросы и ответы".  

В качестве альтернативного решения, можно создавать не поддомены, а подпапки - внутренние разделы сайта. Их можно быстро создать, но во-первых, они тоже требуют отдельного контента, а во-вторых, их не получится так легко присвоить отдельному региону, как в случае с поддоменами. Придется подождать, пока поисковик проанализирует структуру и начнет доверять сайту.

Метод топонимов

Если у вас много регионов продвижения и при этом ограниченный бюджет, а сама поисковая выдача не сильно отличается - можете использовать метод топонимов. Достаточно собрать всю семантику по центральному региону, например Москва, а потом для каждого ключевого слова подставить в конце нужный топоним:

"разработка сайтов" + "топоним"

разработка сайтов в питере
разработка сайтов в москве
разработка сайтов в уфе

Выводы

Создание семантического ядра - один из важнейших этапов разработки и оптимизации веб-сайта. Без него, сайт - тоже самое, что и машина без колес. Сайт без семантического ядра обречен на провал, так как не учитывает реальные запросы пользователей в поисковой выдаче и игнорирует алгоритмы ранжирования поисковиков. 

В процессе составления семантического ядра очень важно:

  • а) подобрать правильно маркерные запросы, т.к. от них будет зависеть структура и охват ядра;
  • б) парсить семантику с применением стоп-слов - если нецелевые запросы-пустышки попадут в сем-ядро, это приведет к отсутствию трафика;
  • в) грамотно распределить ключевые слова по страницам сайта - придерживаться полученной в кластеризации структуры, не размещать на одной странице несколько кластеров, не размещать коммерческие и инфомационные кл.слова вместе. 

Используйте полученные из семантического ядра слова для разработки полезного и релевантного контента. 

Удачи!

Поделиться

Интересно почитать

Анатомия поисковой выдачи Google

Хотите доминировать в результатах поиска Google? Тогда ваша стратегия должна включать нечто больше, чем просто анализ ключевых слов и «подкованную» кампанию AdWords. Чтобы максимально использовать присутствие в Google, нужно поработать с результатами поисковой выдачи – Google SERP и..
Виталий Крашенинин - специалист отдела клиентской поддержки Rush Analytics · 10 мин
14 Дек. 2017
Будь в курсе первым!