Рекомендации по чистке ядра

Семантическое ядро необходимо начать чистить еще на этапах его формирования.
Так как бывают запросы с большим количеством мусора.

К примеру, мы составляем ядро по женской одежде «парки пальто» - сюда могут попасть: парки Горького, победы и т.д., что для нас будет не нужным.



В нашем сервисе сейчас реализовано 2 функционала по очистке семантики от не нужных ключей.

  1. Стоп-слова есть в функционале сбора поисковых подсказок. Например, если вас не интересуют запросы со словом "бесплатно" - добавьте это слово в список стоп-слов и встретив это слово на любом уровне сбора подсказок - мы удалим его и не будем в дальнейшем перебирать фразы с этим словом - это существенно сбережет ваш бюджет.
  2. В функционале кластеризации так же есть стоп-слова.

    Для чего это нужно? Представьте, что вы собрали 5000 ключевых слов из Wordstat и хотите их сгруппировать, а вручную чистить мусорные слова типа "бесплатно", "скачать", "майнкрафт" не хочется. В таком случае - просто добавьте их в список стоп-слов и еще до кластеризации запросов - мы их удалим и будем кластеризовать только эффективные и нужные запросы.

После кластеризации, если вы пропустили предыдущие шаги и мусор уже попал в вашу семантику. Рекомендуем поступать следующим образом.
Вручную, просто, удаляем все не нужные кластера. Мусорные слова будут группироваться в отдельные кластера. Они не перемешиваться с нужными вам, так как имеют разные URL, а это главное при формировании групп.