Главная / Блог / Что такое заспамленность текста и как этого избежать?
Поделиться

Что такое заспамленность текста и как этого избежать?

Всем привет! Мы продолжаем цикл статей о создании качественного контента и его оптимизации. В этой статье речь пойдет о спаме. Что такое спам, какие виды поискового спама бывают, что такое заспамленность и тошнота текста, как нужно оптимизировать тексты, чтобы избежать фильтров поисковых систем и занять место в ТОПе, какими SEO инструментами пользоваться? Обо всем этом мы поговорим в сегодняшней статье.

Что такое спам?

Термин "спам" появился в интернете в начале 90-х и ассоциировался в основном с массовыми email-рассылками, которые распространяли ненужную людям информацию рекламного или другого характера. Но мало кто знает, что само слово “SPAM” расшифровывается как Spiced Ham (острая ветчина) и Shoulders of pork and ham (свиные лопатки и окорока). Впервые слово использовалось в 1936 году в качестве товарного знака для острых мясных консерв американской компании Hormel Foods. После Первой мировой войны, чтобы избавиться от остатков товара в избыточном количестве, компания запустила большую рекламную кампанию - на автомобилях и фасадах домов, на самолетах и ​​кораблях, на автобусах и трамваях, на витринах, в газетах и ​​по радио, везде, где только можно было, бросалось в глаза слово "SPAM". В дальнейшем, оно стало употребляться по отношению к любой ненужной и часто повторяющейся, бесполезной, навязчивой информации, а людей которые распространяли спам называли - спамерами.

Что такое спам?

Поисковый и контентный спам

  • Поисковый спам (спамдексинг) - разновидность веб-спама, применяется с целью обмануть поисковую систему и искусственно поднять веб-страницу в ТОП выдач, манипулировать результатами поиска. Проявляется через искусственное повышение частоты вхождений ключевого слова в тексте, в метатегах (title, h1, description), анкорах, атрибутах изображений. К поисковому спаму также относятся: свопинг, дорвеи, кликджекинг, клоакинг, дублированный, замаскированный контент и другие методы Black Hat SEO.
  • Контентный спам -  это малополезный, не релевантный и не уникальный, автоматически сгенерированный или перенасыщенный рекламой, не оптимизированный контент. Проявляется через высокую тошноту и заспамленность, а также "водность" текста, переспам по ключевым словам, не качественный рерайт.

Как поисковые системы реагируют на спам в текстах?

С появлением первых поисковых систем не было четко определенных алгоритмов семантического анализа, релевантность веб-страницы определялась в основном мета-тегами "keywords" и "description", что позволяло манипулировать SERP'ом (от Search Engines Result Page - результаты поисковой выдачи). Таким образом, количество не качественных сайтов, а также сайтов, которые использовали дублированный, украденный контент росло. В итоге, SERP захламлялся, а пользователь не получал точных результатов. Поисковики решили изменить эту ситуацию и ввели специальные фильтры, которые "зачищали" поисковую выдачу от спамных сайтов. Таким образом, в ТОП начали попадать только страницы, которые соответствуют поисковой оптимизации.

Какие же существуют фильтры поисковиков? Давайте остановимся на этом подробнее.

Текстовые фильтры Яндекса

  • Фильтр "Переспам" - появился, по словам некоторых оптимизаторов, еще в 2010 году и коснулся текстов сайтов. Оптимизаторы дали ему свое имя - «Ты спамный». Фильтр задевал длинные, не релевантные, "водяные" тексты-портянки, которые не имели четкой структуры, насыщенные большим количеством ключевых слов - писались не для людей, а поисковых ботов. Сайты, который попадали под фильтр резко теряли позиции (на 10-30 ступенек).
  • Фильтр "Новый" - является усовершенствованным алгоритмом «Переспама». Внимательный к сайтам с чрезмерно долгим и заспамленным Title, а также злоупотребление тегами выделения слова в тексте - <b>, <u>, <strong>, <em> и <i>, которые применяются некоторыми оптимизаторами для искусственного поднятия частоты ключевого слова на странице.
  • Фильтр "Баден-Баден" - является фактически сборной версией всех предыдущих антиспам-фильтров Яндекса. Был запущен 22 марта 2017. Его особенность - искусственный интеллект, который способен распознавать человеческую речь. Его задача - полностью и окончательно избавиться от спамных сайтов и сделать SERP более информативным и релевантным.

Текстовые фильтры Google

  • Фильтр "Панда" - по некоторым данным появился еще в 2011 году, а может и раньше. В отличие от "Пингвина", который наказывал за ссылочный спам, Панда проверяла их на дублированный и не оптимизированный контент. Сайты, которые копировали контент с других ресурсов, или публиковали бессмысленный, малоценный контент, насыщенный рекламой - подвергались жесткой фильтрации.
  • Фильтр "Колибри" - его название происходит от скорости и точности птички колибри. Запущен 26 сентября 2013. «Колибри» стал вестником глубокого семантического анализа с применением искусственного интеллекта, который постепенно внедрялся в Google. «Колибри» точно понимает логику поискового запроса пользователя, естественную человеческую речь, учитывая контекст и значение отдельных слов, с акцентом на разговорный стиль. Колибри еще называют - «понимающим алгоритмом». Таким образом, веб-разработчикам и авторам было рекомендовано оптимизировать свои сайты, используя естественное сочетание слов, например LSI ключи.

Как проверить попал ли ваш сайт под фильтр?

Проверить, были ли применены какие-то действия со стороны поисковых систем очень просто с помощью вебмастеров. В Яндекс Вебмастере перейдите в пункт Диагностика -> Безопасность и нарушения:

Проверка на текстовый фильтр в Яндекс Вебмастере

В Google Search Console - Проблемы безопасности и меры, принятые вручную -> Меры, принятые вручную:

Проверка фильтра в Google Search Console

Что такое заспамленность, водность, тошнота текста?

Заспамленность текста - это слишком частое повторение ключевого слова в тексте. Измеряется соотношением количества вхождений ключевого слова к общему числу слов в тексте. Заспамленность не должна превышать 60%. Тексты с высоким процентом заспамленности могут пессимизироваться поисковыми роботами (позиции понижаются за переспам), а при большом количестве заспамленных веб-страниц - сайт и вовсе могут забанить и он исчезнет из результатов поиска.

Заспамленность и вода в тексте

На уровень заспамленности веб-страницы также влияют такие показатели как: водность и тошнота текста.

  • Водность текста -  наличие в тексте стоп-слов, фразеологизмов, а также словесных оборотов, фраз, соединительных слов, не несущими смысловой нагрузки. От 15% до 30% - превышенное содержание воды в тексте, такой текст требует оптимизации.
  • Тошнота текста - примерно то же, что и заспамленность, являет собой насыщенность текста ключевыми словами, делится на классическую и академическую тошноту текста. По показателям тошноты можно судить о естественности, качестве текста. Высокий показатель тошноты означает, что текст писался для поисковых ботов, а не людей. Рекомендуется не поднимать классическую тошноту выше 3, академическая тошнота должна быть в пределах 3-10%.

Читайте также: Составляем список стоп-слов

Пример заспамленного текста (курсивом выделен переспам по ключевому слову):

"Мы продаем эксклюзивные коробки для сигар. Наши эксклюзивные коробки для сигар изготавливаются вручную. Если вы хотите приобрести эксклюзивную коробку для сигар, свяжитесь с нашим специалистом по продаже коробок для сигар по адресу eksklusivnie.korobki@example.com."

Как предотвратить спам на странице?

Во-первых, нужно писать уникальные и качественные тексты своими словами, пользуясь при этом рекомендациями Яндекс и Google:

Малополезный контент, спам, избыток рекламы - Яндекс Помощь

Запросный спам - Яндекс Помощь

Блог Яндекса для вебмастеров / Тексты оптимизировались, переоптимизировались, но не выоптимизировались

Руководство по поисковой оптимизации - Справка Google

Ошибки в содержании статьи - Справка Google

Что такое автоматически созданный контент? - Справка Google

Что такое скопированное содержание? - Справка Goolgle

Во-вторых, придерживаться советов, которые были описаны в нашем мануале "Как написать статью для блога?".

И в-третьих, пользоваться SEO-инструментами для проверки и оптимизации текста, например:

Анализ и оптимизация текста в Текстовом Анализаторе

Инструмент удобен тем, что он может вывести любую страницу из-под текстового фильтра, а также может сравнить текстовую оптимизацию вашей веб-страницы и страниц-конкурентов из выдачи ТОПа, а потом на базе этого сравнения выдать готовое техническое задание на оптимизацию или написание текста с нуля.

К примеру, возьмем веб-страницу с переспамом и отправим ее на анализ в Текстовый Анализатор по продвигаемому ключевому слову "спортивная одежда adidas":

Пример заспамленного текста

Читайте также: Как правильно делать тест рассылки по email

На первом шаге создания проекта указываем поисковую систему (Yandex/Google) и точный регион, а также добавляем продвигаемые на странице ключевые слова:

Оптимизация текста в Rush Analytics

На втором шаге добавляем URL страницы, которую нужно проанализировать и выбираем нужных конкурентов из ТОПа, желательно исключить сайты-агрегаторы и не прямых конкурентов:

Добавляем URL для анализа в Текстовом Анализаторе

Можно загрузить свой список URL конкурентов для сравнения и задать нужный тип фильтрации:

 

Выбираем конкурентов для текстового анализа

Жмем кнопку "Следующий шаг" и запускаем проект. На выходе получим файлы отчетов:

  • Текстовый анализ (XLSX) - это таблица для оптимизатора, содержит результаты текстового анализа;
  • ТЗ копирайтеру (DOCX) - все то же, что и в таблице, только в формате технического задания;
  • Ваш SEO-текст (TXT) - в этом файле показан основной текст на странице в который нужно вносить изменения.

Файлы отчета текстового анализа в Rush Analytics

Откроем таблицу Excel с анализом и ознакомимся с результатами, которые нам выдал инструмент:

Оптимизация текстов в Rush Analytics

Читайте также: Оптимизация под голосовой поиск

Как видим, система зафиксировала переспам "Баден-Баден" по ключевому слову "adidas" и сразу же порекомендовала удалить его из текста 17 раз. Далее, нам предложено в зоне H1 удалить “спортивная одежда adidas” и поставить фразу "Одежда Adidas", а в TITLE -  сделать комбинацию из 5 слов, обязательными среди которых должны стать "одежды adidas" или "одежду adidas", на выбор. Таким образом, Title может выглядеть так: "Магазин спортивной одежды adidas" или "Купить одежду adidas по низким ценам".

Подробнее о работе с Текстовым Анализатором читайте в специальной статье.

Вот и все, нам удалось очистить текст от переспама, тем самым избежав фильтра “Баден-Баден” и оптимизировать его под поисковые системы. В результате, веб-страница должна хорошо ранжироваться и занять место в ТОПе. Осталось только регулярно проверять позиции.

Поделиться

Интересно почитать

Как написать статью?

Мы научимся пошагово создавать качественные статьи: выбор темы, построение структуры, заголовок, вступление, тело статьи, заключение, призыв к действию.
Виталий, специалист Rush Analytics · 8 мин
27 Май. 2019
Будь в курсе первым!