Our website collects cookies and IP address, for the convenience of your work. If you do not want this data to be processed, then you must leave the site.
Согласен
Главная / Блог / Что такое заспамленность текста и как этого избежать?

Что такое заспамленность текста и как этого избежать?

Поделиться

Всем привет! Мы продолжаем цикл статей о создании качественного контента и его оптимизации. В этой статье речь пойдет о спаме. Что такое спам, какие виды поискового спама бывают, что такое заспамленность и тошнота текста, как нужно оптимизировать тексты, чтобы избежать фильтров поисковых систем и занять место в ТОПе, какими SEO инструментами пользоваться? Обо всем этом мы поговорим в сегодняшней статье.

Что такое спам?

Термин "спам" появился в интернете в начале 90-х и ассоциировался в основном с массовыми email-рассылками, которые распространяли ненужную людям информацию рекламного или другого характера. Но мало кто знает, что само слово “SPAM” расшифровывается как Spiced Ham (острая ветчина) и Shoulders of pork and ham (свиные лопатки и окорока). Впервые слово использовалось в 1936 году в качестве товарного знака для острых мясных консерв американской компании Hormel Foods. После Первой мировой войны, чтобы избавиться от остатков товара в избыточном количестве, компания запустила большую рекламную кампанию - на автомобилях и фасадах домов, на самолетах и ​​кораблях, на автобусах и трамваях, на витринах, в газетах и ​​по радио, везде, где только можно было, бросалось в глаза слово "SPAM". В дальнейшем, оно стало употребляться по отношению к любой ненужной и часто повторяющейся, бесполезной, навязчивой информации, а людей которые распространяли спам называли - спамерами.

Что такое спам?

Поисковый и контентный спам

  • Поисковый спам (спамдексинг) - разновидность веб-спама, применяется с целью обмануть поисковую систему и искусственно поднять веб-страницу в ТОП выдач, манипулировать результатами поиска. Проявляется через искусственное повышение частоты вхождений ключевого слова в тексте, в метатегах (title, h1, description), анкорах, атрибутах изображений. К поисковому спаму также относятся: свопинг, дорвеи, кликджекинг, клоакинг, дублированный, замаскированный контент и другие методы Black Hat SEO.
  • Контентный спам -  это малополезный, не релевантный и не уникальный, автоматически сгенерированный или перенасыщенный рекламой, не оптимизированный контент. Проявляется через высокую тошноту и заспамленность, а также "водность" текста, переспам по ключевым словам, не качественный рерайт.

Как поисковые системы реагируют на спам в текстах?

С появлением первых поисковых систем не было четко определенных алгоритмов семантического анализа, релевантность веб-страницы определялась в основном мета-тегами "keywords" и "description", что позволяло манипулировать SERP'ом (от Search Engines Result Page - результаты поисковой выдачи). Таким образом, количество не качественных сайтов, а также сайтов, которые использовали дублированный, украденный контент росло. В итоге, SERP захламлялся, а пользователь не получал точных результатов. Поисковики решили изменить эту ситуацию и ввели специальные фильтры, которые "зачищали" поисковую выдачу от спамных сайтов. Таким образом, в ТОП начали попадать только страницы, которые соответствуют поисковой оптимизации.

Какие же существуют фильтры поисковиков? Давайте остановимся на этом подробнее.

Текстовые фильтры Яндекса

  • Фильтр "Переспам" - появился, по словам некоторых оптимизаторов, еще в 2010 году и коснулся текстов сайтов. Оптимизаторы дали ему свое имя - «Ты спамный». Фильтр задевал длинные, не релевантные, "водяные" тексты-портянки, которые не имели четкой структуры, насыщенные большим количеством ключевых слов - писались не для людей, а поисковых ботов. Сайты, который попадали под фильтр резко теряли позиции (на 10-30 ступенек).
  • Фильтр "Новый" - является усовершенствованным алгоритмом «Переспама». Внимательный к сайтам с чрезмерно долгим и заспамленным Title, а также злоупотребление тегами выделения слова в тексте - <b>, <u>, <strong>, <em> и <i>, которые применяются некоторыми оптимизаторами для искусственного поднятия частоты ключевого слова на странице.
  • Фильтр "Баден-Баден" - является фактически сборной версией всех предыдущих антиспам-фильтров Яндекса. Был запущен 22 марта 2017. Его особенность - искусственный интеллект, который способен распознавать человеческую речь. Его задача - полностью и окончательно избавиться от спамных сайтов и сделать SERP более информативным и релевантным.

Текстовые фильтры Google

  • Фильтр "Панда" - по некоторым данным появился еще в 2011 году, а может и раньше. В отличие от "Пингвина", который наказывал за ссылочный спам, Панда проверяла их на дублированный и не оптимизированный контент. Сайты, которые копировали контент с других ресурсов, или публиковали бессмысленный, малоценный контент, насыщенный рекламой - подвергались жесткой фильтрации.
  • Фильтр "Колибри" - его название происходит от скорости и точности птички колибри. Запущен 26 сентября 2013. «Колибри» стал вестником глубокого семантического анализа с применением искусственного интеллекта, который постепенно внедрялся в Google. «Колибри» точно понимает логику поискового запроса пользователя, естественную человеческую речь, учитывая контекст и значение отдельных слов, с акцентом на разговорный стиль. Колибри еще называют - «понимающим алгоритмом». Таким образом, веб-разработчикам и авторам было рекомендовано оптимизировать свои сайты, используя естественное сочетание слов, например LSI ключи.

Как проверить попал ли ваш сайт под фильтр?

Проверить, были ли применены какие-то действия со стороны поисковых систем очень просто с помощью вебмастеров. В Яндекс Вебмастере перейдите в пункт Диагностика -> Безопасность и нарушения:

Проверка на текстовый фильтр в Яндекс Вебмастере

В Google Search Console - Проблемы безопасности и меры, принятые вручную -> Меры, принятые вручную:

Проверка фильтра в Google Search Console

Что такое заспамленность, водность, тошнота текста?

Заспамленность текста - это слишком частое повторение ключевого слова в тексте. Измеряется соотношением количества вхождений ключевого слова к общему числу слов в тексте. Заспамленность не должна превышать 60%. Тексты с высоким процентом заспамленности могут пессимизироваться поисковыми роботами (позиции понижаются за переспам), а при большом количестве заспамленных веб-страниц - сайт и вовсе могут забанить и он исчезнет из результатов поиска.

Заспамленность и вода в тексте

На уровень заспамленности веб-страницы также влияют такие показатели как: водность и тошнота текста.

  • Водность текста -  наличие в тексте стоп-слов, фразеологизмов, а также словесных оборотов, фраз, соединительных слов, не несущими смысловой нагрузки. От 15% до 30% - превышенное содержание воды в тексте, такой текст требует оптимизации.
  • Тошнота текста - примерно то же, что и заспамленность, являет собой насыщенность текста ключевыми словами, делится на классическую и академическую тошноту текста. По показателям тошноты можно судить о естественности, качестве текста. Высокий показатель тошноты означает, что текст писался для поисковых ботов, а не людей. Рекомендуется не поднимать классическую тошноту выше 3, академическая тошнота должна быть в пределах 3-10%.

Читайте также: Составляем список стоп-слов

Пример заспамленного текста (курсивом выделен переспам по ключевому слову):

"Мы продаем эксклюзивные коробки для сигар. Наши эксклюзивные коробки для сигар изготавливаются вручную. Если вы хотите приобрести эксклюзивную коробку для сигар, свяжитесь с нашим специалистом по продаже коробок для сигар по адресу eksklusivnie.korobki@example.com."

 

Как предотвратить спам на странице?

 

Во-первых, нужно писать уникальные и качественные тексты своими словами, пользуясь при этом рекомендациями Яндекс и Google:

 

Малополезный контент, спам, избыток рекламы - Яндекс Помощь

 

Запросный спам - Яндекс Помощь

 

Блог Яндекса для вебмастеров / Тексты оптимизировались, переоптимизировались, но не выоптимизировались

 

Руководство по поисковой оптимизации - Справка Google

 

Ошибки в содержании статьи - Справка Google

 

Что такое автоматически созданный контент? - Справка Google

 

Что такое скопированное содержание? - Справка Goolgle

 

Во-вторых, придерживаться советов, которые были описаны в нашем мануале "Как написать статью для блога?".

 

И в-третьих, пользоваться SEO-инструментами для проверки и оптимизации текста, например:

 

 

Анализ и оптимизация текста в Текстовом Анализаторе

 

Инструмент удобен тем, что он может вывести любую страницу из-под текстового фильтра, а также может сравнить текстовую оптимизацию вашей веб-страницы и страниц-конкурентов из выдачи ТОПа, а потом на базе этого сравнения выдать готовое техническое задание на оптимизацию или написание текста с нуля.

 

К примеру, возьмем веб-страницу с переспамом и отправим ее на анализ в Текстовый Анализатор по продвигаемому ключевому слову "спортивная одежда adidas":

 

Пример заспамленного текста

 

Читайте также: Как правильно делать тест рассылки по email

 

На первом шаге создания проекта указываем поисковую систему (Yandex/Google) и точный регион, а также добавляем продвигаемые на странице ключевые слова:

 

Оптимизация текста в Rush Analytics

 

На втором шаге добавляем URL страницы, которую нужно проанализировать и выбираем нужных конкурентов из ТОПа, желательно исключить сайты-агрегаторы и не прямых конкурентов:

 

Добавляем URL для анализа в Текстовом Анализаторе

 

Можно загрузить свой список URL конкурентов для сравнения и задать нужный тип фильтрации:

 

 

 

Выбираем конкурентов для текстового анализа

 

Жмем кнопку "Следующий шаг" и запускаем проект. На выходе получим файлы отчетов:

 

  • Текстовый анализ (XLSX) - это таблица для оптимизатора, содержит результаты текстового анализа;
  • ТЗ копирайтеру (DOCX) - все то же, что и в таблице, только в формате технического задания;
  • Ваш SEO-текст (TXT) - в этом файле показан основной текст на странице в который нужно вносить изменения.

 

Файлы отчета текстового анализа в Rush Analytics

 

Откроем таблицу Excel с анализом и ознакомимся с результатами, которые нам выдал инструмент:

 

Оптимизация текстов в Rush Analytics

 

Читайте также: Оптимизация под голосовой поиск

 

Как видим, система зафиксировала переспам "Баден-Баден" по ключевому слову "adidas" и сразу же порекомендовала удалить его из текста 17 раз. Далее, нам предложено в зоне H1 удалить “спортивная одежда adidas” и поставить фразу "Одежда Adidas", а в TITLE -  сделать комбинацию из 5 слов, обязательными среди которых должны стать "одежды adidas" или "одежду adidas", на выбор. Таким образом, Title может выглядеть так: "Магазин спортивной одежды adidas" или "Купить одежду adidas по низким ценам".

 

Подробнее о работе с Текстовым Анализатором читайте в специальной статье.

 

Вот и все, нам удалось очистить текст от переспама, тем самым избежав фильтра “Баден-Баден” и оптимизировать его под поисковые системы. В результате, веб-страница должна хорошо ранжироваться и занять место в ТОПе. Осталось только регулярно проверять позиции.

 

Поделиться
Еще не зарегистрированы? Еще не зарегистрированы? 2019-07-05T15:23:40+03:00 2019-12-13T16:25:43+03:00 https://www.rush-analytics.ru/sites/default/files/blog/google_1527000958.jpg
Виталий, специалист Rush Analytics
Rush Agency
Оцените статью по 5-бальной шкале
3.91 из 5 на основе 17 оценок
Интересно почитать

Как написать статью?

Виталий, специалист Rush Analytics
8 мин · 27 Май. 2019
Будь в курсе первым!