Этот рекламный блок выводится с помощью сервиса AdPlus.io

Еще один инструмент для проверки тошнотности и водности статьи


Наверно никто уже не помнит мой генератор срезов для РСЯ, я про него писал тут, может кто-то пользовался или начнет, я лично использую его для увеличения конверсии для РСЯ блоков.

А сегодня я хочу рассказать про новый инструмент, который делает практически тоже самое что http://advego.ru/text/seo/ и http://istio.com/, только удобней, по крайней мере я так думаю. Назвал я свое творение просто «SEO TEXT CHECKER«.

Что же он делает?

Он  проверяет тошнотность и водность текста, но особенность этого инструмента в том, что ему не нужно копировать текст, он делает проверку текста на существующих страницах. Может дальше и прикручу проверку по тексту, но пока так.

Как он работает?

Вставляете адрес проверяемой страницы в соответствующее поле и нажимаете «Проверить». Дальше скрипт определяет основное содержание страницы, контентные проекты особенно хорошо распознает, вырезает его, удаляет html и разбивает на слова. Дальше с помощью Yandex Mystem он начинает проверять каждое слово и приводить его к нормализованному виду.

В «основные слова» добавляются только глаголы, существительные и прилагательные.

Если слово не имеет нормализованного состояния, является числом или не является глаголом, существительным или прилагательным, то оно добавляется в список «стоп-слов». Если слово не на русском языке, то оно приводится к нормализованному виду с помощью стеммера Портера, при этом если такое слово меньше 3-х букв, то оно добавляется в список «стоп-слов».

Сравнение с другими

Если сравнивать с выше-упомянутыми инструментами, то мой скрипт работает очень схоже с ними. Кому доверять? Да никому, это всего-лишь еще один показатель, метрика, которую стоит учитывать, но не слепо верить.

В основном я смотрю на количество повторений первых пяти слов, если оно слишком высоко, то отдаю на переработку.

Планы

В планах пакетная проверка списка урлов и всего сайта. Было бы круто, если можно было вбить урл сайта, он бы его спарсил и выдал списком все страницы с показателями частотности и водности.

Еще можно провести эксперимент и определить какой процент водности и тошнотности наиболее приемлем для ПС в определенной тематике.

Буду очень рад, если кому-то покажется эта тулза удобной и он начнет ею пользоваться. Может есть какие предложения или пожелания? Пишите, адекватные предложения обязательно реализую.


27 Ноя, 2015

11 комментариев

  • tim

    27 ноября 2015

    А какие показали должны быть в идеале?

    Reply
    • Archil

      27 ноября 2015

      Идеальных показателей нет, но в среднем до 3% тошнотности и до 35% водности.

      Reply
  • ПЧ

    27 ноября 2015

    «Дальше скрипт определяет основное содержание страницы» регулярками или с помощью семантического анализа или ещё что?

    Reply
  • r0bot

    28 ноября 2015

    Классная тема. Молодец, что думаешь об улучшении контента. Выпустишь скрипт в паблик, и с удовольствием пользовался бы. А так я на измене палить лишний раз свои проекты.

    Reply
    • Archil

      28 ноября 2015

      Братан, никакого риска, не ведется никакой истории, по крайней мере пока. Тем более откуда я узнаю, что это твои сайты? Да и если сильно захотеть, то можно и так найти все твои сайты.

      Скажу как есть, через мои сервисы прошли уже сотни сайтов, у меня просто нет времени все анализировать, да и нет потребности. Так что думаю не стоит на столько заморачиваться.

      Reply
  • Kurash

    30 ноября 2015

    Спасибо, годный чекер, будем пользоваться.

    Reply
    • Archil

      30 ноября 2015

      На здоровье.

      Reply
  • Татьяна

    20 января 2016

    Здорово! Арчил, спасибо!
    Если у меня 3.55-3.9 — это уже плохо?

    Reply
    • Archil

      20 января 2016

      В принципе это нормальные показатели.

      Reply
  • Татьяна

    20 января 2016

    Это я про академическую тошноту (3.55-3.9)… Хотя вот вычитала у тебя — Академическая тошнота документа по сервису http://advego.ru/text/seo/ должна быть в пределах 8-11%, тошнотность по слову не более 3%.

    В общем, я сама, видимо, неправильно тебя поняла…

    Reply

Добавить комментарий