Еще один инструмент для проверки тошнотности и водности статьи
Наверно никто уже не помнит мой генератор срезов для РСЯ, я про него писал тут, может кто-то пользовался или начнет, я лично использую его для увеличения конверсии для РСЯ блоков.
А сегодня я хочу рассказать про новый инструмент, который делает практически тоже самое что http://advego.ru/text/seo/ и http://istio.com/, только удобней, по крайней мере я так думаю. Назвал я свое творение просто «SEO TEXT CHECKER«.
Что же он делает?
Он проверяет тошнотность и водность текста, но особенность этого инструмента в том, что ему не нужно копировать текст, он делает проверку текста на существующих страницах. Может дальше и прикручу проверку по тексту, но пока так.
Как он работает?
Вставляете адрес проверяемой страницы в соответствующее поле и нажимаете «Проверить». Дальше скрипт определяет основное содержание страницы, контентные проекты особенно хорошо распознает, вырезает его, удаляет html и разбивает на слова. Дальше с помощью Yandex Mystem он начинает проверять каждое слово и приводить его к нормализованному виду.
В «основные слова» добавляются только глаголы, существительные и прилагательные.
Если слово не имеет нормализованного состояния, является числом или не является глаголом, существительным или прилагательным, то оно добавляется в список «стоп-слов». Если слово не на русском языке, то оно приводится к нормализованному виду с помощью стеммера Портера, при этом если такое слово меньше 3-х букв, то оно добавляется в список «стоп-слов».
Сравнение с другими
Если сравнивать с выше-упомянутыми инструментами, то мой скрипт работает очень схоже с ними. Кому доверять? Да никому, это всего-лишь еще один показатель, метрика, которую стоит учитывать, но не слепо верить.
В основном я смотрю на количество повторений первых пяти слов, если оно слишком высоко, то отдаю на переработку.
Планы
В планах пакетная проверка списка урлов и всего сайта. Было бы круто, если можно было вбить урл сайта, он бы его спарсил и выдал списком все страницы с показателями частотности и водности.
Еще можно провести эксперимент и определить какой процент водности и тошнотности наиболее приемлем для ПС в определенной тематике.
Буду очень рад, если кому-то покажется эта тулза удобной и он начнет ею пользоваться. Может есть какие предложения или пожелания? Пишите, адекватные предложения обязательно реализую.
tim
27 ноября 2015А какие показали должны быть в идеале?
Archil
27 ноября 2015Идеальных показателей нет, но в среднем до 3% тошнотности и до 35% водности.
ПЧ
27 ноября 2015«Дальше скрипт определяет основное содержание страницы» регулярками или с помощью семантического анализа или ещё что?
Archil
27 ноября 2015Сикрет.
r0bot
28 ноября 2015Классная тема. Молодец, что думаешь об улучшении контента. Выпустишь скрипт в паблик, и с удовольствием пользовался бы. А так я на измене палить лишний раз свои проекты.
Archil
28 ноября 2015Братан, никакого риска, не ведется никакой истории, по крайней мере пока. Тем более откуда я узнаю, что это твои сайты? Да и если сильно захотеть, то можно и так найти все твои сайты.
Скажу как есть, через мои сервисы прошли уже сотни сайтов, у меня просто нет времени все анализировать, да и нет потребности. Так что думаю не стоит на столько заморачиваться.
Kurash
30 ноября 2015Спасибо, годный чекер, будем пользоваться.
Archil
30 ноября 2015На здоровье.
Татьяна
20 января 2016Здорово! Арчил, спасибо!
Если у меня 3.55-3.9 — это уже плохо?
Archil
20 января 2016В принципе это нормальные показатели.
Татьяна
20 января 2016Это я про академическую тошноту (3.55-3.9)… Хотя вот вычитала у тебя — Академическая тошнота документа по сервису http://advego.ru/text/seo/ должна быть в пределах 8-11%, тошнотность по слову не более 3%.
В общем, я сама, видимо, неправильно тебя поняла…