Спонсор поста. ePochta Mailer — лучшая в России программа для электронной рассылки. Убедитесь в этом сами!

Сегодня продолжаю цикл статей по теории SEO. В первой статье Релевантность — как она рассчитывается поисковыми системами Интернет, я рассказал об общих принципах алгоритмов ранжирования в поисковых системах сети интернет. Во второй статье сcылочное ранжирование, я детално остановился на таком факторе, как ссылочное ранжирование. В третьей статье цикла авторитетность страницы, я описал еще один из факторов, прямопропорционально влияющих на выдачу, авторитетность страницы. Сегодня я хотел бы поговорить о внутренней оптимизации или о внутренних факторах ранжирования, влияющих на релевантность выдачи.

Внутренние факторы

О внутренних факторах или внутренней оптимизации написано немало постов, статей. Много сообщений написано на форумах. Есть пособия по составлению семантического ядра ресурса. Но сегодня я хотел бы остановится на теоретической части, чтобы вы смогли уловить математическую зависимость организации документа и его релевантности определенному запросу.

Алгоритмы поисковых систем достаточно сложные и основаны в первую очередь на математике. Именно поэтому в данном цикле я публикую  математические статьи, чтобы попытаться лучше понять принцип работы поисковых систем Интернет.

Условная формулы расчета релевантности, описанная в первой статье цикла, имеет вид:

Значение величины — релевантности внутренних факторов ранжирования, определяется как релевантность исходного кода документа запросу . Исходный код страницы – это набор команд браузеру, используемых для отображения содержимого страницы, а так же текст и метаданные. Условная формула для расчета данного показателя может быть записана следующим образом.

где релевантность -го фактора внутреннего ранжирования;

– количество словоформ, совпавших с словоформами запроса в -м факторе внутреннего ранжирования;

– общее количество словоформ  в -м факторе внутреннего ранжирования;

– весовой коэффициент -го фактора внутреннего ранжирования;

– множество словоформ, используемых в -м факторе внутреннего ранжирования;

– количество словоформ, используемых в -м факторе внутреннего ранжирования;

– общее количество словоформ, используемых в факторах внутреннего ранжирования;

– общее количество внутренних факторов ранжирования в коде страницы .

На значение влияет расположение искомого текста на странице и частота встречаемости слов запроса в рассматриваемом документе, т.е. доля слов из текста запроса в общем количестве слов документа. Больший вес имеют слова, расположенные ближе к началу документа. Особо ценится точное вхождение текста запроса в текст документа. Следует отметить, что поиск по стоп-словам (союзы, междометия, предлоги, частицы) не производится, но они учитываются при ранжировании документов, что может серьезно влиять на результат выдачи.

То же самое можно сказать и о морфологии запроса. ПС отдают предпочтение одинаковой форме слов в тексте запроса и тексте документа. Для Google это имело принципиальное значение до тех пор, пока эта ПС не начала поддерживать русскую морфологию.

Другим внутренним фактором ранжирования является частота употребления слов в документе. Не существует определения «идеальной» плотности слов в документе хотя бы потому, что в каждой ПС она будет своя. Существуют лишь рекомендации о плотности ключевых слов на странице в пределах 3-7%. В теории поисковых систем это называют семантическим ядром.

К элементам форматирования текста относятся следующие html-теги:

· <h1>,…,<h6> – заголовки страниц;

· <strong> – акцентирование текста;

· <b> – выделение текста жирным;

· <i> – курсив.

Служебные теги keywords и description активно использовались многими поисковыми системами. Но в связи с тем, что их содержимое не видно пользователю на экране браузера, они стали действенным инструментом для обмана поисковых систем, что привело к тому, что в настоящее время влияние этих мета тегов незначительно или отсутствует. Например, Google при ранжировании документов их игнорируют вообще, но использует содержимое мета-тега description при построении сниппетов – фрагментов текста, содержащих слова из запроса, выдаваемых рядом со ссылкой на документ в результатах поиска. На сайте Яндекса указано, что он учитывает первые 50 слов из тега keywords при условии, что это слово присутствует в тексте страницы.

Наибольший эффект из страничных факторов даёт применение тэга title – заголовка страницы. Причём использовать в нём можно даже слова, которые не содержатся в тексте страницы – это тоже даёт эффект, хотя и меньший, но в некоторых случаях это оправдано. К тексту внутри этого тэга применимы те же понятия, что и для текста документа вообще: больший вес имеют слова, расположенные ближе к началу, очень эффективно точное вхождение искомой фразы. Судя по информации представленной на сайтах Яндекса, эта ПС не учитывает частоту вхождения слов из запроса в этом теге, а только факт их присутствия. Нецелесообразно делать очень длинные словосочетания в теге title, так как ПС могут накладывать ограничение на длину индексируемой части этого тега.

Атрибут alt тега img. – это текстовый комментарий к изображениям. Для Яндекса этот атрибут имеет значение только при поиске по картинкам, а при ранжировании документов в основном поиске не используется. Google учитывает содержимое этого атрибута только для изображений, являющихся ссылками.

В большинстве случаев при анализе позиций сайта в выдаче трудно выделить влияние как внутренних, так и других факторов. Но эффект каждого из факторов нетрудно проследить в краевых ситуациях, когда влияние других факторов крайне мало или отсутствует. Для начала можно поэкспериментировать с внутренними факторами ранжирования и проследить позиции, чтобы понять, как они влияют напозиции.

Терехов
В качестве видео дополнения сегодняшнего поста предлагаю вам посмотреть, как  блондинка при помощи электроники заменяет ансамбль. У нее это неплохо получается.

Постовой. Фото стрижек