Релевантность – как она рассчитывается поисковыми системами Интернет
Сегодняшней публикацией начинаю цикл теоретических статей, посвященных расчету релевантности документов ресурсов сайтов поисковыми системами Интернет! Сегодня расскажу об общих принципах ранжирования поисковых систем, а так же приведу классификацию факторов ранжирования, приведу общую формулу расчета значения релевантности.
Алгоритмы ранжирования ПС не являются секретными сведениями. Кроме того, в сети периодически происходит публикация тех или иных особенностей алгоритмов ПС. Характерный пример этого – ежегодный Российский семинар по Оценке Методов Информационного Поиска (РОМИП). Этот семинар – инициатива по созданию плацдарма для проведения независимой оценки методов информационного поиска, ориентированных на работу с русскоязычной информацией. Общий алгоритм текстового ранжирования Яндекса, представленный на РОМИП, описан тут.
Факторы, влияющие на ранжирование, делятся на статические и динамические. Статические факторы не зависят от запроса к ПС, например авторитетность страницы, который еще называют PageRank. (не путать с тулбарным PR Google). Динамические факторы зависят от текста запроса и подразделяются на внутренние (организация документа) и внешние (ссылочное ранжирование).
Факторы ранжирования поисковых систем
- Статические факторы ранжирования – авторитетность страницы
- ВИЦ – взвешенный индекс цитирирования Yandex
- PageRank – авторитетность страницы Google (не путать с тулбарным PageRank)
- Динамические факторы ранжирования
- Внешние факторы – ссылочное ранжирование
- Внутренние факторы – внутренняя оптимизация
- Собственные факторы ранжирования – собственные каталоги ресурсов
- Yandex-каталог http://yaca.yandex.ruYaca
- Каталог Google http://www.google.com/dirhp
Число факторов ранжирования и их значимость различны в альтернативных ПС и постоянно меняется с течением времени.Это связано с постоянным развитием самих ПС и развитием алгоритмов поиска. Условную формулу для вычисления показателя релевантности можно представить следующим образом источник.
, (1)
где
– итоговое значение релевантности документа
запросу
;
– значение релевантности кода документа
запросу
– показатель качества внутренняя оптимизация;
– релевантность текста ссылок с других документов на документ
запросу
; этот показатель для краткости можно назвать ссылочной релевантностью.
– показатель авторитетности страницы
относительно запроса
;
– некоторая монотонно неубывающая функция; допускают упрощение, что
;
– некоторые коэффициенты, позволяющие аппроксимировать формулу релевантности под каждую ПС.
Однако формула (1) не учитывает собственных факторов ранжирования ПС, к которым относятся собственные каталоги ресурсов поисковых систем. Условную формулу для расчета показателя релевантности с учетом собственных факторов ранжирования ПС можно представить следующим образом.
, (2)
где
,
,
– некоторые аппроксимирующие коэффициенты, для каждой ПС свои;
– релевантность собственных факторов ранжирования ПС.
В данной статье я описал факторы ранжирования ПС, привел их классификацию, привел общую формулу для расчета значения релевантности. В следующих статьях цикла теории SEO я подробнее остановлюсь на каждом факторе ранжирования более подробно.
Терехов
Постовой! Хакасия в интернете
В качестве видео дополнения предлагаю посмотреть ролик, в котором наглядно продемонстрировано определение видимости сайта в поисковиках при помощи программы site-auditor.



