Блог Терехова продвижение сайтов, ведение блогов, заработок в интернет

Продвижение сайтов Ведение блогов Заработок в интернет

Релевантность – как она рассчитывается поисковыми системами Интернет

Четверг, марта 19, 2009

0

Сегодняшней публикацией начинаю цикл теоретических статей, посвященных расчету релевантности документов ресурсов сайтов поисковыми системами Интернет!  Сегодня расскажу об общих принципах ранжирования поисковых систем, а так же приведу классификацию факторов ранжирования, приведу общую формулу расчета значения релевантности.

Релевантность

Алгоритмы ранжирования ПС не являются секретными сведениями. Кроме того, в сети периодически происходит публикация тех или иных особенностей алгоритмов ПС. Характерный пример этого – ежегодный Российский семинар по Оценке Методов Информационного Поиска (РОМИП). Этот семинар – инициатива по созданию плацдарма для проведения независимой оценки методов информационного поиска, ориентированных на работу с русскоязычной информацией. Общий алгоритм текстового ранжирования Яндекса, представленный на РОМИП, описан тут.
Факторы, влияющие на ранжирование, делятся на статические и динамические. Статические факторы не зависят от запроса к ПС, например авторитетность страницы, который еще называют PageRank. (не путать с тулбарным PR Google). Динамические факторы зависят от текста запроса и подразделяются на внутренние (организация документа) и внешние (ссылочное ранжирование).

Факторы ранжирования поисковых систем

  • Статические факторы ранжирования – авторитетность страницы
    • ВИЦ – взвешенный индекс цитирирования Yandex
    • PageRank – авторитетность страницы Google (не путать с тулбарным PageRank)
  • Динамические факторы ранжирования
    • Внешние факторы – ссылочное ранжирование
    • Внутренние факторы – внутренняя оптимизация
  • Собственные факторы ранжирования – собственные каталоги ресурсов
    • Yandex-каталог http://yaca.yandex.ruYaca
    • Каталог Google http://www.google.com/dirhp

Число факторов ранжирования и их значимость различны в альтернативных ПС и постоянно меняется с течением времени.Это связано с постоянным развитием самих ПС и развитием алгоритмов поиска. Условную формулу для вычисления показателя релевантности можно представить следующим образом источник.

, (1)

где итоговое значение релевантности документа запросу ;

значение релевантности кода документа запросу показатель качества внутренняя оптимизация;

релевантность текста ссылок с других документов на документ запросу ; этот показатель для краткости можно назвать ссылочной релевантностью.

показатель авторитетности страницы относительно запроса ;

– некоторая монотонно неубывающая функция; допускают упрощение, что ;

некоторые коэффициенты, позволяющие аппроксимировать формулу релевантности под каждую ПС.

Однако формула (1) не учитывает собственных факторов ранжирования ПС, к которым относятся собственные каталоги ресурсов поисковых систем. Условную формулу для расчета показателя релевантности с учетом собственных факторов ранжирования ПС можно представить следующим образом.

, (2)

где , , некоторые аппроксимирующие коэффициенты, для каждой ПС свои;

релевантность собственных факторов ранжирования ПС.

В данной статье я описал факторы ранжирования ПС, привел их классификацию, привел общую формулу для расчета значения релевантности. В следующих статьях цикла теории SEO я подробнее остановлюсь на каждом факторе ранжирования более подробно.
Терехов

Постовой! Хакасия в интернете
В качестве видео дополнения предлагаю посмотреть ролик, в котором наглядно продемонстрировано определение видимости сайта в поисковиках при помощи программы site-auditor.


В рамках Олимпийского конкурса я начал вести блог под названием Купюрочки, на страницах которого я делюсь своим опытом заработка на рекламе в Интернет. Можете подписаться на обновления блога через RSS или на электронную почту чтобы регулярно получить свежие статьи.

Последний пост с Купюрочек

День 9 – работаем над трафиком на блоге


« « Интернет-магазин конструкторов лего/ Пятница – только позитив » »

Похожие записи

Предлагаю оставить комментарий к посту Релевантность – как она рассчитывается поисковыми системами Интернет



25 комментариев


  1. Fewal (21 comments.) марта 19, 2009 в 6:20 дпReply to this comment

    Интересно, и почему это ни кто ни писал до этого про то что есть четкое понятие релевантности…


  2. Terehoff (1123 comments.) марта 19, 2009 в 7:39 дпReply to this comment

    Fewal – это материалы моей диссертационной работы! Вот и решил поделиться своими наработками в блогосфере! По поводу четкости – это не совсем так. Я привел лишь обобщенную формулу, которая может быть применима для большого количества поисковых систем. В каждом конкретном случае свои нюансы. Это всего лишь теоретический базис, который позволяет дать общее представление о ранжировании документов в поисковых системах!


  3. Devaka (20 comments.) марта 19, 2009 в 9:54 дпReply to this comment

    Terehoff, так держать! :smile:
    Скажи нам, какая тема твоей диссертации?


  4. kotik (69 comments.) марта 19, 2009 в 10:31 дпReply to this comment

    Интересный пост. Вечером буду изучать более подробно, может быть даже подискутируем :)


  5. Terehoff (1123 comments.) марта 19, 2009 в 12:02 ппReply to this comment

    Devaka – вот тебя Akismet не любит :grin: ! Тема диссертации будет точно ясна примерно через месяц! Сегодняшнее название примерно звучит так: «Организация многоальтернативного поиска в современной информационной среде в условиях избыточного дублирования и постоянного роста количества информационных ресурсов». Пока что так видится. В практическом применении понятие под понятием «информационная среда» используется сеть интернет, которая по сути дела является огромнейшей открытой информационной средой масштаба планеты!


  6. Kareg (53 comments.) марта 19, 2009 в 12:23 ппReply to this comment

    Ну прям матанализ какой-то


  7. Terehoff (1123 comments.) марта 19, 2009 в 9:05 ппReply to this comment

    Kareg – а ты думал, каким образом работают поисковики – думаешь просто так! Прочитал одну статью, как человек хотел устроиться работать в Yandex. После собеседования он просто офигел и выдал – я не смогу работать с теми, кто за обедом спокойно разговаривает о первом замечательном пределе :lol: ! Информационный поиск – это прежде всего наука!


  8. Моторокер (8 comments.) марта 20, 2009 в 11:26 дпReply to this comment

    а что за код комментария в статье?
    /!–[if !vml]–\
    /!–[endif]–\
    ?
    Заменил угловые скобки на слеши.

    О, в статье только один восклицательный знак! Прогресс :)


  9. Terehoff (1123 comments.) марта 20, 2009 в 12:11 ппReply to this comment

    Моторокер – не совсем понял про код комментария.
    >а что за код комментария в статье?
    >/!–[if !vml]–\
    >/!–[endif]–\
    >?
    >Заменил угловые скобки на слеши.


  10. Анастасия (2 comments.) марта 23, 2009 в 5:03 дпReply to this comment

    Формула – это хорошо:), но вот только самое главное в этой формуле – функции и подбор (или выбор) коэффициентов, он куда важнее внешней формы (типа линейная комбинация факторов таких-то умножить на фактор такой-то). Будет что-то раскрывающее эти факторы «вглубь»?


  11. Terehoff (1123 comments.) марта 23, 2009 в 9:09 дпReply to this comment

    Анастасия, значения коэффициентов – это ключи к разгадке алгоритма поисковой системы. Их никто не скажет, можно лишь попытаться подобрать в процессе эксперимента. В последующих статьях цикла теории SEO я подробнее оставнолюсь на каждом факторе ранжирования и теоретической формуле его расчета. Подписывайся на RSS и не пропустишь обновления, которое будет на этой неделе :idea:


  12. Анна (2 comments.) марта 23, 2009 в 3:01 ппReply to this comment

    Я и не знала, что с факторами ранжирования все так запущено:)) Да, непростое это дело – электронная коммерция и раскрутка сайтов. Желаю Вам успешной защиты диссертации! Спасибо за информацию!


  13. Terehoff (1123 comments.) марта 23, 2009 в 5:39 ппReply to this comment

    Анна – спасибо и Вам Анна. Буду рад видеть вас на своем блоге!


  14. Argon (7 comments.) марта 24, 2009 в 10:43 ппReply to this comment

    За статью спасибо, желаю удачи с диссертацией!
    Хоть и немного опоздал с комментом :smile:


  15. Terehoff (1123 comments.) марта 24, 2009 в 11:04 ппReply to this comment

    Argon – на днях будет новая статья из цикла теория SEO. Подписывайтесь на RSS чтобы не опаздывать :grin:


  16. Argon (7 comments.) марта 24, 2009 в 11:47 ппReply to this comment

    Уже подписался :idea: .


  17. BloggerSeo марта 25, 2009 в 5:58 ппReply to this comment

    Эту статью я периодически просматриваю и частично использую в своей работе уже 2-3 года (точной даты выхода не помню). Что же такого вы в неё привнесли кроме банального копипаста?


  18. Terehoff (1123 comments.) марта 25, 2009 в 11:05 ппReply to this comment

    BloggerSeo – формула (2) – это моя модернизация первоисточника. В последующих статьях данного цикла вы найдете еще немало дополнений. Кроме того, эта статья не совсем первоисточник. В сети есть еще информация на эту тему.


  19. 007R (2 comments.) марта 26, 2009 в 12:04 дпReply to this comment

    помогите раскрутить http://www.politeconomics.org.ua


  20. 007R (2 comments.) марта 26, 2009 в 12:05 дпReply to this comment

    как поднять Тиц моего сайта http://www.politeconomics.org.ua?


  21. BloggerSeo марта 26, 2009 в 9:55 дпReply to this comment

    То что эта статья не истинный первоисточник я знаю, и ваша модернизация на самом деле ничего особенно нового не привносит. Глубже копать нужно ) (попробуйте сопоставить формулы и реальные данные – тогда поймете о чем я говорю)


  22. Terehoff (1123 comments.) марта 26, 2009 в 11:49 дпReply to this comment

    BloggerSeo – я не претендую на научную новизну в рамках академии наук. Я всего лишь опубликовал статью по мотивам своей диссертации. Много там нового или нет, это уже другой вопрос. Я нашел материал, решил его немного дополнить и опубликовал со ссылкой на первоисточник. Я выслушал выше мнение, оно полезно для меня, будем работать дальше. У вас ко мне еще есть вопросы? :smile:


  23. Terehoff (1123 comments.) марта 26, 2009 в 12:06 ппReply to this comment

    007R – отпиши по мылу из контактов, поговорим :cool:


  24. Андрей Морковин (36 comments.) сентября 14, 2009 в 9:43 дпReply to this comment

    На моей памяти – это первая диссертационная работа, которая, по моим ощущениям, будет иметь смысл и будет интересна.


  25. Папараць-кветка (3 comments.) декабря 27, 2009 в 4:32 ппReply to this comment

    Легко работать с теми, кто за обедом спокойно разговаривает о первом замечательном пределе? :lol:

Оставьте ваш комментарий

Имя (*)

E-Mail (не публикуется) (*)

Сайт

Текст комментария
=) 8) ;( ;) :P :-D =-O :-! *IN LOVE* %) *CRAZY*

Разноцветные метки