Я тут наблюдаю за рынком и игроками из своей песочницы и по причины участия в этом рынке смотрю, кто что и про кого говорит).  И в то время, как одни (один) говорит что у нас все схвачено и перекрыто, другие (их несколько) говорят, что все работает и ничего не палится.

кто врет?

Чтобы не быть громогласным: вот очередное заявление яндекса (оформленное в виде доклада) и ответ movebo (естественно, с прямой ссылкой, которая уже не работает).

Давайте проанализируем основные моменты, ху из ху, кто больше врет и, особенно, зачем :).

Yandex про 1ю ступень

Первая ступень – это капча, так называемая роботоловилка. Она предназначена для того, чтобы защитить Яндекс от наплыва большого количества ботов, совершенно простых и примитивных. Если не было этой первой преграды, то на сервисы Яндекса очень сильно возросла бы нагрузка, и ему было бы очень сложно отвечать на запросы пользователей.

Роботоловилка состоит из двух частей – классификатора робота и человека, и теста, призванного отличить одного от другого.

Movebo про 1ю ступень

И если первая ступень — русскоязычная капча описана подробно, красочно и понятно (не вполне правда понятно, как связана капча и поведенческие факторы=), то о второй и третьей ступенях «чистки» сказано совсем немного и как-то мельком. 

Yandex про 2ю ступень

Вторая ступень – быстрая и легкая очистка от роботов, которая в основном используется в персонализированных сервисах: 

  • Персонализация 
  • Поисковые подсказки 

Для ограничения reverse engineering’а

Movebo про 2ю ступень

Вторая ступень – легкая чистка от накруток (роботов) в персонализации и поисковых подсказках. Из того что мы видим, накручивается это действительно очень просто и многие компании пользуются этим. Т.е. очистка на этом этапе либо практически отсутствует либо действительно учитывает только какие-то совсем явные показатели.

Yandex про 3ю ступень

Третья ступень – глубокая очистка. Это крупный, очень хорошо развитый алгоритм, использующий огромное количество данных, учитывающий большое количество пользовательских распределений.

  • Алгоритм глубокой очистки это:
  • Около 2000 факторов (распределений)
  • Около 200 функций очистки
  • В основном используется 34 фактора

Movebo про 3ю ступень

Наибольший, конечно, интерес представляет третья часть доклада, в которой говорится о «крупном, хорошо развитом алгоритме, использующей огромное количество данных, учитывающий большое количество пользовательских распределений».  
 
Приведенные дальше цифры вызывают, при первом взгляде, конечно уважение: 
• 2000 факторов (распределений); (Больше чем в мартикснете? Яндекс, вы серьезно? Звучит очень забавно)
• 200 функций очистки;
• Правда тут же пишут, что используют в основном 34 фактора. 
 
Если же абстрагироваться от больших и якобы страшных цифр, что можно увидеть? Подробное описание алгоритма действия капчи, а все остальное —  обтекаемые слова о каком-то большом количестве каких-то факторов, благодаря которым Яндекс может распознавать роботов.  И в конце — предупреждение о том, что продвижение поведенческими факторами будет караться «сроком от…».

Интересный финал

0_c8ae7_69d50431_L

 

Тут мне хочется встать на сторону Movebo при всем моем уважении к команде Яндекса. Есть интересные инсайды, когда Яндекс сильно интересовался внутренней кухней сервисов по работе с поведенческими.

Другой вопрос — как отличить одного живого человека от другого живого человека, когда оба серфят по сайту в поиске нужной информации, которая представлена наглядным образом. А еще, скажите мне, где есть ли тут накрутка?

2014.03.17-10.33.52

 

А она есть, просто вы ее не видите. Или нет ее на самом деле? Показалось?

Movebo молодцы, что реагируют на заявления «противоположной стороны» (грамотно троллят). Еще нюанс, если бы сервис не зарабатывал, он бы не существовал уже несколько лет. Значит работает, значит яндекс привирает, что все палит. Пока работает, еще минимум полгода-год все будет по-прежнему. А там посмотрим).

Терехов.