Зябрев и SeoPult MaxПро SeoPult MAX я впервые услышал на конференции CyberMarketing прямо накануне вылета в Египет. В буквальном смысле  SeoPult MAX — это алгоритм эффективного подбора доноров. Знаю, прекрасно знаю, что и вы, и я много раз слышали про эти эффективные алгоритмы от многих игроков рынка. Но по большей части эти алгоритмы были черным ящиком и назывались их общие моменты.

На конференции CyberMarketing алгоритм SeoPult Max представлял Илья Зябрев, человек с МехМатовским образованием МГУ, который в данный момент заниамется финансовой математикой. Мы с ним лично познакомились еще на Дне рождения SEONews и помнится долго разговаривали на тему науки. Как раз в тот момент я подходил к финальной части написания кандидатской диссертации и его наработки в области информационного поиска, в частности ранжирования документов были мне очень и очень интересны.

Ребята из SeoPult по моей просьбе любезно предоставили материалы, касающиеся научной и математической стороны  SeoPult Max. Основная статья тут. Поясню ее, точнее переведу на ненаучный язык.

Суть алгоритма в том, чтобы для продвижения конкретного запроса подобрать наиболее эффективную тройку: страница донора — страница акцептора — анкор. Ссылочная составляющая в рунете по-прежнему играют ощутимую роль, без покупки ссылок в топ вылезают единицы за счет долгосрочной кропотливой работы над сайтом. В коммерческих тематиках это время не всегда есть.

Как работает SeoPult Max?

Лучше показать это на примере. Есть доноры — это сайты, с которых ссылки покупаются/получаются/проставляются. Есть акцепторы — это как раз продвигаемые ресурсы. Есть анкоры — тексты ссылок на донорах. Теперь определимся с понятием частотного паттерна.

Для продвижения акцептора мы закупились ссылками с 50 доноров (к примеру для ровного числа). Одним из факторов оценки доноров является ТИЦ (опять же для простоты изложения).

Интервал значений тИЦ Количество
0-90 50
100-190 28
200-290 7
300-390 4
400-490 3
500-590 2
600-690 2
700-790 2
800-890 1
900-990 1
Итого 100

Исходя из таблицы видно, что было куплено 50 ссылок на донорах с ТИЦом от 0 до 90, 28 ссылок на донорах с ТИЦом от 100 до 190 и тд. В статистике количественные показатели принято нормировать и  использовать не количество, а доли. Так как показателей много, абсолютное их количество может исчисляться миллионами и для удобства их все приводят к значению от 0 до 1. Итого получаем вот такое.

Интервал значений тИЦ Относительная частота
0-90 0,50
100-190 0,28
200-290 0,07
300-390 0,04
400-490 0,03
500-590 0,02
600-690 0,02
700-790 0,02
800-890 0,01
900-990 0,01
Итого 1

На основе второй таблицы можно построить график частотного распределения.

pub34ris2.jpg

В SeoPult Max используется 184 фактора, по которым анализируются все доноры. На каждый фактор можно построить свое распределение. Итого, 184 распределения образуют пресловутый частотный паттерн или говоря простым русским языком — набор графиков со статистическими данными.

Для подборки оптимальных доноров алгоритм  SeoPult Max анализирует топ 50 выдачи Яндекса по определенному запросу. Таким образом получается 50 паттернов х 184 фактора = 9200 распределений факторов. На основе этих данных строится «идеальный» частотный паттерн, состоящий из 184х распределений. Таким образом мы получаем картину «идеальных» доноров для данной продвигаемой страницы под данный запрос, покупка ссылок с которых позволит добиться максимального влияния ссылочного фактора на ранжирование.

Теперь осталось пояснить алгоритм на примере наших любимых топовых  SEO контор.

Возьмем один из самых простых и наглядных факторов, обозначенных в статье как TRaslm — релевантность донора заданному запросу. То есть для продвижения своего сайта по запросу ХХХХ нам надо закупиться ссылками с сайтов из топ Яндекса, вылезаемых по  запросу ХХХ. Формула для расчета фактора выглядит так* (на всякий случай привожу).

pub34ris3.jpg

где t — леммы слов донора D, Q-множество лемм слов запроса, aSLM – аппроксимированная спектральная языковая модель ([3]). Другими словами TRaslm – это сумма значений aSLM лемм донора, которые встречаются в запросе. Лемма в данном случае — каноническая форма слова.

*Можете пропустить текст под формулой, если нет желания вчитываться. Дальше все понятно без формул.

Результаты подсчета значения данного фактора для запроса «продвижение сайтов», нашего самого главного и любимого запроса. На момент написания статьи Зябрева топ выглядел так:

  1. demis.ru
  2. seo-dream.ru
  3. bdbd.ru
  4. vipseo.ru
  5. promo.ingate.ru
  6. vipro.ru
  7. intelsib.ru
  8. advans.ru
  9. optimism.ru
  10. buyfish.ru

Всех или почти всех вы прекрасно знаете. Посмотрим, что скрывается за их донорами.

Страница Распределение TRaslm
demis.ru
seo-dream.ru
bdbd.ru
vipseo.ru
promo.ingate.ru
vipro.ru
intelsib.ru
advans.ru
optimism.ru
buyfish.ru

Как мы видим, «горбики» или распределения очень даже похожи, что говорит о том, что ссылки куплены и/или получены примерно с одинаковых по показателям релевантности доноров. Причем релевантность доноров — это только один фактор из 184.

Если все эти горбики наложить друг на друга, то получим такой график.

pub34ris39.jpg

На основании этих горбиков можно выделить общую закономерность и рассчитать параметры для идеального донора. На рисунке он показан черной линией. Методы построения расчета параметров идеального донора не разглашаются, но в самом простом и грубом варианте это может быть среднее арифметическое.

В реальной работе  SeoPult Max анализ происходит по 184 факторам, при этом постоянно отслеживается соответствие распределений всех показателям «идеального» донора. Перестройка множества доноров происходит исходя из заданного бюджета и принципа минимальных изменений уже существующего множества (оно и логично, чтобы массово не отказываться от уже полученного платным путем массива ссылок).

Буду ждать результатов эффективности использования данного алгоритма по сравнению с обычным методом закупки ссылок  SeoPult. При этом хочу отметить, что ссылки важны, но не менее важен сам сайт. Уверен, что у топ 10 по запросу «Продвижение сайтов» с самими сайтами с точки зрения внутренней оптимизации все просто замечательно, поэтому и картина появилась наглядная.

От себя лично хочу выразить благодарность команде  SeoPult за возможность более глубоко ознакомиться с наработками по  SeoPult Max, которые я скорее всего смогу использовать в своей научной работе, которая видимо возобновиться в будущем году…

Терехов.