Краткое и полное SEO описание
#1
Отправлено 30 Ноябрь 2010 - 17:48
#2
Отправлено 02 Декабрь 2010 - 15:28
Лично у меня есть ощущение что эти теги keywords и description уже давно играют очень малую роль в ранжировании сайтов, а с вводом технологий типа Матрикснета думаю влияние этих метатегов снизошло на ноль или очень близкую к нулю цифру и их заполняют скорее по традиции.
#3
Отправлено 02 Декабрь 2010 - 15:36
Матрикснет: новая идеология поиска Яндекса
Когда в Рунете было 10 000 сайтов, простой поиск по совпадению ключевых слов и ранжирование отсеянных страниц по базовым показателям авторитетности (аналогичным классическому алгоритму Page Rank) вполне удовлетворял пользователей. Качество выдачи даже при таком относительно примитивном подходе было приемлемым. Но взрывной рост количества страниц (документов) и приемов манипуляции известными факторами ранжирования привели к выбиванию с рынка поиска игроков, не сумевших найти более продвинутое решение. Среди отечественных разработок достаточно вспомнить Aport и Rambler – они потеряли лояльность пользователей в рекордно короткие сроки из-за мусора и спама в SERP.
Однако Яндексу удалось преодолеть кризис: технологии компании пошли по пути стремительного увеличения количества обрабатываемых факторов, что позволило поддерживать качество выдачи. А 17 ноября 2009 года, с внедрением алгоритма «Снежинск», подход к ранжированию перевернулся с ног на голову. Раньше формула расчета релевантности документов была жесткой. Соотношение важности ее коэффициентов определялось изначально, на теоретических выкладках, а затем подстраивалось и «подкручивалось» – это и были апдейты алгоритма.
Теперь же система машинного обучения (MLR, machine-learned ranking) Матрикснет анализирует тысячи факторов (признаков страниц), но коэффициенты важности каждого из них – по сути, это и есть формула ранжирования – присваиваются на основе оценки страниц живыми людьми, асессорами. Теперь не формула диктует, что хорошо для пользователей, а пользователи решают, какая формула лучше работает – точнее, создают ее. При достаточно большой выборке документов и добросовестной работе асессоров выдача, как показывает практика прошедшего года, получается релевантной – даже в настоящее время, когда в индексе Яндекса находится около 11 миллиардов страниц, а количество разнообразных поисковых запросов достигает десятков миллионов. Внутренняя метрика качества поиска pfound выросла на 5%, и это, судя по всему, еще не предел (а по тому, что значение не достигает маркетингово льстивых 70, 200 или 35353225%, яндексоиды честно и объективно измеряют этот критерий).
Как работает машинное обучение?
Берем объекты (в нашем случае – веб-страницы) и описываем их как можно большим количеством признаков. Поскольку мы не знаем, какие признаки действительно важны и определяют качество веб-страницы («здравый смысл» иногда расходится с истинным положением вещей), следует переложить задачу присваивания важности на компьютерный алгоритм.
Алгоритму нужно «скормить» выборку документов, распределенных живыми людьми по степени соответствия некому поисковому запросу. А машина найдет общие признаки у наиболее релевантных и нерелевантных страниц, и на основе этих данных построит правила.
Обученный алгоритм может очень быстро выполнять работу по анализу документов. 100 ассессоров анализируют 1000 документов (каждый просматривает эту одинаковую тысячу, чтобы нивелировать элемент «вкусовщины» и человеческой ошибки), а машина может в миллионы раз быстрее отранжировать десятки миллионов документов.
В архитектуре поисковых систем применяются наработки двух математических «школ» машинного обучения: SVM (support vector machines) и Boosting (метод TreeNet). Первая позволяет быстро проводить обсчет, но оперируя ограниченным сотнями количеством признаков, а вторая требует много машинного времени даже по нынешним меркам, но обсчет может вестись по тысячам критериев. Однако группе сотрудников Яндекса под руководством Павла Карповича и Андрея Гулина удалось оптимизировать и приспособить к задачам поискового ранжирования алгоритм TreeNet. Суть усовершенствований: прием в работу каждого примера, кластеризация, устойчивые правила, матричный принцип. Правила, вырабатываемые Матрикснетом, достаточно просты и поддаются распараллеливанию на вычислительные потоки, что позволяет, повторимся, быстро анализировать страницы по тысячам критериев – по очень сложной формуле, объем которой достигает 280 мегабайт. В 200 6 году – 0,02 килобайта (это информация из официального пресс-релиза в блоге Яндекса, хотя непонятно, как формула может занимать 20 байт. Вероятно, в релизе содержится ошибка – вместо «килобайта» следует читать «мегабайта»).
Как происходит обработка поискового запроса?
Мы не будем останавливаться на частностях типа учета геозависимости запроса, но сосредоточимся на базовой (и достаточно условно описанной) архитектуре поиска.
Яндекс использует пирамидальный поиск: сначала из всего гигантского множества документов выбирается ограниченное количество соответствующих базовым критериям – «кворум». На этом этапе применяется отсев по порогу содержания простейших ключевых слов (термов). Поскольку документов в индексе очень много, полученная выборка тоже может быть чрезмерно широкой для полной формулы Матрикснета – поэтому ее нужно сократить до размера, который эта формула может «переварить» в установленное для обработки одного запроса время. Для этого проводится анализ по статическим параметрам (так называемый «фаст ранк»): стандартный вес, траст и так далее. Лучшие результаты передаются на ранжирование полной формулой. Итак, сначала проводятся сравнительно простые вычисления с огромным количеством документов, а затем – сложные вычисления с небольшим количеством заведомо подходящих и уже неплохих.
Конечно, выдача по наиболее распространенным запросам кэшируется серверами среднего уровня, поэтому каждый раз обсчет не производится (хотя постоянное пополнение индекса новыми документами вызывает необходимость периодического перезапуска всей последовательности итераций).
Итак, ограниченное количество документов, которые нужно отранжировать, передается на вход Матрикснета. Алгоритм имеет структуру дерева решений, после прохождения которого получается матрица документов с присвоенными «числовыми значениями релевантности». Точнее, для каждого документа необходимо пройти по тысячам деревьев – и ноу-хау Яндекса заключается в балансировке (в математическом смысле), позволяющей очень заметно ускорить вычисления.
Как оптимизировать сайт для Матрикснет?
Ответить на вопрос «как победить Матрикснет» в двух предложениях невозможно.
Но все же основные практические рекомендации таковы:
- делать качественные сайты с оригинальным контентом;
- ориентироваться на признаки текущих лидеров ТОП10 по интересующим запросам;
- в процессе внутренней оптимизации страниц брать на вооружение подсказки различных seo оптимизаторов из блогов, статей, форумов и seo систем, которые актуализируются по экспериментальным данным.
*Информация взята из официального письма Сеопульта "Выпуск №23: Принципы Матрикснет".
#4
Отправлено 02 Декабрь 2010 - 18:36
Я так понимаю, с внедрением Матрикснета ссылки на сайт все равно остаются важным критерием отбора?
И еще: все-таки мне не понятно про SEO-описания. Где они прописываются? Заголовок страницы я поняла - в теге TITLE. А описания?
#5
Отправлено 02 Декабрь 2010 - 21:08
Матрикснетом они на мой взгляд просто перевели оценку всех параметров сайта на объективный не эмоциональный механизм который трезво понимает какие сайты нравится людям и дают им верные ответы на поисковые запросы. Машина легко выявляет те параметры, которые отличают "Хорошие" сайты от "плохих" и дают им больший приоритет. Хотя мне кажется что этой технологией они в первую очередь решают проблему устойчивости поисковика к поисковому спаму.
SEO описания выдаются в специально добавленных переменных. Их можно обнаружить через функцию {print_vars} в шаблонах. Возможно в вашем шаблоне соответствующих переменных не было на момент его установки, поэтому сейчас они не отображаются, но их всегда можно добавить если необходимо.
#6
Отправлено 03 Декабрь 2010 - 13:12
Мне на сайте, в принципе, хватает обычного текста, т.е. обычного описания. Поэтому добавлять ничего не нужно. Я просто думала, что заполнение этих параметров (SEO-описаний) может как-то помочь с продвижением в поисковиках. Теперь поняла, что видимо нет.
#7
Отправлено 29 Октябрь 2011 - 01:15
support (02 Декабрь 2010 - 21:08) писал:
Матрикснетом они на мой взгляд просто перевели оценку всех параметров сайта на объективный не эмоциональный механизм который трезво понимает какие сайты нравится людям и дают им верные ответы на поисковые запросы. Машина легко выявляет те параметры, которые отличают "Хорошие" сайты от "плохих" и дают им больший приоритет. Хотя мне кажется что этой технологией они в первую очередь решают проблему устойчивости поисковика к поисковому спаму.
SEO описания выдаются в специально добавленных переменных. Их можно обнаружить через функцию {print_vars} в шаблонах. Возможно в вашем шаблоне соответствующих переменных не было на момент его установки, поэтому сейчас они не отображаются, но их всегда можно добавить если необходимо.
А на вопрос Джамшуд так и не ответил... Что, блин все-таки надо писать в этом SEO-описании???
#8
Отправлено 29 Октябрь 2011 - 12:32
#9
Отправлено 21 Октябрь 2012 - 18:29
#10
Отправлено 21 Октябрь 2012 - 18:40
#11
Отправлено 21 Октябрь 2012 - 19:44
#12
Отправлено 12 Ноябрь 2012 - 19:14
#13
Отправлено 13 Ноябрь 2012 - 14:35
Количество пользователей, читающих эту тему: 0
0 пользователей, 0 гостей, 0 анонимных