На днях поисковая система «Яндекс» анонсировала выход нового низкочастотного алгоритма под названием Палех. 

Каждый день поиск «Яндекса» отвечает примерно на 280 миллионов запросов. Какие-то запросы уникальны — их задают один раз, и они, возможно, больше никогда не повторятся. Уникальных и просто редких запросов очень много — около ста миллионов в день. Именного в таких реалиях «Яндекс» запустил новый алгоритм который получил название Палех. Данная  программа-алгоритм выбирает и предоставляет только нужные данные, более того система способна самостоятельно повышать свои поисковые навыки на основе специальной сети нейронов. Последняя была создана искусственно и уже набирает обороты.

По традиции поисковика программу-алгоритм назвали Палехом в честь древнего города. Там берет свое начало лаковая роспись, знаменитая на весь мир. Почему именно Палех? Это идея разработчиков. Им пришлась по вкусу одна из лаковых росписей. На картине была изображена Жар-птица. Пытливый ум программиста увидел в сказочном персонаже  график, с помощью которого система делегирует запросы пользователей.
orig

График частотного распределения запросов в Яндексе часто представляют в виде птицы, у которой есть клюв, туловище и длинный хвост.

  1. Клюв – это самые частые запросы (высокочастотные запросы) и их само мало.
  2. Туловище – запросы средней частотности которые.
  3. Длинный хвост – запросы редкие, по отдельности встречаются чрезвычайно редко, но вместе составляют существенную часть поискового потока.

Анализ системы показал, что сложные запросы оттягивают на себя большой объем трафика Интернета. Так, из общего количества, редкие запросы составляют больше одной трети! Вот и получается, что клюв – маленький, туловище – побольше, хвост самый большой. К слову сказать, запросы из «Клюва» продвигаются крайне сложно, в то время как из «Туловище» полегче, а вывести в ТОП 10 запросы из «длинного хвоста» еще проще. Но это так, лирическое отступление.

Как работает новый алгоритм?

Для примера рассмотрим запросы от людей, которые хотят узнать название фильма или книги по запомнившемуся эпизоду: [фильм про человека который выращивал картошку на другой планете] («Марсианин») или [фильм где физики рассказывали даме про дейтерий] («Девять дней одного года»). При этом зачастую далеко не всегда на релевантной страничке встречаются слова из запроса — ведь один и тот же смысл в запросе и на странице может быть выражен совершенно по-разному. Именно по этому я всегда рекомендую не ограничиваться одним или двумя предложениями, а максимально раскрывать тему каждой страницы вашего сайта.

Искусственные нейронные сети — один из методов машинного обучения, который стал особенно популярен в последние годы. Для примера возьмем один поисковый запрос и три различные страницы. Суть в том, что новый алгоритм сам определяет тематику запроса и предлагает максимально релевантный ответ.

orig-1

Какой вывод можно сделать из этого анонса. С каждым днем процесс продвижения сайтов становится все более сложным, но фундоментальные принципы продвижения остаются неизменными. Для увеличения необходимо подробно и всесторонне раскрывать тему на целевой страницы, а также в текстах необходим использовать не только частотные ключевые слова в разных вхождениях но и синонимы.