Команда Google опубликовала обновленный гайд по ранжированию сайтов в своем поиске. В нем рассказывается о самых важных, с точки зрения специалистов Google, системах ранжирования, с помощью которых работает основной поисковый алгоритм.
BERT
BERT — это алгоритм, с помощью которого определяются смыслы и интенты слов в поисковых запросах.
Информационные системы для кризисных ситуаций
Поиск Google разработан с целью предлагать людям полезную и актуальную информацию в том числе во времена кризиса — личного или массового характера:
- Личный кризис: поисковые алгоритмы постоянно работают над тем, чтобы лучше понимать, когда пользователи ищут информацию, переживая личные кризисные ситуации. С помощью такой установки поиск в первую очередь показывает данные о горячих линиях, доверенных организациях, помогающих людям в сложных жизненных ситуациях (суицидальное поведение, вопросы сексуального характера, гендерная жестокость, наркотическая зависимость и других).
- SOS-оповещения: при возникновении природных или других масштабных бедствий, поиск Google нацелен на демонстрацию последних данных от локальных, национальных или международных служб, включая телефоны и сайты экстренных служб, карты и так далее.
Дедупликационные системы
Поисковые алгоритмы запрограммированы показывать самые релевантные поисковым запросам результаты, отсеивая бесполезные дублирующиеся версии. Это относится и к расширенным сниппетам: контент не повторяется на первой странице выдачи, если он уже был показан в сниппете.
Система точного совпадения названия домена
Google оценивает слова в доменных именах как один из факторов релевантности контента. Но домены некоторых сайтов специально включают в себя поисковые запросы, и Google умеет распознавать их и ранжировать с учетом остальных факторов.
Системы «свежести»
Есть категория запросов, результаты по которым должны быть максимально свежими, опубликованными совсем недавно. Алгоритмы Google определяют интент таких запросов и включают в первые результаты последние материалы и новый контент по теме, если таковой имеется.
Система полезного контента
Алгоритмы настроены на отображение в выдаче оригинального и полезного контента, который создан людьми для людей, а не для краулеров.
Система анализа ссылок и PageRank
PageRank — одна из ключевых систем поискового алгоритма Google, которая оценивает, как страницы в вебе ссылаются друг на друга. Это помогает определять содержимое и его потенциальную пользу для пользователя.
Системы местных новостей
Поисковое ранжирование в Google включает систему идентификации источников новостей в случаях, когда это релевантно.
MUM
MUM (Multitask Unified Model — унифицированная мультизадачная модель) — это алгоритм на базе ИИ, способный понимать и генерировать язык. Модель не используется для основного ранжирования сайтов в поиске, но применяется, когда требуются специфические особенности.
Нейронное соответствие
Еще один алгоритм на основе ИИ, которая применяется для понимания интерпретаций смыслов в поисковых запросах и сопоставления их с содержимым страницы.
Системы оригинального контента
С помощью этих систем Google выдвигает на первый план страницы с оригинальным контентом, а не скопированным или процитированным. В рамках этой же системы работает поддержка специальной микроразметки, обозначающая приоритет среди похожих страниц.
Системы пессимизации и удаления
Согласно политике Google, контент определенного типа может удаляться из выдачи по таким причинам, как:
- Требование закона. Например, если контент на странице нарушает авторское право, это дает Google основания понизить в выдаче и другие страницы сайта. Аналогичная ситуация происходит, если пользователи оставляют жалобы на сайт с клеветой, контрафактной продукцией и решениями суда.
- Персональная информация. Например, если сайт нарушает политику о персональных данных и требует плату за удаление контента, все страницы будут понижены в выдаче. То же самое касается сайтов, в отношении которых Google получает много сигналов о наличии на них данных, которые позволяют идентифицировать личность. Автоматически предотвращается высокое ранжирование фото и видео сексуального или интимного характера по запросам, включающим имена.
Система оценки взаимодействия со страницей (Page Experience)
Данная система анализирует такие критерии, как: наличие безопасного протокола, навязчивая реклама, скорость загрузки, наличие оптимизации для мобильных устройств.
Система Passage Ranking
Это алгоритм на ИИ, который используется для анализа фрагментов или отдельных абзацев, а не всего контента страницы целиком.
Читайте по теме: Google Passage Ranking: что это такое и что изменилось после его запуска
Система ранжирования отзывов (Product Reviews)
Алгоритм специально разработан для продвижение качественных отзывов, в которых содержится описание личного опыта, аналитика и оригинальное исследование, написанное людьми, хорошо разбирающимися в теме.
Система RankBrain
Еще один алгоритм, работающий на базе ИИ, который помогает понимать, как разные слова связаны с концептом чего-либо. Благодаря этому Google умеет находить релевантный контент, даже если в нем не содержатся ключевые слова из поискового запроса.
Системы надежной информации
Сразу несколько алгоритмов Google работают на показ настолько надежных источников информации, насколько это возможно. Когда таких ресурсов недостаточно или система не получила достаточно сигналов о высоком качестве материалов, алгоритм автоматически показывает рекомендации по контенту с советами о способах поиска, которые помогут найти более полезные результаты.
Система разнообразия сайтов
Благодаря действиям этого алгоритма в топе Google показывает страницы разных сайтов в выдаче. В редких случаях возможно попадание в топ двух и более страниц одного сайта: например, когда они определяются как особенно релевантные запросу.
То же касается и поддоменов: в большинстве случаев поддомены рассматриваются алгоритмом как часть корневого домена, но иногда возможно определение поддомена как отдельного сайта.
Система обнаружения спама
Google борется со спамом в сети, так как он мешает формировать релевантную выдачу по запросам пользователей. Системы Google, в том числе SpamBrain, регулярно обновляются, чтобы находить контент, который нарушает правила.
Устаревшие системы
Некоторые алгоритмы перестали действовать как самостоятельные системы. Теперь они либо часть какой-то новой системы, либо включены в основной алгоритм ранжирования. К ним относятся Hummingbird, Mobile‑friendly, Page speed, «Панда», «Пингвин», «Безопасные сайты».
Комментарий эксперта:«Отличный гайд для систематизации всех сведений по системам ранжирования Google. Несмотря на то, что механизмы работы каждой составляющей алгоритма в документе не описываются подробно, руководство будет полезно для начинающих SEO-специалистов и веб-мастеров, которым необходимо быть в курсе всех последних изменений в работе поисковой системы».
Главный технолог SEO-эксперт компании SEO.RU
Полина Маенкова