Наверх
Open Nav
/
/
Атрибут rel="canonical": гид по использованию
В тренде

Атрибут rel="canonical": гид по использованию

01.08.2022 Время прочтения: 17 минут

Дата обновления: 18.08.2022

Полина Маенкова

Автор статьи: Полина Маенкова, главный технолог SEO-эксперт компании SEO.RU

Что такое канонические страницы?

Начнем с определений.

Что такое каноническая страница? Это страница, которая для поисковых систем является главной среди всех остальных с похожим контентом.

Например, на сайте есть карточка товара — телевизора 66 с таким URL:

продавец-техники.ру/крупная-бытовая-техника/телевизоры/телевизор66

При определенных настройках настройках CMS открыть ее можно не только напрямую, но и, например, из раздела акций или Smart TV. Тогда у одного телевизора 66 будет несколько URL-адресов — и из них нужно выбрать оригинальную:

продавец-техники.ру/акции/телевизоры/телевизор66

продавец-техники.ру/smart-tv/телевизор66

продавец-техники.ру/доступно-в-рассрочку/телевизоры/телевизор66

Фильтры — не единственное, что генерирует такие клоны: мобильная версия, AMP и Турбо, пагинация и многое другое способно запускать технику клонирования.

Что такое каноническая ссылка? Это ссылка, содержащая атрибут link rel="canonical" и указывающая путь к канонической странице.

Каноническая ссылка размещается на неканонических страницах. Если предельно упростить, неканоническая отказывается от статуса канонической с помощью ссылки. Как бы передает его посредством размещения URL страницы-преемницы с атрибутом rel="canonical".

Атрибут rel canonical

Если объяснения не помогли, а делать что-то нужно, закажите SEO-аудит у профессионалов: вы получите подробный перечень рекомендаций по улучшению всех сторон сайта.

Как указать канонический адрес?

Задать каноникал можно несколькими способами.

Использование готовых плагинов CMS

Некоторые CMS содержат внутренние решения для указания каноникал.

В Wordpress можно использовать YoastSEO — это бесплатный плагин, который поможет решить и другие задачи поисковой оптимизации.

YoastSEO canonical

Для движка OpenCart разработано расширение SEO Canonical Links — правда, оно платное (20$):

OpenCart SEO Canonical Links

Для X-Cart — модуль SEO Ultimate (тоже платный — $59.00):

X-Cart SEO Ultimate

А для системы PrestaShop есть модуль Canonical SEO URLs + Google Hreflang Pro (за 69,99€ в год):

PrestaShop есть модуль Canonical SEO URLs Google Hreflang Pro

Если сайт реализован на система Joomla!, указать атрибут можно с помощью расширения Custom Canonical:

Joomla Custom Canonical

В Битриксе настройку canonical можно провести без установки дополнительных модулей— достаточно отметить соответствующую опцию в компоненте:

Bitrix Canonical

Внутренние функции CMS для работы с канониклами — это простой метод: не нужно перебирать строки кода каждой из неканоничных страниц.

Однако это не самый надежный способ: после использования средств движка или плагинов, стоит проверить наличие canonical и корректность работы.

Добавление элемента link в HTML-код

Этот способ — самый популярный. В HTML-код документа, внутри тега <head> нужно добавить элемент link rel="canonical".

В коде страницы это выглядит так:

link canonical внутри тега head html кода

Каноническую ссылку нужно разместить в коде каждой дублирующихся страниц.

HTTP-заголовок

Как использовать canonical для канонизации ссылок на электронные документы (docx, pdf, xlsx и др.)?

Для подобных документов проблема дублирования тоже актуальна: один файл может быть доступен с нескольких URL-адресов. Эти форматы не подразумевают раздела <head>, как HTML-документы, поэтому и способ нужен другой.

Чтобы избежать атаки клонов и вытекающих последствий, нужно указать главный адрес посредством HTTP-заголовка с применением .htaccess или PHP.

Когда запрашивается дублирующийся файл, сервер должен перенаправлять на основной. На примере нашего примера с телевизорами — добавим ссылку на инструкцию:

HTTP/1.1 200 OK
Content-Type: manual/pdf
Link: <http://продавец-техники.ру/телевизор66/canonical-tags/>; rel="canonical"

Файл Sitemap

Файл Sitemap содержит ссылки, которые подлежат индексации, поэтому все указанные в карте сайта адреса имеют статус канонических. Не нужно указывать атрибуты или прописывать специальные теги. Главное — отследить, чтобы в файле sitemap.xml не было ссылок на дублирующиеся страницы. Иначе краулеры не смогут сориентироваться и правильно проиндексировать сайт.

Для чего используются канонические ссылки?

Главная задача использования каноникал — устранить риск попадания дублей страниц в индекс поисковых систем, чтобы они не засоряли выдачу.

Читайте по теме: Как найти и удалить дубли страниц на сайте? Инструкция

По этой причине поисковые системы борются с дублями: схожесть контента дает краулерам основания считать сайт непригодным для топа. Сайт начинает терять места в выдаче, снижается уникальность всего контента, из-за расплодившихся URL появляются проблемы с индексацией, создается внутренняя конкуренция между документами. Страницам даже необязательно быть совсем одинаковыми: когда бот видит несколько похожих вариантов наполнения, он может интерпретировать это как сигнал некачественного сайта. Но он может выбрать и добавить в индекс совсем не тот URL, который нужен в выдаче. Тут, правда, стоит отметить, что canonical для Яндекс и Гугл — это не прямая директива, а лишь рекомендация, и боты все равно могут включить в поиск другую страницу.

Однако указание canonical помогает избежать многих проблем при продвижении сайта.

Откуда берутся дубли страниц в индексе ПС?

Причин, по которым один и тот же контент доступен по разным URL-адресам, много. В некоторых случаях существование близнецов оправдано — то есть здесь нет никакой ошибки. В других же появление дублей сигнализирует о некорректной настройке сайта.

  1. Дубли по структуре.

В начале статьи мы приводили пример с URL карточки товара в магазине телевизоров и разными способами перейти к ней. Речь может идти не только о временных разделах типа акций, но и о постоянных разделах категорий.

  1. Страницы с GET-параметрами.

Источников появления параметрических страниц в индексе поисковых систем очень много (особенно это актуально для больших e-commerce сайтов):

  • Страницы сортировки товаров (по убыванию/возрастанию цены, по популярности и т.д).
  • Страницы результатов поиска по сайту (чаще всего содержит параметры s или q).
  • Страницы фильтров по категориям.
  • Ссылки с UTM-метками, которые используются для отслеживания переходов по рекламным источникам.

  1. Не настроен корректный ответ сервера для несуществующих URL.

Если на сайте не настроена страница 404, то любые вариации URL, которых нет в структуре сайта, будут отдавать ответ 200 ОК, т.е. будут доступны для поисковых роботов. Вероятнее всего, контент таких страниц будет дублировать содержимое каких-то существующих документов, например, страницу каталога.

Rel=canonical или 301 редирект?

Каноникал и 301 редирект передают поисковикам принципиально разные сигналы:

  • Rel canonical — это главная среди похожих: существует много URL с одинаковым или похожим контентом, но есть одна, которую нужно индексировать. Доступна и оригинальная страница, и ее сестры-близнецы.

    Поэтому использование тега оправдано, когда все URL-адреса нужно сохранить доступными.

  • 301 редирект — это новая взамен старой: существует одна страница, но не по старому, а по новому адресу, и именно новую версию нужно индексировать. Контент по оригинальному URL больше не доступен, его поисковая система исключает из индекса.

    Настройка 301 редиректа нужна, когда старая страница окончательно удалена и взамен ее создана новая.

Сходства этих двух вариантов заключаются в том, что и 301 редирект, и каноникал передают сигналы ранжирования от одной страницы к другой. Под сигналами ранжирования здесь имеется в виду ссылочный вес страниц и поведенческие факторы (хотя последнее представители поисковых систем официально не подтверждают).

Частые ошибки

  • Ошибка в написании канонического URL.

В HTML-коде важен каждый символ — из-за лишнего или недостающего заданный параметр не будет работать. Если canonical не работает, в первую очередь нужно проверить корректность его написания: все ли слеши указаны, корректный ли протокол (HTTP/HTTPS), полная ли ссылка.

  • Два и более атрибута rel=canonical.

В этом случае поисковой бот может проигнорировать обе версии. Краулеры Google не смогут понять, какая из страниц является основной, и канонизируют URL по другим сигналам.

  • Каноническая ссылка ведет на страницу с 301 или 404 ответом.

При таком сценарии канонической становится страница, которая уже должна быть удалена из индекса и с которой уже настроено перенаправление на новую. Из-за этого боты могут путаться и неверно истолковывать изначальный замысел. Лучше сразу канонизировать новую страницу.

Если каноническая ссылка ведет на URL с 404 ошибкой, сигнал канонизации просто никуда не передается и нигде не учитывается.

  • Размещение rel="canonical" в секции body.

Это ошибка по невнимательности, сродни первому пункту. Атрибут rel = "canonical" работает только в tag <head> или в HTTP-заголовке.

  • Каноничная страница закрыта от индексирования.

Если каноничная страница закрыта от индексации в файле robots.txt или с помощью директивы noindex в теге , краулер не будет сканировать ее, и страница не попадет в поисковую выдачу. Зато в таком случае в поиск может попасть ее дубль.

  • Каноничная страница не имеет входящих ссылок.

Каноническая страница без внутренних входящих ссылок недоступна для пользователя. Значит, он перейдет на неканонический вариант и атрибут канонизации не сработает.

  • Неканонические страницы в файле sitemap.xml.

Как описано ранее, все ссылки в Sitemap по умолчанию считаются подлежащими индексации. Неканоническим URL там не место.

Self-referential canonical

Атрибут rel="canonical" можно применять на самого себя: то есть канонизировать не какую-то другую страницу, а основную. Даже если на сайте нет ни дублированных, ни похожих страниц, данный URL-адрес будет индексироваться поисковыми ботами.

Кроме того, Джон Мюллер из Google рекомендует использовать самоссылающиеся каноникал из-за возможных разночтений версий в нижнем и верхнем регистре, а также при написании адресов с www и без них.

Пусть другие тоже знают!

Еще на эту тему

Другие интересные статьи

Сколько стоит контекстная реклама в Яндекс и Google? Прогноз бюджета на рекламу
Сколько стоит контекстная реклама в Яндекс и Google? Прогноз бюджета на рек ...
Узнайте, из чего складывается стоимость контекстной рекламы....
14.03.2023 65005
Что такое GIT и как он работает?
Что такое GIT и как он работает?
Git (от англ. – Global Information Tracker) – это си...
10.07.2018 28187
Как перенести сайт на новую CMS без ущерба для SEO
Как перенести сайт на новую CMS без ущерба для SEO
Благое намерение перенести сайт на хорошую CMS может выстели...
13.02.2023 458
Оставить заявку Оставить заявку