Использование файла Sitemap
Sitemap
— это файл со ссылками на страницы сайта, который сообщает поисковым системам об актуальной структуре сайта. Яндекс поддерживает форматы XML и TXT. Формат XML позволяет передавать дополнительную информацию.
Примечание
Яндекс не гарантирует, что все указанные в файле URL попадут в результаты поиска.
В каких случаях нужен файл Sitemap
Яндекс разрабатывает специальные алгоритмы, по которым индексирующий робот узнает о сайте. Например, с помощью внутренних и внешних ссылок — переходя с одной страницы на другую. Иногда робот может пропустить страницы. Используйте Sitemap
, если на сайте:
- большое количество страниц;
- отдельные страницы без навигационных ссылок;
- глубокая вложенность.
Поддерживаемые Яндексом форматы
Яндекс поддерживает протокол Sitemap. Чтобы передать информацию, используйте следующие элементы:
Тег |
Обязательно |
Описание |
Да |
Адрес страницы. |
|
Нет |
Дата последнего обновления страницы. |
|
Нет |
Частота изменения страницы. Максимальный размер — 100 байтов. |
|
Нет |
Значимость страницы. Робот загружает страницы поочередно с учетом наличия и значения коэффициента от 0.0 до 1.0. Укажите коэффициент для тех URL, которые наиболее важны для сайта. Максимальный размер — 100 байтов. |
Пример:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.example.com/page1.html</loc>
<lastmod>2005-01-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
...
</urlset>
Используйте этот формат, чтобы сообщить только об адресах страниц.
Пример:
https://www.example.com/page1.html
https://www.example.com/page2.html
Также с помощью Sitemap
вы можете передать информацию о локализованных страницах сайта и об изображениях (см. раздел Справки Яндекс Картинок).
Чтобы передавать в файле Sitemap
информацию о видео, используйте микроразметку и добавьте страницы с видео в Sitemap
.
Внимание
Поиск Яндекса не поддерживает передачу RSS и Atom-фидов с помощью файла Sitemap
.
Требования к файлу
- Используйте кодировку UTF-8. Кириллические URL робот Яндекса распознает как в закодированном виде, так и в оригинале.
- Максимальное количество ссылок — 50 000. Вы можете разделить
Sitemap
на несколько отдельных файлов и указать их в файле индекса Sitemap. - Максимальный размер файла в несжатом виде — 50 МБ.
- Указывайте ссылки на страницы только того домена, на котором будет расположен файл.
- Разместите файл на том же домене, что и сайт, для которого он составлен.
- При обращении к файлу сервер должен возвращать HTTP-код 200.
Как создать файл и сообщить о нем Яндексу
- Определите канонические URL для страниц, которые будут указаны в файле
Sitemap
. Это необходимо, если на сайте есть несколько страниц со схожей информацией. - Выберите формат и с помощью одного из сторонних ресурсов сформируйте файл.
- Проверьте файл с помощью инструмента Анализ файлов Sitemap.
- Укажите ссылку на файл в robots.txt или в разделе Файлы Sitemap Яндекс Вебмастера.
При необходимости вы можете удалить информацию о Sitemap.
Вопросы и ответы
Как организовать Sitemap для большого сайта
Как правило, в Sitemap
принято включать все значимые страницы сайта. Если на сайте множество страниц, вы можете удалить из Sitemap
уже известные Яндексу страницы и вносить в файл только новые или часто обновляющиеся.
Если вы используете файл индекса Sitemap отметьте тегом lastmod файлы Sitemap
, которые часто обновляются.
Определить, какие страницы сайта уже известны Яндексу, можно в Вебмастере на странице Индексирование → Статистика обхода.
Sitemap отображается в сервисе как исключенная страница со статусом «Неверный формат документа»
Отображение файла Sitemap
и других XML-файлов как исключенных страниц носит только информативный характер и никак не влияет на индексирование сайта или обработку Sitemap
.
Файл Sitemap
может отображаться в группе исключенных страниц, так как робот попытался проиндексировать его как обычную страницу. Не смотря на это файлы Sitemap
не участвуют в поиске.
При обработке Sitemap возникла ошибка «Неизвестный тег»
Файл Sitemap
может содержать только определенные XML-элементы. Если Вебмастер обнаружит в файле другие элементы, например, указание на мобильную версию, в Вебмастере появится ошибка «Неизвестный тег». Неподдерживаемые элементы игнорируются роботом при обработке Sitemap
, при этом данные из поддерживаемых элементов учитываются. Поэтому менять файл Sitemap
необязательно.
Если содержимое файла будет изменено, потребуется до двух недель на обновление информации в Вебмастере.
Файл Sitemap находится в статусе «Не проиндексирован»
Файл Sitemap
может быть не проиндексирован по нескольким причинам:
- Робот обошел файл
Sitemap
недавно и еще не успел обработать его. Подождите две недели. Если вы используете файл индексаSitemap
с несколькими файлами, то их обработка может занять больше времени, чем одного файлаSitemap
. - Сайт ранее был недоступен для индексирующего робота. Необходимо дождаться следующего посещения сайта роботом.
- Доступ к
Sitemap
запрещен в файле robots.txt, при обращении кSitemap
сервер возвращает HTTP-код, отличный от 200. Проверьте доступность файла для робота с помощью инструмента Проверка ответа сервера, указав полный путь к файлу.
Если проблема с доступом актуальна, обратитесь к администратору сайта или сервера, на котором он расположен. Если файл составлен корректно, он будет повторно обработан в течение двух недель с момента последнего запроса роботом. Проверить файл можно с помощью инструмента Анализ файлов Sitemap.
Файл Sitemap находится в статусе «Документ не содержит текст»
Такой статус отображается в инструменте Проверка ответа сервера и сообщает, что робот не может проиндексировать файл как обычную страницу сайта и включить его содержимое в результаты поиска. На обработку Sitemap
этот статус не влияет. Чтобы проверить корректность Sitemap
используйте в Вебмастере инструмент Анализ файлов Sitemap.
Файл Sitemap находится в статусе «URL запрещён к индексированию тегом noindex»
Такой статус отображается в инструменте Проверка ответа сервера и сообщает, что файл закрыт от индексирования — как правило, запрет прописан в HTTP-заголовке X-Robots-Tag. Директива запрещает файлу появляться в результатах поиска, но не влияет на обработку содержимого Sitemap
. Чтобы проверить корректность Sitemap
используйте в Вебмастере инструмент Анализ файлов Sitemap.
Sitemap не обрабатывается
Как правило, файл Sitemap
обрабатывается роботом в течение двух недель после добавления его в Вебмастер. Если этого не произошло, проверьте:
-
Что
Sitemap
относится именно к тому сайту, для которого вы добавляете его в Вебмастер. Убедитесь, что адрес сайта совпадает: протокол (HTTP/HTTPS), наличие или отсутствие префикса www. -
Ответ сервера при запросе
Sitemap
. Если доступ кSitemap
запрещен в файле robots.txt или при обращении к нему возвращается HTTP-код, отличный от 200, файл не будет обработан роботом. Если при проверке отображается статус «Запрещен метатегомnoindex
», это не говорит об ошибке. Метатег noindex запрещает включение файла в поисковую базу, но не мешает роботу обрабатывать его содержимое. -
Корректность файла с помощью инструмента Анализ файлов Sitemap. Устраните ошибки, если они обнаружены.
Sitemap составлен корректно и доступен для робота, но не обрабатывается больше двух недель
Какое в Sitemap максимальное число символов для одного URL
Общий лимит символов 2048. Из них 1024 символа — на доменное имя сайта, например https://site.com
. Оставшиеся 1024 символа — на путь к внутренним страницам сайта, то есть для символов, которые идут после доменного имени, например /page_1/page_2/...
.
Ссылка, которая связывает страницы одного сайта. Страницы могут находиться в разных каталогах одного домена или на поддоменах.
Ссылка, которая расположена на другом сайте.