Структура XML Sitemap
XML Sitemap — стандартизированный формат (протокол sitemaps.org). Базовая структура: элемент urlset содержит набор url-элементов с обязательным тегом loc (URL страницы) и опциональными lastmod, changefreq, priority.
Теги и их значение
loc (обязательный)
Абсолютный URL страницы. Должен совпадать с canonical URL. Кодируйте специальные символы: & → &
lastmod (рекомендуемый)
Дата последнего изменения в формате W3C Datetime. Google использует этот тег для определения приоритета обхода. Указывайте только реальную дату изменения — не генерируйте её автоматически как текущую дату.
changefreq и priority
Google официально игнорирует эти теги. Яндекс учитывает changefreq. Можно включить для совместимости с другими поисковиками, но не надейтесь на них в работе с Google.
Sitemap Index
Для сайтов с более чем 50 000 URL создайте индексный файл, ссылающийся на несколько карт. Максимальный размер одного файла: 50 МБ несжатого XML.
Специализированные Sitemap
- Image Sitemap — для новостей и фото-сайтов
- Video Sitemap — помогает индексировать видео
- News Sitemap — для новостных сайтов (статьи за последние 48 часов)
- hreflang Sitemap — для многоязычных сайтов
Лучшие практики
- Включайте только канонические, индексируемые URL
- Обновляйте lastmod при реальных изменениях контента
- Используйте сжатие gzip (.xml.gz) для экономии полосы
- Отправляйте Sitemap через Search Console и Яндекс.Вебмастер
- Добавляйте ссылку на Sitemap в robots.txt
