Три подхода в использовании системы Google Sitemaps (исходники, download)Источник: vitaweb Титус Хоскинс, Перевод: Демьянчук Виталий
Недавно компанией Google был представлен новый механизм упрощающий индексацию сайта, при помощи которого любой веб-мастер может создавать так называемую карту сайта и предлагать её для индексирования в Google. Эта система получила соответствующее название Google Sitemaps (Sitemap - карта сайта). Для того, чтобы наиболее эффективно использовать технологию Google Sitemaps на вашем сайте, вы должны иметь специальным образом сгенерированный XML-файл для отправки информации об изменениях страниц непосредственно в Google. Сегодня RSS в быту можно перевести как "Really Simple Syndication - действительно простая трансляция", но разработчики этого формата расшифровывают аббревиатуру RSS как "богатая сводка информации о сайте". XML - это, примерно, настолько же простой код, как и HTML. Самая распространённая сфера применения XML - RSS-ленты новостей, которые доставляют определённого рода информацию о сайте заинтересованным лицам. В нашем случае заинтересованным лицом является Google. При создании файла XML для системы Sitemaps Google как бы просит веб-мастеров сообщать об изменениях на сайте, фактически, веб-мастер выполняет работу Googlebot'а. Это очень полезная вещь! В Интернете постоянно появляется очень много новых сайтов. Индексирование всего того материала, что появляется каждый день, - довольно тяжёлая задача для Google. При помощи сервиса Sitemaps, веб-мастеры сегодня могут быть уверенными в том, что их веб-сайт будет обязательно проиндексирован. Будьте добры, заметьте, что использование сервиса Sitemaps НИКАК не может повлиять на ваши показатели в самом поиске. Вы будете продолжать борьбу со своими конкурентами за высокие позиции результатов выдачи запрошенной информации. Однако Sitemaps поможет вам быть уверенным в том, что все ваши страницы будут быстро проиндексированы и переиндексированы поисковой системой Google. Существуют также и другие весомые преимущества использования сервиса Google's Sitemaps: в основном они выражаются в управлении некоторыми ключевыми переменными, атрибутами и тегами в файле XML. Попытаюсь объяснить это максимально понятно: технология Sitemaps реализуется в одном файле с расширением .xml, который находится в корне вашего сайта. XML-файл сайта содержится небольшой код, описывающий каждую страницу вашего сайта. Вот небольшой пример:<?xml version="1.0" encoding="UTF-8"?> В начале документа содержится информация о файле, а также XML-код. Весь код, описывающий одну страницу, заключается между тегами <url> в начале и конце одного XML-блока, который отвечает за одну страницу. Давайте посмотрим на стандартные элементы любого XML-файла, который необходим для корректной работы сервиса Google Sitemaps:
location - http://www.yoursite.com - адрес страницы сайта priority - здесь вы устанавливаете приоритет конкретной страницы над другой страницей. Почему же это так важно? last modified - дата последнего изменения страницы. Данная отметка позволяет избежать переиндексирования тех страниц, которые не были изменены с момента последнего визита поисковой системы. change frequency - этим параметром вы говорите Google, как часто вы делаете изменения на этой странице. Для этого параметра есть опции: Never - никогда, weekly - еженедельно, daily - ежедневно, hourly - ежечасно и так далее. Если вы часто обновляете страницу, то этот параметр очень важен. Зачем мне нужен XML-генератор? Как показывает практика, XML-файл на вашем сайте необходимо постоянно обновлять. Следовательно, для сохранения драгоценного времени вам нужен генератор, который мог бы просканировать страницы вашего сайта, составить список всех адресов страниц, а затем отправлять этот файл Google. Помните, что Google также предоставляет вам возможность отсылки и обычного текстового файла со всеми адресами страниц вашего сайта. К текущему моменту существует большое количество генераторов, программ которые могут составлять XML-файлы карты сайта. Пока вы читаете эту статью, в Мире с каждой минутой их становится всё больше и больше. Для вашего удобства, мы опишем здесь 3 различных подхода по уровню сложности, благодаря которым вы можете сгенерировать XML-файлы карты сайта. Очень сложный подход: генератор на Python Если вы знаете ваш сервер, как свои 5 пальцев, и вы не испытываете труда в установке скриптов, то тогда слово "сложность" - это ничто для вас. Google предоставляет небольшой скрипт генератора, который вы можете загрузить отсюда: ссылка на генератор. и установить на ваш сайт. Он будет автоматически сканировать директорию вашего сайта, наполнять ваш XML-файл содержимым, а затем отправлять его в Google. Для работы этого скрипта необходим Python версии 2.2, который должен быть установлен на вашем веб-сервере. Однако его трудно найти на многих веб-серверах. Но если вы отличный специалист, то использование этого метода - самый лучший вариант. Ваш не нужно иметь аккаунта в Google для использования сервиса Sitemaps, но всё-таки желательно его получить, т. к. в данном случае вы сможете получать статистическую информацию о вашем сайте. Если вы уже имеете другой аккаунт в системе Google: будь то Gmail, Google Alerts и так далее, - просто используйте какой-нибудь из них для входа и следуйте указаниям оттуда. Сложный: генератор на коде PHPЭто генератор, написанный на коде PHP, который вы можете загрузить на ваш сервер. Данный генератор проиндексирует ваш сайт и предоставит вам сгенерированный XML-файл карты сайта. Загрузить PHP-скрипт можно отсюда: Загрузить phpSitemapNG. Закачайте этот файл на ваш сервер, запустите генератор для того, чтобы создать XML-файл и отправить его в Google. Опять же, эта задача не покажется трудной, если вы хорошо разбираетесь в PHP и настройке скриптов. Простой подход: бесплатный онлайновый генераторЭти генераторы можно найти везде, и Google содержит список этих "сторонних собирателей" на своём сайте. Найти их можно здесь: http://code.google.com/sm_thirdparty.html. Самый простой в использовании - это http://www.xml-sitemaps.com: (желательно использовать сервис: http://www.sitemapspal.com/, т к. на момент перевода статьи вышеупомянутый севрис был не доступен - прим. переводчика) вы можете индексировать до 500 (2000 страниц - http://www.sitemapspal.com/) страниц этим онлайновым генератором за довольно короткий промежуток времени. Робот проиндексирует ваш сайт, создаст XML-файл, который вы можете загрузить в сжатом или несжатом виде, сделав небольшие изменения, такие как установка приоритетов, смена частоты и т. д. Затем загрузите этот файл на ваш сайт с именем sitemap.xml в корневую директорию, т. е. туда, где находится главная страница вашего сайта. Дайте знать системе Google Sitemaps о вашем XML-файле. Больше ничего не нужно. Конечно, есть один недостаток: если вы часто добавляете страницы на ваш сайт, вам придётся также добавлять в ваш XML-файл карты сайта новые строчки. Однако это действительно большая проблема только для тех, кто каждый день добавляет новые страницы на сайт. Здесь вам только поможет знание таких технологий, как Python или PHP, чтобы всё это делать автоматически. Google - главная поисковая система Интернета, так что возможность обновлять информацию о ваших страницах, используя систему Google Sitemaps, очень важный шаг. Если вы хотите, чтобы ваш сайт был конкурентоспособным, это фактически самый мудрый способ добиться вашей цели. В каталоге Download Вы можете найти другие полезные материалы - утилиты, программы, документацию, исходники, электронные книги. Если Вы обнаружили неработающую ссылку, пожалуйста, помогите другим посетителям и администратору каталога Download - сообщите об этом редактору. |