Оптимизация HTML кода для поисковиков

Источник: Webzz

Оптимизация HTML кода для поисковиков..
Зачем это нужно и как это делать, я попытаюсь объяснить наиболее доступно. Если Вы чувствуете, что не понимаете хотя бы 20% этой статьи, то могу посоветовать скачать учебник по HTML. За последние 3-4 года поисковые системы очень сильно изменились. Причина этого - резкий рост количества web-сайтов. Прежние методы ранжирования результатов поиска не дают возможности расставить ресурсы в правильном порядке, необходим более точный инструмент для определения релевантности страницы. Что такое релевантность? Говоря простым языком - это соответствие найденной web-страницы введенному запросу. Каждая поисковая система имеет несколько роботов, которые постоянно ходят по Сети, переходя со страницы на страницу по ссылкам, за это их и называют пауками. По сути дела это просто программа, которая сохраняет в базы данных поисковой системы части HTML кода страниц.
Далее полученная информация обрабатывается(индексируется), согласно алгоритмам расчета релевантности и становится доступной для поиска. Естественно у каждой системы свои уникальные алгоритмы, которые к сожалению держатся в секрете. Основываясь на личном опыте, я попытаюсь рассказать на что нужно обращать внимание при оптимизации HTML кода. Но сначала хочу заметить, что существует еще один критерий, влияющий на выдачу результатов поиска - индекс цитирования.
Теперь к делу. Первое, что ищет робот, прейдя на сайт - это файл robots.txt, расположенный в корневом каталоге общедоступных документов. Если он его там не найдет - ничего страшного не случится.

Содержание robots.txt :
1. Строка "User-Agent:" после двоеточия перечисляется список роботов, к которым вы хотите обратиться.
2. Строка "Disallow:" - собственно обращение, вернее запрет на индексацию указанных после двоеточия директорий или
документов. Нужно указывать абсолютный путь, например: если надо запретить индексацию директории http://site.ru/secret/ ,
то строка будет выглядеть так -
Disallow: /secret/
Пока сайт не оптимизирован или полностью не готов, следует запретить его индексацию всем роботам. Соответственно robots.txt будет выглядеть так -

User-Agent: *
Disallow: /

Далее робот индексирует главную страницу и все остальные, на которые нашел ссылки (но не более 500 страниц за один раз).
Теперь рассмотрим сам HTML код. Прежде всего - это заголовок (то что между тегами <title></title>). Ему надо уделить много внимания, так как поисковые системы придают заголовкам большое значение при подсчете релевантности (особенно Яndex). Не
стоит здесь писать url вашего сайта - для этого есть адресная строка. Необходимо коротко и ясно отразить тему страницы, только не надо повторять одно и тоже много раз во всех падежах.
Допустим вы продаёте холодильники. Во многих магазинах я видел следующий заголовок <title>.::Super Shop::. Интернет магазин. Любые товары - на любой вкус.</title>
Неужели, люди ищущие это средство будут искать интернет магазин, а не само средство. Более разумным был бы такой заголовок: <title>Холодильники. Большой выбор.</title>

Далее я приведу meta теги, которые так же должны располагаться вверху, внутри тега <head> на мой взгляд это обязательные
теги.

<meta name="description" content="Описание">
<meta name="keywords" content="ключевые слова">
<meta name="resource-type" content="Document">
<meta name="document-state" content="Dynamic">
<meta name="robots" content="ALL">
<meta name="revisit-after" content="14 days">
<meta http-equiv="Pragma" content="no-cache">

Тег "description" - очень важный тег. Именно его увидят пользователи в результатах поиска и решат, посещать ли ваш сайт. В данном случае я бы написал: "Холодильники из европы по низким ценам. Бесплатная доставка."

Тег "keywords" - сильно влияет на релевантность страницы. В него нужно включать 7 - 10 слов (не больше) по которым пользователи ищут в поисковых системах информацию, аналогичную вашей. Не надо повторять одни и те же слова по нескольку раз - это не повлияет на релевантность. Слова пишите без запятых - через пробел, чтобы поисковая система могла сама
составить из них словосочетания. В тоже время старайтесь слова, составляющие наиболее популярные поисковые запросы, ставить рядом. И самое главное! в "keywords" не должно быть слов, которые не встречаются нигде на странице - это очень распространенная ошибка, которая приводит к снижению релевантности страницы.

В теге "revisit-after" не указывайте меньше 9 дней, это может не понравиться роботу.

Далее, сразу (или почти сразу) после тега <body> должен располагаться логотип и/или заголовок. В поле "alt" логотипа укажите два-три слова, которые присутствуют и в заголовке и в "keywords" (по которым мы и оптимизируем страницу). В нашем примере это будет "средство от облысения". Заголовок должен быть аналогичный и обязательно между тегами <h1></h1>. Если
такой громоздкий заголовок не вписывается в концепцию дизайна, то его размер и цвет можно изменить в таблице стилей (CSS), главное чтобы заголовок оставался заголовком и выделялся на странице.

Если CSS расположить в отдельном файле то h1 можно придать любой внешний вид, вплоть до невидимости на странице. Паук не заметит подмены свойств (по крайней мере пока он этого делать не научился), но ходят упорные слухи что Google скоро прикроет и эту халяву :)) В любом случае не стесняйтесь использовать CSS, если надо придать заголовку более компактный вид
- это не будет считаться спамом. Но и не переборщите с количеством заголовков: 2-3 максимум, иначе вас исключат из базы данных поисковой системы. Если слово не из списка ключевых, не заключайте его в теги <b> или <strong>, используйте их только при выделении ключевых слов. А как тогда выделять заголовки или пункты меню, не содержащие keywords ? Ответ простой
- используйте CSS. Старайтесь придерживаться частоты ключевых слов в 2%-7% и располагайте их как можно выше. Большую страницу, разбивайте на более мелкие (поисковым системам это нравится). Хотя общее количество страниц сайта, соответствующих запросу не сильно влияет на его положение в результатах поиска, все же лучше много небольших страниц, чем мало больших :). Не используйте фреймы - роботы их не "видят". Если без фреймов не обойтись, то описание сайта поместите в тег <noframes> хоть это сильно не поможет... Элементы ImageMaps тоже мешают индексации.
Используйте стандартные HTML ссылки <a href=http://site.ru>Site</a>. И последнее - чужую рекламу, скрипты и коды
счетчиков заключайте в теги <noindex></noindex>, чтобы робот их не индексировал.


Страница сайта http://185.71.96.61
Оригинал находится по адресу http://185.71.96.61/home.asp?artId=9883