|
Хотите помочь
мне и сайту? Нажмите,
пожайлуста на все 7
ссылок внизу, и
откроются 7 новых окон,
подождите пока
страницы загрузится
полностю и вы можете
их выключать. Они вам
не приченят никакого
вреда, а только вам
будет большая
благодарность от меня
и сайта. Ссылка Ссылка Ссылка Ссылка Ссылка Ссылка Ссылка.
|
|
Как сделать,
чтобы Rambler находил мои
документы?
|
Дмитрий Крюков, 30 июня
1998
Источник: http://www.rambler.ru/
Данный документ
описывает общие принципы,
относящиеся только к
поисковой системе Rambler.
Возможно, некоторые
положения этого документа
будут не соответствовать
аналогичным принципам
других поисковых систем,
следовательно,
использовать их нужно с
осторожностью.
Сами принципы
достаточно просты. Вот они:
- Прежде всего
рекомендуем заполнить
регистрационную
анкету в поисковой
системе Rambler, анкета
находится по адресу http://www.rambler.ru/new/add_site.shtml.
Это будет гарантией
того, что по крайней
мере, эта анкета будет
найдена при
соответствующем
поиске, и по ссылке из
нее человек сможет
попасть на ваш сайт.
Рекомендуется также
проделать это в случае,
если ваши странички
располагаются на
зарубежных сайтах.
Роботы Rambler сканируют
сайты, находящиеся в
рамках Содружества и
игнорируют остальные
зарубежные сайты.
Определение
принадлежности сайта
производится по
формальному признаку -
домену первого уровня
в URL сайта.
- В случае, если ваш сайт
находится за рубежом,
но существенная часть
сайта содержит
русскоязычные
материалы, или если
ваш сайт находится в
пределах содружества,
но входит в другие
домены первого уровня
( .com .org .net и пр.), вы
можете отослать
письмо на адрес webmaster@stack.net
с просьбой включить
ваш сайт в число
сканируемых. Наши
сотрудники рассмотрят
эту просьбу и примут
решение о
целесообразности
такого включения.
Пожалуйста, не стоит
обращаться с
подобными просьбами,
если ваши странички
располагаются на
зарубежных публичных
сайтах, таких как: geocities,
tripod, aol, xoom, netcom, hypermart
и других, подобных
этим. Роботы Rambler не
сканируют эти сайты.
Не следует также
обращаться с такими
просьбами, если в
качестве URL вы укажите
один из адресов-редиректоров,
например *.da.ru. Однако
это не мешает вам
заполнить анкету - см.
предыдущий пункт.
- Роботы Rambler при
сканировании
игнорируют поля <meta...keywords=...>.
Это связано с тем, что
наша система
старается
индексировать
документ таким, как
есть, а не таким, как
хочет владелец. Не
секрет, что зачастую
владельцы документов
злоупотребляют этими
полями в документе, с
тем, чтобы их
документы обязательно
находились по словам,
при этом часто
реальное содержание
документа не
соответствует данным
критериям.
- Не следует также
использовать
невидимый текст на
страничке (т.е. шрифты,
цвет которых
соответствует цвету
background). Комментарии в
документе роботы Rambler
тоже не сканируют, по-этому
советуем использовать
их по прямому
назначению. Помните,
что каждый
комментарий
увеличивает размер
вашего документа, а
значит снижает
вероятность того, что
в каком-нибудь
конкретном случае
документ будет
просмотрен до конца.
Обычно это делают с
той же целью, которая
указана в предыдущем
пункте.
- Базовые понятия и
ключевые слова для
данного сайта следует
включать в HTML тэги (в
порядке значимости):
- <TITLE>
- <H1-..H6>
- <ADDRESS>
- <B>, <STRONG>
Чем чаще слово
встречается в
комбинации этих полей,
тем более вероятно,
что поисковая система
Rambler найдет ваш
документ ближе к
началу списка
результатов поиска.
Конечно,
использование этих HTML
тэгов должно
органично сочетаться
с дизайном вашего
сайта. Кроме того, чем
ближе располагается
поисковое слово к
началу документа, тем
больше весовой
коэффициент данного
слова.
- Не следует включать в
список желаемых
ключевых слов
общеупотребительные,
часто встречающиеся
слова, такие как сервер,
html, ru, страница и
другие. Ваши слова
должны быть
достаточно
информативными (в
идеале уникальными).
Не следует также
ориентироваться на
слова, состоящие из
одних цифр. В
настоящий момент
поисковая система Rambler
игнорирует такие
слова. Возможно, в
будущем это будет
изменено, но на
сегодня это именно так.
- С точки зрения поиска
использование фреймов
в документе не
приветствуется. Это не
означает, что роботы
не умеют сканировать
фреймы. Это означает
только то, что
отсканированный
отдельный фрейм не
может дать
представление о целом
документе. Данное
замечание не
отностится к случаю,
когда фреймы в
документе
используются
исключительно для
удобств навигации.
Роботы Rambler прекрасно
справляются с
конструкциями фреймов,
однако мы советуем
включать в текст таких
документов HTML тэг
<NOFRAMES> с
последующим описанием
документа и ссылками.
Разумеется, это
увеличит размер
странички, но будет
являться актом "доброй
воли" к
пользователям
текстовых браузеров (например
lynx) и поисковым
машинам.
- Поисковый сервер Rambler
автоматически
исключает из индекса
слова, встретившиеся в
более чем 800 тыс.
документов. Такие
слова не являются
информативными для
поиска, и в 99,9% случаев
можно обойтись без них.
- При указании
перекрестных ссылок в
документе будте
предельно внимательны,
проверьте
работоспособность
каждой ссылки, иначе
роботы не смогут
добраться в глубь
дерева ваших
документов. Следует
также иметь ввиду, что
с точки зрения HTML
записи типа:
- <a href="directory"....>>
и
<a href="directory/"....>>
(слэш в конце href)
являются разными
ссылками. Обычно при
запросе по первой
ссылке робот получит
редирект на вторую, а
значит извелечет сам
документ только на
следующем проходе при
обращении к Вашему
серверу. Тем самым вы
замедляете время
индексации вашего
сайта.
- Максимальный размер
документа для роботов
Rambler составляет 200KB.
Документы большего
размера отсекаются до
указанной величины.
Кроме того, считается
"дурным тоном"
делать документы
такого размера без
особой на то
необходимости.
- Роботы Рамблер
обрабатывают ссылки
типа <a htef="/cgi-bin/imagemap...">,
однако наряду со
ссылкой такого вида мы
рекомендуем поместить
в текст документа
конструкцию <map name="name">.
Это ускорит
индексацию документов,
указанных в IMAGEMAP и
облегчит доступ к
документам для
обычных браузеров.
- Часто изменяющиеся (динамические)
документы
рекомендуется
исключить из списка
индексируемых, т.к.
актуальность этих
документов быстро
теряется. Осуществить
это можно с помощью
стандартного для HTTP
механизма -
посредством файла robots.txt
в головной директории
вашего сайта.
- Части документа, не
требующие по вашему
мнению индексации,
можно отделять в
документе с помощью
тэгов <index>....<noindex>
- При написании
документов
внимательно следите
за соблюдением
русского/латинского
регистров. Часто
вместо русской буквы 'р'
используют латинскую
'p'. Некоторые подобные
ошибки индексатор
исправляет, но не все.
Слова с подобными
опечатками теряют
информативность.
Старайтесь не
использовать символов
переноса части слова
на другую строку '-'.
Это затрудняет
определение того,
является ли начало
следующей строки
продолжением слова
или просто дефисом.
Помните, что браузер
сам осуществляет
представление
документа согласно
текущим установкам
каждого конкретного
пользователя.
- Отнеситесь серьезно к
планированию и
размещению вашего
сайта, чтобы вам не
приходилось
направлять письма с
просьбами
переиндексировать Ваш
сайт администраторам
поисковых систем в
связи с их переносом
или полным изменением
структуры. Поисковые
машины - вешь
достаточно
инерционная для этого.
Желаю успехов!
Источник: http://www.izcity.com/
|
Копирование и
использование данных
материалов разрешается только
в случае указания на сайт "WEBMASTER" как на источник
получения информации, при этом
во всех ссылках обязательно
явное указание адреса вэб-сайта
http://www.wmzone.narod.ru/ .
Вебмастер: Sergey
Nikitin
E-mail: webpredator@ukr.net
|