SAPE: Поисковая система и её роботы (самое основное)
  В каталоге 4141 сайтов (проверка 1226)
 Наш поиск  
Скачай себе интернет-пейджер!

3 пользователей на сайте
Добавить ресурс | Добавить RSS канал | Изменить данные | Платные услуги | 10 новых сайтов | 10 лучших сайтов | Гостевая книга | Каталог КПК | Wallpapers

Сервис полуавтоматической и ручной регистрации RSS-лент и блогов www.addrss.ru

Поисковая система и её роботы (самое основное)

Поисковый робот (робот поисковой системы - web-crawler, spider) является неотемлимой частью поисковой системы/машины (web search engine).
Он представляет собой программу со следующими основными функциями:

посещение страницы веб-узлов (сайтов)
индексация содержимого страниц.

Кроме содержимого страниц поисковый робот индексирует и найденные на страницах ссылки на другие веб-ресурсы (именно по-этому для рейтинга вашего сайта важно, чтобы на других веб-сайтах имелись ссылки на ваш ресурс).
Робот может возвращаться на сайт через определенный промежуток времени и заново проиндексировать содержимое сайта (для этого используется тег
<meta name=" revisit-after" content="# days ">, где вместо решётки # указывается количество дней).
Полученная таким образом информация заносится в базу поисковой машины, из которой впоследствии выбирается информация по пользовательскому запросу.

Индекс поисковой системы - это база поисковой машины, которая хранит в себе информацию о проиндексированных поисковым роботом html-страниц, а также файлов других типов, расположенных в каталогах веб-сервера.

Поисковый робот руководствуется инструкциями, получаемыми из файла robots.txt, расположенного в корневом каталоге сайта.

Основные поисковые роботы Рунета

Вернуться назад


Добавить ресурс | Добавить RSS канал | Изменить данные | Платные услуги | 10 новых сайтов | 10 лучших сайтов | Гостевая книга | Каталог КПК | Wallpapers
вопросы-ответы | правила сайта | о нас
Яндекс цитирования Rambler's Top100
Copyright 2006 © Infonew. All rights reserved.