Текущая версия |
Ваш текст |
Строка 213: |
Строка 213: |
| | | |
| === Процесс индексирования === | | === Процесс индексирования === |
− |
| |
− | Индексация — это процесс, во время которого поисковые роботы посещают сайты, собирая с их страниц разнообразную информацию и занося ее в специальные базы данных. Потом эти данные обрабатываются, и строится индекс — выжимка из документов. Именно по индексу поисковая система
| |
− | ищет и выдает ссылки на сайты, исходя из запросов пользователей.
| |
− |
| |
− |
| |
− | Рассмотрим процесс индексирования на примере поисковой системы Яндекс.
| |
− |
| |
− |
| |
− | В поисковой системе есть 2 типа роботов: быстрый (быстро-робот) и основной. Задача основного робота — индексация всего контента, а быстрого —
| |
− | занесение в базы данных самой свежей информации. Планировщик поискового робота составляет маршруты посещения и передает его «пауку», который ходит по выбранным страницам и выкачивает из них информацию. Если во время индексации в документах обнаруживаются новые ссылки, они добавляются в общий список.
| |
− |
| |
− |
| |
− | При первом посещении «паук» проверяет состояние ресурса. Если его характеристики подходят под требования Яндекса, сайт заносится в базу.
| |
− | При повторном посещении «пауком» уже проиндексированной страницы происходит ее обновление.
| |
− |
| |
− | [[Файл:Indexyandex.png]]
| |
− |
| |
− | Документы в индекс попадают следующими способами: автоматически, когда поисковый робот сам переходит по внешним и внутренним ссылкам, либо
| |
− | если владелец сайта сам добавил URL через специальную форму или через установленную на сайте Яндекс.Метрику. Этот сервис передает URL страниц
| |
− | на индексацию Яндексу. При необходимости в интерфейсе Метрики можно отключить данную опцию.
| |
| | | |
| === Скорость индексации и обновления страниц === | | === Скорость индексации и обновления страниц === |