Паук (программа)

Паук (программа)

Поиско́вый ро́бот («веб-пау́к», краулер) — программа, являющаяся составной частью поисковой системы и предназначенная для обхода страниц Интернета с целью занесения информации о них в базу данных поисковика. По принципу действия паук напоминает обычный браузер. Он анализирует содержимое страницы, сохраняет его в некотором специальном виде на сервере поисковой машины, которой принадлежит, и отправляется по ссылкам на следующие страницы. Владельцы поисковых машин нередко ограничивают глубину проникновения паука внутрь сайта и максимальный размер сканируемого текста, поэтому чересчур большие сайты могут оказаться не полностью проиндексированными поисковой машиной. Кроме обычных пауков, существуют так называемые «дятлы» — роботы, которые «простукивают» проиндексированный сайт, чтобы определить, что он доступен.

Порядок обхода страниц, частота визитов, защита от зацикливания, а также критерии выделения значимой информации определяются поисковыми алгоритмами.

В большинстве случаев переход от одной страницы к другой осуществляется по ссылкам, содержащимся на первой и последующих страницах.

Также многие поисковые системы предоставляют пользователю возможность самостоятельно добавить сайт в очередь для индексирования. Обычно это существенно ускоряет индексирование сайта, а в случаях, когда никакие внешние ссылки не ведут на сайт, вообще оказывается единственной возможностью указать на его существование.

Ограничить индексацию сайта можно с помощью файла

См. также

Ссылки




Wikimedia Foundation. 2010.

Игры ⚽ Нужна курсовая?

Полезное


Смотреть что такое "Паук (программа)" в других словарях:

  • Паук в паутине (Вавилон-5) — Паук в паутине Сериал Вавилон 5 Номер серии Сезон 2 Серия №  …   Википедия

  • Паук (пасьянс) — У этого термина существуют и другие значения, см. Паук (значения). «Паук» в среде Windows 7 …   Википедия

  • Паук (значения) — Паук: В Викисловаре есть статья «паук» Пауки (лат. Aranei)  отряд паукообразных членистоногих. Паук, или поисковый робот  программа, скачивающая веб страницы для последующего индексирования. Паук (пасьянс)&# …   Википедия

  • Программа входа в систему — компонент операционной системы Microsoft Windows, отвечающий за вход в систему. Содержание …   Википедия

  • Человек-паук (серия игр) — У этого термина существуют и другие значения, см. Человек паук (значения). По мотивам приключений супергероя Marvel Comics Человека паука было разработано множество компьютерных и видеоигр. Содержание 1 До 1990 х 2 1990 е 3 2000 е …   Википедия

  • Галилео (программа) — У этого термина существуют и другие значения, см. Галилео. Галилео Жанр научно популярная развлекательная программа Режиссёр(ы) Кирилл Гаврилов, Елена Калиберда Редактор(ы) Дмитрий Самородов Производство Телеформат ( …   Википедия

  • Блокнот (программа) — У этого термина существуют и другие значения, см. Блокнот (значения). Блокнот Компонент Microsoft Windows …   Википедия

  • Веб-паук — Поисковый робот («веб паук», краулер)  программа, являющаяся составной частью поисковой системы и предназначенная для обхода страниц Интернета с целью занесения информации о них в базу данных поисковика. По принципу действия паук напоминает… …   Википедия

  • Список выпусков телепередачи «Большая разница по-украински» — Содержание 1 Канал «ICTV» 2 Канал «1+1» 3 Канал «Интер» В этой стат …   Википедия

  • Цикл (программирование) — У этого термина существуют и другие значения, см. цикл. В данной статье или разделе имеется список источников или внешних …   Википедия


Поделиться ссылкой на выделенное

Прямая ссылка:
Нажмите правой клавишей мыши и выберите «Копировать ссылку»