Краулер

Краулер

Поиско́вый ро́бот («веб-пау́к», краулер) — программа, являющаяся составной частью поисковой системы и предназначенная для обхода страниц Интернета с целью занесения информации о них в базу данных поисковика. По принципу действия паук напоминает обычный браузер. Он анализирует содержимое страницы, сохраняет его в некотором специальном виде на сервере поисковой машины, которой принадлежит, и отправляется по ссылкам на следующие страницы. Владельцы поисковых машин нередко ограничивают глубину проникновения паука внутрь сайта и максимальный размер сканируемого текста, поэтому чересчур большие сайты могут оказаться не полностью проиндексированными поисковой машиной. Кроме обычных пауков, существуют так называемые «дятлы» — роботы, которые «простукивают» проиндексированный сайт, чтобы определить, что он доступен.

Порядок обхода страниц, частота визитов, защита от зацикливания, а также критерии выделения значимой информации определяются поисковыми алгоритмами.

В большинстве случаев переход от одной страницы к другой осуществляется по ссылкам, содержащимся на первой и последующих страницах.

Также многие поисковые системы предоставляют пользователю возможность самостоятельно добавить сайт в очередь для индексирования. Обычно это существенно ускоряет индексирование сайта, а в случаях, когда никакие внешние ссылки не ведут на сайт, вообще оказывается единственной возможностью указать на его существование.

Ограничить индексацию сайта можно с помощью файла

См. также

Ссылки




Wikimedia Foundation. 2010.

Игры ⚽ Нужен реферат?

Полезное


Смотреть что такое "Краулер" в других словарях:

  • веб-краулер — сущ., кол во синонимов: 2 • программа (114) • робот (29) Словарь синонимов ASIS. В.Н. Тришин. 2013 …   Словарь синонимов

  • Command \x26 Conquer 4: Tiberian Twilight — Command Conquer 4: Tiberian Twilight Command Conquer 4: Tiberian Twilight / Command Conquer 4 : Эпилог Разработчик EA Los Angeles …   Википедия

  • Command & Conquer 4: Tiberian Twilight — / Command Conquer 4 : Эпилог Разработчик …   Википедия

  • Поисковый робот — («веб паук», краулер)  программа, являющаяся составной частью поисковой системы и предназначенная для перебора страниц Интернета с целью занесения информации о них в базу данных поисковика. По принципу действия паук напоминает обычный… …   Википедия

  • Список терминов вселенной Дюны — Эта страница глоссарий. Список терминов и технологий вселенной Дюны. Термины, имеющие отношение к природе и географии Арракиса, а также слова и понятия языка фременов приведены в ст …   Википедия

  • Spanish Fry — Эпизод «Футурамы» «Шпанский Фрай» «Spanish Fry» …   Википедия

  • Comix Zone — Стиль этой статьи неэнциклопедичен или нарушает нормы русского языка. Статью следует исправить согласно стилистическим правилам Википедии …   Википедия

  • Веб-паук — Поисковый робот («веб паук», краулер)  программа, являющаяся составной частью поисковой системы и предназначенная для обхода страниц Интернета с целью занесения информации о них в базу данных поисковика. По принципу действия паук напоминает… …   Википедия

  • На-барон — Список терминов вселенной Дюны. Содержание: А Б В Г Д Е Ж З И К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Э …   Википедия

  • Паук (программа) — Поисковый робот («веб паук», краулер)  программа, являющаяся составной частью поисковой системы и предназначенная для обхода страниц Интернета с целью занесения информации о них в базу данных поисковика. По принципу действия паук напоминает… …   Википедия


Поделиться ссылкой на выделенное

Прямая ссылка:
Нажмите правой клавишей мыши и выберите «Копировать ссылку»