Невидимый веб

Невидимый веб

Глубокая паутина (также известна как невидимая паутина) — множество веб-страниц Всемирной паутины, неиндексируемых поисковыми системами. Термин произошел от соотв. англ. invisible web[1]. Наиболее значительной частью глубокой паутины является глубинный веб (от англ. deep web, hidden web), состоящий из веб-страниц, динамически-генерируемых по запросам к онлайн базам данных[2]. Не следует смешивать понятие глубокая паутина с понятием тёмная паутина (от англ. англ. dark web), под которым имеются в виду сетевые сегменты, вообще не подключённые к сети Интернет.

Содержание

Суть проблемы

В глубокой паутине находятся веб-страницы, не связанные с другими гиперссылками — например, страницы, динамически создаваемые по запросам к базам данных. В глубокой паутине также находятся сайты, доступ к которым открыт только для зарегистрированных пользователей. Поисковые системы используют специальные роботы (англ. web crawler), которые переходят по гиперссылкам и индексируют содержимое веб-страниц, на которых они оказываются. В то же время, информация из баз данных, доступная пользователям через поисковые веб-формы (но не по гиперссылкам), остается недоступной для робота, неспособного в режиме реального времени правильно заполнить форму значениями (другими словами, сформировать запрос к базе данных). Таким образом, значительная часть Всемирной паутины оказывается скрыта от поисковых роботов. Используя аналогию, информация, будучи недоступной для поисковых систем, находится «на глубине» (от англ. deep).

Масштаб

В 2000 году поисковая компания «BrightPlanet» провела исследование, которое показало, что в глубокой паутине находится в 500 раз больше документов, чем доступно через поисковые системы. Конечно, эти цифры могут быть не совсем точными. Например, существует проблема с различением разных представлений одного и того же материала в базах данных.

Ключи к решению

В 2005 году компания «Yahoo!» сделала серьёзный шаг к решению этой проблемы. Компания выпустила поисковый движок «Yahoo! Subscriptions», который производит поиск по сайтам (пока немногочисленным), доступ к которым открыт только зарегистрированным участникам этих сайтов.

Это, однако, полностью не решило имеющейся проблемы. Эксперты поисковых систем по-прежнему пытаются найти технические возможности для индексации содержимого баз данных и доступа к закрытым веб-сайтам.


Специальные поисковые машины

Литература

  1. Гари Прайс, Крис Шерман. "Невидимая паутина: Открывая источники информации, которые поисковые машины не видят" (англ. «The Invisible Web: Uncovering Information Sources Search Engines Can’t See», издательство CyberAge Books, 2001, ISBN 0-910965-51-X).
  2. Денис Шестаков, Наталья Воронцова (2005). "Структура русскоязычной части глубинного Веба". Интернет-математика 2005, стр.320-341. Ссылка

Ссылки


Wikimedia Foundation. 2010.

Игры ⚽ Поможем сделать НИР

Полезное


Смотреть что такое "Невидимый веб" в других словарях:

  • I2P — Проверить нейтральность. На странице обсуждения должны быть подробности …   Википедия

  • ICQ — У этого термина существуют и другие значения, см. ICQ (значения). ICQ (англ. I seek You  «я ищу тебя»)  централизованная служба мгновенного обмена сообщениями сети Интернет, в настоящее время принадлежащая инвестиционному фонду… …   Википедия

  • Гуглизм — (англ. Googlism)  пародийная религия, основанная Мэтом МакФерсоном (англ. Matt MacPherson). Центральной идеей гуглизма является тот факт, что современной науке неизвестны сущности, столь же близкие к Всеведенью, как близка к этому… …   Википедия

  • Летающий Макаронный Монстр — Эту страницу предлагается переименовать в Пастафарианство. Пояснение причин и обсуждение  на странице Википедия:К переименованию/23 июня 2012. Возможно, её текущее название не соответствует нормам современного русского языка и/или… …   Википедия

  • iMule — iMule …   Википедия

  • Презерватив — Мужской презерватив Презерватив (фр. préservatif, от позднелат. praeservo  предохраняю), также кондом (фр. condom)  средство контрацепции …   Википедия

  • Чайник Рассела — «Чайник Рассела» (англ. Russell s Teapot)  аналогия, впервые приведённая английским математиком и философом Бертраном Расселом (1872 1970) для опровержения идеи, что бремя доказательства ложности религиозных утверждений лежит на… …   Википедия

  • Расследования авиакатастроф — Расследование авиакатастроф Mayday Жанр Документальная драма …   Википедия

  • Дигидрогена монооксид — Эта статья об одной из научных шуток. О веществе см. статью Вода. Молекула вещества, состоящая из одного атома кислорода (оксигена) и двух атомов водорода (гидрогена) …   Википедия

  • Поисковый спам — (спамдексинг или веб спам)  сайты и страницы в Интернете, созданные с целью манипуляции результатами поиска в поисковых машинах  в конечном счёте, для обмана пользователя. Основные виды Не имеющие отношения к содержимому страницы, но… …   Википедия


Поделиться ссылкой на выделенное

Прямая ссылка:
Нажмите правой клавишей мыши и выберите «Копировать ссылку»