- Поисковые машины
-
Поиско́вая систе́ма — веб-сайт, предоставляющий возможность поиска информации в Интернете. Большинство поисковых систем ищут информацию на сайтах Всемирной паутины, но существуют также системы, способные искать файлы на ftp-серверах, товары в интернет-магазинах, а также информацию в .
Как правило, основной частью поисковой системы является поиско́вая маши́на (поиско́вый движо́к) — комплекс программ, обеспечивающий функциональность поисковой системы. Основными критериями качества работы поисковой машины являются релевантность(степень соответствия запроса и найденного, то есть уместность результата), полнота базы, учёт морфологии языка. Индексация информации осуществляется специальными поисковыми роботами. В последнее время появился новый тип поисковых движков, основанных на технологии
Улучшение поиска — это одна из приоритетных задач сегодняшнего Интернета (см. про основные проблемы в работе поисковых систем в Глубокая паутина).
По данным компании Net Applications[1] в декабре 2007 года рыночная доля распределялась:
По данным аналитической компании comScore все поисковые сайты в декабре 2007 года обработали 66 млрд 221 млн поисковых запросов.[2][3] Яндекс попал в статистику и находится на 9-ом месте. Таблица сравнения поисковых систем: http://s41.radikal.ru/i091/0906/93/eabbd5e9414e.bmp
Содержание
История
Хронология Год Система Событие 1993 Aliweb Запуск 1993 JumpStation Запуск 1994 WebCrawler Запуск 1994 AltaVista Запуск 1995 Excite Запуск 1995 Open Text Запуск 1995 Magellan Запуск 1995 SAPO Запуск 1996 Inktomi Основана 1996 HotBot Основана 1996 Ask Jeeves Основана 1996 Aport Запуск 1997 Northern Light Запуск 1997 Яндекс Запуск 1998 Mail.ru Запуск 1999 Teoma Основана 2000 Окончательный запуск 2004 MSN Search Запуск (бета) 2005 бета) 2006 Ask.com Запуск 2006 Live Search Запуск 2006 Gogo.ru Запуск (бета) Одним из первых инструментов поиска в интернете (до WWW) был Archie.
Первой поисковой системой для Всемирной паутины был «Wandex», уже не существующий индекс, который создавал «World Wide Web Wanderer» — бот, разработанный Мэтью Грэем (англ. Matthew Gray) из Массачусетского технологического института в 1993. Также в 1993 году появилась поисковая система «Aliweb», работающая до сих пор. Первой полнотекстовой (т. н. «crawler-based», то есть индексирующей ресурсы при помощи робота) поисковой системой стала «WebCrawler», запущенная в 1994. В отличие от своих предшественников, она позволяла пользователям искать по любым ключевым словам на любой веб-странице — с тех пор это стало стандартом во всех основных поисковых системах. Кроме того, это был первый поисковик, о котором было известно в широких кругах. В 1994 был запущен «
Вскоре появилось множество других конкурирующих поисковых машин, таких как «Excite», «Infoseek», «Inktomi», «Northern Light» и «интернет-каталогами, такими, как «Yahoo!». Позже каталоги соединились или добавили к себе поисковые машины, чтобы увеличить функциональность. В 1996 году русскоязычным пользователям интернета стало доступно морфологическое расширение к поисковой машине Altavista и оригинальные российские поисковые машины Aport. 23 сентября 1997 была открыта поисковая машина Яндекс.
В последнее время завоёвывает всё большую популярность практика применения методов кластерного анализа и метапоиска. Из международных машин такого плана наибольшую известность получила «Clusty» компании Vivísimo. В 2005 году на российских просторах при поддержке МГУ запущен поисковик кластеризацию. В 2006 году открылась российская метамашина [4] с визуальной кластеризацией.
Помимо поисковых машин для Всемирной паутины, существовали и поисковики для других протоколов, такие как Archie для поиска по анонимным Gopher.
Популярные поисковые системы
- Всеязычные:
- [5])
- Yahoo! (0,4 % Рунета) и принадлежащие этой компании поисковые машины:
- Inktomi
- MSN (0,2 % Рунета) (принадлежит компании Англоязычные и международные:
- AskJeeves (механизм Teoma)
- Русскоязычные — большинство «русскоязычных» поисковых систем индексируют и ищут тексты на многих языках — украинском, белорусском, английском и др. Отличаются же они от «всеязычных» систем, индексирующих все документы подряд, тем, что в основном индексируют ресурсы, расположенные в доменных зонах, где доминирует русский язык или другими способами ограничивают своих роботов русскоязычными сайтами.
Примечания
- ↑ http://marketshare.hitslink.com/report.aspx?qprid=4&qptimeframe=M&qpsp=107&qpdt=1&qpct=3&qpf=1
- ↑ http://www.comscore.com/press/release.asp?press=2018
- ↑ http://habrahabr.ru/blog/yandex/34614.html
- ↑ 12.06.2006: Nigma.ru тестирует AJAX-интерфейс для поиска
- ↑ данные об охвате русскоязычных поисковых запросов указаны согласно статистике LiveInternet
См. также
- Список поисковых машин
- Информационный поиск
- Поисковая оптимизация
- Статистика запросов
- Глубокая паутина
- Поисковый спам
- Каталог ресурсов в Интернете
- DataparkSearch
- Wikia Search
- Списки библиотек и поисковые системы
Ссылки
- Захаров Н. В. Информационно-поисковые системы в филологических науках
- История поисковых систем
- UFOSETI — поиск НЛО и пришельцев в интернете
- Портал поисковых технологий «Search Tools» (англ.)
Литература
- Ашманов Игорь Станиславович, Иванов Андрей Александрович Продвижение сайта в поисковых системах. — М.: «Вильямс», 2007. — С. 304. — ISBN 978-5-8459-1155-1
- Колисниченко Денис Николаевич Поисковые системы и продвижение сайтов в Интернете. — М.: «Диалектика», 2007. — С. 272. — ISBN 978-5-8459-1269-5
- Всеязычные:
Wikimedia Foundation. 2010.