Поисковая система: различия между версиями
[отпатрулированная версия] | [отпатрулированная версия] |
X7q (обсуждение | вклад) |
|||
Строка 313: | Строка 313: | ||
== Ссылки == |
== Ссылки == |
||
* [http://www.zpu-journal.ru/e-zpu/2008/5/Zakharov_ISS/ Захаров Н. В. Информационно-поисковые системы в филологических науках] |
* [http://www.zpu-journal.ru/e-zpu/2008/5/Zakharov_ISS/ Захаров Н. В. Информационно-поисковые системы в филологических науках] |
||
* [http://www.artpix.ru/about/articles/search_history/ История поисковых систем] |
|||
* [http://www.web-analyst.ru/search_system.html Компоненты, алгоритмы поисковых систем] |
* [http://www.web-analyst.ru/search_system.html Компоненты, алгоритмы поисковых систем] |
||
* [http://www.searchtools.com/ Портал поисковых технологий «Search Tools»] {{ref-en}} |
* [http://www.searchtools.com/ Портал поисковых технологий «Search Tools»] {{ref-en}} |
Версия от 09:37, 26 мая 2011
Эта статья должна быть полностью переписана. |
Поиско́вая систе́ма — программно-аппаратный комплекс с веб-интерфейсом, предоставляющий возможность поиска информации в Интернете. Под поисковой системой обычно подразумевается сайт, на котором размещён интерфейс (фронт-энд) системы. Программной частью поисковой системы является поисковая машина (поисковый движок) — комплекс программ, обеспечивающий функциональность поисковой системы и обычно являющийся коммерческой тайной компании-разработчика поисковой системы.
Большинство поисковых систем ищут информацию на сайтах Всемирной паутины, но существуют также системы, способные искать файлы на FTP-серверах, товары в интернет-магазинах, а также информацию в группах новостей Usenet.
Улучшение поиска — это одна из приоритетных задач современного Интернета (см. про основные проблемы в работе поисковых систем в статье Глубокая паутина).
По данным компании Net Applications,[1] в январе 2011 года использование поисковых систем распределялось следующим образом:
История
Хронология | ||
---|---|---|
Год | Система | Событие |
1993 | W3Catalog | Запуск |
Aliweb | Запуск | |
JumpStation | Запуск | |
1994 | WebCrawler | Запуск |
Infoseek | Запуск | |
Lycos | Запуск | |
1995 | AltaVista | Запуск |
Daum | Основание | |
Open Text Web Index | Запуск | |
Magellan | Запуск | |
Excite | Запуск | |
SAPO | Запуск | |
Yahoo! | Запуск | |
1996 | Dogpile | Запуск |
Inktomi | Основание | |
HotBot | Основание | |
Ask Jeeves | Основание | |
1997 | Northern Light | Запуск |
Яндекс | Запуск | |
1998 | Запуск | |
1999 | AlltheWeb | Запуск |
GenieKnows | Основание | |
Naver | Запуск | |
Teoma | Основание | |
Vivisimo | Основание | |
2000 | Baidu | Основание |
Exalead | Основание | |
2003 | Info.com | Запуск |
2004 | Yahoo! Search | Окончательный запуск |
A9.com | Запуск | |
Sogou | Запуск | |
2005 | MSN Search | Окончательный запуск |
Ask.com | Запуск | |
GoodSearch | Запуск | |
SearchMe | Основание | |
2006 | wikiseek | Основание |
Quaero | Основание | |
Ask.com | Запуск | |
Live Search | Запуск | |
ChaCha | Запуск (бета) | |
Guruji.com | Запуск (бета) | |
2007 | wikiseek | Запуск |
Sproose | Запуск | |
Wikia Search | Запуск | |
Blackle.com | Запуск | |
2008 | Powerset | Запуск |
Picollator | Запуск | |
Viewzi | Запуск | |
Cuil | Запуск | |
Boogami | Запуск | |
LeapFish | Запуск (бета) | |
Forestle | Запуск | |
VADLO | Запуск | |
Duck Duck Go | Запуск | |
2009 | Bing | Запуск |
KAZ.KZ | Запуск | |
Yebol | Запуск (бета) | |
Mugurdy | Закрытие | |
Goby | Запуск | |
2010 | Яндекс (англ.) | Запуск |
Cuil | Закрытие | |
Blekko | Запуск (бета) | |
Viewzi | Закрытие |
Одним из первых инструментов поиска в интернете (до Всемирной паутины) был Archie.
Первой поисковой системой для Всемирной паутины был «Wandex», уже не существующий индекс, который создавал «World Wide Web Wanderer» — бот, разработанный Мэтью Грэем (англ. Matthew Gray) из Массачусетского технологического института в 1993. Также в 1993 году появилась поисковая система «Aliweb», работающая до сих пор. Первой полнотекстовой (т. н. «crawler-based», то есть индексирующей ресурсы при помощи робота) поисковой системой стала «WebCrawler», запущенная в 1994. В отличие от своих предшественников, она позволяла пользователям искать по любым ключевым словам на любой веб-странице — с тех пор это стало стандартом во всех основных поисковых системах. Кроме того, это был первый поисковик, о котором было известно в широких кругах. В 1994 был запущен «Lycos», разработанный в университете Карнеги Мелона.
Вскоре появилось множество других конкурирующих поисковых машин, таких как «Excite», «Infoseek», «Inktomi», «Northern Light» и «AltaVista». В некотором смысле они конкурировали с популярными интернет-каталогами, такими, как «Yahoo!». Позже каталоги соединились или добавили к себе поисковые машины, чтобы увеличить функциональность. В 1996 году русскоязычным пользователям интернета стало доступно морфологическое расширение к поисковой машине Altavista и оригинальные российские поисковые машины «Рамблер» и «Апорт». 23 сентября 1997 была открыта поисковая машина Яндекс.
В последнее время завоёвывает всё большую популярность практика применения методов кластерного анализа и поиска по метаданным. Из международных машин такого плана наибольшую известность получила «Clusty» компании Vivísimo. В 2005 году на российских просторах при поддержке МГУ запущен поисковик «Нигма», поддерживающий автоматическую кластеризацию. В 2006 году открылась российская метамашина Quintura, предлагающая визуальную кластеризацию в виде облака тегов. «Нигма» тоже экспериментировала[2] с визуальной кластеризацией.
Помимо поисковых машин для Всемирной паутины, существовали и поисковики для других протоколов, такие как Archie для поиска по анонимным FTP-серверам и «Veronica» для поиска в Gopher.
Популярные поисковые системы
Согласно данным LiveInternet об охвате русскоязычных поисковых запросов:
- Всеязычные:
- Англоязычные и международные:
- Русскоязычные — большинство «русскоязычных» поисковых систем индексируют и ищут тексты на многих языках — украинском, белорусском, английском, татарском и др. Отличаются же они от «всеязычных» систем, индексирующих все документы подряд, тем, что в основном индексируют ресурсы, расположенные в доменных зонах, где доминирует русский язык или другими способами ограничивают своих роботов русскоязычными сайтами.
Некоторые из поисковых систем используют внешние алгоритмы поиска. Так, Qip.ru использует поисковый механизм Яндекса, а Nigma сочетает в себе как свой алгоритм, так и сборную выдачу от других поисковиков.
Необычные поисковые системы
- Koogle (с его помощью ортодоксальные иудеи могут найти контент, признанный раввинами удовлетворяющим религиозным требованиям).[3]
- Yauba (индийский поиск «для параноиков» — в отличие от привычных поисковиков, за пользователями не следят, а все записи о его действиях удаляются с сервера).[3]
- TinEye — поисковая система, специализирующаяся на поиске изображений в Интернете.
- Генон — поисковая система, собирающая и создающая контент у себя на сайте.
- ImHalal - первый исламский поисковик. Новый поисковик может отличить разрешённые для мусульман (халяльные) результаты поиска от запретных (харамных).
См. также
- Список поисковых машин
- Информационный поиск
- Статистика запросов
- Поисковый спам
- Каталог ресурсов в Интернете
- DataparkSearch
- Qwika
- Wikia Search
- Электронная библиотека#Списки библиотек и поисковые системы
Примечания
Литература
- Ашманов И. С., Иванов А. А. Продвижение сайта в поисковых системах. — М.: Вильямс, 2007. — 304 с. — ISBN 978-5-8459-1155-1.
- Колисниченко Д. Н. Поисковые системы и продвижение сайтов в Интернете. — М.: Диалектика, 2007. — 272 с. — ISBN 978-5-8459-1269-5.
- Ландэ Д. В. Поиск знаний в Internet. — М.: Диалектика, 2005. — 272 с. — ISBN 5-8459-0764-0.
- Маннинг К., Рагхаван П., Шютце Х. Введение в информационный поиск. — Вильямс, 2011. — ISBN 978-5-8459-1623-5.