Поисковая система

Материал из Википедии — свободной энциклопедии
Это старая версия этой страницы, сохранённая 109.254.53.33 (обсуждение) в 10:34, 4 ноября 2010 (Необычные поисковые системы). Она может серьёзно отличаться от текущей версии.
Перейти к навигации Перейти к поиску

Поиско́вая систе́ма — программно-аппаратный комплекс с веб-интерфейсом, предоставляющий возможность поиска информации в Интернете. В просторечии под поисковой системой подразумевают веб-сайт, на которой размещён интерфейс (фронт-энд) системы. Программной частью поисковой системы является поиско́вая маши́на (поиско́вый движо́к) — комплекс программ, обеспечивающий функциональность поисковой системы и являющийся коммерческой тайной компании-разработчика поисковой системы.

Большинство поисковых систем ищут информацию на сайтах Всемирной паутины, но существуют также системы, способные искать файлы на ftp-серверах, товары в интернет-магазинах, а также информацию в группах новостей Usenet.

Улучшение поиска — это одна из приоритетных задач современного Интернета (см. про основные проблемы в работе поисковых систем в статье Глубокая паутина).

По данным компании Net Applications[1] в апреле 2010 года использование поисковых систем на Западе распределялось следующим образом:

В вышеприведенный отчёт не входят российские поисковики, такие как, например, Яндекс, Рамблер или Nigma.

По данным аналитической компании comScore все поисковые сайты в декабре 2007 года обработали 66 млрд 221 млн поисковых запросов.[2][3] Яндекс попал в статистику и находится на 9-ом месте. В настоящее время, по данным LiveInternet[источник не указан 5208 дней], доли поисковых систем распределяются следующим образом: · Яндекс — 57,2 %, · Google — 23 %, · Mail.Ru — 10,3 %, · Рамблер — 4,2 %.

История

Хронология
Год Система Событие
1993 Aliweb Запуск
1993 JumpStation Запуск
1994 WebCrawler Запуск
1994 Lycos Запуск
1994 Infoseek Запуск
1995 AltaVista Запуск
1995 Excite Запуск
1995 Open Text Запуск
1995 Magellan Запуск
1995 SAPO Запуск
1996 Inktomi Основана
1996 HotBot Основана
1996 Ask Jeeves Основана
1996 Rambler Запуск
1996 Aport Запуск
1997 Northern Light Запуск
1997 Google Запуск
1997 Яндекс Запуск
1999 AlltheWeb Запуск
1999 Mail.ru Запуск
1999 Teoma Основана
2000 Baidu Основана
2004 Yahoo! Search Окончательный запуск
2004 MSN Search Запуск (бета)
2005 Nigma Запуск (бета)
2006 Ask.com Запуск
2006 Генон Запуск
2006 Live Search Запуск
2006 Quintura Запуск
2007 Gogo.ru Запуск (бета)
2008 TinEye Запуск (бета)
2009 Bing Запуск

Одним из первых инструментов поиска в интернете (до WWW) был Archie.

Первой поисковой системой для Всемирной паутины был «Wandex», уже не существующий индекс, который создавал «World Wide Web Wanderer» — бот, разработанный Мэтью Грэем (англ. Matthew Gray) из Массачусетского технологического института в 1993. Также в 1993 году появилась поисковая система «Aliweb», работающая до сих пор. Первой полнотекстовой (т. н. «crawler-based», то есть индексирующей ресурсы при помощи робота) поисковой системой стала «WebCrawler», запущенная в 1994. В отличие от своих предшественников, она позволяла пользователям искать по любым ключевым словам на любой веб-странице — с тех пор это стало стандартом во всех основных поисковых системах. Кроме того, это был первый поисковик, о котором было известно в широких кругах. В 1994 был запущен «Lycos», разработанный в университете Карнеги Мелона.

Вскоре появилось множество других конкурирующих поисковых машин, таких как «Excite», «Infoseek», «Inktomi», «Northern Light» и «AltaVista». В некотором смысле они конкурировали с популярными интернет-каталогами, такими, как «Yahoo!». Позже каталоги соединились или добавили к себе поисковые машины, чтобы увеличить функциональность. В 1996 году русскоязычным пользователям интернета стало доступно морфологическое расширение к поисковой машине Altavista и оригинальные российские поисковые машины Rambler и Aport. 23 сентября 1997 была открыта поисковая машина Яндекс.

В последнее время завоёвывает всё большую популярность практика применения методов кластерного анализа и метапоиска. Из международных машин такого плана наибольшую известность получила «Clusty» компании Vivísimo. В 2005 году на российских просторах при поддержке МГУ запущен поисковик Nigma, поддерживающий автоматическую кластеризацию. В 2006 году открылась российская метамашина Quintura, предлагающая визуальную кластеризацию в виде облака ключевых слов. Nigma тоже экспериментировала[4] с визуальной кластеризацией.

Помимо поисковых машин для Всемирной паутины, существовали и поисковики для других протоколов, такие как Archie для поиска по анонимным FTP-серверам и «Veronica» для поиска в Gopher.

Популярные поисковые системы

  • Всеязычные:
  • Англоязычные и международные:
  • Русскоязычные — большинство «русскоязычных» поисковых систем индексируют и ищут тексты на многих языках — украинском, белорусском, английском и др. Отличаются же они от «всеязычных» систем, индексирующих все документы подряд, тем, что в основном индексируют ресурсы, расположенные в доменных зонах, где доминирует русский язык или другими способами ограничивают своих роботов русскоязычными сайтами.

Из перечисленных поисковых систем не все имеют собственный поисковый алгоритм — так QIP.ru используют поисковый механизм Яндекса, а Nigma сочетает в себе как свой алгоритм, так и сборную выдачу от других поисковиков[6].

Необычные поисковые системы

  • Koogle (с его помощью ортодоксальные иудеи могут найти контент, признанный раввинами удовлетворяющим религиозным требованиям)[7]
  • Yauba (индийский поиск «для параноиков» — в отличие от привычных поисковиков, за пользователями не следят, а все записи о его действиях удаляются с сервера)[7]
  • TinEye — поисковая система, специализирующаяся на поиске изображений в Интернете.
  • Генон — поисковая система, собирающая и создающая контент у себя на сайте.
  • * [ALLhave ] - первая поисковая система, способная индексировать формы, выдачу других поисковых систем.

См. также

Примечания

  1. Search engine market share
  2. Baidu Ranked Third Largest Worldwide Search Property by comScore in December 2007 — comScore, Inc
  3. «Яндекс» — девятый поисковик мира / Яндекс / Хабрахабр
  4. 12.06.2006: Nigma.ru тестирует AJAX-интерфейс для поиска
  5. данные об охвате русскоязычных поисковых запросов указаны согласно статистике LiveInternet
  6. данные о посещаемости Qip-поиск, Quintura и Genon.ru указана согласно статистике LiveInternet
  7. 1 2 Запущен «кошерный» поисковик Koogle

Литература

  • Ашманов И. С., Иванов А. А. Продвижение сайта в поисковых системах. — М.: Вильямс, 2007. — 304 с. — ISBN 978-5-8459-1155-1.
  • Колисниченко Д. Н. Поисковые системы и продвижение сайтов в Интернете. — М.: Диалектика, 2007. — 272 с. — ISBN 978-5-8459-1269-5.
  • Ландэ Д. В. Поиск знаний в Internet. — М.: Диалектика, 2005. — 272 с. — ISBN 5-8459-0764-0.

Ссылки

Шаблон:Веб и веб-сайты