Поисковая система
Содержимое этой статьи нуждается в чистке. |
Поиско́вая систе́ма — программно-аппаратный комплекс с веб-интерфейсом, предоставляющий возможность поиска информации в Интернете. В просторечии под поисковой системой подразумевают веб-сайт, на которой размещён интерфейс (фронт-энд) системы. Программной частью поисковой системы является поиско́вая маши́на (поиско́вый движо́к) — комплекс программ, обеспечивающий функциональность поисковой системы и являющийся коммерческой тайной компании-разработчика поисковой системы.
Большинство поисковых систем ищут информацию на сайтах Всемирной паутины, но существуют также системы, способные искать файлы на ftp-серверах, товары в интернет-магазинах, а также информацию в группах новостей Usenet.
Улучшение поиска — это одна из приоритетных задач современного Интернета (см. про основные проблемы в работе поисковых систем в статье Глубокая паутина).
По данным компании Net Applications[1] в апреле 2010 года использование поисковых систем на Западе распределялось следующим образом:
- Google — 86,30 %
- Yahoo — 5,30 %
- Bing — 3,13 %
- Baidu — 3,45 %
- Ask — 0,67 %
- AOL — 0,44 %
- MSN — 0,08 %
- AltaVista — 0,07 %
- Excite — 0,03 %
- Lycos — 0,02 %
- All the Web — 0,01 %
В вышеприведенный отчёт не входят российские поисковики, такие как, например, Яндекс, Рамблер или Nigma.
По данным аналитической компании comScore все поисковые сайты в декабре 2007 года обработали 66 млрд 221 млн поисковых запросов.[2][3] Яндекс попал в статистику и находится на 9-ом месте. В настоящее время, по данным LiveInternet[источник не указан 5208 дней], доли поисковых систем распределяются следующим образом: · Яндекс — 57,2 %, · Google — 23 %, · Mail.Ru — 10,3 %, · Рамблер — 4,2 %.
История
Хронология | ||
---|---|---|
Год | Система | Событие |
1993 | Aliweb | Запуск |
1993 | JumpStation | Запуск |
1994 | WebCrawler | Запуск |
1994 | Lycos | Запуск |
1994 | Infoseek | Запуск |
1995 | AltaVista | Запуск |
1995 | Excite | Запуск |
1995 | Open Text | Запуск |
1995 | Magellan | Запуск |
1995 | SAPO | Запуск |
1996 | Inktomi | Основана |
1996 | HotBot | Основана |
1996 | Ask Jeeves | Основана |
1996 | Rambler | Запуск |
1996 | Aport | Запуск |
1997 | Northern Light | Запуск |
1997 | Запуск | |
1997 | Яндекс | Запуск |
1999 | AlltheWeb | Запуск |
1999 | Mail.ru | Запуск |
1999 | Teoma | Основана |
2000 | Baidu | Основана |
2004 | Yahoo! Search | Окончательный запуск |
2004 | MSN Search | Запуск (бета) |
2005 | Nigma | Запуск (бета) |
2006 | Ask.com | Запуск |
2006 | Генон | Запуск |
2006 | Live Search | Запуск |
2006 | Quintura | Запуск |
2007 | Gogo.ru | Запуск (бета) |
2008 | TinEye | Запуск (бета) |
2009 | Bing | Запуск |
Одним из первых инструментов поиска в интернете (до WWW) был Archie.
Первой поисковой системой для Всемирной паутины был «Wandex», уже не существующий индекс, который создавал «World Wide Web Wanderer» — бот, разработанный Мэтью Грэем (англ. Matthew Gray) из Массачусетского технологического института в 1993. Также в 1993 году появилась поисковая система «Aliweb», работающая до сих пор. Первой полнотекстовой (т. н. «crawler-based», то есть индексирующей ресурсы при помощи робота) поисковой системой стала «WebCrawler», запущенная в 1994. В отличие от своих предшественников, она позволяла пользователям искать по любым ключевым словам на любой веб-странице — с тех пор это стало стандартом во всех основных поисковых системах. Кроме того, это был первый поисковик, о котором было известно в широких кругах. В 1994 был запущен «Lycos», разработанный в университете Карнеги Мелона.
Вскоре появилось множество других конкурирующих поисковых машин, таких как «Excite», «Infoseek», «Inktomi», «Northern Light» и «AltaVista». В некотором смысле они конкурировали с популярными интернет-каталогами, такими, как «Yahoo!». Позже каталоги соединились или добавили к себе поисковые машины, чтобы увеличить функциональность. В 1996 году русскоязычным пользователям интернета стало доступно морфологическое расширение к поисковой машине Altavista и оригинальные российские поисковые машины Rambler и Aport. 23 сентября 1997 была открыта поисковая машина Яндекс.
В последнее время завоёвывает всё большую популярность практика применения методов кластерного анализа и метапоиска. Из международных машин такого плана наибольшую известность получила «Clusty» компании Vivísimo. В 2005 году на российских просторах при поддержке МГУ запущен поисковик Nigma, поддерживающий автоматическую кластеризацию. В 2006 году открылась российская метамашина Quintura, предлагающая визуальную кластеризацию в виде облака ключевых слов. Nigma тоже экспериментировала[4] с визуальной кластеризацией.
Помимо поисковых машин для Всемирной паутины, существовали и поисковики для других протоколов, такие как Archie для поиска по анонимным FTP-серверам и «Veronica» для поиска в Gopher.
Популярные поисковые системы
- Всеязычные:
- Англоязычные и международные:
- Русскоязычные — большинство «русскоязычных» поисковых систем индексируют и ищут тексты на многих языках — украинском, белорусском, английском и др. Отличаются же они от «всеязычных» систем, индексирующих все документы подряд, тем, что в основном индексируют ресурсы, расположенные в доменных зонах, где доминирует русский язык или другими способами ограничивают своих роботов русскоязычными сайтами.
Из перечисленных поисковых систем не все имеют собственный поисковый алгоритм — так QIP.ru используют поисковый механизм Яндекса, а Nigma сочетает в себе как свой алгоритм, так и сборную выдачу от других поисковиков[6].
Необычные поисковые системы
- Koogle (с его помощью ортодоксальные иудеи могут найти контент, признанный раввинами удовлетворяющим религиозным требованиям)[7]
- Yauba (индийский поиск «для параноиков» — в отличие от привычных поисковиков, за пользователями не следят, а все записи о его действиях удаляются с сервера)[7]
- TinEye — поисковая система, специализирующаяся на поиске изображений в Интернете.
- Генон — поисковая система, собирающая и создающая контент у себя на сайте.
- * [ALLhave ] - первая поисковая система, способная индексировать формы, выдачу других поисковых систем.
См. также
- ImHalal
- Список поисковых машин
- Информационный поиск
- Статистика запросов
- Поисковый спам
- Каталог ресурсов в Интернете
- DataparkSearch
- Qwika
- Wikia Search
- Электронная библиотека#Списки библиотек и поисковые системы
Примечания
- ↑ Search engine market share
- ↑ Baidu Ranked Third Largest Worldwide Search Property by comScore in December 2007 — comScore, Inc
- ↑ «Яндекс» — девятый поисковик мира / Яндекс / Хабрахабр
- ↑ 12.06.2006: Nigma.ru тестирует AJAX-интерфейс для поиска
- ↑ данные об охвате русскоязычных поисковых запросов указаны согласно статистике LiveInternet
- ↑ данные о посещаемости Qip-поиск, Quintura и Genon.ru указана согласно статистике LiveInternet
- ↑ 1 2 Запущен «кошерный» поисковик Koogle
Литература
- Ашманов И. С., Иванов А. А. Продвижение сайта в поисковых системах. — М.: Вильямс, 2007. — 304 с. — ISBN 978-5-8459-1155-1.
- Колисниченко Д. Н. Поисковые системы и продвижение сайтов в Интернете. — М.: Диалектика, 2007. — 272 с. — ISBN 978-5-8459-1269-5.
- Ландэ Д. В. Поиск знаний в Internet. — М.: Диалектика, 2005. — 272 с. — ISBN 5-8459-0764-0.
Ссылки
- Захаров Н. В. Информационно-поисковые системы в филологических науках
- История поисковых систем
- Компоненты, алгоритмы поисковых систем
- Портал поисковых технологий «Search Tools» (англ.)
- Национальная поисковая система Российской Федерации (статья)
Эту статью необходимо исправить в соответствии с правилом Википедии об оформлении статей. |