DataparkSearch: различия между версиями

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску
[непроверенная версия][непроверенная версия]
Содержимое удалено Содержимое добавлено
Нет описания правки
Строка 28: Строка 28:
* [http://inet-sochi.ru/ «Интернет Сочи»] — демо-сайт, использующий DataparkSearch для организации поиска по базе сайтов, а также реализующий вспомогательные поиске в базах видео, телеонных номеров и итории запросов.
* [http://inet-sochi.ru/ «Интернет Сочи»] — демо-сайт, использующий DataparkSearch для организации поиска по базе сайтов, а также реализующий вспомогательные поиске в базах видео, телеонных номеров и итории запросов.
* [http://www.newslookup.com/ newslookup.com] -- новостной сайт, использующий DataparkSearch.
* [http://www.newslookup.com/ newslookup.com] -- новостной сайт, использующий DataparkSearch.

{{Поисковые машины}}


[[Категория:Поисковые системы|D]]
[[Категория:Поисковые системы|D]]

Версия от 19:06, 5 августа 2011

DataparkSearch
Тип поисковая машина
Разработчик Максим Захаров
Написана на Си
Операционные системы FreeBSD, GNU/Linux, Sun Solaris
Последняя версия 4.53 (24 января 2010)
Репозиторий github.com/Maxime2/datap…
Лицензия GNU General Public License
Сайт www.dataparksearch.org

DataparkSearch Engineпоисковая машина с открытым исходным текстом, написанная на языке С. Распространяется по лицензии GNU GPL. Предназначена для организации поиска на одном или многих веб-серверах.

DataparkSearch самостоятельно может индексировать текст, HTML и XML, а также многие другие данные, используя внешние парсеры.

Машина готова для индексирования мультиязычных сайтов: поддерживается множество различных кодировок и языков, а также их автоматическое определение; использует технологию согласования содержимого для индексирования копий одной и той же страницы на разных языках; может искать без учёта акцентов символов (диакритических знаков); а также разбивать на слова и фразы китайского, корейского, тайского и японского языков. Возможно использование синонимов, акронимов и всех морфологических форм слова для расширения результатов поиска.

Использует собственную технологию ссылочного ранжирования, основанную на нейронной сети. Эта технология называется Neo Popularity Rank. Результаты поиска могут сортироваться по релевантности, популярности, дате последнего изменения и по важности (произведению релевантности на популярность).

Для уточнения ранжирования сайтов может автоматически строить рефераты индексируемых страниц, состоящие из трёх наиболее важных предложений.

Ссылки