DataparkSearch

Материал из Википедии — свободной энциклопедии
Это старая версия этой страницы, сохранённая 212.176.39.52 (обсуждение) в 17:23, 3 октября 2005. Она может серьёзно отличаться от текущей версии.
(разн.) ← Предыдущая версия | Текущая версия (разн.) | Следующая версия → (разн.)
Перейти к навигации Перейти к поиску

DataparkSearch Engine -- поисковая машина с открытым исходным кодом, написаная на языке С. Распространяется по лицензии GPL. И предназначена для организации поиска на одном или многих веб-серверах.

DataparkSearch самостоятельно может индексировать даеые типов text/plain, text/html and text/xml и многих других, используя внешние парсеры.

Машина готова для индексирования мультиязычных сайтов: поддерживается множество различных кодировок и языков, а также их автоматическое определение, использует технологию согласования содержимого для интексирования копий одной и той же страницы на разных языках, может искать без учёта акцентов символов (диакретических знаков), а также разбивать на слова фразы китайского, корейского, тайского и японского языков. Возможно использование синонимаов, акронимов и всех морфологических форм слова для расширения результатов поиска.

Использует собсвенную технологию ссылочного ранжирования, основанную на нейронной сети. Эта технология называется Neo Popularity Rank. Результаты поиска могут сортироваться по релевантности, популярности, дате последнего измненения и по важности (произведению релевантности на популярность).

Внешние ссылки