DataparkSearch: различия между версиями
[непроверенная версия] | [непроверенная версия] |
Нет описания правки |
A.I. (обсуждение | вклад) эту статью и люди обычнеы будут читать ;) |
||
Строка 13: | Строка 13: | ||
'''DataparkSearch Engine''' — [[Поисковая система|поисковая машина]] с открытым исходным текстом, написаная на [[Си_(язык программирования)|языке С]]. Распространяется по лицензии [[GPL]]. Предназначена для организации [[поиск]]а на одном или многих [[Веб-сайт|веб-серверах]]. |
'''DataparkSearch Engine''' — [[Поисковая система|поисковая машина]] с открытым исходным текстом, написаная на [[Си_(язык программирования)|языке С]]. Распространяется по лицензии [[GPL]]. Предназначена для организации [[поиск]]а на одном или многих [[Веб-сайт|веб-серверах]]. |
||
DataparkSearch самостоятельно может индексировать |
DataparkSearch самостоятельно может индексировать текст, [[HTML]] и [[XML]], а также многих других используя внешние парсеры. |
||
Машина готова для индексирования мультиязычных сайтов: поддерживается множество различных кодировок и языков, а также их автоматическое определение; использует технологию согласования содержимого для индексирования копий одной и той же страницы на разных языках; может искать без учёта акцентов символов (диакретических знаков); а также, разбивать на слова фразы китайского, корейского, тайского и японского языков. Возможно использование синонимов, акронимов и всех морфологических форм слова для расширения результатов поиска. |
Машина готова для индексирования мультиязычных сайтов: поддерживается множество различных кодировок и языков, а также их автоматическое определение; использует технологию согласования содержимого для индексирования копий одной и той же страницы на разных языках; может искать без учёта акцентов символов (диакретических знаков); а также, разбивать на слова фразы китайского, корейского, тайского и японского языков. Возможно использование синонимов, акронимов и всех морфологических форм слова для расширения результатов поиска. |
Версия от 02:40, 6 марта 2007
DataparkSearch | |
---|---|
Тип | поисковая машина |
Разработчик | Максим Захаров |
Написана на | Си |
Операционные системы | FreeBSD, GNU/Linux, Sun Solaris |
Последняя версия | 4.44 (22 января, 2007) |
Репозиторий | github.com/Maxime2/datap… |
Лицензия | GPL |
Сайт | www.dataparksearch.org |
DataparkSearch Engine — поисковая машина с открытым исходным текстом, написаная на языке С. Распространяется по лицензии GPL. Предназначена для организации поиска на одном или многих веб-серверах.
DataparkSearch самостоятельно может индексировать текст, HTML и XML, а также многих других используя внешние парсеры.
Машина готова для индексирования мультиязычных сайтов: поддерживается множество различных кодировок и языков, а также их автоматическое определение; использует технологию согласования содержимого для индексирования копий одной и той же страницы на разных языках; может искать без учёта акцентов символов (диакретических знаков); а также, разбивать на слова фразы китайского, корейского, тайского и японского языков. Возможно использование синонимов, акронимов и всех морфологических форм слова для расширения результатов поиска.
Использует собственную технологию ссылочного ранжирования, основанную на нейронной сети. Эта технология называется Neo Popularity Rank. Результаты поиска могут сортироваться по релевантности, популярности, дате последнего измненения и по важности (произведению релевантности на популярность).
Для уточнения ранжирования сайтов может автоматически строить рефераты индексируемых страниц, состоящие из трёх наиболее важных предложений.
Ссылки
- Официальный сайт проекта
- «Вершки Рунета» -- демо-сайт, использующий DataparkSearch, здесь вы можете посмотреть работу с китайским, корейский, тайским и японским языками, также проиндексированы страницы и на других языках.
- Новостная поисковая машина, использующая DataparkSearch
- Поисковая машина товаров, использующая DataparkSearch