DataparkSearch: различия между версиями

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску
[непроверенная версия][отпатрулированная версия]
Содержимое удалено Содержимое добавлено
Нет описания правки
м Ссылки: исключение ссылок на порталы по итогу опроса о порталах
 
(не показана 21 промежуточная версия 16 участников)
Строка 4: Строка 4:
screenshot = |
screenshot = |
developer = Максим Захаров |
developer = Максим Захаров |
latest_release_version = 4.48 |
latest_release_version = 4.54 |
latest_release_date = [[25 октября]], [[2007]] |
latest_release_date = [[3 декабря]] [[2016]] |
programming language = [[Си (язык программирования)|C]] |
operating_system = [[FreeBSD]], [[GNU]]/[[Linux]], [[Solaris_(операционная_система)|Sun Solaris]] |
operating_system = [[FreeBSD]], [[GNU]]/[[Linux]], [[Solaris|Sun Solaris]] |
genre = [[Поисковая система|поисковая машина]] |
genre = [[Поисковая система|поисковая машина]] |
license = [[GNU General Public License]] |
license = [[GNU General Public License]] |
website = [http://www.dataparksearch.org/ www.dataparksearch.org] |
website = [http://www.dataparksearch.org/ www.dataparksearch.org] |
}}
}}
'''DataparkSearch Engine''' — [[Поисковая система|поисковая машина]] с открытым исходным текстом, написаная на [[Си_(язык программирования)|языке С]]. Распространяется по лицензии [[GNU General Public License|GNU GPL]]. Предназначена для организации [[поиск]]а на одном или многих [[Веб-сайт|веб-серверах]].
'''DataparkSearch Engine''' — [[Поисковая система|поисковая машина]] с открытым исходным текстом, написанная на [[Си (язык программирования)|языке С]]. Распространяется по лицензии [[GNU General Public License|GNU GPL]]. Предназначена для организации [[поиск]]а на одном или многих [[Веб-сайт|веб-серверах]].


DataparkSearch самостоятельно может индексировать текст, [[HTML]] и [[XML]], а также многих других используя внешние парсеры.
DataparkSearch самостоятельно может индексировать текст, [[HTML]] и [[XML]], а также многие другие данные, используя внешние [[Синтаксический анализатор|парсеры]].


Машина готова для индексирования мультиязычных сайтов: поддерживается множество различных кодировок и языков, а также их автоматическое определение; использует технологию согласования содержимого для индексирования копий одной и той же страницы на разных языках; может искать без учёта акцентов символов (диакретических знаков); а также, разбивать на слова фразы китайского, корейского, тайского и японского языков. Возможно использование синонимов, акронимов и всех морфологических форм слова для расширения результатов поиска.
Машина готова для индексирования многоязычных сайтов: поддерживается множество различных кодировок и языков, а также их автоматическое определение; использует технологию согласования содержимого для индексирования копий одной и той же страницы на разных языках; может искать без учёта акцентов символов (диакритических знаков); а также разбивать на слова и фразы китайского, корейского, тайского и японского языков. Возможно использование синонимов, акронимов и всех морфологических форм слова для расширения результатов поиска.


Использует собственную технологию ссылочного ранжирования, основанную на [[Искусственная нейронная сеть|нейронной сети]]. Эта технология называется Neo Popularity Rank. Результаты поиска могут сортироваться по [[Релевантность|релевантности]], популярности, дате последнего измненения и по важности (произведению релевантности на популярность).
Использует собственную технологию ссылочного ранжирования, основанную на [[Искусственная нейронная сеть|нейронной сети]]. Эта технология называется Neo Popularity Rank. Результаты поиска могут сортироваться по [[Релевантность|релевантности]], популярности, дате последнего изменения и по важности (произведению релевантности на популярность).


Для уточнения ранжирования сайтов может автоматически строить рефераты индексируемых страниц, состоящие из трёх наиболее важных предложений.
Для уточнения ранжирования сайтов может автоматически строить рефераты индексируемых страниц, состоящие из трёх наиболее важных предложений.


== Ссылки ==
== Ссылки ==
{{портал|свободное программное обеспечение}}
* [http://www.dataparksearch.org/ Официальный сайт проекта]
* [http://www.dataparksearch.org/ Официальный сайт проекта]
* [http://code.google.com/p/dataparksearch/ Страница проекта в Google Code]
* [http://www.43n39e.ru/ «Вершки Рунета»] — демо-сайт, использующий DataparkSearch, здесь вы можете посмотреть работу с китайским, корейский, тайским и японским языками, также проиндексированы страницы и на других языках.
* [http://www.freshports.org/www/dpsearch Порт FreeBSD]
* [http://www.newslookup.com/ newslookup.com] — новостной сайт, использующий DataparkSearch.


[[Категория:Поисковые системы|D]]
{{Поисковые машины}}
[[Категория:Свободное программное обеспечение]]


[[Категория:Поисковые машины]]
[[en:DataparkSearch]]
[[Категория:Свободное программное обеспечение, написанное на Си]]
[[fr:DataparkSearch]]
[[Категория:Программное обеспечение с лицензией GNU GPL]]

Текущая версия от 16:54, 20 декабря 2021

DataparkSearch
Тип поисковая машина
Разработчик Максим Захаров
Написана на C
Операционные системы FreeBSD, GNU/Linux, Sun Solaris
Последняя версия 4.54 (3 декабря 2016)
Репозиторий github.com/Maxime2/datap…
Лицензия GNU General Public License
Сайт www.dataparksearch.org

DataparkSearch Engineпоисковая машина с открытым исходным текстом, написанная на языке С. Распространяется по лицензии GNU GPL. Предназначена для организации поиска на одном или многих веб-серверах.

DataparkSearch самостоятельно может индексировать текст, HTML и XML, а также многие другие данные, используя внешние парсеры.

Машина готова для индексирования многоязычных сайтов: поддерживается множество различных кодировок и языков, а также их автоматическое определение; использует технологию согласования содержимого для индексирования копий одной и той же страницы на разных языках; может искать без учёта акцентов символов (диакритических знаков); а также разбивать на слова и фразы китайского, корейского, тайского и японского языков. Возможно использование синонимов, акронимов и всех морфологических форм слова для расширения результатов поиска.

Использует собственную технологию ссылочного ранжирования, основанную на нейронной сети. Эта технология называется Neo Popularity Rank. Результаты поиска могут сортироваться по релевантности, популярности, дате последнего изменения и по важности (произведению релевантности на популярность).

Для уточнения ранжирования сайтов может автоматически строить рефераты индексируемых страниц, состоящие из трёх наиболее важных предложений.