Кластеризация документов: различия между версиями

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску
[непроверенная версия][отпатрулированная версия]
Содержимое удалено Содержимое добавлено
Нет описания правки
 
(не показано 18 промежуточных версий 18 участников)
Строка 1: Строка 1:
'''Кластеризация документов''' — одна из задач [[Информационный поиск|информационного поиска]].
'''Кластериза́ция докуме́нтов''' — одна из задач [[Информационный поиск|информационного поиска]].
Целью кластеризации документов является автоматическое выявление групп семантически похожих документов среди заданного фиксированного множества документов. Следует отметить, что группы формируются только на основе попарной схожести описаний документов, и никакие характеристики этих групп не задаются заранее, в отличие от [[Классификация документов|классификации документов]], где категории задаются заранее.
Целью кластеризации документов является автоматическое выявление групп семантически похожих документов среди заданного фиксированного множества документов. Группы формируются только на основе попарной схожести описаний документов, и никакие характеристики этих групп не задаются заранее, в отличие от [[Классификация документов|классификации документов]], где категории задаются заранее.


== См. также ==
[[Категория:Информатика]]
* [[Кластерный анализ]]
* [[Классификация документов]]
* [[Тематическое моделирование]]
{{Искусственный интеллект}}
{{rq|empty|source}}
{{Перевести|en|Document clustering}}

[[Категория:Автоматическая обработка текстов]]
[[Категория:Информационный поиск]]

Текущая версия от 08:34, 10 мая 2024

Кластериза́ция докуме́нтов — одна из задач информационного поиска. Целью кластеризации документов является автоматическое выявление групп семантически похожих документов среди заданного фиксированного множества документов. Группы формируются только на основе попарной схожести описаний документов, и никакие характеристики этих групп не задаются заранее, в отличие от классификации документов, где категории задаются заранее.