Кластеризация документов

Материал из Википедии — свободной энциклопедии
Это старая версия этой страницы, сохранённая AbiyoyoBot (обсуждение | вклад) в 11:19, 9 марта 2023 (См. также: замена устаревших перенаправлений: rq/stub -> rq/empty). Она может серьёзно отличаться от текущей версии.
Перейти к навигации Перейти к поиску

Кластериза́ция докуме́нтов — одна из задач информационного поиска. Целью кластеризации документов является автоматическое выявление групп семантически похожих документов среди заданного фиксированного множества документов. Группы формируются только на основе попарной схожести описаний документов, и никакие характеристики этих групп не задаются заранее, в отличие от классификации документов, где категории задаются заранее.

См. также