CRISP-DM

Материал из Википедии — свободной энциклопедии
Это старая версия этой страницы, сохранённая McCow (обсуждение | вклад) в 14:02, 14 сентября 2016. Она может серьёзно отличаться от текущей версии.
Перейти к навигации Перейти к поиску

Шаблон:Computer-data-stub

CRISP-DM (Cross-Industry Standard Process for Data Mining[1]  (англ.) — межотраслевой стандартный процесс для исследования данных) — это проверенный в промышленности инструмент содействия усилиям по исследованию данных.

Жизненный цикл исследования данных

Модель жизненного цикла исследования данных состоит из шести фаз, а стрелки обозначают наиболее важные и частые зависимости между фазами. Последовательность этих фаз строго не определена. Как правило в большинстве проектов приходится возвращаться к предыдущим этапам, а затем снова двигаться вперед [2].

Фазы цикла исследования данных

  1. Понимание бизнес-целей (Business Understanding)
  2. Начальное изучение данных (Data Understanding)
  3. Подготовка данных (Data Preparatin)
  4. Моделирование (Modeling)
  5. Оценка (Evaluation)
  6. Внедрение (Deployment)

См. также

Очистка данных

Ссылки

  1. Shearer C., The CRISP-DM model: the new blueprint for data mining, J Data Warehousing (2000); 5:13—22.
  2. Óscar Marbán, Gonzalo Mariscal and Javier Segovia (2009); A Data Mining & Knowledge Discovery Process Model. In Data Mining and Knowledge Discovery in Real Life Applications, Book edited by: Julio Ponce and Adem Karahoca, ISBN 978-3-902613-53-0, pp. 438-453, February 2009, I-Tech, Vienna, Austria.