CRISP-DM: различия между версиями

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску
[непроверенная версия][непроверенная версия]
Содержимое удалено Содержимое добавлено
Нет описания правки
м откат правок 85.113.208.4 (обс.) к версии Рейму Хакурей
Метка: откат
Строка 2: Строка 2:
'''CRISP-DM''' (''Cross-Industry Standard Process for Data Mining''<ref name=Shearer00>Shearer C., ''The CRISP-DM model: the new blueprint for data mining'', J Data Warehousing (2000); 5:13—22.</ref> {{ref-en}} — межотраслевой стандартный процесс для исследования данных) — это проверенная в промышленности и наиболее распространённая <ref>{{Cite web|url=http://www.kdnuggets.com/polls/2002/methodology.htm|title=Poll: What main methodology are you using for data mining?|publisher=www.kdnuggets.com|accessdate=2016-09-14}}</ref> <ref>{{Cite web|url=http://www.kdnuggets.com/polls/2004/data_mining_methodology.htm|title=Poll: Data Mining Methodology|publisher=www.kdnuggets.com|accessdate=2016-09-14}}</ref> <ref>{{Cite web|url=http://www.kdnuggets.com/polls/2014/analytics-data-mining-data-science-methodology.html|title=What main methodology are you using for your analytics, data mining, or data science projects? Poll|publisher=www.kdnuggets.com|accessdate=2016-09-14}}</ref> методология по [[Data mining|исследованию данных]].
'''CRISP-DM''' (''Cross-Industry Standard Process for Data Mining''<ref name=Shearer00>Shearer C., ''The CRISP-DM model: the new blueprint for data mining'', J Data Warehousing (2000); 5:13—22.</ref> {{ref-en}} — межотраслевой стандартный процесс для исследования данных) — это проверенная в промышленности и наиболее распространённая <ref>{{Cite web|url=http://www.kdnuggets.com/polls/2002/methodology.htm|title=Poll: What main methodology are you using for data mining?|publisher=www.kdnuggets.com|accessdate=2016-09-14}}</ref> <ref>{{Cite web|url=http://www.kdnuggets.com/polls/2004/data_mining_methodology.htm|title=Poll: Data Mining Methodology|publisher=www.kdnuggets.com|accessdate=2016-09-14}}</ref> <ref>{{Cite web|url=http://www.kdnuggets.com/polls/2014/analytics-data-mining-data-science-methodology.html|title=What main methodology are you using for your analytics, data mining, or data science projects? Poll|publisher=www.kdnuggets.com|accessdate=2016-09-14}}</ref> методология по [[Data mining|исследованию данных]].


Модель жизненного цикла исследования данных состоит из шести фаз, а стрелки обозначают наиболее важные и частые зависимости между фазами. Последовательность этих фаз строго не определена. Как правило в большинстве проектов приходится возвращаться к предыдущим этапам, а затем снова двигаться вперед <ref name="Marban">Óscar Marbán, Gonzalo Mariscal and Javier Segovia (2009); [http://cdn.intechopen.com/pdfs/5937/InTech-A_data_mining_amp_knowleл исследования данных]]
Модель жизненного цикла исследования данных состоит из шести фаз, а стрелки обозначают наиболее важные и частые зависимости между фазами. Последовательность этих фаз строго не определена. Как правило в большинстве проектов приходится возвращаться к предыдущим этапам, а затем снова двигаться вперед <ref name="Marban">Óscar Marbán, Gonzalo Mariscal and Javier Segovia (2009); [http://cdn.intechopen.com/pdfs/5937/InTech-A_data_mining_amp_knowledge_discovery_process_model.pdf ''A Data Mining & Knowledge Discovery Process Model'']. In Data Mining and Knowledge Discovery in Real Life Applications, Book edited by: Julio Ponce and Adem Karahoca, ISBN 978-3-902613-53-0, pp. 438-453, February 2009, I-Tech, Vienna, Austria.</ref>.

Первая версия этой методологии была представлена на четвёртом по счёту мероприятии под названием '''''CRISP-DM SIG Workshop''''' в [[Брюссель|Брюсселе]] в марте 1999<ref name="crispDMbrussels">Pete Chapman (1999); [http://lyle.smu.edu/~mhd/8331f03/crisp.pdf ''The CRISP-DM User Guide''].</ref>, а пошаговая инструкция была опубликована годом позже.<ref name="crispDMguide">Pete Chapman, Julian Clinton, Randy Kerber, Thomas Khabaza, Thomas Reinartz, Colin Shearer, and Rüdiger Wirth (2000); [ftp://ftp.software.ibm.com/software/analytics/spss/support/Modeler/Documentation/14/UserManual/CRISP-DM.pdf ''CRISP-DM 1.0 Step-by-step data mining guide''].</ref>

== Фазы цикла исследования данных ==
[[File:CRISP-DM Process Diagram.png|thumb|right|Жизненный цикл исследования данных]]


# Понимание бизнес-целей (''Business Understanding'')
# Понимание бизнес-целей (''Business Understanding'')

Версия от 17:18, 13 февраля 2020

CRISP-DM (Cross-Industry Standard Process for Data Mining[1]  (англ.) — межотраслевой стандартный процесс для исследования данных) — это проверенная в промышленности и наиболее распространённая [2] [3] [4] методология по исследованию данных.

Модель жизненного цикла исследования данных состоит из шести фаз, а стрелки обозначают наиболее важные и частые зависимости между фазами. Последовательность этих фаз строго не определена. Как правило в большинстве проектов приходится возвращаться к предыдущим этапам, а затем снова двигаться вперед [5].

Первая версия этой методологии была представлена на четвёртом по счёту мероприятии под названием CRISP-DM SIG Workshop в Брюсселе в марте 1999[6], а пошаговая инструкция была опубликована годом позже.[7]

Фазы цикла исследования данных

Жизненный цикл исследования данных
  1. Понимание бизнес-целей (Business Understanding)
  2. Начальное изучение данных (Data Understanding)
  3. Подготовка данных (Data Preparation)
  4. Моделирование (Modeling)
  5. Оценка (Evaluation)
  6. Внедрение (Deployment)

См. также

Ссылки

  1. Shearer C., The CRISP-DM model: the new blueprint for data mining, J Data Warehousing (2000); 5:13—22.
  2. Poll: What main methodology are you using for data mining? www.kdnuggets.com. Дата обращения: 14 сентября 2016.
  3. Poll: Data Mining Methodology. www.kdnuggets.com. Дата обращения: 14 сентября 2016.
  4. What main methodology are you using for your analytics, data mining, or data science projects? Poll. www.kdnuggets.com. Дата обращения: 14 сентября 2016.
  5. Óscar Marbán, Gonzalo Mariscal and Javier Segovia (2009); A Data Mining & Knowledge Discovery Process Model. In Data Mining and Knowledge Discovery in Real Life Applications, Book edited by: Julio Ponce and Adem Karahoca, ISBN 978-3-902613-53-0, pp. 438-453, February 2009, I-Tech, Vienna, Austria.
  6. Pete Chapman (1999); The CRISP-DM User Guide.
  7. Pete Chapman, Julian Clinton, Randy Kerber, Thomas Khabaza, Thomas Reinartz, Colin Shearer, and Rüdiger Wirth (2000); CRISP-DM 1.0 Step-by-step data mining guide.
  8. CRISP-DM методология на сайте открытого университета "Интуит". Data Mining: Информация. ИНТУИТ.

Шаблон:Computer-data-stub