CRISP-DM: различия между версиями
[непроверенная версия] | [непроверенная версия] |
Нет описания правки |
м откат правок 85.113.208.4 (обс.) к версии Рейму Хакурей Метка: откат |
||
Строка 2: | Строка 2: | ||
'''CRISP-DM''' (''Cross-Industry Standard Process for Data Mining''<ref name=Shearer00>Shearer C., ''The CRISP-DM model: the new blueprint for data mining'', J Data Warehousing (2000); 5:13—22.</ref> {{ref-en}} — межотраслевой стандартный процесс для исследования данных) — это проверенная в промышленности и наиболее распространённая <ref>{{Cite web|url=http://www.kdnuggets.com/polls/2002/methodology.htm|title=Poll: What main methodology are you using for data mining?|publisher=www.kdnuggets.com|accessdate=2016-09-14}}</ref> <ref>{{Cite web|url=http://www.kdnuggets.com/polls/2004/data_mining_methodology.htm|title=Poll: Data Mining Methodology|publisher=www.kdnuggets.com|accessdate=2016-09-14}}</ref> <ref>{{Cite web|url=http://www.kdnuggets.com/polls/2014/analytics-data-mining-data-science-methodology.html|title=What main methodology are you using for your analytics, data mining, or data science projects? Poll|publisher=www.kdnuggets.com|accessdate=2016-09-14}}</ref> методология по [[Data mining|исследованию данных]]. |
'''CRISP-DM''' (''Cross-Industry Standard Process for Data Mining''<ref name=Shearer00>Shearer C., ''The CRISP-DM model: the new blueprint for data mining'', J Data Warehousing (2000); 5:13—22.</ref> {{ref-en}} — межотраслевой стандартный процесс для исследования данных) — это проверенная в промышленности и наиболее распространённая <ref>{{Cite web|url=http://www.kdnuggets.com/polls/2002/methodology.htm|title=Poll: What main methodology are you using for data mining?|publisher=www.kdnuggets.com|accessdate=2016-09-14}}</ref> <ref>{{Cite web|url=http://www.kdnuggets.com/polls/2004/data_mining_methodology.htm|title=Poll: Data Mining Methodology|publisher=www.kdnuggets.com|accessdate=2016-09-14}}</ref> <ref>{{Cite web|url=http://www.kdnuggets.com/polls/2014/analytics-data-mining-data-science-methodology.html|title=What main methodology are you using for your analytics, data mining, or data science projects? Poll|publisher=www.kdnuggets.com|accessdate=2016-09-14}}</ref> методология по [[Data mining|исследованию данных]]. |
||
Модель жизненного цикла исследования данных состоит из шести фаз, а стрелки обозначают наиболее важные и частые зависимости между фазами. Последовательность этих фаз строго не определена. Как правило в большинстве проектов приходится возвращаться к предыдущим этапам, а затем снова двигаться вперед <ref name="Marban">Óscar Marbán, Gonzalo Mariscal and Javier Segovia (2009); [http://cdn.intechopen.com/pdfs/5937/InTech- |
Модель жизненного цикла исследования данных состоит из шести фаз, а стрелки обозначают наиболее важные и частые зависимости между фазами. Последовательность этих фаз строго не определена. Как правило в большинстве проектов приходится возвращаться к предыдущим этапам, а затем снова двигаться вперед <ref name="Marban">Óscar Marbán, Gonzalo Mariscal and Javier Segovia (2009); [http://cdn.intechopen.com/pdfs/5937/InTech-A_data_mining_amp_knowledge_discovery_process_model.pdf ''A Data Mining & Knowledge Discovery Process Model'']. In Data Mining and Knowledge Discovery in Real Life Applications, Book edited by: Julio Ponce and Adem Karahoca, ISBN 978-3-902613-53-0, pp. 438-453, February 2009, I-Tech, Vienna, Austria.</ref>. |
||
Первая версия этой методологии была представлена на четвёртом по счёту мероприятии под названием '''''CRISP-DM SIG Workshop''''' в [[Брюссель|Брюсселе]] в марте 1999<ref name="crispDMbrussels">Pete Chapman (1999); [http://lyle.smu.edu/~mhd/8331f03/crisp.pdf ''The CRISP-DM User Guide''].</ref>, а пошаговая инструкция была опубликована годом позже.<ref name="crispDMguide">Pete Chapman, Julian Clinton, Randy Kerber, Thomas Khabaza, Thomas Reinartz, Colin Shearer, and Rüdiger Wirth (2000); [ftp://ftp.software.ibm.com/software/analytics/spss/support/Modeler/Documentation/14/UserManual/CRISP-DM.pdf ''CRISP-DM 1.0 Step-by-step data mining guide''].</ref> |
|||
== Фазы цикла исследования данных == |
|||
[[File:CRISP-DM Process Diagram.png|thumb|right|Жизненный цикл исследования данных]] |
|||
# Понимание бизнес-целей (''Business Understanding'') |
# Понимание бизнес-целей (''Business Understanding'') |
Версия от 17:18, 13 февраля 2020
CRISP-DM (Cross-Industry Standard Process for Data Mining[1] (англ.) — межотраслевой стандартный процесс для исследования данных) — это проверенная в промышленности и наиболее распространённая [2] [3] [4] методология по исследованию данных.
Модель жизненного цикла исследования данных состоит из шести фаз, а стрелки обозначают наиболее важные и частые зависимости между фазами. Последовательность этих фаз строго не определена. Как правило в большинстве проектов приходится возвращаться к предыдущим этапам, а затем снова двигаться вперед [5].
Первая версия этой методологии была представлена на четвёртом по счёту мероприятии под названием CRISP-DM SIG Workshop в Брюсселе в марте 1999[6], а пошаговая инструкция была опубликована годом позже.[7]
Фазы цикла исследования данных
- Понимание бизнес-целей (Business Understanding)
- Начальное изучение данных (Data Understanding)
- Подготовка данных (Data Preparation)
- Моделирование (Modeling)
- Оценка (Evaluation)
- Внедрение (Deployment)
См. также
- Data mining
- Очистка данных
- CRISP-DM методология на сайте открытого университета "Интуит" [8]
- Статья о CRISP-DM на сайте MachineLearning.ru
Ссылки
- ↑ Shearer C., The CRISP-DM model: the new blueprint for data mining, J Data Warehousing (2000); 5:13—22.
- ↑ Poll: What main methodology are you using for data mining? www.kdnuggets.com. Дата обращения: 14 сентября 2016.
- ↑ Poll: Data Mining Methodology . www.kdnuggets.com. Дата обращения: 14 сентября 2016.
- ↑ What main methodology are you using for your analytics, data mining, or data science projects? Poll . www.kdnuggets.com. Дата обращения: 14 сентября 2016.
- ↑ Óscar Marbán, Gonzalo Mariscal and Javier Segovia (2009); A Data Mining & Knowledge Discovery Process Model. In Data Mining and Knowledge Discovery in Real Life Applications, Book edited by: Julio Ponce and Adem Karahoca, ISBN 978-3-902613-53-0, pp. 438-453, February 2009, I-Tech, Vienna, Austria.
- ↑ Pete Chapman (1999); The CRISP-DM User Guide.
- ↑ Pete Chapman, Julian Clinton, Randy Kerber, Thomas Khabaza, Thomas Reinartz, Colin Shearer, and Rüdiger Wirth (2000); CRISP-DM 1.0 Step-by-step data mining guide.
- ↑ CRISP-DM методология на сайте открытого университета "Интуит" . Data Mining: Информация. ИНТУИТ.
Это заготовка статьи по информатике. Помогите Википедии, дополнив её. |