CRISP-DM: различия между версиями
[непроверенная версия] | [непроверенная версия] |
Спасено источников — 5, отмечено мёртвыми — 0. Сообщить об ошибке. См. FAQ.) #IABot (v2.0.8.7 |
Спасено источников — 0, отмечено мёртвыми — 1. Сообщить об ошибке. См. FAQ.) #IABot (v2.0.9.5 |
||
Строка 3: | Строка 3: | ||
Модель жизненного цикла исследования данных в методологии состоит из шести фаз, а стрелки обозначают наиболее важные и частые зависимости между фазами. Последовательность этих фаз строго не определена. Как правило в большинстве проектов приходится возвращаться к предыдущим этапам, а затем снова двигаться вперед<ref name="Marban">Óscar Marbán, Gonzalo Mariscal and Javier Segovia (2009); [http://cdn.intechopen.com/pdfs/5937/InTech-A_data_mining_amp_knowledge_discovery_process_model.pdf ''A Data Mining & Knowledge Discovery Process Model''] {{Wayback|url=http://cdn.intechopen.com/pdfs/5937/InTech-A_data_mining_amp_knowledge_discovery_process_model.pdf |date=20130430234844 }}. In Data Mining and Knowledge Discovery in Real Life Applications, Book edited by: Julio Ponce and Adem Karahoca, ISBN 978-3-902613-53-0, pp. 438—453, February 2009, I-Tech, Vienna, Austria.</ref>. |
Модель жизненного цикла исследования данных в методологии состоит из шести фаз, а стрелки обозначают наиболее важные и частые зависимости между фазами. Последовательность этих фаз строго не определена. Как правило в большинстве проектов приходится возвращаться к предыдущим этапам, а затем снова двигаться вперед<ref name="Marban">Óscar Marbán, Gonzalo Mariscal and Javier Segovia (2009); [http://cdn.intechopen.com/pdfs/5937/InTech-A_data_mining_amp_knowledge_discovery_process_model.pdf ''A Data Mining & Knowledge Discovery Process Model''] {{Wayback|url=http://cdn.intechopen.com/pdfs/5937/InTech-A_data_mining_amp_knowledge_discovery_process_model.pdf |date=20130430234844 }}. In Data Mining and Knowledge Discovery in Real Life Applications, Book edited by: Julio Ponce and Adem Karahoca, ISBN 978-3-902613-53-0, pp. 438—453, February 2009, I-Tech, Vienna, Austria.</ref>. |
||
Первая версия этой методологии была представлена на четвёртом по счёту мероприятии CRISP-DM SIG Workshop в [[Брюссель|Брюсселе]] в марте 1999 года<ref name="crispDMbrussels">Pete Chapman (1999); [http://lyle.smu.edu/~mhd/8331f03/crisp.pdf ''The CRISP-DM User Guide''] {{Wayback|url=http://lyle.smu.edu/~mhd/8331f03/crisp.pdf |date=20150714123142 }}.</ref>, а пошаговая инструкция была опубликована годом позже<ref name="crispDMguide">Pete Chapman, Julian Clinton, Randy Kerber, Thomas Khabaza, Thomas Reinartz, Colin Shearer, and Rüdiger Wirth (2000); [ftp://ftp.software.ibm.com/software/analytics/spss/support/Modeler/Documentation/14/UserManual/CRISP-DM.pdf ''CRISP-DM 1.0 Step-by-step data mining guide''].</ref>. |
Первая версия этой методологии была представлена на четвёртом по счёту мероприятии CRISP-DM SIG Workshop в [[Брюссель|Брюсселе]] в марте 1999 года<ref name="crispDMbrussels">Pete Chapman (1999); [http://lyle.smu.edu/~mhd/8331f03/crisp.pdf ''The CRISP-DM User Guide''] {{Wayback|url=http://lyle.smu.edu/~mhd/8331f03/crisp.pdf |date=20150714123142 }}.</ref>, а пошаговая инструкция была опубликована годом позже<ref name="crispDMguide">Pete Chapman, Julian Clinton, Randy Kerber, Thomas Khabaza, Thomas Reinartz, Colin Shearer, and Rüdiger Wirth (2000); [ftp://ftp.software.ibm.com/software/analytics/spss/support/Modeler/Documentation/14/UserManual/CRISP-DM.pdf ''CRISP-DM 1.0 Step-by-step data mining guide'']{{Недоступная ссылка}}.</ref>. |
||
[[Файл:CRISP-DM Process Diagram.png|thumb|right|Жизненный цикл исследования данных]] |
[[Файл:CRISP-DM Process Diagram.png|thumb|right|Жизненный цикл исследования данных]] |
||
Текущая версия от 18:01, 6 июня 2023
CRISP-DM (англ. Cross-Industry Standard Process for Data Mining[1]) — наиболее распространённая[2][3][4] методология по исследованию данных.
Модель жизненного цикла исследования данных в методологии состоит из шести фаз, а стрелки обозначают наиболее важные и частые зависимости между фазами. Последовательность этих фаз строго не определена. Как правило в большинстве проектов приходится возвращаться к предыдущим этапам, а затем снова двигаться вперед[5].
Первая версия этой методологии была представлена на четвёртом по счёту мероприятии CRISP-DM SIG Workshop в Брюсселе в марте 1999 года[6], а пошаговая инструкция была опубликована годом позже[7].
Фазы цикла исследования данных:
- Понимание бизнес-целей (Business Understanding)
- Начальное изучение данных (Data Understanding)
- Подготовка данных (Data Preparation)
- Моделирование (Modeling)
- Оценка (Evaluation)
- Внедрение (Deployment)
Последовательность фаз не является строгой и перемещается вперед и назад между различными фазами, как это всегда требуется. Стрелки на диаграмме процесса указывают на наиболее важные и частые зависимости между фазами. Внешний круг на диаграмме символизирует циклический характер самого интеллектуального анализа данных. Процесс интеллектуального анализа данных продолжается после развертывания решения. Уроки, извлеченные в ходе процесса, могут вызвать новые, часто более целенаправленные бизнес-вопросы, а последующие процессы интеллектуального анализа данных извлекут пользу из опыта предыдущих.
Примечания
[править | править код]- ↑ Shearer C., The CRISP-DM model: the new blueprint for data mining, J Data Warehousing (2000); 5:13—22.
- ↑ Poll: What main methodology are you using for data mining? www.kdnuggets.com. Дата обращения: 14 сентября 2016. Архивировано 16 января 2017 года.
- ↑ Poll: Data Mining Methodology . www.kdnuggets.com. Дата обращения: 14 сентября 2016. Архивировано 8 февраля 2017 года.
- ↑ What main methodology are you using for your analytics, data mining, or data science projects? Poll . www.kdnuggets.com. Дата обращения: 14 сентября 2016. Архивировано 1 августа 2016 года.
- ↑ Óscar Marbán, Gonzalo Mariscal and Javier Segovia (2009); A Data Mining & Knowledge Discovery Process Model Архивная копия от 30 апреля 2013 на Wayback Machine. In Data Mining and Knowledge Discovery in Real Life Applications, Book edited by: Julio Ponce and Adem Karahoca, ISBN 978-3-902613-53-0, pp. 438—453, February 2009, I-Tech, Vienna, Austria.
- ↑ Pete Chapman (1999); The CRISP-DM User Guide Архивная копия от 14 июля 2015 на Wayback Machine.
- ↑ Pete Chapman, Julian Clinton, Randy Kerber, Thomas Khabaza, Thomas Reinartz, Colin Shearer, and Rüdiger Wirth (2000); CRISP-DM 1.0 Step-by-step data mining guide (недоступная ссылка).