ISSN: 2165- 7866
Óscar Marbán und Javier Segovia
Vorhandene Data Mining-Prozessmodelle schlagen die eine oder andere Möglichkeit vor, Projekte strukturiert zu entwickeln und versuchen, ihre Komplexität durch effektives Projektmanagement zu reduzieren. In jeder technischen Umgebung ist bekannt, dass eine der Managementaufgaben, die zur Reduzierung von Projektproblemen beiträgt, die systematische Projektdokumentation ist, aber nur wenige der vorhandenen Data Mining-Prozesse bieten eine solche Dokumentation an. Darüber hinaus weisen diese wenigen auf die Notwendigkeit hin, in jeder Phase eine Dokumentation als Input für die nächste zu erstellen, zeigen jedoch nicht, wie dies zu tun ist. Auf der anderen Seite gibt es in der Literatur Beispiele für UML-Erweiterungen für Data Mining-Projekte, aber sie konzentrieren sich immer auf die Modellimplementierungsseite und berücksichtigen nicht den Rest des Prozesses. In diesem Artikel stellen wir eine Erweiterung der UML-Modellierungssprache für Data Mining-Projekte (DM-UML) vor, die alle Dokumentationsanforderungen für ein Projekt abdeckt, das einem Standardprozess, nämlich CRISP-DM, entspricht, vom Geschäftsverständnis bis zur Bereitstellung. Wir zeigen auch ein Beispiel für eine reale Anwendung der vorgeschlagenen DM-UML-Modellierung. Dieser Ansatz bietet nicht nur die Vorteile einer standardisierten Dokumentationserstellung, sondern stellt auch ein sehr nützliches und transparentes Tool für die Modellierung und Verknüpfung der Geschäftsverständnis- bzw. Modellierungsphase mit dem Rest des Projekts bis hin zur Bereitstellung dar. Darüber hinaus erleichtert er die Kommunikation mit den am Projekt beteiligten nichttechnischen Stakeholdern - Probleme, die beim Data Mining schon immer eine offene Frage waren.