ISSN: 2165- 7866
Óscar Marbán y Javier Segovia
Los modelos de proceso de Minería de Datos existentes proponen una forma u otra de desarrollar proyectos de manera estructurada, tratando de reducir su complejidad a través de una gestión de proyectos efectiva. Es bien sabido en cualquier entorno de ingeniería que una de las tareas de gestión que ayuda a reducir los problemas del proyecto es la documentación sistemática del proyecto, pero pocos de los procesos de Minería de Datos existentes proponen su documentación. Además, estos pocos remarcan la necesidad de producir documentación en cada fase como insumo para la siguiente, pero no muestran cómo hacerlo. Por otro lado, en la literatura hay ejemplos de extensiones UML para proyectos de minería de datos, pero siempre se enfocan en el lado de la implementación del modelo y no toman en cuenta el resto del proceso. En este artículo, presentamos una extensión del lenguaje de modelado UML para proyectos de minería de datos (DM-UML) que cubre todas las necesidades de documentación para un proyecto conforme a un proceso estándar, a saber, CRISP-DM, que van desde la comprensión del negocio hasta la implementación. También mostramos un ejemplo de una aplicación real del modelado DM-UML propuesto. El resultado de este enfoque es que, además de las ventajas de tener una forma estandarizada de producir la documentación, constituye claramente una herramienta muy útil y transparente para modelar y conectar la fase de comprensión o modelado del negocio con el resto del proyecto hasta la implementación. , así como una forma de facilitar la comunicación con los stakeholders no técnicos involucrados en el proyecto, problemas que siempre han sido una cuestión abierta en la minería de datos.