Implementación del árbol de decisión mediante Hadoop MapReduce

Tianyi Yang y Anne Hee Hiong Ngu

abstracto

Implementación del árbol de decisión mediante Hadoop MapReduce

Tianyi Yang y Anne Hee Hiong Ngu

Hadoop es una de las plataformas informáticas de propósito general más populares para el procesamiento distribuido de macrodatos. HDFS es la implementación de un sistema de archivos distribuido por Hadoop para poder almacenar una gran cantidad de datos de manera confiable y servir el componente de procesamiento de datos por Hadoop al mismo tiempo. MapReduce es el principal motor de procesamiento de Hadoop. En este estudio, implementamos HDFS y MapReduce para un conocido árbol de decisiones de algoritmos de aprendizaje de manera escalable para problemas de entrada de gran tamaño. Se evalúa el rendimiento computacional con el número de nodos y el tamaño del problema.

Descargo de responsabilidad: este resumen se tradujo utilizando herramientas de inteligencia artificial y aún no ha sido revisado ni verificado.

Revista internacional de minería de datos biomédicos Acceso abierto

abstracto

Implementación del árbol de decisión mediante Hadoop MapReduce

Revista internacional de minería de datos biomédicos
Acceso abierto