ISSN: 0974-276X
Ali Seman, Ida Rosmini Othman2, Azizian Mohd Sapawi y Zainab Abu Bakar
La clasificación de datos de repetición en tándem corto Y se ha introducido recientemente en las clasificaciones supervisadas y no supervisadas. Este estudio continúa los esfuerzos para clasificar los datos YSTR en función de cuatro modelos de árboles de decisión: Detección automática de interacción CHisquared (CHAID), Árbol de clasificación y regresión (CART), Árbol estadístico rápido, imparcial y eficiente (QUEST) y C5. Se utilizó una herramienta de minería de datos, llamada IBM Statistical Package for the Science Social Modeler 15.0 (IBM® SPSS® Modeler 15) para evaluar el rendimiento de los modelos sobre seis datos Y-STR. Los resultados generales mostraron que los modelos de árboles de decisión pudieron clasificar los seis datos Y-STR de manera significativa. Entre los cuatro modelos, C5 es el modelo más consistente donde produjo la puntuación de precisión más alta del 91,85 %, la puntuación de sensibilidad del 93,69 % y la puntuación de especificidad del 96,32 %.