Ginecología y Obstetricia

Ginecología y Obstetricia
Acceso abierto

ISSN: 2161-0932

abstracto

Una aplicación del aprendizaje automático en la FIV: Comparación de la precisión de los algoritmos de clasificación para la predicción de gemelos

John Rinehart

Antecedentes: Los dilemas de toma de decisiones clínicas son particularmente notables en la práctica de la FIV, dado que grandes conjuntos de datos a menudo se generan que permiten a los médicos hacer predicciones que informan las opciones de tratamiento. Este estudio aplicó el aprendizaje automático mediante el uso de datos de FIV para determinar el riesgo de gemelos cuando hay dos o más embriones disponibles para la transferencia. Si bien la mayoría de los clasificadores pueden proporcionar estimaciones de precisión, este estudio fue más allá al comparar clasificadores tanto por precisión como por Área bajo la curva (AUC).
Métodos: Los datos del estudio se derivaron de una gran sistema de registro médico electrónico que es utilizado por más de 140 clínicas de FIV y contenía 135,000 ciclos de FIV. El conjunto de datos se redujo de 88 variables a 40 e incluyó solo aquellos ciclos de FIV en los que se crearon dos o más embriones de blastocisto. Los siguientes clasificadores se compararon en términos de precisión y AUC: un modelo lineal generalizado, análisis discriminante lineal, análisis discriminante cuadrático, K-vecinos más cercanos, máquina de vectores de soporte, bosques aleatorios y potenciación. También se aplicó un algoritmo de aprendizaje de conjunto de apilamiento para usar predicciones de clasificadores para crear un nuevo modelo.
Resultados: Si bien el clasificador de conjunto fue el más preciso, ninguno de los clasificadores predominó por ser significativamente superior a otros clasificadores. Los hallazgos indicaron que los métodos de refuerzo para clasificadores funcionaron mal; los clasificadores de análisis discriminante lineal y logístico funcionaron mejor que el clasificador de análisis discriminante cuadrático, y la máquina de vectores de soporte funcionó casi tan bien como el clasificador de árbol. Los resultados de AUC fueron consistentes con las comparaciones de precisión. También se realizó una validación externa utilizando un conjunto de datos diferente que contenía 588 observaciones. Todos los modelos funcionaron mejor con el conjunto de datos de validación externa, con el clasificador de bosque aleatorio funcionando notablemente mejor que cualquier otro clasificador.
Conclusiones: estos resultados respaldan la impresión de que los grandes datos pueden ser valiosos en el proceso de toma de decisiones clínicas; pero que ningún algoritmo estadístico único proporciona la máxima precisión para todas las bases de datos. Por lo tanto, diferentes conjuntos de datos requerirán investigación para determinar qué algoritmos son los más precisos para un conjunto de datos en particular. Estos hallazgos subrayan la premisa de que los médicos con acceso a grandes cantidades de datos pueden usar modelos analíticos predictivos avanzados para crear información clínica sólida de vital importancia para la atención del paciente.

Top