Revista de Proteómica y Bioinformática

Revista de Proteómica y Bioinformática
Acceso abierto

ISSN: 0974-276X

abstracto

Diagnósticos para métodos estadísticos de selección de variables para la predicción de Enfermedad ulcerosa péptica en la infección por Helicobacter pylori

Hyunsu Ju, Allan R Brasier, Alexander Kurosky, Bo Xu, Victor E Reyes y David Y Graham

Antecedentes: El desarrollo de modelos de clasificación precisos depende de los métodos utilizados para identificar las variables más relevantes. El objetivo de este artículo es evaluar métodos de selección de variables para identificar variables importantes en la predicción de una respuesta binaria utilizando modelos estadísticos no lineales. Nuestros objetivos en la selección de modelos incluyen producir modelos estables sin sobreajuste que sean interpretables, que generen predicciones precisas y tengan un sesgo mínimo. Este trabajo fue motivado por los datos sobre las características clínicas y de laboratorio de las infecciones por Helicobacter pylori obtenidos de 60 personas inscritas en un estudio observacional prospectivo. Resultados: Realizamos una comparación exhaustiva del rendimiento de varios modelos de clasificación no lineal sobre el conjunto de datos de H. pylori. Comparamos los resultados de selección de variables por Splines de Regresión Adaptativa Multivariada (MARS), Regresión Logística con regularización, Modelos Aditivos Generalizados (GAMs) y Selección Bayesiana de Variables en GAMs. Descubrimos que el enfoque del modelo MARS tiene el poder predictivo más alto porque las suposiciones de no linealidad de los predictores candidatos se satisfacen en gran medida, un hallazgo demostrado a través de procedimientos de prueba de desviación de chi-cuadrado en GAM. Conclusiones: Nuestros resultados sugieren que los aminoácidos libres fisiológicos citrulina, histidina, lisina y arginina son las principales características para predecir la enfermedad de úlcera péptica por H. pylori sobre la base del perfil de aminoácidos.

Top