ISSN: 0974-276X
Abishek Suresh, Pattabhiraman Lalitha y Pandjassarame Kangueane
Los homodímeros de proteínas desempeñan un papel fundamental en la catálisis y la regulación, y su mecanismo de plegamiento es intrigante. Los mecanismos de plegamiento del homodímero (2 estados [2S] sin intermediarios y 3 estados [3S] con intermediarios monómeros [3SMI] o dímeros [3SDI]) se han observado y documentado para aproximadamente 46 homodímeros (27 2S; 12 3SMI; 7 3SDI) con estructuras 3D conocidas. La determinación de los mecanismos de plegamiento a través de experimentos de desnaturalización clásicos requiere mucho tiempo, es tediosa y costosa. Por lo tanto, es de interés predecir su mecanismo de plegado. Además, un gran número de estructuras de homodímeros con mecanismo de plegamiento desconocido están disponibles en el PDB. Por lo tanto, es convincente predecir su mecanismo de plegado utilizando las características estructurales intrínsecas de cada estructura compleja. Por lo tanto, desarrollamos un modelo de árbol de clasificación y regresión (CART) usando parámetros predictivos ((a) tamaño de proteína monomérica (ML); (b) área de interfaz (B/2); (c) interfaz a residuos totales (I/ T) ratio) derivado de un conjunto de datos (46 homodímeros con estructuras conocidas y mecanismo de plegamiento) para la predicción de mecanismos de plegamiento. El conjunto de datos se dividió subjetivamente en conjuntos de entrenamiento (13 2S; 6 3SMI; 3 3SDI) y de prueba (14 2S; 6 3SMI; 4 3SDI) para la validación. El modelo se desempeñó bastante bien para predecir 2S y 3SMI tanto durante el entrenamiento como durante la prueba usando ML e I/T como variables predictivas. Sin embargo, cabe señalar que el rendimiento del modelo en la clasificación de 3SDI es deficiente. No obstante, el modelo no fue estable con la inclusión de la variable predictiva B/2 y, por lo tanto, no se consideró durante el entrenamiento y las pruebas. El modelo CART produjo precisiones del 85 % (2S), 83 % (3SMI) y 100 % (3SDI) con valores predictivos positivos (PPV) del 100 % (2S), 83 % (3SMI) y 75 % (3SDI) durante el entrenamiento . Luego produjo precisiones de 100 % (2S) y 50 % (3SMI) con valores predictivos positivos (PPV) de 74 % (2S), 60 % (3SMI) durante la prueba. Por lo tanto, luego usamos el modelo para asignar mecanismos de plegamiento a homodímeros de proteínas con estructuras conocidas y mecanismos de plegamiento desconocidos. Este ejercicio proporciona un marco para las estructuras de homodímero pronosticadas con un mecanismo de plegamiento desconocido para una mayor verificación a través de experimentos de plegamiento. El modelo CART fue capaz de asignar mecanismos de plegamiento a todas (169) las estructuras de homodímeros (con datos de plegamiento desconocidos) debido a sus sólidas capacidades de aprendizaje automáticas, a diferencia del modelo de decisión desarrollado manualmente que dejaba algunas estructuras sin asignar.