ISSN: 0974-276X
Haiou Li, Qiang Lyu y Jianlin Cheng
La predicción de la estructura de proteínas es un problema importante en biología computacional y se aplica ampliamente a diversos problemas biomédicos, como el estudio de la función de proteínas, el diseño de proteínas y el diseño de fármacos. En este trabajo, desarrollamos un nuevo enfoque de aprendizaje profundo basado en un codificador automático de eliminación de ruido profundamente apilado para la reconstrucción de la estructura de la proteína. Aplicamos nuestro enfoque a una predicción de estructura de proteína basada en plantilla utilizando solo las coordenadas estructurales 3D de proteínas plantilla homólogas como entrada. Las plantillas se identificaron para una proteína diana mediante una búsqueda PSI-BLAST. Se utilizó 3DRobot (un programa que genera automáticamente señuelos de estructura proteica diversos y bien empaquetados) para generar modelos de señuelo iniciales para el objetivo a partir de las plantillas. Se entrenó un codificador automático de eliminación de ruido apilado en los señuelos para obtener un modelo de aprendizaje profundo para la proteína objetivo. Luego, el modelo profundo entrenado se usó para reconstruir el modelo estructural final para la secuencia objetivo. Con proteínas diana que tienen proteínas de plantilla muy similares como puntos de referencia, la puntuación GDT-TS de las estructuras predichas es superior a 0,7, lo que sugiere que el autocodificador profundo es un método prometedor para la reconstrucción de estructuras de proteínas.