Revista de Proteómica y Bioinformática

Revista de Proteómica y Bioinformática
Acceso abierto

ISSN: 0974-276X

abstracto

Predicción de la calidad del modelo de proteínas a partir de alineaciones de secuencias por soporte Máquinas vectoriales

Xin Deng, Jilong Li y Jianlin Cheng

La evaluación de la calidad de un modelo de estructura de proteína es esencial para la predicción de la estructura de proteína. Aquí, desarrollamos un método de Máquina de vectores de soporte (SVM) para predecir el puntaje de calidad (puntaje GDT-TS) de un modelo de estructura de proteína a partir de las características extraídas de la alineación de secuencia utilizada para generar el modelo. Desarrollamos un método de evaluación de la calidad del modelo de máquina de vectores de soporte (SVM), tomando como entrada una alineación por pares de plantilla única de consulta o una alineación de plantilla múltiple de consulta. Para el esquema de alineación por pares, las características de entrada que se introducen en el predictor SVM incluyen el valor e normalizado de la alineación dada, el porcentaje de pares de residuos idénticos en la alineación, el porcentaje de residuos de la consulta alineados con los de la plantilla y la suma de las puntuaciones BLOSUM de todos los residuos alineados dividida por la longitud de las posiciones alineadas. De manera similar, para el esquema de alineación múltiple, las características de entrada incluyen el porcentaje de residuos de la secuencia objetivo alineados con los de una o más plantillas, el porcentaje de residuos alineados de la secuencia objetivo que son iguales a los de cualquier plantilla , la puntuación media de BLOSUM de residuos alineados y la puntuación media de Gonnet160 de residuos alineados. Se entrenó un predictor de regresión SVM en los datos de entrenamiento para predecir las puntuaciones GDT-TS de los modelos a partir de las características de entrada. Se calcularon el error cuadrático medio (RMSE) y el error medio absoluto (ABS) entre las puntuaciones GDT-TS predichas y reales para evaluar el rendimiento. Se aplicó una validación cruzada de cinco veces para seleccionar los mejores valores de parámetros basados en el promedio de RMSE y ABS en las cinco veces. El RMSE y el ABS del predictor de SVM optimizado en los datos de prueba estuvieron cerca de 0,1. El buen rendimiento de la SVM y el predictor basado en la alineación de secuencias indica que la integración de características de alineación de secuencias con una SVM es eficaz para la evaluación de la calidad del modelo de proteínas.

Top