ISSN: 0974-276X
Akram Mohamed y Chittibabu Guda
La determinación de las funciones funcionales de las enzimas es muy importante para construir el modelo metabólico de un organismo e identificar las funciones potenciales que pueden desempeñar las enzimas en las vías metabólicas y de enfermedades. Con el crecimiento exponencial de los datos de secuencias de genes y proteínas, no es factible caracterizar experimentalmente la(s) función(es) de todas las enzimas. Alternativamente, se pueden utilizar métodos computacionales para anotar la enorme cantidad de secuencias de enzimas no anotadas. Para la predicción de la función y la clasificación de las enzimas, las características basadas en la composición de aminoácidos, la secuencia y las propiedades estructurales, la composición del dominio y la información de péptidos específicos han sido ampliamente utilizadas por diferentes enfoques computacionales. Cada espacio de características tiene sus propios méritos y limitaciones en la precisión general de la predicción. La precisión de la predicción mejora cuando se utilizan métodos de aprendizaje automático para clasificar las enzimas. Dada la naturaleza incompleta y desequilibrada de las anotaciones en las bases de datos biológicas, los métodos de conjunto o los métodos que se basan en una combinación de características ortogonales son más deseables para lograr una mayor precisión y cobertura en la clasificación de enzimas. En este artículo de revisión, describimos sistemáticamente todas las características y métodos utilizados hasta ahora para la predicción de clases de enzimas. Según el conocimiento de los autores, esta revisión representa la descripción más exhaustiva de los métodos utilizados para la predicción computacional de las clases de enzimas.