Revista de Proteómica y Bioinformática

Revista de Proteómica y Bioinformática
Acceso abierto

ISSN: 0974-276X

abstracto

NRPred-FS: un predictor de dos niveles basado en la selección de características para la energía nuclear Receptores

Pu Wang y Xuan Xiao

Motivación: Los receptores nucleares (NR) desempeñan un papel en todos los procesos fisiológicos y de desarrollo y son objetivos farmacológicos importantes en una amplia variedad de enfermedades y estados de salud. En los últimos años, se han introducido muchos métodos de aprendizaje automático para identificar los NR y sus subfamilias con alto rendimiento y bajo costo. Sin embargo, todos estos predictores se desarrollan sobre la base de un conjunto de datos antiguo en NucleaRDB; además, no se emplea ninguna técnica de selección de características, por lo que el rendimiento es muy limitado.

Resultado: en este estudio, se desarrolla un predictor de dos niveles basado en la selección de características, llamado NRPred-FS, que se puede usar para identificar una proteína de consulta como un receptor nuclear o no basándose solo en su información de secuencia, si es , la predicción continuará automáticamente para identificarla aún más entre las siguientes ocho subfamilias: (1) similar a la hormona tiroidea (NR1), (2) similar a HNF4 (NR2), (3) similar a los estrógenos, (4) factor de crecimiento nervioso IB -similar (NR4), (5) similar a Fushi tarazu-F1 (NR5), (6) similar al factor nuclear de células germinales (NR6), (7) similar a knirps (NR0A) y (8) similar a DAX (NR0B). Las secuencias de receptores nucleares se codifican como vectores de características derivados de secuencias formados mediante la incorporación de varias características fisicoquímicas y estadísticas. Además, el conjunto de funciones se optimiza mediante un algoritmo de selección de funciones hacia adelante para reducir las dimensiones de las funciones y obtener una mayor precisión de clasificación. Como demostración, este método pasó por pruebas rigurosas en conjuntos de datos de referencia derivados de la última versión de NucleaRDB y UniProt. Las precisiones generales de predicción de la validación cruzada dejando uno fuera fueron de alrededor del 97 % y 93 % en el primer y segundo nivel, respectivamente. Para comodidad de los usuarios, se puede acceder gratuitamente al potente predictor NRPred-FS en http://www.jci-bioinfo.cn/NRPred-FS. Con suerte, será un vehículo útil para identificar los NR y sus subfamilias.

Top