ISSN: 0974-276X
Salim A y Vinod Chandra SS
Los microARN son moléculas pequeñas de ARN no codificantes que regulan la expresión génica. El microARN puede unirse a los ARNm y controlar la función prevista de los ARNm. Hay un puñado de algoritmos computacionales para la predicción de objetivos, pero el grado de falsos positivos y falsos negativos es alto. En este artículo, proponemos un modelo oculto de Markov para la predicción de semillas y un clasificador de máquina de vectores de soporte (SVM) para la predicción de objetivos. El conjunto de datos positivos para el entrenamiento se ha recopilado a partir de objetivos validados experimentalmente, mientras que el conjunto de datos negativos se ha identificado sistemáticamente a partir de falsos positivos predichos. Cada secuencia candidata de diana de ARNm se alinea con la secuencia de microARN y se prueba para una región semilla utilizando el modelo HMM entrenado. Si la prueba tiene éxito, se extrajeron 22 características del dúplex alineado y se introdujeron en un clasificador SVM. El módulo de identificación de semillas basado en HMM funciona con una precisión del 95,6 % y el clasificador SVM proporciona una precisión del 97,49 %. Hemos comparado los sitios de unión de 9 microARN en ARN de 148 m con los resultados de sitios diana validados y nuestros resultados son más precisos que otros enfoques.