Revista internacional de minería de datos biomédicos

Revista internacional de minería de datos biomédicos
Acceso abierto

ISSN: 2090-4924

abstracto

Algoritmo de predicción de genes basado en la selección de características del marco de lectura abierto para secuencias metagenómicas

ruilin li

La predicción genética es un enfoque importante para tratar de mejorar el comentario de las cualidades metagenómicas. Se ha ejecutado una variedad de modelos de expectativas de calidad que dependen de varios estándares, con énfasis en modelos medibles, modelos de Markov o Markov mejorados, modelos de aprendizaje profundo, etc. Los cálculos de pronóstico de calidad actuales, por ejemplo, FragGeneScan, Prodigal, MetaGeneAnnotator, Orphelia, Glimmer3 , GeneMarkS-2, estaban destinados únicamente a secciones cortas o genomas completos; sin embargo, lo anterior hará que las cualidades reconocidas se fragmenten y lo último no sea adecuado para especies oscuras.

Mientras tanto, de acuerdo con los efectos secundarios de estos cálculos de referencia anteriores, la tasa de error de expectativa fue moderadamente alta (27,10 %~54,70 %), en particular para los conjuntos de datos con baja inclusión (conjunto de datos escalonados). En esta investigación, propusimos un cálculo que depende de la selección de resaltados de los ORF denominados Consenso, que consolidó los ORF creados a partir de modelos conocidos, extrajo los ORF ' red de componentes y la red de marcas de comparación. Finalmente, la disposición ideal fue adquirida por la respuesta menos cuadrada de las cuadrículas de elementos y marcas. El indicador general de la previsión de calidad a través de Consensus fue superior al de la programación única (la puntuación F fue del 82,94 % en el conjunto de datos aturdido).

Top