Revista internacional de minería de datos biomédicos

Revista internacional de minería de datos biomédicos
Acceso abierto

ISSN: 2090-4924

abstracto

Una canalización para la reconstrucción de secuencias de ncRNA y la caracterización de la estructura de posibles homólogos de la salida BLAST

Schwarz M y Panek J

Abstracto

Se utiliza el cálculo BLAST por numerosas investigaciones como un aparato exploratorio de búsqueda de arreglos de ARN. Es increíblemente valioso, pero su rendimiento incorpora básicamente datos de agrupación, lo que no es suficiente para la representación de secciones de arreglos. Posteriormente hemos fomentado un pipeline para reconocer agrupaciones totales de las partes, prever diseños auxiliares de los arreglos en cuestión y recoger su homología con la pregunta RNA. La canalización incorpora algunas fases: 1) reconstitución de aciertos BLAST con cálculo Locarna seguro, 2) suposición de homología con el ARN de pregunta con cálculo RSEARCH, 3) previsión de un diseño auxiliar con cálculo Centroid-homfold. Nuestra canalización se puede utilizar para la representación de ncRNA en general al ampliar los datos recordados por el rendimiento BLAST. Además, tiende a ser muy útil cuando se deben encontrar homólogos de ncRNA no caracterizados, por ejemplo, recientemente reconocidos y para los cuales no se pueden utilizar estrategias más complejas para la búsqueda de homología, ya que requieren más datos del ARN en su información que no es #39;t accesible.

Buscar secuencias similares en una base de datos a través de BLAST o una herramienta similar es una de las tareas de bioinformática más comunes aplicadas en general y a los ARN no codificantes. Sin embargo, los resultados de la búsqueda pueden ser difíciles de interpretar debido a la presencia de coincidencias parciales con las secuencias de sujetos de la base de datos. Aquí presentamos rboAnalyzer – una herramienta que ayuda a interpretar el resultado de la búsqueda de secuencias al (1) extender las coincidencias parciales a secuencias de sujeto de longitud completa plausibles, (2) predecir la homología de los ARN representados por secuencias de sujeto de longitud completa con el ARN de consulta, (3) agrupar información sobre los ARN homólogos encontrados en los resultados de búsqueda y las bases de datos públicas como Rfam para predecir estructuras secundarias más confiables para todas las coincidencias, y (4) contextualizar las coincidencias proporcionando los resultados de la predicción y otra información relevante en una rica salida gráfica. El uso de coincidencias de longitud completa predichas mejora la predicción de la estructura secundaria y hace que rboAnalyzer sea robusto con respecto a la identificación de homología. El resultado de la herramienta debería ayudar al usuario a caracterizar de forma fiable los ARN no codificantes en el resultado de BLAST. La utilidad del rboAnalyzer y su capacidad para extender correctamente coincidencias parciales a longitud completa se demuestra en ARN homólogos conocidos. Para permitir que el usuario use bases de datos personalizadas y opciones de búsqueda, rboAnalyzer acepta cualquier resultado de búsqueda como un archivo de texto en formato BLAST. El resultado principal es una página HTML interactiva que muestra las características calculadas y otro contexto de las coincidencias. La salida también se puede exportar en una secuencia apropiada y/o formatos de estructura secundaria.

Top