Errores computacionales y sesgos en la lectura corta de secuenciación de próxima generación

Irina Abnizova; Rene te Boekhorst y Yuriy L Orlov

abstracto

Errores computacionales y sesgos en la lectura corta de secuenciación de próxima generación

Irina Abnizova, Rene te Boekhorst y Yuriy L Orlov

Las tecnologías de secuenciación de próxima generación producen una cantidad astronómica de datos útiles, pero también artefactos y errores. Algunos de estos errores pueden imitar señales biológicas verdaderas, como mutaciones, y por lo tanto pueden invalidar las conclusiones. En la secuenciación de próxima generación, pueden ocurrir dos tipos de errores: experimentales y computacionales. Los errores computacionales son aquellos que se derivan del post-procesamiento digital de muestras secuenciadas, y son el tema principal de este trabajo. El posprocesamiento implica procedimientos como la puntuación de calidad, la alineación, el ensamblaje, la llamada de variantes, el genotipado y la corrección de errores de los datos. Este documento trata sobre los errores de posprocesamiento y los métodos computacionales para detectarlos y corregirlos.

Descargo de responsabilidad: este resumen se tradujo utilizando herramientas de inteligencia artificial y aún no ha sido revisado ni verificado.

Revista de Proteómica y Bioinformática Acceso abierto

abstracto

Errores computacionales y sesgos en la lectura corta de secuenciación de próxima generación

Revista de Proteómica y Bioinformática
Acceso abierto