ISSN: 0974-276X
Irina Abnizova, Rene te Boekhorst y Yuriy L Orlov
Las tecnologías de secuenciación de próxima generación producen una cantidad astronómica de datos útiles, pero también artefactos y errores. Algunos de estos errores pueden imitar señales biológicas verdaderas, como mutaciones, y por lo tanto pueden invalidar las conclusiones. En la secuenciación de próxima generación, pueden ocurrir dos tipos de errores: experimentales y computacionales. Los errores computacionales son aquellos que se derivan del post-procesamiento digital de muestras secuenciadas, y son el tema principal de este trabajo. El posprocesamiento implica procedimientos como la puntuación de calidad, la alineación, el ensamblaje, la llamada de variantes, el genotipado y la corrección de errores de los datos. Este documento trata sobre los errores de posprocesamiento y los métodos computacionales para detectarlos y corregirlos.