ISSN: 0974-276X
Erica Plummer, Jimmy Twin, Dieter M. Bulach, Suzanne M. Garland y Sepehr N Tabrizi
Objetivo y métodos: el análisis de datos masivos de secuenciación paralela de 16S rRNA requiere el uso de canalizaciones bioinformáticas sofisticadas. Hay varias canalizaciones disponibles, sin embargo, existe literatura limitada disponible que compara las características, ventajas y desventajas de cada canalización. Esto hace que la elección de qué método utilizar a menudo no esté clara. Usando datos de lectura microbiana intestinal recopilados de una cohorte de bebés muy prematuros, comparamos tres canalizaciones comúnmente utilizadas para el análisis del gen 16S rRNA: MetaGenome Rapid Anotation usando Subsystem Technology (MG-RAST), Quantitative Insights into Microbial Ecology (QIIME) y mothur. Utilizando principalmente parámetros predeterminados, las tres canalizaciones se compararon en términos de clasificación taxonómica, análisis de diversidad y facilidad de uso.
Resultados: en general, las tres canalizaciones detectaron el mismo filo en abundancias similares (P>0,05). Se observó una diferencia entre los pipelines en cuanto a la clasificación taxonómica de géneros de la familia Enterobacteriaceae, específicamente Enterobacter y Klebsiella (P<0.0001 y P=0.0026 respectivamente). Descubrimos que el tiempo de análisis fue más rápido con QIIME en comparación con mothur y MG-RAST (aproximadamente 1 hora en comparación con 10 horas y 2 días respectivamente).
Conclusión: este estudio mostró que QIIME, mothur y MG-RAST producen resultados comparables y que, independientemente de qué tubería o algoritmo se seleccione para el análisis de los datos de secuenciación del gen 16S rRNA, es probable que genere una descripción general confiable de alto nivel de composición de la muestra al analizar muestras fecales. Las diferencias que observamos a nivel de género resaltan que una limitación clave del uso del análisis del gen 16S rRNA para la clasificación a nivel de género y especie es que las especies bacterianas relacionadas pueden ser indistinguibles debido a secuencias del gen 16S rRNA casi idénticas. Es importante tener esto en cuenta al analizar los datos de secuenciación del gen 16S rRNA.