ABOid: un software para la identificación automatizada y la clasificación filoproteómica de datos espectrométricos de masas en tándem

Samir V. Deshp; e; Rabih E. Jabbour; Peter A. Snyder; Michael Stanford; Charles H. Wick y Alan W. Zulich

abstracto

ABOid: un software para la identificación automatizada y la clasificación filoproteómica de datos espectrométricos de masas en tándem

Samir V. Deshpande, Rabih E. Jabbour, Peter A. Snyder, Michael Stanford, Charles H. Wick y Alan W. Zulich

Hemos desarrollado un conjunto de algoritmos bioinformáticos para la identificación y clasificación automatizadas de microbios en función del análisis comparativo de secuencias de proteínas. Esta aplicación utiliza información de secuencia de proteínas microbianas revelada por proteómica basada en espectrometría de masas para la identificación y clasificación filoproteómica. Los algoritmos transforman los resultados de la búsqueda de espectros de iones de productos de iones de péptidos en una base de datos de proteínas, realizada por un software disponible comercialmente (por ejemplo, SEQUEST), en un resultado taxonómicamente significativo y fácil de interpretar. Para lograr este objetivo, construimos una base de datos de proteínas personalizada compuesta por proteomas teóricos derivados de todos los genomas bacterianos completamente secuenciados (1204 microorganismos al 25 de agosto de 2010) en formato FASTA. Cada secuencia de proteína en la base de datos se complementa con información sobre un organismo de origen y la posición cromosómica de cada marco de lectura abierto (ORF) de codificación de proteína está incrustada en el encabezado de secuencia de proteína. Además, esta información está vinculada con una posición taxonómica de cada bacteria de la base de datos. ABOid analiza los archivos de resultados de búsqueda SEQUEST para proporcionar las probabilidades de que las asignaciones de secuencias de péptidos a un espectro de masas de iones de producto (MS/MS) sean correctas y utiliza las coincidencias aceptadas de espectro a secuencia para generar una secuencia a organismo ( STO) matriz de asignaciones. Debido a que las secuencias de péptidos están presentes o ausentes de forma diferente en varias cepas que se comparan, esto permite la clasificación de especies bacterianas con un alto rendimiento. Para este propósito, las matrices de asignaciones de STO, vistas como mapas de bits de asignación, se analizan a continuación mediante un módulo ABOid que utiliza relaciones filogenéticas entre especies bacterianas como parte del proceso del árbol de decisión y mediante la aplicación de técnicas estadísticas multivariadas (componente principal y análisis de conglomerados), para revelar la relación de la muestra desconocida analizada con los microorganismos de la base de datos. Nuestro algoritmo de clasificación e identificación bacteriana utiliza asignaciones de un organismo analizado a grupos taxonómicos basados en un esquema organizado que comienza en el nivel de phylum y sigue a través de clases, órdenes, familias y géneros hasta el nivel de cepa.

Descargo de responsabilidad: este resumen se tradujo utilizando herramientas de inteligencia artificial y aún no ha sido revisado ni verificado.

Revista de cromatografía y técnicas de separación Acceso abierto

abstracto

ABOid: un software para la identificación automatizada y la clasificación filoproteómica de datos espectrométricos de masas en tándem

Revista de cromatografía y técnicas de separación
Acceso abierto