ISSN: 0974-276X
Mourad Atlas y Susmita Datta
La espectrometría de masas ha surgido como una tecnología fundamental para la elaboración de perfiles proteómicos de alto rendimiento. Tiene un enorme potencial en la investigación biomédica. Sin embargo, la complejidad de los datos plantea nuevos desafíos estadísticos para el análisis. Es probable que los métodos estadísticos y los desarrollos de software para analizar datos proteómicos continúen siendo un área importante de investigación en los próximos años. En este artículo, se propone un nuevo método estadístico para analizar datos de espectrometría de masas MALDI-TOF de alta dimensión en la investigación proteómica. El conocimiento químico sobre la distribución isotópica de las moléculas peptídicas junto con el modelado cuantitativo se utiliza para detectar picos químicamente valiosos de cada espectro. Más específicamente, se ajusta una mezcla de distribución de Poisson desplazada en la ubicación a la distribución isotópica desamidada de una molécula peptídica. La estimación de máxima verosimilitud mediante la técnica de maximización de expectativas (EM) se utiliza para estimar los parámetros de la distribución. Luego se construye una prueba estadística formal para determinar si un grupo de características consecutivas (valores de intensidad) en un espectro de masas corresponde a un patrón isotrópico verdadero. Así, se identifican los picos monoisotópicos en un espectro individual. El rendimiento de nuestro método se examina a través de extensas simulaciones. También proporcionamos una ilustración numérica de nuestro método con un conjunto de datos reales y lo comparamos con un método existente de detección de picos. Se proporciona validación bioquímica externa de nuestros picos detectados.