ISSN: 0974-276X
James C Wright y Jyoti S Choudhary
La evaluación estadística precisa de las identificaciones de péptidos de la base de datos de secuencias a partir de espectros de masas en tándem es esencial en los experimentos de proteómica basados en espectrometría de masas. Estas estadísticas dependen del modelado preciso de identificaciones aleatorias. El enfoque objetivo-señuelo se ha convertido en el enfoque de facto para calcular FDR en conjuntos de datos proteómicos. El principio fundamental de este enfoque es buscar un conjunto de secuencias de proteínas señuelo que emulen el tamaño y la composición de las secuencias de proteínas objetivo buscadas sin coincidir con las proteínas reales de la muestra. Para hacer esto, es común invertir o barajar las proteínas y los péptidos en la base de datos de destino. Sin embargo, estos enfoques tienen sus inconvenientes y limitaciones. Un problema de confusión clave es la redundancia de péptidos entre las bases de datos objetivo y señuelo que conduce a una estimación imprecisa de FDR. Esta inexactitud se amplifica aún más a nivel de proteína y cuando se buscan grandes bases de datos de secuencias, como las que se utilizan para la proteogenómica. Aquí, presentamos un método híbrido unificador para generar secuencias señuelo de manera rápida y eficiente con una superposición mínima entre el objetivo y los péptidos señuelo. Mostramos que la aplicación de un enfoque de señuelo inverso puede producir hasta un 5% de redundancia de péptidos y muchos más péptidos adicionales tendrán exactamente la misma masa precursora que un péptido objetivo. Nuestro método híbrido aborda estos dos problemas cambiando primero los sitios de escisión proteolítica con el aminoácido anterior, invirtiendo la base de datos y luego mezclando las secuencias redundantes. Este método híbrido flexible reduce la superposición de péptidos entre los péptidos objetivo y señuelo a aproximadamente el 1 % de los péptidos, lo que hace que el modelo señuelo sea más robusto y sea adecuado para grandes espacios de búsqueda. También demostramos el efecto anticonservador de los péptidos redundantes en el cálculo de valores q en datos de tejido cerebral de ratón.