Revista internacional de minería de datos biomédicos

Revista internacional de minería de datos biomédicos
Acceso abierto

ISSN: 2090-4924

abstracto

Un análisis bayesiano de las variaciones del número de copias en datos de hibridación genómica comparativa de matrices

Xiaowei Wu y Hongxiao Zhu

La hibridación genómica comparativa de matrices (CGH) se ha utilizado ampliamente para detectar variaciones en el número de copias genómicas (CNV). El objetivo central del análisis de datos de matriz CGH es detectar con precisión regiones homogéneas de proporciones de intensidad logarítmica que representan cambios relativos en el número de copias de ADN. En los últimos años se han propuesto varios métodos. Sin embargo, la mayoría de los métodos no consideran las correlaciones de las mediciones de sondas vecinas y, por lo general, están diseñados para el análisis a nivel de una sola muestra en lugar de detectar CNV comunes o recurrentes entre múltiples muestras. Proponemos un enfoque basado en segmentos bayesianos para un análisis eficiente de datos CGH de matriz. El método propuesto se basa en suposiciones simples pero es lo suficientemente general como para acomodar varias correlaciones espaciales entre las mediciones de la sonda. También permite muestras múltiples con CNV recurrentes, por lo tanto, puede tomar prestada fuerza entre muestras. A diferencia de otro enfoque basado en sondas desarrollado en el mismo marco bayesiano, el enfoque basado en segmentos parametriza las proporciones de intensidad logarítmica media de una manera más adecuada, lo que conduce a un esquema de muestreo posterior basado en la cadena de Markov de salto reversible de Monte Carlo. Realizamos un estudio de simulación para comparar estos dos enfoques y el método de segmentación binaria circular de uso común y el método del modelo de Markov oculto bayesiano. El enfoque basado en segmentos logra una mejor precisión de estimación y una mayor eficiencia computacional en comparación con el enfoque basado en sondas, y también proporciona mejores resultados en comparación con los otros dos métodos, especialmente para datos con una relación señal/ruido relativamente baja y alta correlación. El enfoque basado en segmentos se aplica aún más a los datos de líneas celulares de Corriel y a los datos de adenocarcinoma pancreático.

Top