ISSN: 0974-276X
Huy Vuong, Kerby Shedden, Yashu Liu y David M. Lubman
Un área activa en la investigación de biomarcadores de cáncer es el desarrollo de métodos estadísticos para identificar firmas de expresión que reflejen la heterogeneidad del cáncer entre los individuos afectados. Tomlins et al. [5] observaron patrones heterogéneos de activación de oncogenes dentro de varios tipos de cáncer e introdujeron un método estadístico llamado Análisis de perfil de valores atípicos del cáncer (COPA) para identificar "genes atípicos del cáncer". Desde entonces, se han desarrollado varios enfoques estadísticos relacionados, pero las características operativas de estos procedimientos (por ejemplo, potencia, tasa de falsos positivos) aún no se han caracterizado por completo, especialmente en un entorno de proteómica. Aquí, utilizamos la simulación para identificar el grado en que debe mantenerse un patrón de valores atípicos de expresión diferencial para que los enfoques basados en valores atípicos sean más efectivos que los enfoques basados en la media. También proponemos un procedimiento de diagnóstico que caracteriza los niveles potencialmente desiguales de expresión diferencial en las colas y en el centro de una distribución de valores de expresión. Encontramos que para tamaños de muestra y tamaños de efecto típicos de los estudios proteómicos, el patrón de valores atípicos debe ser fuerte para que el análisis basado en valores atípicos brinde un beneficio significativo. Esto se corrobora con el análisis de los datos de proteómica de un estudio de melanoma, en el que la expresión diferencial está presente con mayor frecuencia en toda la distribución, en lugar de concentrarse en las colas, aunque algunas proteínas muestran patrones de expresión consistentes con la expresión atípica.