ISSN: 0974-276X
Huai Li y Ming Zhan
La comparación entre especies de perfiles de expresión génica permite descifrar los programas transcripcionales fundamentales y específicos de especies de las células y ofrece información en la organización y evolución del genoma y la red genética. Aquí, proponemos un algoritmo para comparar datos de micromatrices de diferentes especies para desentrañar módulos transcripcionales que se conservan o divergen a lo largo de la evolución. El algoritmo propuesto se basa en la descomposición de matriz entre especies que incluye un análisis de componente independiente no lineal seguido de una factorización de matriz dispersa probabilística generalizada en datos de micromatrices de diferentes especies. El algoritmo propuesto captura la modularidad transcripcional que podría resultar de interacciones altamente no lineales entre genes y divide los genes en módulos transcripcionales mutuamente no exclusivos. Los módulos transcripcionales conservados se identifican por las variables latentes que están asociadas con prototipos biológicos predominantes compartidos entre especies. Ilustramos la aplicación del algoritmo propuesto mediante un análisis de datos de células madre embrionarias (ESC) humanas y de ratón. El análisis descubrió módulos transcripcionales conservados y divergentes en los transcriptomas de ESC, lo que arrojó luz sobre la comprensión de los mecanismos reguladores fundamentales y específicos de la especie que controlan el desarrollo de ESC.