ISSN: 0974-276X
Wouter Ouwerkerk y Aeilko H. Zwinderman
Antecedentes: El empalme alternativo de los ARN mensajeros brinda a las células la oportunidad de crear isoformas de proteínas de una multitud de funciones a partir de un solo gen al excluir o incluir exones durante el procesamiento postranscripcional. Sigue siendo difícil reconstruir la contribución de estas variantes de empalme en la cantidad total de expresión génica.
Métodos: presentamos una formulación probabilística del problema de reconstrucción de empalme alternativo utilizando un modelo de mezcla finita y proporcionamos una solución basada en el principio de máxima verosimilitud. Nuestro modelo se basa en la suposición de que el nivel de expresión esperado de los exones en una variante de empalme particular es el mismo para todos los exones en esa variante, pero permite el error de medición. En este algoritmo, la expresión en un paciente se puede escribir como una suma ponderada del número de densidades gaussianas multivariantes de mezcla de variantes de empalme. Estimamos el parámetro del modelo maximizando la probabilidad total usando un algoritmo de optimización de Nelder y Mead en R. Para evaluar nuestro algoritmo, comparamos los valores AIC/BIC de seis modelos: Método de modelado de mezcla normal óptimo establecido, todos los exones se transcriben por igual, el actual variantes de empalme conocidas, todas las variantes de empalme posibles, las variantes conocidas asistidas con las variantes de alta prevalencia del modelo de todas las variantes posibles y variantes de empalme seleccionadas manualmente.
Resultados: aplicamos los modelos a tres genes (SLC2A10, TGFßR2 y FBN1), con 25, 29 y 265 posibles variantes de empalme, asociadas con el síndrome de Marfan en datos de expresión de genes/exones de 63 pacientes con Marfan’ síndrome de s. Los modelos con las variantes de empalme conocidas asistidas con las variantes de empalme de alta prevalencia de todas las variantes de empalme posibles tenían los mejores valores AI C/BI C para los tres genes. En SLC2A10 y FBN1 hubo uno, en TGFβR2 dos variantes de empalme predominantes.
Conclusión: encontramos cuatro posibles nuevas variantes de empalme en tres genes asociados con el síndrome de Marfan.