Revista internacional de minería de datos biomédicos

Revista internacional de minería de datos biomédicos
Acceso abierto

ISSN: 2090-4924

abstracto

A proteomics strategy to analyze complex traits and gene functions

Sartén Yinghong

Abstracto

El análisis proteómico de características complejas es valioso para comprender las capacidades de calidad y los instrumentos de atributos. Sin embargo, la calidad inquebrantable de la investigación proteómica está influenciada por numerosos elementos, por ejemplo, los efectos de la base hereditaria, la inspección de variedades y las condiciones de prueba. En esta metodología, se examinaron cuatro líneas isogénicas cercanas (NIL) de trigo enano con esterilidad masculina (DS) con varias bases hereditarias y se utilizó una gran cantidad de información de espectrometría de masas (MS) de diferentes grupos para considerar los atributos DS en el trigo. Desde el principio, se establecieron de varias maneras otras proteínas de espiga juveniles de cuatro NIL de trigo DS y se distinguieron con diversas espectrometrías de masas.y se identificó una suma de 58170 grupos de proteínas a partir de dieciséis pruebas libres. Además se desglosaron las apropiaciones ricas de proteínas que identificaban en varias frecuencias y comunicaban tipos. Mediante el uso de algunas fórmulas sencillas que sabían evaluar la calidad constante de la articulación de proteínas, se construyó una base de datos que contenía niveles de articulación de 58170 grupos de proteínas y estimaciones de evaluación de gran alcance de 17187 proteínas sin duplicaciones. Concentrándose en el sistema de características de esterilidad masculina atómica y la capacidad de Taigu Genie Male-Sterile Wheat (TGMSW) calidad ms2 en esos NIL, Los proteomas de la espiga juvenil de tres NIL de trigo DS se diseccionaron en las mismas condiciones y se contrastaron 160 proteínas comunicadas diferencialmente y 43 proteínas comunicadas profundamente reconocidas en esta prueba y la base de datos. Por fin, se resuelve que 28 proteínas se identificaron firmemente con la característica de esterilidad masculina. El resultado muestra que la gran cantidad de información de MS de diferentes grupos es útil para examinar las características complejas y las capacidades de calidad.

 Introducción

Una célula humana se caracteriza por sus partes, por ejemplo, el genoma, epigenoma, proteoma, metaboloma o transcriptoma, y ​​sus comunicaciones. Esto da como resultado un sistema administrativo complejo que apenas comenzamos a comprender y que representa una prueba importante para encontrar la causa celular de una dolencia humana determinada. A pesar de que una metodología orgánica de marcos que incorpore todas las perspectivas que caracterizan a un tipo de célula sería más adecuada para comprender el giro humano de los acontecimientos y la infección, los analistas poco a poco comienzan a abandonar la separación de su propio espacio particular: Omics.

La sociedad de asociación del genoma completo (GWAS, por sus siglas en inglés) descubrió loci de azar genómico que posiblemente afectan la enfermedad y las cualidades fenotípicas. Este amplio activo tiene una garantía extraordinaria al brindar formas novedosas de medicación personalizada, incluido el pronóstico del riesgo de enfermedad, la anticipación y la toma enfocada de medicamentos. Una de las dificultades significativas que enfrentan los analistas en el camino entre la prueba distintiva subyacente de una afiliación y el tratamiento exacto de los pacientes es el conocimiento de los componentes orgánicos que subyacen a estas afiliaciones. En la actualidad, el enfoque para explicar estas preguntas se basa en el análisis integrador de información amplia del sistema sobre la variedad del genoma mundial , la articulación de la calidad, la autoridad del factor de registro, los perfiles epigenéticos y la cromatina .cumplimiento. La antigüedad de esta información depende principalmente de una secuenciación de última generación. En cualquier caso, debido a numerosos giros de eventos en curso, la proteómica basada en espectrometría de masas actualmente ofrece oportunidades adicionales, por parte del campo GWAS hasta ahora apenas percibidas, para la prueba reconocible de variaciones prácticas del genoma y, específicamente, para la identificación y representación de (diferencialmente ) se unieron a los edificios de proteínas al igual que las cualidades objetivas fisiológicas. En esta encuesta, presentamos estos impulsos proteómicos y recomendamos cómo se pueden coordinar en los procesos de trabajo posteriores a GWAS. Sostenemos que la combinación de métodos profundamente integrales es sorprendente y puede brindar una imagen imparcial y detallada de los loci GWAS y su asociación irreflexiva en la infección.

Identificación y caracterización de las variantes funcionales

Habiendo reconocido efectivamente una gran cantidad de nuevas variaciones normales e inusuales que se encuentran en LD con los tagSNP de GWAS retratados recientemente, la siguiente gran prueba es ubicar las variaciones causales entre ellas. La mayoría de las estrategias que se han desarrollado hasta ahora se centran en los SNP que se encuentran en el lugar de codificación o descifrado de una cualidad porque pueden afectar la estructura esencial y, por lo tanto, la capacidad de una proteína (Ng y Henikoff 2003; Saccone et al. 2011; Cvejic et al. 2013). Sea como fuere, una gran parte de las variaciones periódicas relacionadas distinguidas hasta ahora no planean dentro o en LD a un área de codificación de proteínas (Easton et al. 2012) y, en consecuencia, pueden estar un poco relacionadas con sistemas administrativos de articulación de calidad.epigenética o proteómica.

Integración de GWAS con información epigenética sobre elementos reguladores

Un SNP situado en un área sin codificación puede, por ejemplo, perturbar o crear un sitio de restricción de factor de registro (TF) en un componente administrativo en funcionamiento (Reddy et al. 2012). Como resultado, se puede ajustar el movimiento administrativo y, en consecuencia, la salida de una calidad que está limitada por este componente (Kasowski et al. 2010). Un GWAS SNP que cubra con un área administrativa en funcionamiento o un sitio de restricción de TF tentativamente reconocido en un tipo de célula significativo posteriormente tiene una mayor probabilidad de ser prácticamente importante (Jia et al. 2009; Harismendy et al. 2011; Paul et al. 2011 ).

En realidad, un informe en curso que incluye la planificación de ADNasa I de todo el genoma en 349 pruebas de células y tejidos indicó que el 76,6 % de todos los SNP GWAS no codificantes existen en un sitio demasiado sensible (DHS) a la ADNasa I o están en LD terminado con SNP en un cerca del DHS (Maurano et al. 2012). Además de contemplar las alteraciones de histonas y el ejemplo de acoplamiento de TF por cromatinainmunoprecipitación seguida de secuenciación (ChIP-seq) (Johnson et al. 2007; Robertson et al. 2007), prueba reconocible del sitio extremadamente sensible de la ADNasa I mediante secuenciación (DNase-seq) o huella genómica avanzada (DGF) (Crawford et al. 2006) ; Boyle et al. 2008; Hesselberth et al. 2009) son procedimientos significativos para planificar componentes administrativos (Visel et al. 2009). Recientemente utilizamos la combinación de estas innovaciones para caracterizar los lugares restringidos y, posteriormente, el efecto administrativo de las proteínas de oncofusión PML-RARα y AML1-ETO en la leucemia mieloide intensa (Saeed et al. 2012).

Predicción y validación de la unión del factor de transcripción diferencial dependiente de SNP

Las investigaciones coordinadas utilizan con frecuencia temas de restricción de TF presentes en las impresiones de DHS o DNase I y cubren las tapas de ChIP-seq para prever la restricción diferencial de TF provocada por un SNP (Schaub et al. 2012a; Maurano et al. 2012). Si bien esta es una excelente manera de tratar de limitar la cantidad de SNP asociados con un fenotipo específico a aquellos que pueden tener un trabajo causal, al igual que cualquier método tradicional, también puede descubrir varios aspectos positivos y negativos falsos. Los resultados falsos pueden ser el resultado de utilizar bases de datos con información creada a partir de diferentes tipos de células, a menudo para una dolencia o un fenotipo de calidad, no tipos de células pertinentes. Numerosos componentes administrativos distales son explícitos en el tipo de célula (Heintzman et al. 2009; Dimas et al. 2009) y, de esta manera, un factor de registro que se vincula a una localidad con un SNP probablemente no se comunicará en otro tipo de células significativas para un atributo específico o infección. Además, el haplotipo para el SNP específico de las líneas celulares utilizadas en la base de datos frecuentemente no se considera para estas investigaciones. A pesar de los inmensos esfuerzos que se han realizado para retratar los temas restrictivos de TF (Badis et al. 2009; Jolma et al. 2013; Noyes et al. 2008), solo para alrededor de la mitad de los más de 1,000 TF humanos un ADN de comparación se conoce el tema restrictivo, presentando así una predisposición hacia aquéllos. Para concluir, la mayoría de las metodologías basadas en temas consideran los temas de restricción de TF en un entorno separado. En cualquier caso, unos cuantos TF que son parte de un TF Además, el haplotipo para el SNP específico de las líneas celulares utilizadas en la base de datos frecuentemente no se considera para estas investigaciones. A pesar de los inmensos esfuerzos que se han realizado para retratar los temas restrictivos de TF (Badis et al. 2009; Jolma et al. 2013; Noyes et al. 2008), solo para alrededor de la mitad de los más de 1,000 TF humanos un ADN de comparación se conoce el tema restrictivo, presentando así una predisposición hacia aquéllos. Para concluir, la mayoría de las metodologías basadas en temas consideran los temas de restricción de TF en un entorno separado. En cualquier caso, unos cuantos TF que son parte de un TF Además, el haplotipo para el SNP específico de las líneas celulares utilizadas en la base de datos frecuentemente no se considera para estas investigaciones. A pesar de los inmensos esfuerzos que se han realizado para retratar los temas restrictivos de TF (Badis et al. 2009; Jolma et al. 2013; Noyes et al. 2008), solo para alrededor de la mitad de los más de 1,000 TF humanos un ADN de comparación se conoce el tema restrictivo, presentando así una predisposición hacia aquéllos. Para concluir, la mayoría de las metodologías basadas en temas consideran los temas de restricción de TF en un entorno separado. En cualquier caso, unos cuantos TF que son parte de un TF 2013; Noyes et al. 2008), solo para alrededor de la mitad de los más de 1,000 TF humanos se conoce un tema restrictivo del ADN comparativo, lo que presenta una predisposición hacia ellos. Para concluir, la mayoría de las metodologías basadas en temas consideran los temas de restricción de TF en un entorno independiente. En cualquier caso, unos cuantos TF que son parte de un TF 2013; Noyes et al. 2008), solo para alrededor de la mitad de los más de 1,000 TF humanos se conoce un tema restrictivo del ADN comparativo, lo que presenta una predisposición hacia ellos. Para concluir, la mayoría de las metodologías basadas en temas consideran los temas de restricción de TF en un entorno separado. En cualquier caso, unos cuantos TF que son parte de un TFla familia puede buscar un tema similar y la cercanía oficial de TF puede afectar las afinidades de los demás. Por lo tanto, las técnicas basadas en expectativas aún no pueden suplantar la representación bioquímica de la autoridad y el movimiento diferenciales del TF.

Caracterización espectrométrica de masas de SNP funcionales o variantes

Debido a varias mejoras computacionales y especializadas durante la década más reciente, la ubicación y evaluación de proteínas en mezclas complejas por espectrometría de masas se ha convertido en un procedimiento normalizado (verificado en Ahrens et al. 2010). Además de la investigación de proteomas completos (de Godoy et al. 2008) y la medición de alteraciones postraduccionales (exploradas en Choudhary y Mann 2010), la estrategia también se ha utilizado ampliamente para examinar las comunicaciones y construcciones de proteínas de manera justa ( encuestado en Vermeulen et al. 2008), ofreciendo de esta manera una opción en contraste con el refinamiento parcial seguido de manchas occidentales con anticuerpos explícitos.

Observaciones finales

GWA considera proporcionar datos significativos sobre la relación entre los atributos fenotípicos y los loci genómicos. En la actualidad, en el tiempo posterior a GWAS, una tarea importante es desentrañar los procedimientos naturales y los componentes prácticos fundamentales de estas afiliaciones. Esto requiere la coordinación minuciosa de un alcance enorme, información multidimensional y habilidades de diferentes campos. Se han realizado varios esfuerzos coordinados productivos entre científicos en calidad hereditaria, genómica y epigenómica. Estas investigaciones incorporadas son 'directas' ya que dependen principalmente de una etapa de innovación comparativa y el rendimiento de información de la secuenciación de vanguardia. Los diferentes campos que consideran el proteoma o el metaboloma dependen de estimaciones espectrométricas de masas y, de esta manera, configuraciones de prueba y procesos de examen totalmente únicos.Las ofertas de investigación en proteómica hasta ahora apenas se perciben y coordinan en los planes posteriores a la GWA.

Top