Revista de Proteómica y Bioinformática

Revista de Proteómica y Bioinformática
Acceso abierto

ISSN: 0974-276X

abstracto

GMSECT: Herramienta de comparación exhaustiva de secuencias masivas de todo el genoma para variaciones estructurales y de número de copias

Abhishek Narain Singh

GMSECT es una ‘interfaz de aplicación’ que maneja eficientemente las grandes secuencias genómicas para procesamiento rápido y eficiente. Es una ‘interfaz de paso de mensajes’ computación paralela basada en ‘herramienta’ eso puede ser operado en un grupo para "Comparación exhaustiva de secuencias masivas", para identificar coincidencias como la estructural variantes. El algoritmo GMSECT se puede implementar utilizando otras interfaces de programación de aplicaciones paralelas así como hilos Posix o incluso puede implementarse en forma de envío en serie. hay completo flexibilidad a la elección de la herramienta de comparación que se puede implementar y con los parámetros opcionales a partir del elección de herramientas de comparación para adaptarse a la velocidad, sensibilidad y especificidad de la alineación por pares. el algoritmo es simple y robusto, y se puede aplicar para comparar múltiples genomas, cromosomas o secuencias grandes, de diferentes individuos para la comparación personalizada del genoma y funciona bien para homólogos y distantes especies. La herramienta puede incluso aplicarse a genomas más pequeños como el genoma microbiano como el de Escherichia. coli o algas como Chlamydomonas reihardtti o la levadura Saccharomyces cerevisiae para realizar comparaciones rápidamente, y por lo tanto encuentra su aplicación a las empresas basadas en productos farmacéuticos y microbianos para la investigación y desarrollo. La interfaz de la aplicación puede comparar de manera eficiente y rápida secuencias masivas para detectar la presencia de numerosos tipos de variación de ADN existentes en el genoma que van desde un solo nucleótido Polimorfismo (SNP) a alteraciones estructurales más grandes, como variantes de número de copia (CNV) e inversiones. El nuevo algoritmo ha sido probado para comparar el cromosoma 21 de la compilación R27c de Celera con todos los 48 cromosomas de la compilación R27c de Celera y con todos los 48 cromosomas del Build 35 humano secuencia de referencia, que tomó solo 2 horas y 10 minutos usando la elección del algoritmo BLAST por pares y con 110 procesadores cada uno con 2,2 GHz de capacidad y 2 GB de memoria. GMSECT facilita el escaneo rápido e interpretación en proyecto de secuenciación personalizado. La interfaz de la aplicación con los recursos anteriores y Se estima que la opción de alineación hace una comparación exhaustiva del genoma humano consigo mismo en solo 2.35 días. Una comparación exhaustiva del genoma de un individuo con un genoma de referencia comprendería dos ‘auto-genoma’ comparación y un ‘genoma no propio’ comparación que se estima que tomará alrededor de 9.4 días con los recursos anteriores. Con la llegada del proyecto de secuenciación genómica personalizada, sería deseable compare cientos de genomas individuales con un genoma de referencia. Esto implicaría un ‘genoma no propio’ y un ‘auto-genoma’ comparación para cada genoma, y tomaría alrededor de 7 días para el genoma de cada individuo usando GMSECT y los recursos mencionados anteriormente.

Top