ISSN: 2153-0637
Raja Mazumder
Las tecnologías de secuenciación actuales están generando petabytes de datos que son inaccesibles para la mayoría de la comunidad investigadora debido a los costos y la experiencia necesarios para analizar big data. Otro obstáculo para analizar dichos datos es la falta de información seleccionada en los repositorios de datos NGS como NCBI SRA. Para abordar los desafíos anteriores, hemos implementado un entorno virtual integrado de alto rendimiento de datos extragrandes (HIVE-XLD) de bajo costo en la nube privada en GWU y la FDA de EE. UU. Se presentarán los efectos de la variación en los sitios activos y los sitios de glicosilación para ilustrar el poder de la integración de big data con objetos funcionales como sitios activos, sitios de unión y rutas.