ISSN: 0974-276X
Jorge Amigo, Antonio Salas, Javier Costas y Ángel Carracedo
Antecedentes: Recientemente han surgido varias plataformas de genotipado de alto rendimiento. Estas plataformas generan grandes cantidades de datos de genotipado que posteriormente son procesados y almacenados en bases de datos públicas y/o privadas. Tanto la variedad de plataformas empleadas por los diferentes laboratorios como la gran cantidad de datos que generan, conllevan serios problemas para la gestión de datos en la mayoría de los laboratorios. Algunos paquetes de software públicos o privados disponibles en la actualidad resuelven algunas necesidades importantes, pero tratan los datos desde un punto de vista que el investigador probablemente no comparta, y es posible que no haya supervisión de los resultados (p. realizarse.
Resultados: El objetivo principal del software Genotyping Data Filter (GDF) es permitir al investigador gestionar localmente un gran número de genotipos generados por las plataformas de genotipado más estándar, obteniendo estadísticas y resúmenes de los experimentos de genotipado manteniendo su privacidad. GDF también permite al usuario supervisar los datos de modo que el investigador pueda evaluar fácilmente parámetros importantes, incluida la proporción de datos faltantes en muestras y polimorfismos de un solo nucleótido (SNP), el equilibrio de Hardy-Weinberg, etc. Además, GDF analiza los datos sin procesar en diferentes formatos de texto necesarios como archivos de entrada en paquetes de software populares que se utilizan con frecuencia en aplicaciones médicas y de genética de poblaciones.
Conclusiones: GDF es un programa Perl que procesa de manera eficiente los datos de varias plataformas de genotipado, lo que permite a los investigadores inspeccionar fácilmente sus propios datos de genotipado y analizarlos en busca de un amplio espectro de software de análisis especializado muy conocido. . Ha sido preparado para ejecutarse a través de una interfaz web fácil de usar en los casos más comunes, pero también puede ejecutarse como un script local en computadoras personales, o incluso en supercomputadoras para proyectos de gran escala.