Revista internacional de minería de datos biomédicos

Revista internacional de minería de datos biomédicos
Acceso abierto

ISSN: 2090-4924

abstracto

ePhenotyping para el aneurisma aórtico abdominal en la red de genómica y registros médicos electrónicos (eMERGE): desarrollo de algoritmos y flujo de trabajo del minero de información Konstanz

Kenneth M Borthwick, Diane T Smelser, Jonathan A Bock, James R Elmore, Evan J Ryer, Zi Ye, Jennifer A. Pacheco, David S. Carrell, Michael Michalkiewicz, William K Thompson, Jyotishman Pathak, Suzette J Bielinski, Joshua C Denny, James G Linneman, Peggy L Peissig, Abel N Kho, Omri Gottesman, Harpreet Parmar, Iftikhar J Kullo, Catherine A McCarty, Erwi

Antecedentes y objetivo: diseñamos un algoritmo para identificar el aneurisma aórtico abdominal casos y controles de historias clínicas electrónicas para ser compartidos y ejecutados dentro de la “registros médicos electrónicos y genómica” (eMERGE) Red.

Materiales y métodos: se usó lenguaje de consulta estructurado para escribir el algoritmo utilizando “Terminología procesal actual” y “Clasificación Internacional de Enfermedades” códigos, con datos demográficos y de encuentro para clasificar a los individuos como caso, control o excluidos. El algoritmo se validó utilizando una revisión de gráficos manual ciega en tres sitios de la red eMERGE y un sitio que no es de la red eMERGE. La validación comprendió la evaluación de un número igual de casos y controles predichos seleccionados al azar de las predicciones del algoritmo. Después de la validación en los tres sitios de la red eMERGE, los sitios restantes de la red eMERGE solo realizaron la verificación. Finalmente, el algoritmo se implementó como un flujo de trabajo en Konstanz Information Miner, que representó la lógica gráficamente mientras retenía datos intermedios para inspección en cada nodo. El algoritmo se configuró para ser independiente del acceso específico a los datos y se podía exportar (sin datos) a otros sitios.

Resultados: El algoritmo demostró valores predictivos positivos (VPP) del 92,8 % (IC: 86,8-96,7) y del 100 % (IC: 97,0-100) para casos y controles, respectivamente. También se desempeñó bien fuera de la red eMERGE. La implementación del algoritmo ejecutable transportable como un flujo de trabajo de Konstanz Information Miner requirió mucho menos esfuerzo que la implementación a partir de un pseudocódigo y aseguró que la lógica era la prevista.

Discusión y conclusión: Este algoritmo de fenotipado electrónico identifica casos y controles de aneurisma de aorta abdominal a partir de la historia clínica electrónica con alto VPP de casos y controles necesarios para fines de investigación, puede difundirse fácilmente y aplicarse a alto rendimiento genético y otros estudios.

Top