Revista internacional de minería de datos biomédicos

Revista internacional de minería de datos biomédicos
Acceso abierto

ISSN: 2090-4924

abstracto

Un método para buscar y clasificar médicos basado en atributos biográficos

melinda zhu

Describimos un método para construir una base de datos de búsqueda para médicos utilizando información extraída de textos en lenguaje natural no estructurados en sitios web públicos. Específicamente, nos enfocamos en atributos biográficos como la facultad de medicina del médico, la universidad y el título universitario, la edad, las especialidades médicas, las publicaciones sobre ciertos tipos de afecciones (y sus frecuencias de citas), los informes de los medios asociados, etc. Las escuelas de medicina basadas en puntajes promedio de MCAT y GPA se pueden usar como parámetros de búsqueda para proporcionar la clasificación de los resultados de la búsqueda. Las citas de publicaciones de investigación y la frecuencia con la que el nombre del médico se asocia con tipos particulares de afecciones médicas también se pueden usar con fines de clasificación. En ausencia de cualquier conocimiento personal de los resultados del tratamiento de un médico en particular, un paciente que busca atención de calidad puede ser mejor ayudado por una lista clasificada de posibles proveedores en función de sus antecedentes educativos, experiencias y conocimiento de sus especialidades. Dado que debemos recopilar la mayor parte de nuestra información de Internet, que consiste principalmente en textos basados en HTML no estructurados, encontrar información específica y categorizarla en una base de datos requiere algoritmos de reconocimiento de patrones basados en lenguaje natural que se pueden aprender y asociar con ciertos términos médicos. así como extraer información sobre antecedentes educativos y experiencias profesionales. Argumentamos que ideas similares se pueden aplicar a muchas otras tareas de búsqueda que pueden beneficiarse de las bases de datos categorizadas creadas a partir del universo de las páginas web no estructuradas. Proponemos que se pueda diseñar un nuevo tipo de motor de búsqueda web utilizando técnicas de procesamiento de lenguaje natural para extraer información categorizada extraída de textos no estructurados para permitir a los usuarios realizar una variedad de búsquedas sofisticadas que actualmente no se pueden realizar con los motores de búsqueda de Internet actuales.

Top