Revista de glucómica y lipidómica

Revista de glucómica y lipidómica
Acceso abierto

ISSN: 2153-0637

abstracto

Glycosciences.DB: an annotated data collection linking glycomics and proteomics data

Michael Böhm

Glycosciences.DB, la base de datos de estructuras de glicanos del portal Glycosciences.de, recopila varios tipos de datos sobre estructuras de glicanos, incluidos restos de carbohidratos de estructuras de bancos de datos de proteínas de todo el mundo. De esta forma forma un puente entre la glucómica y la proteómica.recursos. Una importante actualización de esta base de datos combina una interfaz web rediseñada con una serie de nuevas funciones. Estos incluyen páginas de entrada separadas no solo para estructuras de glicanos sino también para entradas y referencias bibliográficas, opciones mejoradas de búsqueda de subestructuras, una búsqueda de palabras clave recientemente disponible que cubre todos los tipos de entradas en una consulta y nuevos tipos de información que se agregan a las estructuras de glicanos. Estas nuevas características se describen en detalle en este artículo, y también se analizan las opciones sobre cómo los usuarios pueden proporcionar información a la base de datos. Glycosciences.DB Los carbohidratos, a menudo denominados glicanos, son una de las cuatro clases principales de biomoléculas, junto con los ácidos nucleicos, las proteínas y los lípidos. De estos, los carbohidratos son las moléculas más abundantes y también las más complejas. Además de sus conocidas funciones como almacenamiento de energía o componentes estructurales, forman parte de glicoproteínas o glicolípidos y cubren las superficies celulares en el glicocálix. Aquí, sirven como sitios de reconocimiento para las interacciones célula-célula y célula-matriz, pero también para patógenos como los virus, que frecuentemente interactúan con los glicanos en la superficie celular para ingresar a sus células huésped. Los glicanos también están involucrados en las respuestas inmunitarias, la inflamación y enfermedades comocáncer. Los carbohidratos a menudo se reconocen específicamente. Por ejemplo, los virus de la influenza humana y aviar reconocen a sus huéspedes por motivos específicos de glicanos. Por lo tanto, los investigadores en proyectos relacionados con la glucómica deben poder encontrar información sobre los glucanos específicos que les interesan. Glycosciences.DB, anteriormente conocido como SweetDB, fue uno de los primeros esfuerzos para recopilar información sobre las estructuras de los carbohidratos y ponerlos a disposición en línea. . Inicialmente sembrado con datos de la base de datos de estructura de carbohidratos complejos discontinuada (CCSD, a menudo denominada CarbBank), se ha agregado más información a lo largo de los años, como modelos de estructura 3D generados por Sweet-II, resonancia magnética nuclear(RMN) importados de SugaBase o ingresados ​​manualmente de la literatura, o enlaces a entradas del Banco de datos de proteínas mundial ( ) que incluyen carbohidratos. Actualmente, es la fuente principal de nuevos datos en Glycosciences.DB. En el momento de escribir este artículo, Glycosciences.DB contiene ~25 000 entradas de estructuras de glicanos con 12 500 modelos de estructuras 3D, 20 000 referencias bibliográficas, 3400 RMN 1H o 13Cespectros y más de 10 000 referencias a entradas que contienen carbohidratos. En 2018, se lanzó una actualización importante del portal Glycosciences.de, que no solo le da un diseño más moderno al portal, sino que también agrega una serie de nuevas funciones a Glycosciences.DB, incluidas mejoras en las funciones de búsqueda y en la visualización de información. . Antes de la actualización de 2018, solo los glicanos se habían considerado como entradas en Glycosciences.DB. Todos los demás elementos, como las referencias bibliográficas o las estructuras, solo se mostraban como partes de las entradas de glicanos o en las listas de resultados de búsqueda. Ahora las estructuras y las publicaciones también reciben páginas de entrada individuales, que muestran más datos que en la versión anterior. Los tres tipos de entradas, es decir, glicanos, publicaciones y estructuras, están entrelazados entre sí. Para cada tipo de entrada se utiliza un símbolo individual, que se muestra en el encabezado de la entrada y también se usa en enlaces cruzados y listas de resultados de búsqueda, para que los usuarios puedan ver directamente qué tipo de entrada se abrirá en un enlace. Capturas de pantalla de la entrada de estructura de glicanos de Glycosciences.DB (frente, truncada en la línea discontinua), entrada de literatura (centro) y entrada (reverso). Las tres entradas están vinculadas entre sí: la entrada contiene tanto la entrada de la estructura del núcleo de N-glicano mostrada como la referencia bibliográfica. Aún no se ha registrado ninguna estructura de glicano con la entrada de la literatura; el enlace a la entrada de la estructura del núcleo de N-glicano se asigna a través de la entrada. Se agregan nuevas entradas semanalmente mediante la descarga de estructuras recién publicadas y la búsqueda de restos de carbohidratos. Este proceso es en su mayoría automático. La intervención humana solo es necesaria en caso de problemas potenciales, como discrepancias entre el nombre del residuo y el residuo que está realmente presente en la estructura 3D, o nombres de residuos recién introducidos para los que no se almacena ninguna definición en pdb2linucs y pdb-care, las herramientas utilizadas para detectar y validar los glicanos en las estructuras. La cita principal de una entrada también se importa y almacena en Glycosciences.DB. De esta manera, las entradas se pueden vincular automáticamente tanto con las entradas de glicanos como con las de la literatura. Los enlaces cruzados entre los dos últimos tipos de entradas no se pueden agregar automáticamente de manera confiable, ya que no existe una herramienta disponible que pueda extraer información confiable sobre carbohidratos relevantes de una publicación. Sin embargo, la referencia principal de una entrada a menudo también trata de los carbohidratos en esa entrada, en particular en el caso de los complejos proteína-carbohidrato, donde los restos de carbohidratos se han agregado a propósito y, por lo tanto, generalmente (pero no con certeza) también son un tema importante de la publicación. Este no es necesariamente el caso de las glicoproteínas, donde los glucanos también pueden ser un tema importante de la publicación, pero a menudo (particularmente en el caso de glucanos cortos y truncados) simplemente se indican como "también detectados" o incluso no se mencionan en absoluto. Por lo tanto, los enlaces cruzados entre glicanos y entradas de literatura que se asignan a través de entradas no se enumeran junto con los enlaces cruzados asignados manualmente, sino en una sección separada, para que los usuarios puedan identificarlos fácilmente. Las entradas de la estructura de glicanos todavía forman la parte principal del contenido de Glycosciences.DB. Las entradas recopilan información sobre la estructura de un carbohidrato, como modelos de estructura 3D, donde los glicanos también pueden ser un tema importante de la publicación, pero a menudo (particularmente en el caso de glicanos cortos y truncados) simplemente se indican como "también detectados" o incluso no se mencionan en absoluto. Por lo tanto, los enlaces cruzados entre glicanos y entradas de literatura que se asignan a través de entradas no se enumeran junto con los enlaces cruzados asignados manualmente, sino en una sección separada, para que los usuarios puedan identificarlos fácilmente. Las entradas de la estructura de glicanos todavía forman la parte principal del contenido de Glycosciences.DB. Las entradas recopilan información sobre la estructura de un carbohidrato, como modelos de estructura 3D, donde los glicanos también pueden ser un tema importante de la publicación, pero a menudo (particularmente en el caso de glicanos cortos y truncados) simplemente se indican como "también detectados" o incluso no se mencionan en absoluto. Por lo tanto, los enlaces cruzados entre glicanos y entradas de literatura que se asignan a través de entradas no se enumeran junto con los enlaces cruzados asignados manualmente, sino en una sección separada, para que los usuarios puedan identificarlos fácilmente. Las entradas de la estructura de glicanos todavía forman la parte principal del contenido de Glycosciences.DB. Las entradas recopilan información sobre la estructura de un carbohidrato, como modelos de estructura 3D, los enlaces cruzados entre glicanos y entradas de literatura que se asignan a través de entradas no se enumeran junto con los enlaces cruzados asignados manualmente, sino en una sección separada, para que los usuarios puedan identificarlos fácilmente. Las entradas de la estructura de glicanos todavía forman la parte principal del contenido de Glycosciences.DB. Las entradas recopilan información sobre la estructura de un carbohidrato, como modelos de estructura 3D, los enlaces cruzados entre glicanos y entradas de literatura que se asignan a través de entradas no se enumeran junto con los enlaces cruzados asignados manualmente, sino en una sección separada, para que los usuarios puedan identificarlos fácilmente. Las entradas de la estructura de glicanos todavía forman la parte principal del contenido de Glycosciences.DB. Las entradas recopilan información sobre la estructura de un carbohidrato, como modelos de estructura 3D,RMNespectros, referencias bibliográficas, referencias a entradas e información sobre composición de residuos, motivos de subestructura, nombres triviales y datos de taxonomía. La actualización de 2018 viene con algunos elementos adicionales. La información de la estructura del glucano (secuencia de monosacáridos y posiciones de enlace) solo se proporcionó en una anotación 2D en formato CarbBank hasta ahora. Ahora también ofrecemos la estructura en notación lineal para la descripción única de la notación de secuencias de carbohidratos (LINUCS), la notación utilizada internamente en la base de datos para almacenar e identificar las estructuras de glucano y, cuando sea posible, en formato GlycoCT_condensed y GlycoCT_xml. Para obtener más información sobre los formatos de estructura de glucano, consulte . Además de estos formatos de texto, también se han agregado gráficos de nomenclatura de símbolos para glicanos (SNFG) a muchas entradas de glicanos. Al momento de escribir, sin embargo, aún no se han incorporado todas las características recién definidas de la versión actual de SNFG. Los enlaces cruzados a las entradas correspondientes de otras bases de datos del portal Glycosciences.de (GlycoMapsDB y GlycoCD) también se proporcionan ahora donde corresponda. Una característica que es utilizada por muchas genómicas,bases de datos proteómicas o bibliográficas, pero que sepamos que aún no existe en las bases de datos glicómicas, existe la opción de agregar palabras clave a una entrada de la base de datos, que se puede usar para identificar esa entrada en una búsqueda en la base de datos. Esta opción está implementada ahora en Glycosciences.DB. De manera análoga a las entradas y entradas de la literatura, ahora se pueden agregar títulos a las entradas de estructura de glucano en Glycosciences.DB. Difícilmente será posible agregar títulos significativos a todas las entradas. Sin embargo, hay varios glucanos para los que se usan nombres triviales (p. ej., para antígenos de grupos sanguíneos de tipo Lewis, leche humanaoligosacáridos, glucoesfingolípidos de la serie ganglio, etc.), y para muchos otros glucanos, una breve descripción como "estructura central de N-glucano fucosilada en el núcleo" puede ser útil para los usuarios que aún no están familiarizados con las estructuras de los glucanos. Estos títulos también se pueden utilizar en consultas de bases de datos y se muestran junto con la estructura de glicanos en los resultados de consultas de estructuras y en listas de estructuras, por ejemplo, en entradas de literatura para ayudar a los usuarios a identificar los glicanos mostrados. Los modelos de estructura 3D que se proporcionan con muchas entradas pueden dar a los investigadores una percepción de cómo se ven los glicanos. Sin embargo, puede ser difícil leer la estructura 3D de un glicano y encontrar un residuo específico dentro de la estructura, porque los componentes básicos de los monosacáridos que forman los glicanos son muy similares entre sí. Por lo tanto, Hemos agregado una opción para resaltar con color los residuos utilizando los colores de los símbolos SNFG, lo que facilita orientarse en una estructura 3D de glucano. Los halos o los colores de enlace se pueden alternar con las casillas de verificación en las opciones de visualización junto a la estructura 3D. Hasta ahora, los colores se establecen mediante códigos PDB de 3 letras para residuos que ocurren con frecuencia. La lista de códigos de 3 letras admitidos se ampliará aún más para cubrir más residuos en el futuro. Resaltado de residuos en una planta N-glicano con fucosilación central y xilosa (LinucsID 13934). Sin resaltar, los residuos son difíciles de identificar (arriba). Esto se vuelve más fácil cuando se usan halos (abajo a la izquierda) o colores de enlace (abajo a la derecha) con colores que coinciden con los de los símbolos SNFG, incluso cuando la estructura está orientada de manera diferente a los símbolos SNFG.

Top