Das Herzstück der Informationsdienste und der angewandten Forschung bei ZB MED ist das ZB MED-Knowledge-Environment (KE), in dem heterogene Daten aus den Lebenswissenschaften zusammengeführt werden: die digitale vernetzte Wissensbasis.
Das Discovery System LIVIVO bietet den Zugriff auf die Informationen
Anhand des in LIVIVO verwendeten Morphosaurus können Begrifflichkeiten erweitert und mit Metadaten Verfügbarkeitsinformationen im Suchportal LIVIVO verknüpft werden. Dies ermöglicht eine zeitgleiche Recherche in mehr als 60 Millionen Datensätzen aus über 70 Fachdatenquellen in großer fachlicher Bandbreite.
Das KE ist die heterogene Datenbankarchitektur mit Workflows zur Datenanreicherung und -analyse der Informationsdienste und der angewandten Forschung bei ZB MED. Auch der Export in den Suchindex von LIVIVO erfolgt über die KE.
Was steckt hinter dem Knowledge Environment?
Eine Wissensumgebung, englisch: Knowledge Environment, benutzt praktikable Werkzeuge auf Produktionsqualität, um das Wissen einer wissenschaftlichen Domäne systematisch zu organisieren und Usern Zugriff auf das so repräsentierte Wissen zu erlauben. Die Lebenswissenschaften zeichnen sich durch die Heterogenität der Daten und Informationen in Datenbanken und Literatur aus. Verschiedene Ebenen von Informationen sollten Betrachtung finden, wie zum Beispiel verschiedene Entitätsklassen, Prozesse und Relationen. Dies benötigt verschiedene Views auf die Daten, die abhängig sind von der jeweiligen spezifischen Wissensdomäne innerhalb der Lebenswissenschaften. Als so eine integrative Wissensumgebung wird das ZB MED-Knowledge Environment entwickelt, um eine generische und persistente Datenebene zu schaffen, welche die Modellierung, Speicherung und Verknüpfung semantischer Konzepte zwischen Datenbanken und Literatur ermöglicht. Das ZB MED-KE erlaubt, Daten und Literatur zu kuratieren, anzureichern, Qualitätssicherung zu betreiben und auch den Such-Index von LIVIVO zu exportieren.
Das ZB MED-KE basiert auf einer komplexen Infrastruktur, in der bibliothekarische Metadaten, Volltexte, Faktendaten sowie verknüpfte und angereicherte Informationen zur Datenanreicherung und -analyse zusammen geführt werden. Die angereicherten Informationen können Verfügbarkeitsanzeigen, semantische Entitäten und Links zu externen Datenbanken sein.
Im KE werden die den Datensätzen zugrunde liegenden Metadaten durch Information voll- und halbautomatisch angereichert. Sie sind auch mit Datenbanken oder Ontologien externer Anbieter verknüpft.
Zugang zu heterogenen Informationen
Von zentraler Bedeutung ist die verbesserte Verknüpfung und Zugänglichkeit von Literatur. Als angereicherte Informationen sind hier vor allem singuläre Forschungsdaten, Pre-Prints und sogenannte Graue Literatur gemeint. Die Graue Literatur bezieht sich hier auf Publikationen auf Forschungsinstituten wie etwa Ressortforschungseinrichtungen und Leibniz-Instituten.
Semantische Anreicherung von LIVIVO
Das ZB MED-Suchportal LIVIVO enthält Metadaten aus 60 Millionen Publikationen der Lebenswissenschaften. Typische Metadaten sind beispielsweise Titel, Namen der Autorinnen / Autoren oder das Erscheinungsjahr. Mit einer neuen Methode werden Titel und Abstract der Publikationen aus LIVIVO extrahiert und die Texte mit den Begriffen des Morphosaurus annotiert.