Im Blickpunkt

Die Datenflut im Griff - das "Web Data Integration Lab" nimmt in Leipzig seine Arbeit auf

Wie können Daten auf optimale Weise erfasst und miteinander verknüpft werden? Antworten auf diese Frage sind angesichts der Menge von Daten und Informationen im Internet, aber auch in Unternehmen von großem Interesse. An innovativen Datenintegrationslösungen arbeiten Professor Erhard Rahm und seine Mitarbeiter nun im neu gegründeten "Web Data Integration Lab", kurz WDI-Lab, am Institut für Informatik der Universität Leipzig. Das Bundesministerium für Bildung und Forschung fördert das ForMaT-Projekt in den nächsten zwei Jahren mit 1,5 Millionen Euro. Zum Team gehören zehn Wissenschaftler sowie acht studentische Mitarbeiter.

Das Team des WDI-Lab Leipzig: Prof. Dr. Erhard Rahm, Fan Zhang, Sven Kitschke, Hanna Köpcke, Nico Heller, Kerstin Wurdinger, Christian Wartner, Kathleen König, Alsayed Algergawy, Carina Röllig, Sabine Maßmann, Dawid Kotlarz [v.r.n.l.].

Unternehmen stehen häufig vor dem Problem, dass interne Daten mit Informationen externer Anbieter nur schwer in korrekter und nutzungsfähiger Weise gebündelt werden können. Besondere Schwierigkeiten verursacht dabei die große Datenheterogenität unterschiedlicher Web-Anbieter wie Online-Shops oder spezieller Suchmaschinen. So erfordert etwa die Realisierung eines Web-Portals für Urlaubsreisen die korrekte Erfassung und Verknüpfung von sich ständig ändernden Hotel- und Flugangeboten zahlreicher Anbieter. Die Erstellung solcher Datenintegrationslösungen ist mit konventionellen Ansätzen bisher nur unbefriedigend realisierbar. Meist ist ein hoher Entwicklungsaufwand für Spezialprogrammierungen dafür notwendig, der mit hohen Kosten verbunden ist und die Qualität der Ergebnisse ist begrenzt.

Die Lösungsansätze der Wissenschaftler im WDI-Lab hingegen versprechen wesentliche Vorteile für die Unternehmen. Der Einsatz der entwickelten Software ermöglicht schnelle Ergebnisse bei Internetrecherchen, eine Erhöhung der Datenqualität und eine automatische Datentransformation. Kritische Teilaufgaben der Datenintegration, wie etwa der korrekte Abgleich von Produktangeboten oder Produktkatalogen, können weitgehend automatisiert gelöst werden. Die Lösungsansätze wurden in den letzten Jahren von Professor Rahm und seinen Mitarbeitern bereits intensiv erforscht und fanden in der internationalen Wissenschaft große Beachtung. Vorliegende Prototypen werden nun an die Bedürfnisse realer Anwendungen angepasst.

Dazu arbeiten in dem Leipziger Innovationslabor drei Arbeitsgruppen Hand in Hand. Sie widmen sich jeweils einem der thematischen Schwerpunkte der Initiative. Dazu gehören: Workflowbasierte Datenintegration, Schema- und Ontologiematching sowie Objektmatching und Dublettenbehandlung.
Für ihre anwendungsorientierte Arbeit möchten die Wissenschaftler des WDI-Labs intensiv mit Unternehmen kooperieren, die an der Lösung ihrer Datenintegrationsprobleme interessiert sind. Ziel des WDI-Labs ist die Entwicklung einer marktfähigen Technologie zur semantischen Integration von Webdaten. Dazu entwickeln die Leipziger Informatiker eine Art Software-Baukasten. Mit dessen Hilfe ist es möglich, mit sehr geringem Aufwand nutzerspezifische Applikationen zu erstellen, die einen bestimmten Anwendungsfall zur Integration von Webdaten abdecken.



Mehr Informationen zum ForMaT WDI-Lab finden Sie hier.


nach oben