WDI-Lab - Semantische Integration von Webdaten - Leipzig

Das ForMaT-Vorhaben

 

Das WDI-Lab ist ein Innovationslabor am Institut für Informatik der Universität Leipzig. In ihm werden unter Leitung von Professor Erhard Rahm bereits erforschte Teillösungen zur Datenintegration für den Markteinsatz optimiert und ausgebaut.

Die vom WDI-Lab adressierten Datenintegrationsprobleme beinhalten die Bündelung von Unternehmensdaten mit Informationen externer Anbieter in korrekter und nutzungsfähiger Weise. Diese Problemstellungen sind in zahlreichen Unternehmen präsent, bergen aber besondere Schwierigkeiten, verursacht durch die große Datenheterogenität unterschiedlicher Web-Anbieter wie Online-Shops oder speziellen Suchmaschinen. So erfordert etwa die Realisierung eines Web-Portals für Urlaubsreisen die korrekte Erfassung und Verknüpfung von sich ständig ändernden Hotel- und Flugangeboten zahlreicher Anbieter. Dies soll zudem auf einfache, schnelle und zuverlässige Weise geschehen. Die Erstellung solcher Datenintegrationslösungen ist jedoch mit konventionellen Ansätzen nur unbefriedigend realisierbar, nämlich mit hohem Entwicklungsaufwand für Spezialprogrammierungen, hohen Kosten und begrenzter Qualität.
 

Die Ziele

Ziel des WDI-Lab ist die Entwicklung einer marktfähigen Technologie zur semantischen Integration von Webdaten. Dazu wird auf Basis bereits vorliegender Forschungsprototypen ein Framework, also eine Art Software-Baukasten, entwickelt. Mit dessen Hilfe ist es möglich, mit sehr geringem Aufwand nutzerspezifische Applikationen zu erstellen, die einen bestimmten Anwendungsfall zur Integration von Webdaten abdecken.
 

Die thematischen Schwerpunkte

Der Einsatz der entwickelten Software ermöglicht schnelle Ergebnisse bei Internetrecherchen, eine Erhöhung der Datenqualität und eine automatische Datentransformation. Einzelne Komponenten des Frameworks sind dabei auf Schema/Ontologie-Matching sowie Objekt-Matching/Dublettenbehandlung ausgerichtet und können auch unabhängig von den anderen Komponenten ausgeführt werden, um Spezialprobleme zu lösen. Die Lösungsansätze wurden in den letzten Jahren von Professor Rahm und seinen Mitarbeitern bereits intensiv erforscht und fanden in der internationalen Wissenschaft große Beachtung. Vorliegende Prototypen werden nun an die Bedürfnisse realer Anwendungen angepasst. Dazu forschen zehn Wissenschaftliche Mitarbeiter und acht Studentische Hilfskräfte im WDI-Lab in drei Forschungsgruppen:

  • Workflowbasierte Datenintegration
  • Schema- und Ontologiematching
  • Objektmatching/Dublettenbehandlung


Die Partner

  • Gesellschaft zur Förderung des Forschungstransfers e. V., Niederdorfelden
  • SAP Research Center, Dresden
  • Unister Holding GmbH, Leipzig

Kontakt

Carina Röllig
Webdata Solutions GmbH
Angerstraße 40-42
04177 Leipzig
Tel.: 0341 47849727
E-Mail: info@webdata-solutions.com