Im Blickpunkt

CSI: Weimar (Plagiaten auf der Spur)

Ob sich Dr. Matthias Hagen mit seiner Arbeit unter den Studenten der Bauhaus-Universität nur Freunde machen wird? Schließlich forscht sein Weimarer InnoProfile-Team unter anderem an Algorithmen, mit denen sich wissenschaftliche Arbeiten und Texte vergleichen und so Plagiate erkennen lassen. Allerdings ist das nicht das einzige Betätigungsfeld der Initiative "Intelligentes Lernen". Die Fortschritte der letzten zwölf Monate dokumentierten Hagen und seine Kollegen nun im Rahmen ihres 2. Workshops.

Suche und Aufbereitung, Interaktion sowie Wissensvermittlung - das sind kurz gesagt die drei Themenfelder, auf die sich die Thüringer Nachwuchsforschungs-gruppe bei ihrer Arbeit konzentriert. Teamleiter Matthias Hagen ist dabei vor allem im ersten Segment aktiv, schwerpunktmäßig zu Webanfragen zur Plagiaterkennung: "Unser Ziel ist es, verdächtige, also eventuell kopierte, Textstellen verlässlich und schnell mit Referenzdokumenten abgleichen und dadurch identifizieren zu können." Hierzu werden Schlüsselwörter extrahiert und zu spezifischen Suchanfragen zusammengestellt. Das ist schwieriger, als es auf den ersten Blick erscheinen mag, wie Hagen erklärt: "Die Krux ist es, genug Dokumente für einen validen Abgleich zu haben, gleichzeitig aber schnellstmöglich Ergebnisse zu liefern. Wir realisieren das, indem wir Kookkurrenzen nutzen, also Trefferzahlen bei unterschiedlichen Wortkombinationen vergleichen und daraus Wahrscheinlichkeiten ableiten." Somit lassen sich etwa über Google 1.000 relevante Dokumente mithilfe von elf Schlüsselwörtern in wenigen Sekunden finden. Normalweise dauert eine vergleichbare Suche, bei der die Wörter in allen möglichen Varianten kombiniert werden, über zehn Minuten. Es scheint, als würden für Freunde des "Copy-and-Paste" schwere Zeiten anbrechen.

Genial oder banal? Der Computer weiß Bescheid!

Auch die Qualität eines Textes kann ein Rechner bestimmen - wenn man ihm sagt, wie es geht. "Natürlich ist die Frage, ob eine Text gut oder schlecht ist, immer eine subjektive Geschichte", weiß Teammitglied Maik Anderka. "Die Inhalte der Gala lassen sich schließlich nur begrenzt mit dem ManagerMagazin vergleichen. Aber innerhalb eines bestimmten Kontextes, ist die Qualitäts-bestimmung durchaus aussagekräftig." Als Referenzobjekt haben die Nachwuchsforscherinnen und -forscher die Online-Enzyklopädie Wikipedia gewählt und sich dabei auf die sogenannten "featured articles" konzentriert, also jene Beiträge, die von der Wiki-Gemeinschaft als besonders gelungen eingestuft wurden. Mit speziellen Algorithmen zur Schreibstilanalyse gefüttert identifiziert der Computer diese Artikel mit einer Wahrscheinlichkeit von 98 Prozent. Gerade ist Anderka dabei, auch den umgekehrten Weg zu gehen und qualitative Mängel zu detektieren. Dabei helfen ihm die Cleanup-Templates bei Wikipedia. "Das sind Bearbeitungshinweise, die dem Nutzer sagen, dass ein Artikel nicht ausreichend belegt ist oder wichtige Informationen fehlen. Bis wir das entsprechende Programm haben, um auch diese mit hoher Wahrscheinlichkeit herausfiltern zu können, wird es aber noch etwas dauern."

Zwei Dimensionen und unzählige Quadrate

Lernen im mehrdimensionalen Raum zählt nach wie vor zu den Schwerpunkten im Arbeitspaket Interaktion. Christoph Lux hat sich dabei vor allem mit dem Problem der Darstellung großer Datenmengen im zweidimensionalen XHD-Lernraum beschäftigt: "Bei einem hochauflösenden 40-GB-Bild bekommt jeder Rechner Probleme. Daher behelfen wir uns mit einer Quadtree-Hierarchie." Dabei wird das Bild in einzelne Quadrate unterteilt, jedes Quadrat wiederum in Quadrate und so weiter. Wird das Bild aufgerufen, löst der Rechner nur den benötigten Teil wirklich fein auf. Die anderen Bereiche werden gröber, also mit übergeordneten Quadraten dargestellt - ohne dass dies der Betrachter merkt. "Damit lässt sich viel Speicherplatz sparen", erklärt Lux. "Letztlich lädt der Rechner nur 400MB in die Grafikkarte und etwa 2GB in den Arbeitsspeicher. Alles andere bleibt auf der Festplatte und wird nur bei Bedarf abgerufen."

Virtuos virtuellen Klang erzeugen

Hochaufgelöste Körperzelle: Mithilfe einer Quadtree-Hierarchie lassen sich auch große Datenmengen im XHD-Lernraum gezielt und schnell bearbeiten.

Im dreidimensionalen Lernraum geht es aktuell mehr ums Hören als ums Sehen. "Das gemeinsame Interagieren und eine stimmige Projektion für mehrere Betrachter haben wir bereits realisiert", so Nachwuchsforscher Alexander Kulik. "Was bisher fehlte, war der passende Ton." Um Klangquellen zu erzeugen, die von einer bestimmten Position im Raum kommen, arbeitet das InnoProfile-Team mit einem Ring von Lautsprechern, der um die Projektionsleinwand angeordnet ist. "Das dahinter steckende Prinzip ist die Wellenfeldsynthese", erklärt Kulik. "Damit lassen sich Wellenfronten erzeugen, die von einem virtuellen Punkt ausgehen. Würde ein Auto von rechts nach links durchs Bild fahren, steuert der Computer die Schallwellen so, dass die Richtung der Motorengeräusche exakt zur Position des Fahrzeugs passen."

Wenn Kuliks Kollege Andreas-Christoph Bernstein mit seiner Arbeit fertig ist, sitzt der Betrachter vielleicht sogar selbst in der gezeigten 3-D-Welt. "Wir versuchen, Gegenstände und auch Personen mithilfe von Tiefenkameras in den Lernraum zu projizieren. Das könnte in Zukunft etwa für Telefonkonferenzen eine interessante Anwendung sein." Noch steht Bernstein aber am Anfang der Entwicklungsarbeit.

World of Warcraft - für Architekten, Bauingenieure und Co.

Keine Trolle oder Elfen, dafür aber Dämmeigenschaften von Wänden und  Temperaturverläufe im Mauerwerk - darum geht es bei der spielerischen Erkundung der Bauphysik, die Christiane Hadlich dem Publikum abschließend vorstellt. "Prinzipiell orientiert sich unsere Software schon ein wenig an Online-Rollenspielen. Allerdings sollen in unserem Fall Studenten in einer virtuellen Welt lernen, wie sich unterschiedliche Materialien, Bauformen oder Ähnliches auf Faktoren wie den Schallschutz oder die Wärmedämmung auswirken."

Mit dieser Idee dürfte die Nachwuchsgruppe die Weimarer Studenten versöhnlich stimmen - trotz der Geschichte mit den Plagiaten.



Weitere Informationen zum InnoProfil Intelligentes Lernen erhalten Sie hier.


nach oben