Bergische Universität Wuppertal Auf der Suche nach Plagiaten

An der Bergischen Uni entwickeln Forscher eine Software, um zuverlässiger Fälschungen in akademischen Arbeiten zu entdecken.

Norman Meuschke zeigt die Software, die neue Möglichkeiten bei der Plagiatssuche eröffnet.

Foto: Fischer, Andreas H503840

In mehr als 200 Fällen haben die Plagiatssucher der Website Vroniplag Wiki schon Fälle aufgedeckt, in denen in Doktorarbeiten plagiiert wurde – abgeschrieben, ohne dass die Autoren das kenntlich gemacht hätten. In einigen Fällen führte das zur Aberkennung des Doktortitels – einer der prominentesten Fälle und einer der ersten war Karl-Theodor zu Guttenberg, damals Verteidigungsminister – aber nicht mehr lange.

Seitdem ist die Sensibilität für Plagiate in akademischen Arbeiten gestiegen – zumal bei Politikern. Die Suche nach Textübernahmen ist aber nicht einfacher geworden. Auch weil viele Arbeiten aus mehr als Text bestehen.

Das zu verbessern, daran arbeitet aber ein Team der Bergischen Universität. Norman Meuschke vom Lehrstuhl für Data & Knowledge Engineering arbeitet mit Professor Bela Gipp und weiteren Mitarbeitern an einer Software, die sich „HyPlag“ (Hybrid Plagiarism Detection) nennt.

Die Software sucht nicht nur abgeschriebene Textpassagen

Das Besondere: Sie untersucht nicht nur den Text auf 1:1-Kopien, sondern auch auf Paraphrasen, also umformulierte Sätze, Übersetzungen und ähnliche Formeln. Als ein Hilfsmittel dient dazu unter anderem das Quellenverzeichnis. Norman Meuschke erklärt: „Die Quellenverweise innerhalb des Textes oder in Fußnoten hat bisher jedes System ignoriert. Bei Übersetzungen oder Paraphrasen werden diese aber häufig auch übernommen. Guttenberg zum Beispiel hat Teile seiner Arbeit wörtlich aus dem Englischen übersetzt, einschließlich der Quellenverweise. Da die beiden Texte in verschiedenen Sprachen vorlagen, haben andere Systeme das nicht erkannt. Dabei sind die Quellenverweise so etwas wie ein Fingerabdruck einer akademischen Arbeit.“

Plagiate sind kein kleines Problem in der Wissenschaft, aber eines über das man nicht gerne redet. „Es gibt sehr viele Studien, die versuchen etwas nachzuweisen, von dem eigentlich niemand möchte, dass es nachgewiesen wird“, fasst Meuschke zusammen. Befragungen unter Studenten zeigten teils erschreckend hohe Zahlen. Unter Wissenschaftlern gebe so ein Verhalten aber keiner mehr zu. Immerhin hingen Existenzen daran. „Wenn ich als Wissenschaftler erwischt werde, bin ich gebrandmarkt. Schlimmstenfalls beruflich tot.“

Meuschke sagt aber, er sehe sich nicht als Plagiatsjäger. Er programmiere nur die Software, um die Vergleiche von Arbeiten mit vorhandenen Veröffentlichungen möglich zu machen. Er und Gipp arbeiten schon seit 2011 daran, seit Meuschkes Masterarbeit zu dem Thema – inspiriert vom Fall zu Guttenberg. Damals kam die Idee auf, die Quellenverweise zu überprüfen. Daran arbeiten sie seitdem – in Wuppertal, Berkeley (Kalifornien/USA), Konstanz, Tokio (Japan) und seit 2018 wieder in Wuppertal. Neben Quellenverweisen arbeitet die Software auch mit anderen nicht-textuellen Merkmalen wie Formeln oder Grafiken.

Für Meuschke geht es um die Glaubwürdigkeit der Wissenschaft

Wohin ihre Arbeit führt, oder zumindest wie das eingeschätzt wird, zeigt aber ein Bericht der FAZ, die über das Projekt geschrieben hat und die Frage vorweg schickte: „Werden noch Tausende von Doktortiteln entzogen?“

Für Meuschke geht es aber auch um akademische Arbeiten, die in Fachzeitschriften veröffentlicht werden. Er nennt etwa die Medizin als Beispiel. Wenn da eine Studie angefertigt werde zur Wirksamkeit eines Medikaments oder einer Behandlungsmethode, und die werde in einer anderen Studie abgeschrieben, dann kann das in Metastudien – die mehrere Arbeiten zu einem Thema zusammenführen und vergleichen – zu Verfälschungen führen. Und die könnten dann auch Patienten betreffen.

Auch in Sachen Moral von Menschen aus Politik oder Wissenschaft ist Meuschke kritisch, wenn sie plagiieren: Wer bei seiner Doktorarbeit oder einer anderen Arbeit abschreibe und da abkürze, „der nimmt vielleicht auch irgendwo anders Abkürzungen“, meint Meuschke. Mit der Software wäre den Plagiaten zwar kein Ende gesetzt, erklärt Meuschke, aber es wäre ein Fortschritt, um wissenschaftliche Qualität bewahren zu können.

Aktuell ist „HyPlag“ eine Software in der Entwicklung, eine die noch lernt durch bereits nachgewiesene Fälle. Mittelfristig soll sie zu einer offenen Plattform werden, die Unis nutzen können sollen. Ihr Erfolg hänge aber maßgeblich davon ab, auf welche Quellen sie zugreifen kann, erklärt Meuschke. Und da haben nicht alle Unis Zugriff auf alle Datenbanken mit wissenschaftlichen Veröffentlichungen. Das zu ändern, liegt aber nicht in Meuschkes Hand.