Lifehack: Arbeitsweise von KI-Plagiatscannern

Wie zuverlässig arbeiten KI-Scanner?

Kopierst du blindlings KI-erzeugte Inhalte in deine wissenschaftliche Arbeit, ist dies ein No-Go. Nutzt du KI zur Textproduktion und scannst den erzeugten Text dann mit verschiedenen KI-Plagiatscannern, wirst du feststellen, dass die Ergebnisse teilweise erheblich voneinander abweichen. Dies ist widersprüchlich, denn im Wissenschaftsbetrieb muss im Ergebnis ermittelt werden, ob eine eingereichte Bachelor-, Masterarbeit oder Promotion KI-generiert ist oder nicht. Davon hängt ab, ob der Studierende Konsequenzen zu befürchten hat. Eine Ja/Nein-Antwort ist deshalb also erforderlich. Empirische Befunde legen nahe, dass KI-Detektoren eher dazu neigen, Texte als menschengeschrieben zu deklarieren, statt einen KI-Einsatz zu erkennen [1]. Aber der Reihe nach.

Wissenschaftliche Arbeitsweise bedeutet, sich selbst in Sachverhalte einzulesen, einzuarbeiten. Würde man diesen strengen Maßstab ansetzen, wäre die KI-Nutzung im Wissenschaftsbetrieb von vornherein kategorisch auszuschließen.

So, wie man vor zehn Jahren in Wikipedia Begriffe punktuell nachgeschlagen hatte, lassen sich heute ganze Sachverhalte hinsichtlich ihrer Zusammenhänge bei ChatGPT erfragen. Um erste Einblicke in ein unbekanntes Thema zu erlangen, ist dies sicherlich nützlich und auch legal.

Wer hingegen seine komplette Arbeit per KI erzeugen lässt, verstößt gegen das Grundgebot des wissenschaftlichen Arbeitens. Denn ein wissenschaftliches Werk ist bereits dann ein Plagiat, wenn Quellen verwendet wurden, die der Verfasser nicht in der Hand hielt [2]. Dazu existieren bereits Gerichtsurteile, die Aberkennung eines akademischen Titels ist dann sogar rechtens [2]. In praktischer Hinsicht ist jedoch die Nachweisbarkeit nicht immer gewährleistet.

 

Einführung: Quantifizierung von Schriftsprache

Ein KI-Scan ist stets eine Textanalyse. Um diese leisten zu können, wird Sprachliches in ein Zahlensystem überführt. Der Text wird in einem ersten Schritt demnach einer Quantifizierung unterzogen. Was jedoch wie quantifiziert wird, ist abhängig vom jeweiligen Modell und der Zielsetzung. Es können beispielsweise Buchstaben, Wörter, Sätze, Satzzeichen oder Sinneinheiten gezählt werden.

Die wohl einfachste Form der Sprachquantifizierung kennt jedes Kind: Buchstaben werden in alphabetischer Reihenfolge Zahlen zugeordnet: A = 1, B = 2, C = 3 usw. 8 1 21 19 würde demnach HAUS heißen. Der Gedanke liegt äußerst nahe, dass sich auf diese Weise, selbstverständlich auch mit weitaus komplizierteren Methoden, Texte verschlüsseln lassen. Eine bekannte Ver- und Entschlüsselung bot zur Zeit des Zweiten Weltkrieges die Rotor-Verschlüsselungsmaschine Enigma [3].

Umgekehrt existieren Methoden, die die Reihenfolge und Häufigkeit des Auftretens von Schriftzeichen analysieren. Eine Möglichkeit diesbezüglich ist das Zipfsche Gesetz [4]. Ziel kann hier die Ermittlung sein, ob es sich überhaupt um eine Sprache handelt, um eine Verschlüsselung oder um eine wirre Anordnung x-beliebiger Zeichen. Ein Text, der derartige Spekulationen befeuert, ist das Voynich-Manuskript [3] [5] [6].

Ausschnitt aus dem Voynich-Manuskript

Was ist ein Sprachmodell?

Ein Sprachmodell ermöglicht die Produktion von Texten. Genauer gesagt leistet generative KI diese Textproduktion; „generativ“ bedeutet, dass Inhalte erzeugt, also generiert werden. Informationen, die Menschen eingegeben haben, werden verstanden, verarbeitet und es erfolgt eine Ausgabe. Damit findet eine Kommunikation zwischen Mensch und Computer statt. Die folgenden Ausführungen thematisieren Schriftsprache, die von einer KI generiert wird.

 

Quantifizierung von Schriftsprache

Ein Computer kann jedoch Informationen nicht einfach verstehen, da Sprache etwas Qualitatives ist. Sämtliche Informationen müssen demnach quantifiziert werden, also in Zahlenwerte umgewandelt werden. Bei diesem Quantifizierungsprozess ist bezeichnend, dass dieser bereits logisch geschieht, indem Zahlenwerte nicht willkürlich zugeordnet werden.

Wortgruppen werden gebildet und Begriffe zusammengefasst. Die Zuordnung der Zahlenwerte erfolgt damit logisch durch Begriffsfelder. Vereinfacht ausgedrückt: Ähnliche Wörter haben ähnliche Zahlenwerte. Damit dieses Kernprinzip verdeutlicht wird, werden nun fiktive Werte angeführt:

„Hund“ = 17
„Katze“ = 18
„Maus“ = 20
„Ameisenbär“ = 32
„Atomkraftwerk“ = 261

Zur Veranschaulichung wurden hier ganze Wörter dargestellt. In echten Sprachmodellen werden oft kleinere Einheiten wie Silben oder Zeichenketten verwendet, sogenannte Tokens. Die zugeordneten Zahlenwerte sind beispielhaft und zeigen, dass „Hund – Katze“ eine oft auftretende Kombination in der deutschen Sprache darstellt. Das Sprachmodell weiß dies aufgrund der Trainingsdaten, beispielsweise durch den Satz: „Hast du einen Hund oder eine Katze?“.

Die Dreierkombination „Hund – Katze – Maus“ tritt häufiger auf als „Hund – Katze – Ameisenbär“. Eine alltägliche Aussage im Sprachgebrauch könnte beispielsweise sein: „Ich liebe alle Tiere, sozusagen Hund, Katze, Maus.“ Demgegenüber finden sich Aussagen wie „Ein Hund und ein Ameisenbär gehen ins Atomkraftwerk“ äußerst selten. Die zugeordneten Zahlenwerte von „Katze“ und „Eisscholle“ liegen sicher weiter auseinander als „Pinguin“ und „Eisscholle“. Wer dieses Prinzip nachvollziehen kann, hat die Kernlogik von Sprachmodellen verstanden.

Embeddings ermöglichen darüber hinaus die Zuordnung in mehrere Themenfelder. Sobald mehrere Zahlenwerte zugeordnet sind, handelt es sich um einen Vektor. Dadurch wird das Modell mehrdimensional. Ein Vektor für „Katze“ ist hier beispielhaft dargestellt.

\[
\mathbf{v}_{\text{Katze}} =
\begin{bmatrix}
0.021 \\
-0.103 \\
0.577 \\
0.842 \\
-0.331 \\
0.095 \\
0.441 \\
-0.220
\end{bmatrix}
\]

Diese Zahlenwerte sind keine echten Trainingswerte aus einem Sprachmodell. Zudem ist der Vektor aus Gründen der Übersichtlichkeit auf acht Dimensionen gekürzt. In realen Sprachmodellen hat er oft Hunderte von Dimensionen.

 

Leistung eines Sprachmodells

Ein Sprachmodell berechnet, auf welche anderen Wörter im Satz ein bestimmtes Wort achten soll. Diese Gewichtung wird als Self-Attention bezeichnet. Moderne Sprachmodelle nutzen die Self-Attention-Methode [7] innerhalb der Transformer-Architektur, um Wahrscheinlichkeiten berechnen zu können.

Self-Attention im Transformer

\[\mathrm{Attention}(Q,K,V)=\mathrm{softmax}\!\left(\frac{QK^{\top}}{\sqrt{d_k}}\right)V\]

Erklärung der Abkürzungen

  • Q – Queries
  • K – Keys
  • V – Values
  • dk – Dimension

Die „künstliche Intelligenz“ besteht also im ersten Schritt in der Zuordnung von Zahlenwerten auf der Basis von Wortfeldern. Im zweiten Schritt kommt eine Transformer-Architektur zur Anwendung.

 

Das Large Language Model

Ein Sprachmodell (Large Language Model, LLM) analysiert Schriftsprache und erzeugt Texte. Während des Trainingsprozesses wird es durch Eingaben verbessert. Dieser Vorgang wird als maschinelles Lernen bezeichnet. [1] Nach Abschluss des Trainings bleibt das Modell allerdings statisch und lernt nicht von selbst weiter. Maschinelles Lernen ist ein Bestandteil von KI-Systemen, die durch wiederholtes Training und Optimierung ihre Leistung verbessern. [8]

Während des Trainingsprozesses werden die Vektoren angepasst. Ein Sprachmodell von 1990 beispielsweise hätte „Nicht immer, aber immer öfter“ als Phrase gelernt, weil es damals in Werbung und Presse stand. Heute kennt das Modell eher Wörter wie „Ehrenmann“, „lost“ oder „creepy“.

Deep-Learning-Systeme werden automatisch durch große Datenmengen optimiert. Diese Systeme orientieren sich dabei am menschlichen Gehirn, d.h. an neuronalen Netzwerken. Für Deep-Learning-Modelle sollte eine große Datenmenge vorliegen. [9] Zahlreiche Unternehmen sehen die Zukunft der Technologie in KI und die Nutzung dieser als Zukunft der Menschheit [8] [10].

Es wird nun auch deutlich, dass sich die Funktionsweise von Sprachmodellen erheblich von Suchmaschinen unterscheidet. Denn eine klassische Suchmaschine sucht im Wesentlichen nach Buchstaben; ein Sprachmodell errechnet Antworten.

In den nächsten Schritten erfährst du, was bei einem KI-Scan wie analysiert wird.

Wie funktionieren KI-Plagiatscanner?

Ein KI-Plagiatscanner verrechnet im Wesentlichen zwei Werte: Perplexity und Burstiness. Da bei beiden Werten Textzusammenhänge überprüft werden, ist jedes KI-Scan-Ergebnis umso genauer, je länger der eingespeiste Text ist.

Zudem muss zwischen zwei Formen von Ergebnissen unterschieden werden. Beträgt dein Plagiatscore beispielsweise 20%, kann es sein, dass die Wahrscheinlichkeit, dass der eingespeiste Text von einer KI verfasst wurde, 20% beträgt. Mit dieser Information ist nicht näher ersichtlich, welche Stellen gemeint sind. Andere KI-Plagiatscanner spucken als Ergebnis vielleicht ebenso 20% aus, doch hier sind konkrete Stellen markiert. In diesem Fall hat der Scanner 20%, also 20 Wörter von 100, sicher als Plagiat erkannt. Der Vorteil ist hier, dass die Stellen in deinem Scanergebnis entsprechend farblich hervorgehoben sind.

Die im Folgenden dargestellten Methoden sind Analysemethoden, die jeder KI-Plagiatscanner anwendet.

 

Perplexity

Jeder Satz transportiert einen Sinn. Oftmals wird bereits im ersten Teil des Satzes ersichtlich, wie dieser logisch fortgeführt wird. Dies gilt unabhängig vom Gesamtkontext. Beginnt ein Satz mit „Kinder gehen in die Schule, …“ ist die Fortführung „… um zu lernen.“ deutlich wahrscheinlicher als „… auch wenn ihre Klassenräume in bunten Farben gestrichen wurden.“ Diese Annahmen der Unvorhersagbarkeit, im Sprachmodell als Entropie bezeichnet, stellen das Grundprinzip der Analyse dar [11].

Der Perplexitätswert gibt demnach sozusagen an, wie perplex ein Leser ist, wenn er einen Text liest bzw. den Sinn erfasst. KI-erzeugte Texte sind stets leicht verständlich, fließend zu lesen und zu verstehen, denn die einzelnen Sätze bewegen sich jeweils auf einer niedrigen Perplexitätsstufe.

Perplexität ist damit ein Wert, der mathematisch errechnet werden kann. Es steht außer Frage, dass bei einer wissenschaftlichen Arbeit auch der Schreibstil entscheidend ist und nicht nur der reine Informationsgehalt.

Der Duden beispielsweise gibt in seiner Online-Version nicht nur die Häufigkeit des Gebrauchs von Wörtern bekannt, sondern auch deren Einordnung hinsichtlich des Gebrauchs. Schreibst du in deiner Bachelorarbeit beispielsweise „Der Autor sagt …“, nutzt du durch das Wort „sagen“ einen umgangssprachlichen Begriff, der häufig verwendet wird [12]. Formulierst du hingegen „Der Autor konstatiert …“, ist der Begriff im Duden als „bildungssprachlich“ markiert und weist zudem eine geringere Sprachverwendungshäufigkeit auf [13]. Durch die konsequente Verwendung bestimmter Begriffe bzw. Fachsprache können ganze Texte einem Zielpublikum zugeordnet werden. Auch weitere sprachliche Gestaltungsmittel wie Metaphern, sind essenziell für die Texteinordnung. Dies leuchtet ein, denn in einer Liebesgeschichte werden Sachverhalte völlig anders beschrieben als in journalistischen Texten, und diese unterscheiden sich wiederum deutlich von wissenschaftlichen Arbeiten.

Mit ein wenig Sprachgefühl wird deutlich, wie identitäts-, lieb- und genrelos ChatGPT Texte erzeugt. KI-Detektoren ermitteln jedoch weitere Werte.

 

Burstiness

Wie kompliziert ein Text ist, zeigt sich auch an der Satzlänge. Mit ihr eng verbunden ist die Satzstruktur. Menschengeschriebene Texte beinhalten Sätze unterschiedlicher Länge. Beispielsweise bringt der Schreibende in einen Satz noch einen Untergedanken ein, solche Einschübe erscheinen meist durch Kommas getrennt oder werden durch Gedankenstriche ersichtlich. Zudem werden Inhalte an den Satz angehängt oder auf den Kerngedanken wird mit einführenden Worten in einem Halbsatz hingeleitet. Dies hält den Text lebendig, denn anschließende Gedanken werden weniger vorhersehbar. Exakt darin offenbart sich das menschliche Denken und der menschliche Schreibstil.

Burstiness beschreibt demzufolge einen Wert, der sich pro Satz ermitteln und dann auf den kompletten Text, gewissermaßen sinnübergreifend, beziehen lässt. KI-erzeugte Texte variieren hinsichtlich der Satzlänge und ‑struktur kaum. Der Sinn wird nach und nach „erbaut“: Zu erkennen ist dies an jedem einzelnen Satz sowie quasi als Vogelperspektive am kompletten Text. Ein niedriger Burstiness-Wert ist demnach ein wichtiges Indiz dafür, dass es sich um einen KI-generierten Text handelt. [11]

Die Folge ist, dass es aufgrund der Perplexity und Burstiness, selbst durch Umformulierung, nicht immer gelingt, den KI-Score nennenswert zu senken [11]. Denn die Gesamtlogik bleibt gleich. Viel Gestaltungsspielraum zur Logikveränderung bleibt in wissenschaftlichen Texten ohnehin nicht. Empirische Befunde, die durch Tests von KI-Plagiatscannern entstanden sind, legen demgegenüber nahe, dass durch Umformulierung ein KI-Scan-Ergebnis verfälscht werden kann [1].

 

Lifehack: KI-Test

Ich habe mal einen meiner Texte einem KI-Scan unterzogen. Es handelt sich hierbei um den Ausschnitt meiner Kolumne (Okt. 2024). Es dürfte klar sein, dass ich diesen Text selbst geschrieben habe, völlig ohne KI.

Falsch-positives KI-Scanergebnis

Mit ein wenig Sprachgefühl wird an der markierten Stelle jetzt ein leichter zu verstehender Sinn erkennbar (niedriger Perplexity-Wert) und dass sich die markierten Sätze hinsichtlich ihrer Länge und Struktur ähneln (niedriger Burstiness-Wert). Nun wird auch klar, weshalb das „Ah ja!“ abschließend mitmarkiert ist (vgl. Aha-Effekt). Das durchgehend gleiche Verständnislevel endet vor dem Wort „Sowas“; dort endet auch die ähnliche Satzkonstruktion. Wer sich den kompletten Kolumnentext durchliest, wird jetzt, nach der Markierung, einen leichten Stilbruch feststellen.

Wie sehr dies im Einzelfall empfunden wird, hängt wiederum mit den sprachlichen Kompetenzen des Sprachbenutzers zusammen. Da ich seit mehr als zehn Jahren Studierende berate und auch als Dozent gearbeitet hatte, kann ich KI-erzeugte Werke meist auch ohne Scanner entlarven. Den allermeisten Dozenten dürfte es ähnlich gehen.

 

Weitere Scan-Prüfwerte

  • Eine KI erzeugt Texte ohne Rechtschreib– oder Kommasetzungsfehler. Dies ist untypisch für von Menschenhand geschriebene Texte. Ebenfalls tauchen in handgeschriebenen Texten oft Uneinheitlichkeiten auf: In demselben Text wird beispielsweise „potentiell“ mal mit „t“ und mal mit „z“ geschrieben. Dies lässt sich im Rahmen eines Scans ebenso ermitteln und ins Ergebnis einberechnen.
  • Ein weiterer Wert ist der Gunning-Fog-Index. Hier wird der Text ebenfalls quantifiziert, anschließend mittels mathematischer Formel errechnet, welche Schulbildung ein Leser aufweisen muss (Anzahl der Schuljahre), um den Text verstehen zu können. Auch dies kann zur Analyse genutzt werden.
  • Wer Texte professionell schreibt, führt Wörter zusammen, um Sachverhalte kompakt darzulegen. Aus „Verhandlungen über den Frieden“ wird beispielsweise „Friedensverhandlungen“. Ein menschengeschriebener Text variiert zudem in der Ausdrucksweise („Gespräche zur Schaffung eines Friedens“, „über die friedliche Zukunft sprechen“ etc.) und kreiert auf diese Weise neue Logik. Eine KI ist bei weitem nicht so flexibel und ausdrucksstark, vielmehr offenbart die Analyse durchgehend gleiche Verständlichkeitslevel.
  • Derzeit wird an einem digitalen Wasserzeichen gearbeitet, um Texte als ChatGPT-generiert identifizieren zu können. Womöglich existiert das entsprechende Tool dazu bereits. Allerdings setzt OpenAI dieses noch nicht ein [14].

Es gibt viele weitere Formeln zur Lesbarkeitsanalyse. Das Scan-Ergebnis hängt demzufolge stark davon ab, welche Werte ermittelt, verrechnet und als finaler KI-Score ausgegeben werden. Wie ein KI-Scanner im Einzelfall arbeitet, ist nicht näher einsehbar. Wer sich für das genaue Zustandekommen verschiedener KI-Scores durch verschiedene Scanner interessiert, dem sei die Arbeit von Zhang et al. (2024) [15] empfohlen.

Großes rotes Paragraphenzeichen, umgeben von vielen weißen Paragraphenzeichen

Rechtliche Verbindlichkeit

Ob ein KI-Plagiatsergebnis für die Hochschule rechtsgültig ist, ist noch nicht abschließend geklärt. Denn es liegt kein Original als Gegenstück vor, wie es bei herkömmlichem Abschreiben der Fall wäre. Zudem kann die genaue Arbeitsweise des KI-Scanners nicht nachgewiesen werden, wie es in einem rechtsstaatlichen Verfahren erforderlich wäre. [16] Datenschutzrechtlich wird gewarnt, dass sämtliche bei ChatGPT eingegebenen Daten an den Betreiber gesendet werden, der Benutzer dann keine Kontrolle mehr über sie hat und Informationen unbeschränkt lange gespeichert werden können [17]. Es ist daher nicht auszuschließen, dass deine eingespeisten Daten zu einem späteren Zeitpunkt genutzt werden können, um Plagiate aufzudecken. Zusätzlicher Ärger, z.B. weil du deine erhobenen Daten aus einem Unternehmen oder sonstige vertrauliche Dokumente hochgeladen hast, würde sich dem anschließen.

Malte Persike, wissenschaftlicher Leiter des Centers für Lehr- und Lernservices an der RWTH Aachen, bekräftigt zum KI-Einsatz in Abschlussarbeiten: „Wegen eines Täuschungsversuchs würde die Arbeit für ungültig erklärt, sie müsste dann wiederholt werden“ [18]. Weiter betont er: „Nur eine natürliche Person kann Urheberin eines Werkes sein“ [18], auch das Bundesministerium der Justiz stellt dies klar [19]. Wer seine Studienleistung von einer KI verfassen lässt, erbringt demnach keine Eigenleistung.

Umgekehrt ließe sich jedoch auch der Rückschluss ziehen, dass gerade deshalb kein Plagiat vorläge, denn per definitionem ist ein Plagiat die Übernahme „geistigen“ Eigentums. Eine KI ist jedoch kein Mensch, dem ein „Geist“ zuzusprechen wäre. Deshalb müsste der Plagiatsbegriff ausgeweitet werden, denn die Übernahme „von anderen [Autoren]“ passe nun nicht mehr vollends, da eine KI kein Autor im Sinne eines lebendigen Menschen ist [20].

 

Rechtliche Fragen womöglich bald geklärt

Alle juristischen Aspekte werden in naher Zukunft beantwortet werden. Vor jener Klärung ist die KI-Nutzung bei Studienarbeiten mindestens eine rechtliche Grauzone; insbesondere dann, wenn eine Studienarbeit in einem Prüfungsverfahren als Eigenleistung eingereicht wird. Gegenwärtig ist nicht sicher, ob die Aberkennung erworbener Titel durch eine KI-Abschlussarbeit zu einem späteren Zeitpunkt noch erfolgen kann. Halte dich auf jeden Fall an die Vorgaben des Leitfadens.

Dozenten wollen sich zudem nicht veralbern lassen, ungeachtet der noch nicht eindeutigen Rechtslage. Nach wie vor haben Dozenten die Möglichkeit, Studierende wegen einer angeblich „schlechten“ Leistung auf herkömmlichem Wege durchfallen zu lassen.

FAQ: KI-Scanner und Plagiate

Wie zuverlässig arbeiten KI-Scanner?
KI-Scan-Ergebnisse sind in aller Regel recht genau, auch wenn die Scan-Ergebnisse teilweise erheblich voneinander abweichen. Empirische Befunde legen nahe, dass KI‑Detektoren eher dazu neigen, Texte als menschengeschrieben zu deklarieren, statt einen KI‑Einsatz zu erkennen.
Darf KI für die Bachelorarbeit genutzt werden?
Um erste Einblicke in ein unbekanntes Thema zu erlangen, ist KI sicherlich nützlich und legal.
Darf eine Bachelorarbeit mit KI geschrieben werden?
Nein. Wer seine komplette Arbeit per KI erzeugen lässt, verstößt gegen das Grundgebot des wissenschaftlichen Arbeitens.
Wie kann Schrift von einer KI erzeugt oder analysiert werden?
Sprachmodelle (Large Language Model, LLM) leisten dies computergestützt im Rahmen der Quantitativen Linguistik.
Was macht ein KI-Scan?
Ein KI-Scan ist eine Textanalyse. Der Text wird in einem ersten Schritt einer Quantifizierung unterzogen.
Was bedeutet maschinelles Lernen bei KI?
Beim maschinellen Lernen wird das Modell durch Beispiele trainiert und es verbessert seine Leistung anhand neuer Daten.
Was sind Deep-Learning-Systeme?
Deep-Learning-Systeme lernen selbst und orientieren sich am menschlichen Gehirn, d.h. an neuronalen Netzwerken.
Wie arbeiten KI-Plagiatscanner?
Es werden Textzusammenhänge überprüft. Dazu werden im Wesentlichen zwei Werte verrechnet: Perplexity und Burstiness.
Wie kann der KI-Score möglichst exakt ermittelt werden?
Ein KI-Scan-Ergebnis ist umso genauer, je länger der eingespeiste Text ist.
Was bedeutet Perplexity bei KI-Scannern?
Annahme, wie ein Kontext fortgeführt wird. Beginnt ein Satz mit „Kinder gehen in die Schule, …“ ist die Fortführung „… um zu lernen.“ am wahrscheinlichsten. Dies ist das Grundprinzip der Analyse.
Was bedeutet Burstiness bei KI-Scannern?
Burstiness bezieht sich auf die Satzlänge und -struktur. Da menschengeschriebene Texte Sätze unterschiedlicher Länge beinhalten, gibt dieser Wert Aufschluss über einen möglichen KI-Einsatz.
Was ist außer Perplexity und Burstiness relevant für die KI-Textanalyse?
Relevante Faktoren sind unter anderem der Schreibstil allgemein, die Anzahl der Rechtschreib- und Kommasetzungsfehler, Uneinheitlichkeiten, die konsequente Verwendung bestimmter Begriffe bzw. Fachsprache, weitere sprachliche Gestaltungsmittel wie Metaphern. Auch der Gunning-Fog-Index kann als Prüfwert herangezogen werden.
Lässt sich ein KI-Text umformulieren?
Kaum. Denn aufgrund der Perplexity und Burstiness gelingt es selbst durch Umformulierung nicht immer, den KI-Score nennenswert zu senken.
Sind KI-Scan-Ergebnisse für die Hochschule rechtsgültig?
Das ist juristisch noch nicht abschließend geklärt. Denn es liegt kein Original als Gegenstück vor, wie es bei herkömmlichem Abschreiben der Fall wäre.
Darf man sich freuen, wenn man mit einer KI-generierten Bachelorarbeit besteht?
Vorsicht ist geboten, denn es ist nicht auszuschließen, dass bei KI-Systemen eingespeiste Daten zu einem späteren Zeitpunkt genutzt werden, um Plagiate aufzudecken.
Welche Folgen hat ein KI-Plagiat, wenn es nicht auffällt?
Gegenwärtig ist nicht sicher, ob die Aberkennung erworbener Titel durch eine KI-Abschlussarbeit Jahre später noch erfolgen kann. Es ist allgemein bekannt, dass dies bei jeder anderen Plagiatsart möglich ist.
Wie können Dozenten ein KI-Plagiat nachweisen?
Die KI-Nutzung bei Studienarbeiten ist derzeit noch eine rechtliche Grauzone, KI-Ergebnisse nicht rechtsgültig. Jedoch haben Dozenten nach wie vor die Möglichkeit, Studierende wegen einer angeblich „schlechten“ Leistung auf herkömmlichem Wege durchfallen zu lassen.
Woran sollte man sich beim KI-Einsatz bei der Bachelorarbeit orientieren?
Oft regelt der Leitfaden deiner Hochschule den Umfang des erlaubten KI-Gebrauchs.
Gibt es Studien zum Thema KI-Scanner und KI-Score?
Ja, zum Beispiel: Zhang, Yuehan; Ma, Yongqiang, Liu, Jiawei; Liu, Xiaozhong; Wang, Xiaofeng & Lu, Wei (2024): Detection Vs. Anti-detection: Is Text Generated by AI Detectable? In: Sserwanga, Isaac, Joho, Hideo, Joho; Ma, Jie; Hansen, Preben; Wu, Dan; Koizumi, Masanori & Gilliland, Anne J. (Hrsg.): Wisdom, Well-Being, Win-Win, S. 209-222.

Hilfe nach der KI-Nutzung

Spielst du mit dem Gedanken, KI zu nutzen? Dann nimm in deinem eigenen Interesse bitte zuerst Kontakt mit mir auf. Du hast KI genutzt? Ein KI-Text lässt sich nicht problemlos umformulieren. Behauptungen der KI sind teilweise falsch [17]. Deshalb ist es nicht oder nur mit unverhältnismäßig großem Aufwand möglich, einen KI-Text nachträglich mit Quellenangaben zu versehen.

Verschleudere keine wertvolle Bearbeitungszeit, denn deine Thesis ist mehr als eine Umformulierungsleistung. Nutze KI höchstens im von deiner Hochschule erlaubten Umfang.

______________

[1] Weber-Wulff, Debora; Anohina-Naumeca, Alla; Bjelobaba, Sonja; Foltýnek, Tomáš; Guerrero-Dib, Jean; Šigut, Petr; Popoola, Olumide & Waddington, Lorna (2023): Testing of detection tools for AI-generated text. In: Int J Educ Integr 19, 26. https://doi.org/10.1007/s40979-023-00146-z
[2]
https://www.faz.net/aktuell/karriere-hochschule/hoersaal/plagiate-berliner-gericht-verschaerft-zitierregeln-16889827.html [04.10.2025]
[3] Schmeh, Klaus (2012): Nicht zu knacken. München: Carl Hanser Verlag.
[4] Stock, Wolfgang G. (2000): Informationswirtschaft. München: Oldenbourg.
[5] Edwards, Robert H. (2024): Voynich Reconsidered – The Most Mysterious Manuscript in the World. Atglen/PA: Schiffer Publishing.
[6] Voynich-Manuskript: Beinecke Rare Book & Manuscript Library. Yale University. Abrufbar unter: https://collections.library.yale.edu/catalog/2002046 [04.10.2025]
[7] Vaswani, Ashish; Shazeer, Noam; Parmar, Niki; Uszkoreit, Jakob; Jones, Llion; Gomez, Aidan N.; Kaiser, Łukasz & Polosukhin, Illia (2017): „Attention Is All You Need.“ In: Advances in Neural Information Processing Systems (NeurIPS 2017), 30. Curran Associates, abrufbar unter: https://arxiv.org/abs/1706.03762 [04.10.2025]; https://doi.org/10.48550/arXiv.1706.03762 [04.10.2025]
[8] https://www.sap.com/germany/products/artificial-intelligence/what-is-machine-learning.html [04.10.2025]
[9] https://www.managementcircle.de/blog/machine-learning-maschinelles-lernen.html [04.10.2025]
[10] https://www.ibm.com/de-de/topics/machine-learning [04.10.2025]
[11] Mahmud, Saadia (2024): Academic Integrity in the Age of Artificial Intelligence. Hershex/PA: IGI Global.
[12] https://www.duden.de/rechtschreibung/sagen [04.10.2025]
[13] https://www.duden.de/rechtschreibung/konstatieren [04.10.2025]
[14] https://t3n.de/news/wasserzeichen-tool-chatgpt-ki-generierte-texte-entlarven-1639102/ [04.10.2025]
[15] Zhang, Yuehan; Ma, Yongqiang, Liu, Jiawei; Liu, Xiaozhong; Wang, Xiaofeng & Lu, Wei (2024): Detection Vs. Anti-detection: Is Text Generated by AI Detectable? In: Sserwanga, Isaac, Joho, Hideo, Joho; Ma, Jie; Hansen, Preben; Wu, Dan; Koizumi, Masanori & Gilliland, Anne J. (Hrsg): Wisdom, Well-Being, Win-Win, S. 209-222.
[16] https://www.heinze-pruefungsanfechtung.de/taeuschungsversuch-ai-ki/ [04.10.2025]
[17] Schröder, Georg F. (2023): Datenschutzrecht für die Praxis. (5. Aufl.). München: C.H.Beck.
[18] https://www.welt.de/wirtschaft/webwelt/article246448574/ChatGPT-an-der-Uni-Was-bei-KI-im-Studium-erlaubt-ist-und-was-nicht.html [04.10.2025]
[19] https://www.bmj.de/SharedDocs/Downloads/DE/Themen/Nav_Themen/240305_FAQ_KI_Urheberrecht.pdf?__blob=publicationFile&v=2 [04.10.2025]
[20]
Winkler, Julia (2023): Forensik-Projekt 2, KI-Detektoren im Test – Zero Tolerance Policy für ChatGPT mit zerogpt.com. Hochschule Wismar, Fakultät für Ingenieurswissenschaften (Hrsg.). Abrufbar unter: https://it-forensik.fiw.hs-wismar.de/images/f/f9/KI-Detektoren-Test_Winkler.pdf [04.10.2025]

Stand: Oktober 2025, Informationen können sich ggf. rasch ändern.

Jetzt melden, Unterstützung sichern:

Warte nicht, bis es zu spät ist!

Ich helfe gern und lege auch mal eine Nachtschicht ein – ohne Aufpreis. Meine Hilfe ist effektiver und kostengünstiger, wenn du dich frühzeitig bei mir meldest, denn ich rechne nach Stunden ab.

Auch wenn die Zeit drängt: In jeder Phase deiner Bearbeitung unterstütze ich dich mit Feedback oder einem Schreibcoaching.

Du erreichst mich telefonisch, per WhatsApp, per E-Mail oder über das Kontaktformular.