Kann KI Text erkannt werden?

Die kurze Antwort wäre wohl: erstaunlich gut und trotzdem schlecht. Ja wir können Texte (manchmal besser manchmal schlechter) als Mensch- oder Maschinen- generiert deklarieren. Aber ist das der richtige Ansatz, wenn selbst Google sagt: schreib FÜR den Menschen, egal womit oder durch wen.

Steht unsere Schule an einem Punkt, wo KI-generierte Texte nicht mehr von den von Menschen geschriebenen zu unterscheiden sind? Die KI-Textgenerierung betritt das Klassenzimmer und mit ihr KI Detektoren.

KI-Text-Erkenner und ihre Grenzen

KI-Detektoren arbeiten nach ähnlichen Prinzipien wie KI-Textgeneratoren wie ChatGPT. Sie nutzen Metriken wie Perplexität und Burstiness, um die Wahrscheinlichkeit zu berechnen, dass ein Text von einer KI erstellt wurde.

Wie bei jeder Technologie haben auch KI-Detektoren ihre Grenzen. Diese Systeme, obwohl vielversprechend, sind nicht unfehlbar. Das bedeutet, dass die Befähigung und das Verständnis der menschlichen Akteur:Innen eine entscheidende Rolle spielen. Menschen müssen in der Lage sein, die KI zu überwachen, ihre Empfehlungen kritisch zu bewerten und notfalls zu korrigieren.

Die Wirksamkeit von KI-Textdetektoren kann je nach spezifischer Implementierung und dem zu analysierenden Text stark variieren. Eine Analyse untersuchte fünf KI-Textinhaltsdetektoren, die von OpenAI, Writer, Copyleaks, GPTZero und CrossPlag entwickelt wurden. Diese Tools wurden eingesetzt, um generierten Inhalt zu bewerten und die Effektivität jedes Detektors bei der korrekten Identifikation und Kategorisierung des Texts als entweder von KI generiert oder von Menschen geschrieben zu bestimmen. Die Ergebnisse zeigten eine Varianz in der Leistung dieser Tools über GPT 3.5, GPT 4 und von Menschen generierten Inhalt. Während die Tools im Allgemeinen erfolgreicher waren, den von GPT 3.5 generierten Inhalt zu identifizieren, kämpften sie mit dem von GPT 4 generierten Inhalt und zeigten Inkonsistenzen bei der Analyse von Kontrollantworten, die von Menschen geschrieben wurden​1​.

Einige Studien haben ergeben, dass KI-Textdetektoren in praktischen Szenarien nicht zuverlässig sind. Eine bestimmte Art von Angriff, bekannt als Paraphrasing-Angriffe, bei denen ein leichter Paraphraser auf ein grosses Sprachmodell (LLM) angewendet wird, kann eine ganze Reihe von Detektoren brechen​2​. Beispielsweise wurde festgestellt, dass das Paraphrasieren von Text, der von drei grossen Sprachmodellen generiert wurde, erfolgreich mehrere Detektoren umgeht, und die Erkennungsgenauigkeit von DetectGPT von 70,3% auf 4,6% senkt​3​.

Ein anderes Problem ist, dass während die Tools gut darin waren, von Menschen geschriebenen Text zu identifizieren (mit durchschnittlich 96% Genauigkeit), sie sich schlechter anstellten, wenn es darum ging, KI-generierten Text zu erkennen, besonders wenn bestimmte Techniken angewendet wurden, um die Detektoren zu täuschen​4​.

“Die Versprechungen sind hoch, aber die realen Ergebnisse der Technologie oft ernüchternd.” — Roger Basler de Roca

Mehrere Befunde legen nahe, dass die Leistung der Detektoren erheblich variieren kann, abhängig von der Raffinesse des KI-Modells, das zur Generierung des Inhalts verwendet wird. Dies hat bedeutende Auswirkungen auf die Plagiatserkennung und hebt die Notwendigkeit hervor, die Detektionstools kontinuierlich zu verbessern, um mit den sich entwickelnden KI-Textgenerierungsfähigkeiten Schritt zu halten.

Insgesamt zeigen diese Befunde, dass, obwohl KI-Detektions-Tools eine nützliche Hilfe bei der Identifizierung von KI-generiertem Inhalt sein können, sie nicht als alleiniger Bestimmungsfaktor in Fällen von akademischer Integrität verwendet werden sollten. Stattdessen sollte ein ganzheitlicher Ansatz verfolgt werden, der eine manuelle Überprüfung und die Berücksichtigung von Kontextfaktoren umfasst. Dies würde einen faireren Bewertungsprozess gewährleisten und die ethischen Bedenken hinsichtlich der Verwendung von KI-Erkennungstools mildern​1​.

Das KI Wasserzeichen

OpenAI arbeitete lange an einem ‘Wasserzeichensystem’, das in der Theorie eindeutig feststellen kann, ob ein Text von einer KI erstellt wurde. Aber auch hier gibt es Grenzen. Die Hauptmotivation hinter dieser Entwicklung ist die Verhinderung von Missbrauch, wie die Verwendung der von der KI generierten Inhalte durch Dritte und deren Missdarstellung als eigenes Werk​1​.

Diese Wasserzeichen-Initiative zielt darauf ab, eine klare Unterscheidung zwischen von Menschen und von KI erzeugten Inhalten zu ermöglichen, was besonders in akademischen und professionellen Kontexten von Bedeutung ist.

Die Wasserzeichen-Technologie von OpenAI funktioniert als eine Art “Wrapper” über bestehenden Textgenerierungssystemen, indem sie eine kryptografische Funktion auf Serverebene nutzt, um das nächste Token pseudorandomly auszuwählen. Theoretisch würde der generierte Text für den Betrachter weiterhin zufällig erscheinen, aber jemand, der den “Schlüssel” zur kryptografischen Funktion besitzt, könnte ein Wasserzeichen aufdecken​2​.

Eine kryptografische Funktion wird verwendet, um eine erkennbare Signatur in die Worte einzufügen, die von OpenAI’s Textgenerierungs-KI produziert werden​3​.

Die Implementierung des Wasserzeichensystems ist jedoch nicht ohne Herausforderungen. Experten sind geteilter Meinung über die Wirksamkeit des Systems. Einige argumentieren, dass es für Widersacher trivial sein könnte, das System zu umgehen, indem sie beispielsweise Synonyme verwenden oder den Text umschreiben.

Darüber hinaus könnte die Einbettung eines Wasserzeichens in jeden Token die (Lese-)Flüssigkeit des Textes beeinträchtigen, wenn das Wasserzeichen zu offensichtlich ist, oder Zweifel an der Authentizität des Wasserzeichens aufkommen lassen, wenn es zu subtil ist​4​.

Die bessere Alternative: Ausbildung und Schulung von Lehrer:Innen und Schüler:Innen

Wir müssen uns fragen, ob die alleinige Verwendung von KI-Detektoren wirklich die beste Option ist. Es könnte sinnvoller sein, unsere Ressourcen in die Ausbildung und Schulung von Lehrer:Innen und Schüler:Innen zu investieren. Diese stärkere Betonung der Bildung und ein transparenter Umgang mit KI-Technologien könnten eine weit sinnvollere und effektivere Sicherheitsstrategie sein.

Im Kontext des Einsatzes von KI-Detektoren und der Befähigung der Lernenden, diese Technologien effektiv zu nutzen, ist es wichtig, einen umfassenden Plan zu entwickeln, der auf den Prinzipien der Befähigung, Begeisterung und sorgfältigen Begleitung basiert. Hier sind einige Massnahmen, die Bildungseinrichtungen auf verschiedenen Ebenen ergreifen können, um den verantwortungsvollen Umgang mit KI zu fördern und gleichzeitig ein Umfeld der Transparenz und Inklusion zu schaffen:

Grundschule:

Bildungsressourcen Entwickeln:

Entwicklung von altersgerechten Lernressourcen, um den Schüler:Innen die Grundlagen der KI und ihrer Anwendungen beizubringen.Organisation von Workshops und interaktiven Sitzungen, in denen die Kinder die Möglichkeit haben, sich mit KI-Technologien auseinanderzusetzen und diese zu erkunden.

Einbeziehung von Eltern und Erziehungsberechtigten:

Bereitstellung von Informationsressourcen für Eltern, um das Bewusstsein für die Vorteile und Risiken der KI-Technologie zu schärfen.Regelmässige Elterngespräche, um die Bedenken und Vorschläge der Eltern zu hören und gemeinsam Strategien zur sicheren Nutzung von KI im Lernprozess zu entwickeln.

Förderung Kritischen Denkens:

Anleitung der Schüler:Innen zur Fragestellung und kritischen Betrachtung der Informationen, insbesondere derer, die durch KI-Systeme generiert werden.

Mittelschule:

Weiterbildungsprogramme:

Angebot von Kursen und Workshops, die sich auf den ethischen Einsatz von KI und das Verständnis ihrer Funktionsweise konzentrieren.Ermutigung der Schüler:Innen zur Teilnahme an Projekten, die den praktischen Einsatz von KI-Technologien beinhalten.

Transparente Kommunikation:

Klare Kommunikation über die Verwendung von KI-Technologien in der Lernumgebung und die damit verbundenen Richtlinien.Schaffung von Foren für offene Diskussionen zwischen Lehrer:Innen, Schüler:Innen und Eltern über den Einsatz von KI und die Auswirkungen auf den Lernprozess.

Förderung von Online-Sicherheit:

Unterricht in digitaler Ethik und Online-Sicherheit, um ein sicheres und verantwortungsbewusstes Verhalten im digitalen Raum zu fördern.

Hochschule:

Fachliche Weiterbildung:

Bereitstellung von spezialisierten Kursen und Zertifizierungen im Bereich KI und verwandter Technologien.Partnerschaften mit der Industrie, um realistische Einblicke in die Anwendung von KI und die Herausforderungen bei der Implementierung von KI-Detektoren zu bieten.

Forschung und Entwicklung:

Förderung von Forschungsprojekten, die sich auf die Entwicklung effektiver und ethischer KI-Detektoren konzentrieren.Schaffung von Plattformen für den interdisziplinären Austausch und die Zusammenarbeit in Fragen der KI-Ethik und -Governance.

Community Engagement:

Organisation von öffentlichen Vorträgen, Workshops und Diskussionsrunden, um das Bewusstsein für die Möglichkeiten und Risiken der KI-Technologie zu schärfen.

Durch die Umsetzung dieser Massnahmen können Bildungseinrichtungen eine Umgebung schaffen, die die Befähigung, Begeisterung und sorgfältige Begleitung von Schüler:Innen und Lehrer:Innen im Umgang mit KI-Technologien fördert. Es ist von entscheidender Bedeutung, dass alle Beteiligten — von den Lernenden bis zu den Lehrenden und den Familien — aktiv in den Prozess einbezogen werden, um eine inklusive und transparente Lernumgebung zu schaffen, die den verantwortungsbewussten Einsatz von KI-Technologien fördert.

Wenn das für dich spannend klang, dann lass uns gerne reden — bei Fragen gerne melden.

Wie zuverlässig sind KI-Detektoren?

Die Zuverlässigkeit von KI-Detektoren kann variieren und hängt stark von der Qualität des Algorithmus, dem Trainingsdatensatz und den spezifischen Merkmalen des zu erkennenden KI-Textes ab. Fortschritte in der KI-Forschung und Entwicklung verbessern stetig die Fähigkeit von Detektoren, KI-generierten Text zu identifizieren. Allerdings können sehr fortschrittliche KI-Modelle wie GPT-3 oder GPT-4 menschenähnliche Texte erzeugen, die die Erkennung erschweren.

Wie arbeiten KI-Detektoren?

KI-Detektoren arbeiten in der Regel durch die Analyse von Textmerkmalen, die für menschliche Autoren untypisch sind, oder durch den Vergleich mit bekannten Mustern von KI-generierten Texten. Sie können auch auf statistischen Abweichungen basieren, die in den Texten gefunden werden. Manchmal verwenden sie maschinelles Lernen, um besser zu verstehen, wie KI- und menschliche Texte sich unterscheiden, und passen ihre Erkennungsmethoden entsprechend an.

Kann man KI nachweisen?

Ja, die Nachweisbarkeit von KI ist durch bestimmte forensische Techniken und spezialisierte Software möglich. Diese Werkzeuge können Muster und Anomalien identifizieren, die auf die Verwendung von KI hindeuten. Der Nachweis kann allerdings schwieriger werden, je fortschrittlicher die KI-Technologie ist.