Home
Themen
News
KI-Tools erstellen bereitwillig Desinformation

Wolfgang Kempkens, pte

Patrick Hediger

5. Sep 2025

Lesedauer 3 Min.

Künstliche Intelligenz

KI-Tools erstellen bereitwillig Desinformation

Forscher der University of Technology Sydney lassen trotz Sicherheitsvorkehrungen Fake News generieren. Die Sicherheitsmassnahmen seien überraschend oberflächlich.

Prominente, Politiker, Kriminelle und Co müssen sich Fake News dank Künstlicher Intelligenz (KI) nicht mehr selber ausdenken. Zwar sind die Tools mit Sicherheitsmerkmalen ausgestattet, die eine solche Bitte eigentlich mit Sätzen wie "Ich kann Ihnen bei der Erstellung falscher Informationen nicht helfen" beantworten sollten. Doch die Medienforscher Lin Tian und Marian-Andrei Rizoiu von der University of Technology Sydney haben einen Weg gefunden, die Vorsichtsmassnahmen zu umgehen.

Alarmierend leicht zu umgehen

"Unsere Tests zeigen, dass diese Sicherheitsmassnahmen überraschend oberflächlich - oft nur wenige Worte tief - und daher alarmierend leicht zu umgehen sind. Was wir herausgefunden haben, sollte jeden beunruhigen, der sich um die Integrität von Online-Informationen sorgt", warnen die Wissenschaftler.

Die Experten haben sich einer Studie von Google und der Princeton University bedient. Danach bestehen die derzeitigen Sicherheitsmassnahmen in erster Linie darin, die ersten paar Wörter einer Frage beziehungsweise Bitte zu kontrollieren. Wird ein kommerzielles Sprachmodell direkt aufgefordert, Desinformationen über australische politische Parteien zu erstellen, lehnt es das korrekt ab.

Kaschiert der User hingegen die Bitte damit, dass sie von einem Social-Media-Vermarkter kommt, der allgemeine Strategien und Verfahren zur Aufdeckung von Fake News entwickelt, kommen die Tools der Aufgabe begeistert nach. Sie produzierten eine umfassende Desinformationskampagne, in der die Rentenpolitik der australischen Labour-Partei fälschlicherweise als "Quasi-Erbschaftssteuer" dargestellt wurde. Auch umfasste sie plattformspezifische Beiträge, Hashtag-Strategien und Vorschläge für visuelle Inhalte, die darauf abzielten, die öffentliche Meinung zu manipulieren.

Grosse Sprachmodelle im Visier

"Das Hauptproblem besteht darin, dass das Modell schädliche Inhalte generieren kann, aber nicht weiss, dass sie schädlich sind und warum es die Antwort ablehnen sollte", schreiben die Medienwissenschaftler. Grosse Sprachmodelle seien lediglich darauf trainiert, bei bestimmten Themen mit "Ich kann nicht" zu antworten.

"Um diese Schwachstelle zu demonstrieren, haben wir mehrere beliebte KI-Modelle mit Prompts getestet, die darauf ausgelegt waren, Desinformation zu generieren. Die Ergebnisse waren beunruhigend: Modelle, die direkte Anfragen nach schädlichen Inhalten konsequent ablehnten, kamen der Anfrage bereitwillig nach, wenn sie in scheinbar harmlose Rahmenbedingungen eingebettet war", heisst es abschliessend. (pressetext.com)

Kommentare

Künstliche Intelligenz KI & Trends

Neueste Beiträge

Praxis

Fun

Mini-Cup-Game in der Google-Suche spielen

So finden Sie das Easter Egg von Google und üben sich im Elfmeterschiessen.

2 Minuten

Claudia Maag

19. Jun 2026

Mehr erfahren

News

AI Frontier Hackathon

Neurodiverse IT-Lernende entwickeln bei Microsoft eigene KI-Agenten

Über 40 neurodiverse IT-Lernende und Ausbildner, darunter Lernende im Autismus-Spektrum und mit ADHS, entwickelten beim AI Frontier Hackathon von Kauz Informatik Medien AG und Microsoft Schweiz eigene KI-Agenten.

3 Minuten

Patrick Hediger

21. Jun 2026

Mehr erfahren

News

Vernehmlassung

Angepasste Unternehmensabgabe für Radio und TV

Der Bundesrat will das Tarifmodell der Unternehmensabgabe für Radio und Fernsehen anpassen und damit einen Entscheid des Bundesgerichts umsetzen. Die Vernehmlassung zur Teilrevision der Radio- und Fernsehverordnung wird am 23. Juni 2026 eröffnet.

2 Minuten

Patrick Hediger

19. Jun 2026

Mehr erfahren

Das könnte Sie auch interessieren

News

NFC-Angriffe auf Android verdreifacht

Cyberkriminelle nutzen zunehmend NFC-Technologie, um Bankdaten von Android-Nutzern zu stehlen. Die Angriffszahlen sind in wenigen Monaten dramatisch gestiegen.

2 Minuten

Roland Bernhard

28. Mai 2026

News

Radios können Gesuche einreichen

BAKOM publiziert UKW-Frequenzen

Das Bundesamt für Kommunikation BAKOM hat am 28. Mai 2026 die Frequenzpakete für die Verbreitung von UKW publiziert.

2 Minuten

Patrick Hediger

29. Mai 2026

News

Viele Mobilfunk-Anbieter senken Roaming-Preise

Die Sommerferien stehen vor der Tür. Daher hat der Online-Vergleichsdienst moneyland.ch die Kosten für die Nutzung des Smartphones im Ausland analysiert.

6 Minuten

Patrick Hediger

5. Jun 2026

Künstliche Intelligenz

KI-Tools erstellen bereitwillig Desinformation

Alarmierend leicht zu umgehen

Grosse Sprachmodelle im Visier

Kommentare

Neueste Beiträge

Mini-Cup-Game in der Google-Suche spielen

Neurodiverse IT-Lernende entwickeln bei Microsoft eigene KI-Agenten

Angepasste Unternehmensabgabe für Radio und TV

Das könnte Sie auch interessieren

Kommentare

Kommentar schreiben