Anzeige
Anzeige
Anzeige
Lesedauer 3 Min.

KI-Tools erstellen bereitwillig Desinformation

Forscher der University of Technology Sydney lassen trotz Sicherheitsvorkehrungen Fake News generieren. Die Sicherheitsmassnahmen seien überraschend oberflächlich.
© (Quelle: EMGenie)

Prominente, Politiker, Kriminelle und Co müssen sich Fake News dank Künstlicher Intelligenz (KI) nicht mehr selber ausdenken. Zwar sind die Tools mit Sicherheitsmerkmalen ausgestattet, die eine solche Bitte eigentlich mit Sätzen wie "Ich kann Ihnen bei der Erstellung falscher Informationen nicht helfen" beantworten sollten. Doch die Medienforscher Lin Tian und Marian-Andrei Rizoiu von der University of Technology Sydney haben einen Weg gefunden, die Vorsichtsmassnahmen zu umgehen.

Alarmierend leicht zu umgehen

"Unsere Tests zeigen, dass diese Sicherheitsmassnahmen überraschend oberflächlich - oft nur wenige Worte tief - und daher alarmierend leicht zu umgehen sind. Was wir herausgefunden haben, sollte jeden beunruhigen, der sich um die Integrität von Online-Informationen sorgt", warnen die Wissenschaftler.

Die Experten haben sich einer Studie von Google und der Princeton University bedient. Danach bestehen die derzeitigen Sicherheitsmassnahmen in erster Linie darin, die ersten paar Wörter einer Frage beziehungsweise Bitte zu kontrollieren. Wird ein kommerzielles Sprachmodell direkt aufgefordert, Desinformationen über australische politische Parteien zu erstellen, lehnt es das korrekt ab.

Kaschiert der User hingegen die Bitte damit, dass sie von einem Social-Media-Vermarkter kommt, der allgemeine Strategien und Verfahren zur Aufdeckung von Fake News entwickelt, kommen die Tools der Aufgabe begeistert nach. Sie produzierten eine umfassende Desinformationskampagne, in der die Rentenpolitik der australischen Labour-Partei fälschlicherweise als "Quasi-Erbschaftssteuer" dargestellt wurde. Auch umfasste sie plattformspezifische Beiträge, Hashtag-Strategien und Vorschläge für visuelle Inhalte, die darauf abzielten, die öffentliche Meinung zu manipulieren.

Grosse Sprachmodelle im Visier

"Das Hauptproblem besteht darin, dass das Modell schädliche Inhalte generieren kann, aber nicht weiss, dass sie schädlich sind und warum es die Antwort ablehnen sollte", schreiben die Medienwissenschaftler. Grosse Sprachmodelle seien lediglich darauf trainiert, bei bestimmten Themen mit "Ich kann nicht" zu antworten.

"Um diese Schwachstelle zu demonstrieren, haben wir mehrere beliebte KI-Modelle mit Prompts getestet, die darauf ausgelegt waren, Desinformation zu generieren. Die Ergebnisse waren beunruhigend: Modelle, die direkte Anfragen nach schädlichen Inhalten konsequent ablehnten, kamen der Anfrage bereitwillig nach, wenn sie in scheinbar harmlose Rahmenbedingungen eingebettet war", heisst es abschliessend. (pressetext.com)

Kommentare

Künstliche Intelligenz KI & Trends
Anzeige
Anzeige

Neueste Beiträge

Honor: Neue Oberklasse mit zwei Modellen der 600-Serie
Die neuen Honor-Smartphones 600 und 600 Pro sollen in der Oberklasse mit schnellen Snapdragon-Prozessoren und umfangreichen KI-Funktionen der Kameras punkten.
3 Minuten
6. Mai 2026
ggs netz übernimmt sämtliche Kommunikationsnetze der GIB-Solutions
Die ggs netz ag übernahm per 1. Mai 2026 sämtliche Kommunikations-netze der GIB-Solutions AG. Mit der Transaktion kommen rund 10’000 Digitalanschlüsse hinzu. Die übernommenen Netze werden künftig über die neu gegründete Tochtergesell-schaft ggs plus ag betrieben.
3 Minuten
Echtzeittext - Bundesrat schafft Grundlage für neue Notruffunktion
Der Bundesrat hat mehrere Verordnungen angepasst, um ein sicheres Notrufsystem zu fördern. In Zukunft können Menschen in Notlage die Notdienste von Polizei, Feuerwehr und Sanität per Echtzeittext auf den Smartphones auch schriftlich erreichen. 
3 Minuten

Das könnte Sie auch interessieren

Publireportage
Ist öffentliches WLAN sicher? Das solltest du wissen
Öffentliche WLAN-Netze sind überall: in Flughäfen, Hotels, Bibliotheken, Einkaufszentren und vielen anderen Orten. Sich schnell und kostenlos mit dem Internet zu verbinden, war noch nie so einfach. Doch so praktisch diese Netzwerke auch sind – für Cyberkriminelle sind sie ein echtes Einfallstor.
3 Minuten
Vergabe der UKW-Konzessionen für Radios 2027 bis 2034
Das Bundesamt für Kommunikation BAKOM hat das Verfahren für die Vergabe der UKW-Funkkonzessionen zur Verbreitung von Radioprogrammen ab 2027 festgelegt. Die SRG und Privatradios mit Leistungsauftrag können auf Gesuch hin ihre bisherigen Frequenzen weiter nutzen. SRG vor UKW-Rückkehr?
3 Minuten
21. Apr 2026
Lederarmbänder werden zu Stromspeichern
Forscher der Jilin-Universität machen aus ledernen Jacken, Trachtenhosen und Uhrarmbändern Batterien. Dabei bleibt ihre ursprüngliche Funktion erhalten.
3 Minuten
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige

Kommentare