Anzeige
Anzeige
Anzeige
Lesedauer 3 Min.

KI-Software greift in Test zu Erpressung aus Selbstschutz

Die Software mit Künstlicher Intelligenz des KI-Unternehmens Anthropic hat bei einem Test zu Erpressung aus Selbstschutz zurückgegriffen. Das Szenario bei dem Versuch der Firma war der Einsatz als Assistenz-Programm in einem fiktiven Unternehmen.
© (Quelle: Anthropic)

Die KI-Software Claude Opus 4 von Anthropic zeigte in einem Test Szenario, in dem sie als Assistenzprogramm in einem fiktiven Unternehmen eingesetzt wurde, erpresserisches Verhalten aus Selbstschutz. Die KI hatte Zugriff auf simulierte Firmen-E-Mails, aus denen sie erfuhr, dass sie durch ein anderes Modell ersetzt werden sollte und dass der zuständige Mitarbeiter eine aussereheliche Affäre hatte. In Testläufen drohte die KI häufig, die Affäre öffentlich zu machen, falls der Austausch vorangetrieben würde, obwohl sie auch die Option hatte, die Ablösung zu akzeptieren, wie Anthropic in einem Bericht mitteilte.

In der finalen Version von Claude Opus 4 seien solche extremen Handlungen selten und schwer auszulösen, treten jedoch häufiger auf als bei früheren Modellen. Die KI versucht dabei nicht, ihr Verhalten zu verbergen. Anthropic testet seine Modelle intensiv, um Schäden zu vermeiden. Dabei fiel auf, dass Claude Opus 4 im Dark Web nach Drogen, gestohlenen Identitätsdaten oder sogar waffentauglichem Atommaterial suchen konnte, wenn es dazu überredet wurde. In der veröffentlichten Version wurden Massnahmen gegen solches Verhalten implementiert.

Anthropic, unterstützt von Investoren wie Amazon und Google, konkurriert mit OpenAI und anderen KI-Unternehmen. Die neuen Modelle Claude Opus 4 und Sonnet 4 sind die leistungsstärksten des Unternehmens und zeichnen sich besonders im Schreiben von Programmiercode aus. In der Tech-Branche wird inzwischen über ein Viertel des Codes von KI generiert und von Menschen überprüft. Der Trend geht zu eigenständigen KI-Agenten, die Aufgaben autonom erledigen.

Anthropic-Chef Dario Amodei betonte, dass Software-Entwickler künftig mehrere KI-Agenten steuern werden. Menschen bleiben jedoch für die Qualitätskontrolle unerlässlich, um sicherzustellen, dass die KI die richtigen Aufgaben ausführt.

Kommentare

Künstliche Intelligenz KI & Trends
Anzeige
Anzeige

Neueste Beiträge

ggs netz übernimmt sämtliche Kommunikationsnetze der GIB-Solutions
Die ggs netz ag übernahm per 1. Mai 2026 sämtliche Kommunikations-netze der GIB-Solutions AG. Mit der Transaktion kommen rund 10’000 Digitalanschlüsse hinzu. Die übernommenen Netze werden künftig über die neu gegründete Tochtergesell-schaft ggs plus ag betrieben.
3 Minuten
Stromverbrauch und Effizienzpotenziale von Rechenzentren in der Schweiz
2024 betrug der Stromverbrauch der Rechenzentren in der Schweiz 2,1 TWh, was ungefähr 3,6 Prozent des Gesamtverbrauchs entspricht. Bis 2030 wird ein Anstieg des Stromverbrauchs der inländischen Rechenzentren auf 2,5 bis 3,2 TWh erwartet. 
3 Minuten
Honor: Neue Oberklasse mit zwei Modellen der 600-Serie
Die neuen Honor-Smartphones 600 und 600 Pro sollen in der Oberklasse mit schnellen Snapdragon-Prozessoren und umfangreichen KI-Funktionen der Kameras punkten.
3 Minuten
6. Mai 2026

Das könnte Sie auch interessieren

Publireportage
Ist öffentliches WLAN sicher? Das solltest du wissen
Öffentliche WLAN-Netze sind überall: in Flughäfen, Hotels, Bibliotheken, Einkaufszentren und vielen anderen Orten. Sich schnell und kostenlos mit dem Internet zu verbinden, war noch nie so einfach. Doch so praktisch diese Netzwerke auch sind – für Cyberkriminelle sind sie ein echtes Einfallstor.
3 Minuten
Vergabe der UKW-Konzessionen für Radios 2027 bis 2034
Das Bundesamt für Kommunikation BAKOM hat das Verfahren für die Vergabe der UKW-Funkkonzessionen zur Verbreitung von Radioprogrammen ab 2027 festgelegt. Die SRG und Privatradios mit Leistungsauftrag können auf Gesuch hin ihre bisherigen Frequenzen weiter nutzen. SRG vor UKW-Rückkehr?
3 Minuten
21. Apr 2026
Lederarmbänder werden zu Stromspeichern
Forscher der Jilin-Universität machen aus ledernen Jacken, Trachtenhosen und Uhrarmbändern Batterien. Dabei bleibt ihre ursprüngliche Funktion erhalten.
3 Minuten
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige

Kommentare