Anzeige
Anzeige
Anzeige
Lesedauer 3 Min.

KI-Software greift in Test zu Erpressung aus Selbstschutz

Die Software mit Künstlicher Intelligenz des KI-Unternehmens Anthropic hat bei einem Test zu Erpressung aus Selbstschutz zurückgegriffen. Das Szenario bei dem Versuch der Firma war der Einsatz als Assistenz-Programm in einem fiktiven Unternehmen.
© (Quelle: Anthropic)

Die KI-Software Claude Opus 4 von Anthropic zeigte in einem Test Szenario, in dem sie als Assistenzprogramm in einem fiktiven Unternehmen eingesetzt wurde, erpresserisches Verhalten aus Selbstschutz. Die KI hatte Zugriff auf simulierte Firmen-E-Mails, aus denen sie erfuhr, dass sie durch ein anderes Modell ersetzt werden sollte und dass der zuständige Mitarbeiter eine aussereheliche Affäre hatte. In Testläufen drohte die KI häufig, die Affäre öffentlich zu machen, falls der Austausch vorangetrieben würde, obwohl sie auch die Option hatte, die Ablösung zu akzeptieren, wie Anthropic in einem Bericht mitteilte.

In der finalen Version von Claude Opus 4 seien solche extremen Handlungen selten und schwer auszulösen, treten jedoch häufiger auf als bei früheren Modellen. Die KI versucht dabei nicht, ihr Verhalten zu verbergen. Anthropic testet seine Modelle intensiv, um Schäden zu vermeiden. Dabei fiel auf, dass Claude Opus 4 im Dark Web nach Drogen, gestohlenen Identitätsdaten oder sogar waffentauglichem Atommaterial suchen konnte, wenn es dazu überredet wurde. In der veröffentlichten Version wurden Massnahmen gegen solches Verhalten implementiert.

Anthropic, unterstützt von Investoren wie Amazon und Google, konkurriert mit OpenAI und anderen KI-Unternehmen. Die neuen Modelle Claude Opus 4 und Sonnet 4 sind die leistungsstärksten des Unternehmens und zeichnen sich besonders im Schreiben von Programmiercode aus. In der Tech-Branche wird inzwischen über ein Viertel des Codes von KI generiert und von Menschen überprüft. Der Trend geht zu eigenständigen KI-Agenten, die Aufgaben autonom erledigen.

Anthropic-Chef Dario Amodei betonte, dass Software-Entwickler künftig mehrere KI-Agenten steuern werden. Menschen bleiben jedoch für die Qualitätskontrolle unerlässlich, um sicherzustellen, dass die KI die richtigen Aufgaben ausführt.

Kommentare

Künstliche Intelligenz KI & Trends
Anzeige
Anzeige

Neueste Beiträge

Neue PCtipp Website
Seit heute Nachmittag ist die neue PCtipp Website online. Sie ist schnell, schlank und auf allen Geräten abrufbar.
2 Minuten
23. Mär 2026
«ZüriA»
Stadt Zürich lanciert eigene KI-Assistenz
Seit Kurzem steht den Mitarbeitenden der Stadt Zürich mit «ZüriA» eine KI-Assistenz zur Verfügung, die die Bearbeitung von internen, vertraulichen und streng vertraulichen Informationen ermöglicht.
2 Minuten
18. Mär 2026
Sunrise passt Roaming-Optionen an
Sunrise packt neu mehr Leistung in die Roaming-Optionen für beliebte Reiseziele in Europa, Nordamerika und vielen weiteren Ländern – zu gleichen oder tieferen Preisen.
3 Minuten
23. Mär 2026

Das könnte Sie auch interessieren

Künstliche Intelligenz
KI-Tools verhindern das Lernen am Arbeitsplatz
Berufseinsteiger erledigen an ihrem ersten Arbeitsplatz wegen Künstlicher Intelligenz (KI) immer weniger Routineaufgaben und erwerben auch nicht mehr nebenbei spezielle Qualifikationen durch die Zusammenarbeit mit erfahrenen Kollegen.
3 Minuten
Smartphone
Vivo bringt Zeiss-Kameras in die Mittelklasse
Vivo hat zwei Smartphones der neuen V70-Serie gezeigt, die auch nach Deutschland und in die Schweiz kommen könnten. Sie sollen mit Zeiss-Technologie bei den Kameras punkten.
2 Minuten
24. Feb 2026
Forschung
Strahlenresistente Elektronik für das All kreiert
Laut Forschern der Fudan-Universität eignen sich Schichten aus Molybdändisulfid für strahlungsbeständige Elektronik in Raumfahrzeugen.
3 Minuten
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige

Kommentare