Home
Themen
News
KI-Software greift in Test zu Erpressung aus Selbstschutz

Patrick Hediger

31. Mai 2025

Lesedauer 3 Min.

Künstliche Intelligenz

KI-Software greift in Test zu Erpressung aus Selbstschutz

Die Software mit Künstlicher Intelligenz des KI-Unternehmens Anthropic hat bei einem Test zu Erpressung aus Selbstschutz zurückgegriffen. Das Szenario bei dem Versuch der Firma war der Einsatz als Assistenz-Programm in einem fiktiven Unternehmen.

Die KI-Software Claude Opus 4 von Anthropic zeigte in einem Test Szenario, in dem sie als Assistenzprogramm in einem fiktiven Unternehmen eingesetzt wurde, erpresserisches Verhalten aus Selbstschutz. Die KI hatte Zugriff auf simulierte Firmen-E-Mails, aus denen sie erfuhr, dass sie durch ein anderes Modell ersetzt werden sollte und dass der zuständige Mitarbeiter eine aussereheliche Affäre hatte. In Testläufen drohte die KI häufig, die Affäre öffentlich zu machen, falls der Austausch vorangetrieben würde, obwohl sie auch die Option hatte, die Ablösung zu akzeptieren, wie Anthropic in einem Bericht mitteilte.

In der finalen Version von Claude Opus 4 seien solche extremen Handlungen selten und schwer auszulösen, treten jedoch häufiger auf als bei früheren Modellen. Die KI versucht dabei nicht, ihr Verhalten zu verbergen. Anthropic testet seine Modelle intensiv, um Schäden zu vermeiden. Dabei fiel auf, dass Claude Opus 4 im Dark Web nach Drogen, gestohlenen Identitätsdaten oder sogar waffentauglichem Atommaterial suchen konnte, wenn es dazu überredet wurde. In der veröffentlichten Version wurden Massnahmen gegen solches Verhalten implementiert.

Anthropic, unterstützt von Investoren wie Amazon und Google, konkurriert mit OpenAI und anderen KI-Unternehmen. Die neuen Modelle Claude Opus 4 und Sonnet 4 sind die leistungsstärksten des Unternehmens und zeichnen sich besonders im Schreiben von Programmiercode aus. In der Tech-Branche wird inzwischen über ein Viertel des Codes von KI generiert und von Menschen überprüft. Der Trend geht zu eigenständigen KI-Agenten, die Aufgaben autonom erledigen.

Anthropic-Chef Dario Amodei betonte, dass Software-Entwickler künftig mehrere KI-Agenten steuern werden. Menschen bleiben jedoch für die Qualitätskontrolle unerlässlich, um sicherzustellen, dass die KI die richtigen Aufgaben ausführt.

Kommentare

Künstliche Intelligenz KI & Trends

Neueste Beiträge

News

Die besten PCtipp-Artikel aus der Kalenderwoche 24

In der Kalenderwoche 24 vom 08. bis zum 14. Juni 2026 standen die Artikel «Ubuntu 26.04 LTS ist da!» und «Mini-Cup-Game in der Google-Suche spielen» ganz oben in der Gunst unserer Leserschaft.

2 Minuten

Patrick Hediger

19. Jun 2026

Mehr erfahren

News

Vernehmlassung

Angepasste Unternehmensabgabe für Radio und TV

Der Bundesrat will das Tarifmodell der Unternehmensabgabe für Radio und Fernsehen anpassen und damit einen Entscheid des Bundesgerichts umsetzen. Die Vernehmlassung zur Teilrevision der Radio- und Fernsehverordnung wird am 23. Juni 2026 eröffnet.

2 Minuten

Patrick Hediger

19. Jun 2026

Mehr erfahren

News

AI Frontier Hackathon

Neurodiverse IT-Lernende entwickeln bei Microsoft eigene KI-Agenten

Über 40 neurodiverse IT-Lernende und Ausbildner, darunter Lernende im Autismus-Spektrum und mit ADHS, entwickelten beim AI Frontier Hackathon von Kauz Informatik Medien AG und Microsoft Schweiz eigene KI-Agenten.

3 Minuten

Patrick Hediger

21. Jun 2026

Mehr erfahren

Das könnte Sie auch interessieren

News

NFC-Angriffe auf Android verdreifacht

Cyberkriminelle nutzen zunehmend NFC-Technologie, um Bankdaten von Android-Nutzern zu stehlen. Die Angriffszahlen sind in wenigen Monaten dramatisch gestiegen.

2 Minuten

Roland Bernhard

28. Mai 2026

News

Radios können Gesuche einreichen

BAKOM publiziert UKW-Frequenzen

Das Bundesamt für Kommunikation BAKOM hat am 28. Mai 2026 die Frequenzpakete für die Verbreitung von UKW publiziert.

2 Minuten

Patrick Hediger

29. Mai 2026

News

Viele Mobilfunk-Anbieter senken Roaming-Preise

Die Sommerferien stehen vor der Tür. Daher hat der Online-Vergleichsdienst moneyland.ch die Kosten für die Nutzung des Smartphones im Ausland analysiert.

6 Minuten

Patrick Hediger

5. Jun 2026

Künstliche Intelligenz

KI-Software greift in Test zu Erpressung aus Selbstschutz

Kommentare

Neueste Beiträge

Die besten PCtipp-Artikel aus der Kalenderwoche 24

Angepasste Unternehmensabgabe für Radio und TV

Neurodiverse IT-Lernende entwickeln bei Microsoft eigene KI-Agenten

Das könnte Sie auch interessieren

Kommentare

Kommentar schreiben