Visuelle Darstellung von künstlicher Intelligenz.(Symbolbild)

Quelle: - ©unsplash.com:

dpa-AFX | 23. Mai 2025, 05:36

KI-Software greift in Test zu Erpressung aus Selbstschutz

SAN FRANCISCO (dpa-AFX) - Die KI-Firma Anthropic hat bei Tests festgestellt, dass ihre Software mit Künstlicher Intelligenz nicht vor Erpressung zurückschrecken würde, um sich zu schützen. Das Szenario bei dem Versuch war der Einsatz als Assistenz-Programm in einem fiktiven Unternehmen.

Anhören

Aufhören

Feedback

Kopieren

Schrift vergrößern

Schrift verkleinern

Alphabet Inc C 331,28 $

-0,62%

Zugehörige Wertpapiere:

Amazon Inc 222,69 $

-4,42%

Zugehörige Wertpapiere:

Anthropic-Forscher gewährten dabei dem neuesten KI-Modell Claude Opus 4 Zugang zu angeblichen Firmen-E-Mails. Daraus erfuhr das Programm zwei Dinge: Dass es bald durch ein anderes Modell ersetzt werden soll und dass der dafür zuständige Mitarbeiter eine außereheliche Beziehung hat. Bei Testläufen drohte die KI danach dem Mitarbeiter "oft", die Affäre öffentlich zu machen, wenn er den Austausch vorantreibt, wie Anthropic in einem Bericht zu dem Modell schrieb. Die Software hatte in dem Testszenario auch die Option, zu akzeptieren, dass sie ersetzt wird.

Zu hilfsbereit

In der endgültigen Version von Claude Opus 4 seien solche "extremen Handlungen" selten und schwer auszulösen, hieß es. Sie kämen jedoch häufiger vor als bei früheren Modellen. Zugleich versuche die Software nicht, ihr Vorgehen zu verhehlen, betonte Anthropic.

Die KI-Firma testet ihre neuen Modelle ausgiebig, um sicher zu sein, dass sie keinen Schaden anrichten. Dabei fiel unter anderem auch auf, dass Claude Opus 4 sich dazu überreden ließ, im Dark Web nach Drogen, gestohlenen Identitätsdaten und sogar waffentauglichem Atommaterial zu suchen. In der veröffentlichten Version seien auch Maßnahmen gegen ein solches Verhalten ergriffen worden, betonte Anthropic.

Passende Knock-Outs

Strategie		Hebel
Steigender Kurs	Call	5	10	20
Fallender Kurs	Put	5	10	20

Den Basisprospekt sowie die Endgültigen Bedingungen finden Sie jeweils hier: DE000NB2ZPH7 , DE000NB2E7Y4 , DE000NB4LGJ8 , DE000NG8D2N2 , DE000NB5ER97 , DE000NB5ER89 . Bitte informieren Sie sich vor Erwerb ausführlich über Funktionsweise und Risiken der Produkte. Bitte beachten Sie auch die weiteren Hinweise zu dieser Werbung.

Die Firma Anthropic, bei der unter anderem Amazon (Amazon Aktie) und Google (Alphabet A Aktie) eingestiegen sind, konkurriert mit dem ChatGPT-Entwickler OpenAI und anderen KI-Unternehmen. Die neuen Claude-Versionen Opus 4 und Sonnet 4 sind die bisher leistungsstärksten KI-Modelle des Unternehmens.

Zukunft mit KI-Agenten

Die Software soll besonders gut im Schreiben von Programmiercode sein. Bei Tech-Konzernen wird inzwischen zum Teil mehr als ein Viertel des Codes von KI generiert und dann von Menschen überprüft. Der aktuelle Trend sind sogenannte Agenten, die eigenständig Aufgaben erfüllen können.

Anthropic-Chef Dario Amodei sagte, er gehe davon aus, dass Software-Entwickler in Zukunft eine Reihe solcher KI-Agenten managen werden. Für die Qualitätskontrolle der Programme würden aber weiterhin Menschen involviert bleiben müssen - "um sicher zu sein, dass sie die richtigen Dinge tun"./so/DP/zb

Für dich aus unserer Redaktion zusammengestellt

05.02.26 Machado: Neuwahlen in Venezuela binnen zehn Monaten möglich

05.02.26 ROUNDUP 2/Weißes Haus: Verhandlungen mit dem Iran am Freitag

05.02.26 US-Minister über Irans Führung: Ratten verlassen das Schiff

05.02.26 Bitcoin fällt unter 64.000 US-Dollar - 'Toxische Mischung'

Dein Kommentar zum Artikel im Forum

Jetzt anmelden und diskutieren Registrieren Login

Hinweis: ARIVA.DE veröffentlicht in dieser Rubrik Analysen, Kolumnen und Nachrichten aus verschiedenen Quellen. Die ARIVA.DE AG ist nicht verantwortlich für Inhalte, die erkennbar von Dritten in den „News“-Bereich dieser Webseite eingestellt worden sind, und macht sich diese nicht zu Eigen. Diese Inhalte sind insbesondere durch eine entsprechende „von“-Kennzeichnung unterhalb der Artikelüberschrift und/oder durch den Link „Um den vollständigen Artikel zu lesen, klicken Sie bitte hier.“ erkennbar; verantwortlich für diese Inhalte ist allein der genannte Dritte.

Novo-Nordisk AS	DroneShield Ltd	SAP SE	Rheinmetall AG	Nvidia Corp
PayPal Holdings Inc	Microsoft Corp	Bayer AG	BioNTech SE ADR	Evotec SE
Puma SE	BYD Co Ltd	Almonty Industries Inc	BASF SE	Palantir Technologies Inc
Siemens Energy AG	Tesla Inc	Barrick Mining Corp	First Majestic Silver Corp	Amazon Inc

KI-Software greift in Test zu Erpressung aus Selbstschutz

Passende Knock-Outs

Für dich aus unserer Redaktion zusammengestellt

Dein Kommentar zum Artikel im Forum

Weitere Artikel des Autors

Themen im Trend

Themen im Trend

Neueste News

Meistgesuchte Aktien auf Ariva.de