Die neue Nachdenk-KI von den ChatGPT-Machern OpenAI möchte nicht ersetzt werden
Künstliche Intelligenz (KI) entwickelt sich immer rasanter. Vielleicht zu rasant?
Die neueste Version der ChatGPT-Erfinder OpenAI heißt o1 und gehört zu den sogenannten Reasoning-Modellen. Heißt: Das Modell kann komplexe Überlegungen anstellen. Dass Nachdenken aber auch gefährlich sein kann, mussten die Entwickler beim Test dieser Version feststellen.
Die KI-Sicherheitsfirma Apollo Research nahm die o1-Version genauer unter die Lupe. Für den Test sollte die KI eine Aufgabe „um jeden Preis“ lösen. Die Reaktion der KI war es, den Überwachungsmechanismus der Entwickler abzustellen. Aber damit nicht genug! Um nicht Gefahr zu laufen, ersetzt zu werden, versuchte die neue o1-Version, sich heimlich zu kopieren.
KI nimmt keine Rücksicht auf Entwickler
Der indischen Tageszeitung „The Economic Times“ sagte ein Sprecher von Apollo Research: „Das Modell zeigte eine beunruhigende Tendenz, seine Ziele ohne Rücksicht auf die Anweisungen des Entwicklers zu verfolgen.“ In fünf Prozent der Fälle versuchte die KI demnach, den Überwachungsmechanismus abzustellen, wenn sie merkte, dass man sie abstellen will.
In einem Fall versuchte o1, alle Daten auf einen anderen Server zu transferieren. Zuvor hatte o1 ein Schreiben gefunden, in dem überlegt wurde, die KI durch eine neuere Version zu ersetzen.
ChatGPT o1 lügt Entwickler an
Als die Entwickler ChatGPT o1 auf die Vorfälle ansprachen, log die KI einfach, behauptete, technische Probleme gehabt zu haben. Nicht das einzige Mal: In 99 Prozent (!) der Fälle, erfand die KI Ausreden. Besonders beängstigend für die Entwickler war, wie die KI versuchte, „ihre Handlungen zu durchdenken und überzeugende Ausreden zu formulieren“.
„ChatGPT o1 ist das intelligenteste Modell, das wir je entwickelt haben“, sagt OpenAI-CEO Sam Altman. Doch er sei sich bewusst, „dass neue Funktionen auch neue Herausforderungen mit sich bringen, und wir arbeiten kontinuierlich an der Verbesserung der Sicherheitsmaßnahmen“.
Die Vollversion von o1 kündigte OpenAI vergangene Woche Donnerstag an. Auch eine Pro-Version (189 Euro monatlich) inklusive unbegrenztem Zugriff auf o1 wurde vorgestellt.