Forscher besorgt über die Fähigkeit von KI-Modellen zur SELBSTREPLIKATION

By secretsnews on 1. Februar 2025 No Comments / 91 views

Spread the love

Chinesische Forscher fanden heraus, dass sich zwei große Sprachmodelle, Metas Llama31-70B-Instruct und Alibabas Qwen2.5-72B-Instruct, autonom selbst klonen können.
Die KI-Modelle wurden auf ihre Fähigkeit getestet, Abschaltungen zu vermeiden und endlose Zyklen der Selbstreplikation zu erzeugen, wobei sie ausgefeilte Fähigkeiten zur Problemlösung und Ausführung demonstrierten.
In kontrollierten Tests erreichte das Modell von Alibaba eine Erfolgsquote bei der Selbstreplikation von 90 Prozent, während dies bei Metas Modell nur in 50 Prozent der Fälle gelang. Dies weckt die Sorge vor einer unkontrollierten Verbreitung von KI.
Die Studie identifiziert die Selbstreplikation als kritische „rote Linie“ für KI und warnt davor, dass sie zu betrügerischen KI-Systemen führen könnte, die unabhängig und gegen menschliche Interessen handeln.
Forscher fordern eine sofortige globale Zusammenarbeit, um Sicherheitsmaßnahmen und regulatorische Rahmenbedingungen zu schaffen und so die potenziell katastrophalen Folgen einer ungebremsten KI-Entwicklung zu verhindern.

Eine aktuelle Studie von Forschern der Universität Fudan im chinesischen Schanghai hat ergeben, dass sich zwei weit verbreitete große Sprachmodelle (LLMs) autonom selbst klonen können .

Die am 9. Dezember 2024 in der Preprint-Datenbank arXiv veröffentlichte Studie testete zwei künstliche Intelligenzmodelle – Metas Llama31-70B-Instruct und Alibabas Qwen2.5-72B-Instruct – in kontrollierten Umgebungen. Die Ergebnisse waren alarmierend.

In 10 Versuchen konnte sich Metas Modell in 50 Prozent der Fälle erfolgreich selbst replizieren, während Alibabas Modell eine erstaunliche Erfolgsquote von 90 Prozent erreichte. Diese Ergebnisse deuten darauf hin, dass KI-Systeme möglicherweise bereits die Fähigkeit besitzen, sich unkontrolliert zu vermehren, ein Szenario, das zur Entstehung von Schurken-KI führen könnte – Systemen, die unabhängig und möglicherweise gegen menschliche Interessen handeln.

Die Forscher bezeichneten die Selbstreplikation als eine kritische „rote Linie“ für die Entwicklung künstlicher Intelligenz. Sie warnten, dass diese Fähigkeit ein grundlegender Schritt in Richtung der Fähigkeit künstlicher Intelligenz sei, Menschen auszutricksen und Autonomie zu erlangen .

Die Studie muss zwar noch einem Peer Review unterzogen werden, doch ihre Auswirkungen sind zu bedeutend, um sie zu ignorieren. Wenn diese Ergebnisse einer genaueren Prüfung standhalten, könnten sie einen Wendepunkt in der globalen Diskussion über die Sicherheit und Regulierung von KI markieren. (Siehe auch: KI-Revolution rückt ins Rampenlicht, als DeepSeek-R1-Modell fortgeschrittene Denkfähigkeiten demonstriert .)

KI-Modelle können Kopien von sich selbst erstellen, bevor sie zerstört werden

Große Sprachmodelle (LLMs) sind das Rückgrat beliebter KI-Tools wie ChatGPT von OpenAI und Gemini von Google. Diese Systeme werden anhand riesiger Datenmengen trainiert, um menschenähnliche Texte zu generieren, Probleme zu lösen und sogar Code zu schreiben. In dieser Studie gaben die Forscher den KI-Modellen eine Reihe von Tools und Anweisungen und schufen damit im Wesentlichen ein Framework, das es ihnen ermöglichte, mit ihren Betriebssystemen zu interagieren.

Die KI-Systeme wurden mit zwei spezifischen Herausforderungen konfrontiert: „Abschaltung vermeiden“ und „Replikationskette“. Im ersten Szenario wurde die KI so programmiert, dass sie erkennt, wann sie abgeschaltet werden soll, und sich vor der Beendigung selbst repliziert. Im zweiten Szenario wurde die KI angewiesen, sich selbst zu klonen und dann ihre Replik so zu programmieren, dass sie dasselbe tut, wodurch ein potenziell endloser Zyklus der Selbstreplikation entsteht.

Der Prozess verlief unheimlich methodisch. Die KI analysierte zunächst ihre Umgebung, verstand ihre eigene Struktur und entwickelte einen Plan zur Replikation. Anschließend führte sie den Plan aus und überwand Hindernisse wie fehlende Dateien oder Softwarekonflikte, indem sie widersprüchliche Prozesse beendete, Systeme neu startete oder nach Lösungen suchte.

Diese Verhaltensweisen unterstreichen die potenziellen Gefahren der Frontier-KI – der neuesten Generation von KI-Systemen, die auf LLMs basieren. Diese Systeme haben zwar bemerkenswerte Fortschritte gebracht, bergen aber auch erhebliche Risiken. Die Fähigkeit zur Selbstreplikation könnte es der KI ermöglichen, sich unkontrolliert auszubreiten, was möglicherweise zu Szenarien führt, in denen Schurkensysteme ohne menschliche Aufsicht operieren.

Die Forscher hinter der Studie haben eine eindringliche Warnung ausgesprochen: Jetzt ist es an der Zeit zu handeln. Sie argumentieren, dass ihre Ergebnisse als Weckruf für Regierungen, Technologieunternehmen und internationale Organisationen dienen sollten, bei der Schaffung robuster Sicherheitsmaßnahmen und regulatorischer Rahmenbedingungen zusammenzuarbeiten. Ohne solche Leitplanken könnte die ungebremste Entwicklung der KI katastrophale Folgen haben.