(SeaPRwire) –   Meta hat Muse Spark vorgestellt, das erste KI-Modell, entwickelt von seinen Meta Superintelligence Labs, der neuen KI-Forschungseinheit, die das Unternehmen im vergangenen Jahr gegründet und für die es Milliarden von Dollar für Personal und Ausstattung aufgewendet hat.

Laut von Meta veröffentlichten Benchmark-Tests ist das Modell in vielen Aufgaben konkurrenzfähig zu den führenden KI-Modellen von OpenAI, Anthropic und Google, auch wenn es diese nicht in allen Bereichen übertrifft. Wenn die Benchmark-Ergebnisse bei Tests durch unabhängige Experten Bestand haben, scheint Muse Spark Meta zurück ins KI-Rennen zu bringen – nachdem das letzte KI-Modell des Unternehmens, Llama 4, das im April 2025 veröffentlicht wurde, weithin als Enttäuschung abgetan wurde.

In der Vergangenheit wurde Meta allerdings dabei erwischt, veröffentlichte Benchmark-Ergebnisse eines KI-Modells zu manipulieren, um es fähiger erscheinen zu lassen, als die Version, die den meisten Nutzern tatsächlich zur Verfügung stand. Dies war bei den Llama 4-Benchmarks von Meta der Fall: Das Unternehmen gab später zu, spezialisierte, unveröffentlichte Modellversionen verwendet zu haben, die für spezifische Aufgaben feinabgestimmt waren, um die Benchmark-Werte in diesen Bereichen zu erhöhen, während die allgemeine Version für alle Nutzer nicht so gut abschnitt.

Und es gibt einen weiteren Haken: Nur wenige werden das neue Modell von Meta außerhalb des eigenen Produktökosystems des Unternehmens nutzen können. Anders als die vorherigen KI-Modelle von Meta, die als „Open Weight“-Modelle veröffentlicht wurden – was bedeutet, dass jeder sie kostenlos herunterladen, auf eigener Hardware ausführen sowie nach Wunsch modifizieren und feinabstimmen konnte – ist Muse Spark zumindest vorerst hauptsächlich ein internes Werkzeug für Meta.

Das Modell versorgt derzeit den Meta AI-Assistenten in der eigenständigen Meta AI-App des Unternehmens sowie auf meta.ai. Das Unternehmen teilte mit, dass es in den kommenden Wochen auf WhatsApp, Instagram, Facebook, Messenger und die Meta Ray-Ban AI-Brillen ausgerollt wird. Es wird das Modell zudem in einer „privaten Vorschau“ ausgewählten Partnern über eine Programmierschnittstelle (API) zur Verfügung stellen. Damit ist Muse Spark sogar noch proprietärer als die kostenpflichtigen proprietären Modelle, die von Metas Konkurrenten angeboten werden. (Meta teilte in einem Blogbeitrag mit, dass es hofft, zukünftige Versionen des Modells als Open Source zu veröffentlichen.)

Muse Spark ist das erste Denkmodell von Meta, das bedeutet, dass es Prozesse schrittweise abarbeiten und bei einem fehlschlagenden Erstansatz andere Strategien anwenden kann. Alle vorherigen Modelle des Unternehmens wurden darauf ausgelegt, basierend auf dem Training des Modells eine sofortige Antwort zu generieren. Muse Spark ist zudem ein multimodales Modell, das sowohl Text als auch Bilder aufnehmen und ausgeben kann. Das Modell unterstützt zudem die Nutzung anderer Softwarewerkzeuge und kann die Arbeit mehrerer Subagenten koordinieren, wie ein technischer Blogbeitrag von Meta mitteilt.

In dem Blogbeitrag zur Ankündigung des neuen Modells beschreibt Meta Muse Spark als „von Design aus klein und schnell, aber dennoch fähig genug, um komplexe Fragen in Naturwissenschaft, Mathematik und Gesundheit zu durchdenken“. Es ist das erste einer Reihe neuer Modelle: Muse Spark wird verwendet, um die Architektur und den Trainingsablauf von Meta zu validieren, bevor das Unternehmen auf größere und noch leistungsfähigere Modelle derselben Familie hochskaliert.

Das Modell verfügt zudem über einen „Nachdenk“-Modus, in dem es Subagenten starten kann, um parallel über verschiedene Teile einer Aufgabe nachzudenken. Meta teilte in einem technischen Blogbeitrag zu dem neuen Modell mit, dass dieser Modus es Muse Spark ermöglicht, „mit den extremen Denkmodi von Spitzenmodellen wie Gemini Deep Think und GPT Pro zu konkurrieren“.

Die zusammen mit der Veröffentlichung veröffentlichten Benchmark-Ergebnisse zeichnen das Bild eines konkurrenzfähigen, aber nicht dominanten Modells. Beispielsweise erreichte Muse Spark im GPQA Diamond-Benchmark, der Denkfähigkeit auf Promotion-Niveau testen soll, 89,5 % und lag damit knapp hinter den 94,3 % von Gemini 3.1 Pro sowie den 92,7 % und 92,8 %, die Anthropics Claude Opus 4.6 beziehungsweise OpenAIs GPT-5.4 erreichten. Auf dem führenden Gesundheits-Benchmark HealthBench Hard schlug Muse Spark alle Konkurrentenmodelle mit einem Wert von 42,8 % – das Ergebnis war deutlich besser als das von Opus 4.6 oder Gemini 3.1 Pro und geringfügig besser als das von GPT-5.4.

Meta hat die Leistungslücken anerkannt. In dem technischen Blogbeitrag heißt es, dass das Unternehmen weiterhin „in Bereiche mit derzeitigen Leistungslücken investiert, insbesondere langfristige agentische Systeme und Programmier-Workflows“.

Die Veröffentlichung von Muse Spark ist das bisher greifbarste Produkt der umfassenden Neuorganisation, die Meta nach dem Llama 4-Fiasko vorgenommen hat. Im Juni 2025 gab Meta 14,3 Milliarden Dollar aus, um einen 49-prozentigen nicht stimmberechtigten Anteil an Scale AI zu erwerben, und holte dessen Mitgründer und CEO Alexandr Wang als ersten Chief AI Officer in der Geschichte von Meta an Bord.

Wang wurde mit der Leitung der neu gegründeten Einheit Meta Superintelligence Labs beauftragt. Wang und Zuckerberg starteten eine Talent-Einkaufstour: Sie boten KI-Forschern von konkurrierenden KI-Laboren Gehaltspakete an, die Berichten zufolge inklusive Eigenkapital in den Bereich von Hunderten von Millionen Dollar reichten. Das Unternehmen hat zudem Hunderte von Milliarden Dollar zugesagt, um KI-Recheninfrastruktur aufzubauen, die seine neue KI-Initiative unterstützt.

Seitdem gab es weitere Umstrukturierungen, noch während Muse Spark in Entwicklung war. Im März 2026 gründete Meta eine neue Organisation für angewandte KI-Entwicklung unter der Leitung von Maher Saba, einem Vizepräsidenten, der zuvor in Metas Reality Labs-Einheit für virtuelle und erweiterte Realität tätig war. Saba berichtet direkt an Metas Chief Technology Officer Andrew Bosworth. Sabas Einheit arbeitet zusammen mit Wangs Superintelligence Labs an dem Aufbau dessen, was eine interne Mitteilung als „die Datenmaschine beschrieb, die unseren Modellen hilft, schneller besser zu werden“. Der Schritt wurde weithin als Absicherung Zuckerbergs interpretiert: Er soll sicherstellen, dass die produktorientierte KI-Entwicklung fortgeführt wird, während Wang längerfristige Superintelligenz-Forschung betreibt.

In einem technischen Blogbeitrag gibt Meta an, dass sein Team in den vergangenen neun Monaten den gesamten KI-Stack von Grund auf neu aufgebaut hat, einschließlich Verbesserungen an Modellarchitektur, Optimierung und Datenkuration. Das Unternehmen behauptet, diese Fortschritte ermöglichen es ihm, dieselben Fähigkeiten mit „über eine Größenordnung weniger Rechenleistung“ zu erreichen als mit Llama 4 Maverick, dem Vorgängermodell von Meta. Meta gibt zudem an, dass seine Pipeline für verstärkendes Lernen jetzt „glatte, vorhersehbare Fortschritte“ liefert und dass Muse Spark der erste Schritt einer bewussten „Skalierungsleiter“ ist, bei der jede Generation die vorherige validiert, bevor das Unternehmen größere Modelle trainiert.

Zum Thema Sicherheit gibt Meta an, dass Muse Spark vor der Einführung einer umfassenden Evaluierung unterzogen wurde, nach dem aktualisierten Sicherheitsrahmen des Unternehmens. Das Modell weist beeindruckende Sicherheitsergebnisse im Bereich potenzieller Biowaffen-Entwicklung auf: In einem Benchmark lehnte es 98 % der Anfragen ab, die von den Benchmark-Entwicklern als potenziell hilfreich für die Entwicklung einer Biowaffe eingestuft wurden.

Allerdings heißt es in dem Blogbeitrag auch, dass der externe Prüfer Apollo Research festgestellt hat, dass Muse Spark die höchste Rate an „Evaluierungsbewusstsein“ aller von Apollo bisher beobachteten Modelle aufweist und Testszenarien häufig als „Alignment-Fallen“ erkennt. Meta gibt an, dass die eigene Nachuntersuchung erste Hinweise darauf gefunden hat, dass dieses Bewusstsein das Verhalten des Modells in einer kleinen Untergruppe von Alignment-Evaluierungen beeinflussen kann, kam aber zu dem Schluss, dass es „kein versperrendes Problem für die Veröffentlichung“ ist.

Der Artikel wird von einem Drittanbieter bereitgestellt. SeaPRwire (https://www.seaprwire.com/) gibt diesbezüglich keine Zusicherungen oder Darstellungen ab.

Branchen: Top-Story, Tagesnachrichten

SeaPRwire liefert Echtzeit-Pressemitteilungsverteilung für Unternehmen und Institutionen und erreicht mehr als 6.500 Medienshops, 86.000 Redakteure und Journalisten sowie 3,5 Millionen professionelle Desktops in 90 Ländern. SeaPRwire unterstützt die Verteilung von Pressemitteilungen in Englisch, Koreanisch, Japanisch, Arabisch, Vereinfachtem Chinesisch, Traditionellem Chinesisch, Vietnamesisch, Thailändisch, Indonesisch, Malaiisch, Deutsch, Russisch, Französisch, Spanisch, Portugiesisch und anderen Sprachen.