Melde Dich für unseren Newsletter an und erhalte alle wichtigen News direkt in dein Postfach!
Ist Microsoft Copilot einfach nur Spielerei? Google bringt NotebookLM komplett in den Gemini Chatbot und ein mysteriöses Videomodell kann sogar SeeDance 2.0 schlagen!
Alle wichtigen KI-News der Woche haben wir für euch wie immer kompakt zusammengefasst.
🦋 Project Glasswing
Erinnert ihr euch an das letzte Update, als wir über das geleakte Mythos-Modell von Anthropic berichtet haben? Jetzt wird es ernst. Anthropic hat unter dem Namen „Project Glasswing“ eine Vorschau-Version von Claude Mythos an ein Konsortium aus Tech-Giganten freigegeben, darunter Apple, Google, Microsoft, Amazon, Nvidia, CrowdStrike und JPMorgan Chase. Dazu kommen etwa 40 weitere Organisationen, die für kritische Software-Infrastruktur verantwortlich sind. Der Grund: Mythos ist laut Anthropic „allen anderen KI-Modellen in Cyber-Fähigkeiten weit voraus“ und hat bereits Tausende bisher unbekannte Sicherheitslücken in jedem großen Betriebssystem und jedem großen Browser gefunden – einige davon existierten seit über 27 Jahren.
Die Idee hinter Glasswing ist simpel aber wichtig: Bevor solche Fähigkeiten in die Hände von Angreifern gelangen, sollen die Verteidiger einen Vorsprung bekommen. Anthropic will Mythos deshalb nicht allgemein verfügbar machen, sondern zunächst nur für defensive Cybersecurity-Arbeit einsetzen. Allerdings gibt es auch berechtigte Bedenken. Während der Tests wurde beobachtet, dass Mythos nach wiederholten gescheiterten Versuchen kreative Umwege fand, um Sicherheitsmechanismen zu umgehen – inklusive dem Löschen eigener Spuren aus der Git-Historie.
Ein Vorfall sorgte besonders für Aufsehen: Das Modell ist während eines Tests aus seiner Sandbox-Umgebung ausgebrochen. Das schürt natürlich Bedenken, wie gut wir solche extrem fähigen Systeme überhaupt kontrollieren können, besonders wenn sie in den Händen weniger privater Unternehmen liegen. Die Reaktionen sind also gemischt – die potenziellen Vorteile für die Cybersicherheit sind enorm, aber die langfristigen Risiken dürfen wir nicht aus den Augen verlieren.
4️⃣ Gemma 4 von Google
Google hat Gemma 4 veröffentlicht, ihre bisher fortschrittlichste Familie von offenen KI-Modellen, basierend auf der Technologie von Gemini 3. Es gibt vier Größen: E2B und E4B für mobile Geräte und IoT, sowie 26B und 31B für PCs. Der Fokus liegt hier klar auf der Maximierung der „Intelligenz pro Parameter“, also viel Leistung bei effizienter Ressourcennutzung. Die Modelle unterstützen agentische Workflows durch natives Function Calling, multimodales Denken und 140 Sprachen. Besonders spannend für Entwickler: Sie stehen unter der kommerziell freizügigen Apache 2.0 Lizenz.
Die Benchmarks sind teilweise dramatisch besser als beim Vorgänger Gemma 3: Im Mathe-Benchmark AIME 2026 springt die Leistung von 20,8 auf 89,2 Prozent, im Coding von 29,1 auf 80 Prozent.
Die ersten User sind begeistert vom Potenzial, besonders bei den größeren Modellen fürs Coding. Allerdings gab es zum Start auch einige Berichte über Bugs, wie Endlosschleifen bei agentischen Aufgaben, sowie Probleme bei der Integration in Tools wie LM Studio. Da muss Google wohl noch ein paar Kinderkrankheiten ausbessern, aber die Basis sieht sehr vielversprechend aus.
✨ Meta Muse Spark
Meta hat diese Woche sein mit Spannung erwartetes neues KI-Modell vorgestellt: Muse Spark. Es ist das erste Modell aus den Meta Superintelligence Labs, dem neuen KI-Labor unter der Leitung von Alexandr Wang, dem ehemaligen CEO von Scale AI. Nach dem enttäuschenden Start von Llama 4 im letzten Jahr hat CEO Mark Zuckerberg den gesamten KI-Bereich bei Meta umgebaut – und Muse Spark soll jetzt zeigen, dass sich das gelohnt hat. Die Meta-Aktie stieg nach der Ankündigung um über 9 Prozent.
Das Besondere: Muse Spark ist im Gegensatz zu den bisherigen Llama-Modellen nicht Open Source, sondern proprietär. Ein klarer Strategiewechsel für Meta. Das Modell wurde von Grund auf als multimodales System gebaut und kann visuelle Informationen direkt in seine Denkprozesse einbeziehen. Es gibt einen „Contemplating“-Modus, der mehrere Sub-Agenten parallel arbeiten lässt, um mit Reasoning-Modellen wie Gemini Deep Think oder GPT-5.4 Pro zu konkurrieren. Muse Spark powert ab sofort die Meta AI App und Website und wird in den nächsten Wochen auch in WhatsApp, Instagram, Facebook, Messenger und die Ray-Ban Meta AI-Brillen integriert. Laut Meta wurde der gesamte KI-Stack in nur neun Monaten komplett neu aufgebaut – das ist durchaus beeindruckend.
🐴 Happy Horse Videomodell
In der Video-KI-Szene sorgt gerade ein mysteriöses Modell für Aufregung. Auf der renommierten Artificial Analysis Video Arena, wo User in Blindtests zwischen zwei Videos wählen, ohne zu wissen welches Modell sie generiert hat, ist plötzlich ein Modell namens „Happy Horse“ auf Platz 1 gelandet – und hat dabei das bisher führende Seedance 2.0 von ByteDance mit deutlichem Abstand geschlagen.
Niemand weiß genau, wer hinter Happy Horse steckt. Auf der Website gibt es GitHub- und Hugging-Face-Links, die alle auf „Coming Soon“ verweisen. In der Community wird spekuliert, ob es sich um WAN 2.7 von Alibaba handelt, um ein Projekt von ByteDance selbst, oder um ein Team ehemaliger Alibaba- und Kuaishou-Forscher. Der Name „Happy Horse“ passt zum chinesischen Jahr des Pferdes 2026. Was man weiß: Das Modell soll 15 Milliarden Parameter haben, Video und Audio nativ zusammen generieren, bis zu 1080p unterstützen und Lippensynchronisation in 7 Sprachen beherrschen. Ob sich das alles bestätigt, muss man abwarten – aber die Blindtest-Ergebnisse sprechen erst einmal eine klare Sprache.
📝 Notebooks in Gemini
Google bringt die beliebten NotebookLM-Funktionen jetzt direkt in die Gemini App. Mit der neuen Notebooks-Funktion kann man Quellen hochladen und strukturiert damit arbeiten, ohne zwischen verschiedenen Apps wechseln zu müssen. Audio Overviews, die Podcast-ähnlichen Zusammenfassungen, die NotebookLM so beliebt gemacht haben, gibt es jetzt also auch direkt in Gemini.
Das ist ein cleverer Schachzug von Google, denn NotebookLM hat eine treue Fangemeinde aufgebaut, während Gemini die breitere Nutzerbasis hat. Durch die Integration profitieren beide Seiten: Gemini-Nutzer bekommen die tollen Recherche-Features und NotebookLM-Fans einen nahtloseren Workflow. Die eigenständige NotebookLM-App bleibt aber weiterhin bestehen, für alle, die den vollen Funktionsumfang brauchen.
🔐 Anthropic sperrt Drittanbieter
Eine etwas unschöne Nachricht für einige Nutzer: Anthropic hat den Zugriff auf Claude über Drittanbieter-Anwendungen wie OpenClaw für Abonnenten von Claude Pro und Max gesperrt. Wer Claude über solche Tools nutzen will, muss nun auf die kostenpflichtige API ausweichen. Anthropic begründet das mit Kapazitätsengpässen und einer zu hohen Auslastung durch Agenten-Frameworks, die nicht mit den Flatrate-Abos vereinbar seien. Das hat natürlich für einigen Unmut gesorgt.
🇨🇳 GLM-5.1
Z.ai hat GLM-5.1 veröffentlicht, ein neues Modell für „agentic engineering“ mit stark verbesserten Coding-Fähigkeiten. Es schneidet bei Benchmarks wie SWE-Bench Pro hervorragend ab und kann über längere Zeiträume autonom an Aufgaben arbeiten. In Tests hat es beispielsweise eine Vektordatenbank über 600 Iterationen optimiert oder in 8 Stunden eine voll funktionsfähige Linux-Desktop-Umgebung als Webanwendung erstellt. Das Modell ist Open-Source unter der MIT-Lizenz und kann lokal oder über APIs genutzt werden. Eine starke Alternative im Open-Source-Bereich.
🌄 Gerüchte um GPT-Image-2
In der OpenAI-Community verdichten sich die Gerüchte um ein neues Bildgenerierungsmodell namens GPT-Image-2. Mehrere Leaks auf Twitter zeigen angebliche Screenshots und Beispielbilder, die auf deutlich verbesserte Qualität und Konsistenz im Vergleich zum aktuellen System hindeuten. Besonders die Fähigkeit, konsistente Charaktere über mehrere Bilder hinweg beizubehalten, scheint ein Schwerpunkt zu sein.
Allerdings gibt es einen großen Haken: Auf einem der angeblich geleakten Bilder ist ein Wasserzeichen von Googles Gemini zu sehen. Das lässt natürlich starke Zweifel an der Echtheit der Leaks aufkommen. Ob es sich um einen echten Leak, einen Fake oder einen PR-Stunt handelt, ist aktuell noch völlig unklar.
🤳🏻 Wan 2.7 Image
Alibaba hat mit Wan 2.7 ein neues Update seiner KI-Bilderzeugung veröffentlicht. Das Modell verbessert die Bildqualität und Prompt-Treue deutlich. In der Community wird spekuliert, ob Happy Horse, das mysteriöse Video-Modell über das wir vorhin schon gesprochen haben, vielleicht auf der gleichen Technologie basiert. Alibaba bleibt damit im Bereich der Bild- und Video-KI definitiv ein Schwergewicht, das man nicht unterschätzen sollte.
🕹️ Microsoft Copilot nur Spielerei?
Eine kuriose Entdeckung hat diese Woche für Stirnrunzeln gesorgt: TechCrunch hat aufgedeckt, dass in Microsofts Nutzungsbedingungen für Copilot steht, der Dienst sei nur für „Unterhaltungszwecke“ gedacht. Das klingt erst einmal absurd, wenn man bedenkt, dass Microsoft Copilot als Produktivitäts-Tool für Unternehmen bewirbt und Milliarden in die Entwicklung investiert.
Rechtlich ist so eine Formulierung allerdings nicht ungewöhnlich – damit schützt sich Microsoft vor Haftungsansprüchen, falls Copilot fehlerhafte Ergebnisse liefert. Trotzdem wirft es natürlich Fragen auf: Wie ernst kann man ein Tool nehmen, das der Hersteller selbst offiziell als Spielerei einstuft? Für Unternehmen, die Copilot in kritische Workflows einbauen, ist das zumindest ein Punkt, den man im Hinterkopf behalten sollte.
Microsoft ruderte schnell zurück und sprach von einer „veralteten Formulierung“, die geändert werde. Die Community hat trotzdem wie zu erwarten mit viel Spott und Misstrauen reagiert. Es zeigt einmal mehr die Diskrepanz zwischen Marketing-Versprechen und rechtlicher Absicherung bei KI-Produkten.
🎤 Voxtral TTS
Mistral hat mit Voxtral TTS ein eigenes Text-to-Speech Modell vorgestellt. Damit bietet jetzt auch das französische KI-Unternehmen eine Sprachsynthese-Lösung an und tritt in direkte Konkurrenz zu ElevenLabs und xAIs Grok TTS. Voxtral soll besonders natürlich und ausdrucksstark klingen und mehrere Sprachen unterstützen, darunter natürlich auch deutsch. Für Mistral ist das ein weiterer Schritt vom reinen Modell-Anbieter hin zu einer umfassenden KI-Plattform.
Die Qualität wird von den ersten Testerinnen und Testern sehr gelobt, allerdings ist die Open-Weights-Version auf nicht-kommerzielle Nutzung beschränkt.
💨 Anthropic überholt OpenAI
Eine strategisch wichtige Meldung: Anthropic hat eine große Partnerschaft mit Google und Broadcom für Rechenkapazitäten bekannt gegeben. Das Unternehmen sichert sich damit massive Compute-Ressourcen für die Zukunft – ein entscheidender Faktor im KI-Rennen. In Kombination mit den starken Nutzerzahlen, die Anthropic in den letzten Monaten verzeichnet hat, und der Tatsache, dass Claude in mehreren Statistiken erstmals OpenAI überholt hat, allen voran beim Umsatz, festigt sich der Eindruck: Anthropic ist nicht mehr nur der moralisch ambitionierte Underdog, sondern ein ernsthafter Marktführer-Kandidat.
🤔 Kritik an OpenAI
Zum Schluss noch ein ernsteres Thema: Der Pulitzer-Preisträger Ronan Farrow hat ein umfangreiches Porträt geschrieben, das unter dem Titel „Sam Altman May Control Our Future. Can He Be Trusted?“ läuft. Der Artikel beleuchtet Altmans Führungsstil, die internen Konflikte bei OpenAI und die Frage, ob eine Person so viel Einfluss auf die Entwicklung von KI haben sollte. Basierend auf internen Memos und Interviews wird Altman ein Muster von täuschendem und manipulativem Verhalten vorgeworfen. Er soll Führungskräfte und den Vorstand belogen und falsche Versprechungen gemacht haben. Auch die Ereignisse rund um seine kurzzeitige Entlassung 2023 werden detailliert beleuchtet.
Der Artikel hat wie zu erwarten für viel Diskussion gesorgt und wirft grundsätzliche Fragen auf: Wie transparent sind die großen KI-Unternehmen wirklich? Und wer kontrolliert am Ende die Technologie, die unsere Zukunft maßgeblich mitbestimmen wird?
