Die KI-News der Woche vom 12.02.2026

Die KI-News der Woche vom 12.02.2026

Melde Dich für unseren Newsletter an und erhalte alle wichtigen News direkt in dein Postfach!

SeeDance 2 revolutioniert die Video-KI-Erzeugung mit beeindruckenden Demos, Claude ist zurück mit dem neuen Opus 4.6 Modell und ElevenLabs klingt immer menschlicher.

Alle wichtigen KI-News der Woche haben wir für Euch wie immer kompakt zusammengefasst.  

🤖 Claude Opus 4.6

Den Anfang macht diese Woche Anthropic, die mit Claude Opus 4.6 eine beeindruckende Weiterentwicklung ihres Spitzenmodells vorgestellt haben. Das Update konzentriert sich vor allem auf verbesserte Coding-Fähigkeiten und agentischeFunktionen. Das Modell soll jetzt besser planen, Aufgaben über längere Zeiträume verfolgen und zuverlässiger in großen Codebasen agieren können. Ein echtes Highlight ist das auf eine Million Token erweiterte Kontextfenster, das sich aktuell aber noch in der Beta-Phase befindet. 

Anthropic spart dabei nicht mit Superlativen und behauptet, dass Opus 4.6 in wirtschaftlich relevanten Aufgaben das Konkurrenzmodell GPT-5.2 von OpenAI übertrifft. Neue Features wie „Agent Teams“ für die Code-Entwicklung sollen die Anwendungsfälle deutlich erweitern. In der KI-Community gibt es aber auch kritische Stimmen, die Bedenken zur Evaluierung äußern – denn wenn ein Modell so leistungsfähig wird, wird es zunehmend schwieriger, es mit den bisherigen Methoden überhaupt noch zuverlässig zu testen. 

🆕 GPT-5.3 Codex & ChatGPT Update

Aber auch OpenAI hat nachgelegt und mit GPT-5.3-Codex ein neues, agentisches Coding-Modell veröffentlicht. Bei GPT-5.3-Codex handelt es sich um eine wirklich bedeutende Neuerung. Es kombiniert die Coding-Fähigkeiten von GPT-5.2-Codex mit den Reasoning-Fähigkeiten von GPT-5.2 und ist dabei 25% schneller. 

Besonders spannend: GPT-5.3-Codex war maßgeblich an seiner eigenen Entwicklung beteiligt, indem es beim Debugging und der Diagnose von Testergebnissen geholfen hat. Für die KI-Branche ist das ein wichtiger Schritt weg vom reinen Code-Assistenten hin zu einem allgemeinen, interaktiven Mitarbeiter für computerbasierte Tätigkeiten. Das neue Modell ist für alle Nutzer der bezahlten ChatGPT-Pläne verfügbar. Auch in ChatGPT gab es ein Update, das Sam Altman auf Twitter verkündet hat: Das Modell sei wohl ein kleines bisschen besser. Da sind wir mal gespannt, ob wir das in der Benutzung merken werden. 

🎆 Qwen Image-2

Aus China kommt mal wieder eine beeindruckende Neuerung im Bereich der Bildgenerierung. Das Tongyi Lab von Alibaba hat Qwen-Image-2.0 veröffentlicht. Die neue Version führt die bisher getrennten Pfade der Bilderzeugung und -bearbeitung in einem einzigen Modell zusammen. Und besonders cool: Das Modell ist wohl deutlich kleiner als seine Vorgänger, bietet aber trotzdem eine höhere Leistung und Geschwindigkeit. 

Hervorzuheben ist die native Unterstützung für eine 2K-Auflösung, was hochdetaillierte und fotorealistische Bilder ermöglicht. Die eigentliche Sensation ist aber die Fähigkeit des Modells, professionelle Typografie und komplexe textliche Anweisungen zu verarbeiten. Damit lassen sich direkt anspruchsvolle Infografiken, Präsentationsfolien oder sogar Comics erstellen, bei denen Text und Bild nahtlos integriert sind. Wer also schon mal mit den typischen Problemen bei der Textwiedergabe in KI-Bildern zu kämpfen hatte – hier scheint auch Alibaba jetzt einen echten Fortschritt gemacht zu haben. 

🎥 SeeDance 2

Für ordentlich Furore hat auch SeeDance 2.0 gesorgt, ein neues multimodales KI-Video-Generierungsmodell von ByteDance, der Muttergesellschaft von TikTok. Dazu haben wir auch ein eigenes Video gemacht. Das Tool scheint in Sachen Qualität und Kontrollierbarkeit die Konkurrenz von Sora oder Kling zu übertreffen. Nutzer können bis zu 12 verschiedene Dateien – Text, Bilder, Videos und Audio – hochladen und diese mittels natürlicher Sprache referenzieren, um komplexe und konsistente Videoszenen zu erstellen. 

Die Videos können eine Länge von bis zu 15 Sekunden haben und in 1080p ohne Wasserzeichen ausgegeben werden. Gleichzeitig gibt es aber auch erhebliche Kontroversen: Die Verfügbarkeit in den USA ist aufgrund der politischen Bedenken gegenüber ByteDance unklar, und es gibt ethische Bedenken hinsichtlich der Intransparenz bei den Trainingsdaten. Zudem wurden bereits Fälle dokumentiert, in denen das Modell Inhalte generierte, die stark an urheberrechtlich geschütztes Material erinnern. Also hier muss man auf jeden Fall noch abwarten, wie sich das Ganze entwickelt. 

🐝 Kimi Agent Swarm

Das chinesische Unternehmen Kimi, auch bekannt als Moonshot AI, hat mit „Agent Swarm“ eine faszinierende neue Funktion für sein K2.5-Modell vorgestellt. Wir hatten ja schonmal im Update über die Swarm-Funktion von Kimi berichtet und jetzt gibt es dazu einen eigenen, ausführlichen Blogartikel. Statt auf einen einzelnen, immer leistungsfähigeren Agenten zu setzen, deployt Agent Swarm ein selbstorganisierendes System von bis zu 100 Sub-Agenten, die komplexe Aufgaben parallel bearbeiten. Diese Struktur, die sich selbst entwirft und Aufgaben quasi wie ein CEO an Mitarbeiter verteilt, soll die Limitierungen sequenzieller Verarbeitung überwinden. 

Technisch ermöglicht die Funktion über 1.500 Tool-Aufrufe und liefert Ergebnisse bis zu 4,5-mal schneller als ein einzelner Agent. Das ist schon eine beeindruckende Ansage. Die Funktion ist aktuell aber nur für die „Top Tier Subscribers“ verfügbar. 

💸 ElevenLabs Investitionen

Kommen wir zu ElevenLabs, die gleich mit zwei positiven Nachrichten aufwarten. Zum einen hat das Unternehmen in einer Series-D-Finanzierungsrunde satte 500 Millionen US-Dollar eingesammelt, was die Bewertung auf beeindruckende 11 Milliarden US-Dollar schraubt. Angeführt wurde die Runde von Sequoia Capital und seit der Gründung 2022 hat ElevenLabs damit insgesamt über 780 Millionen Dollar an Investitionen erhalten. Das frische Kapital soll vor allem in die Forschung und Entwicklung sowie die internationale Expansion fließen – unter anderem mit neuen Büros in Berlin, London und Tokio.

🎤 ElevenLabs Expressive Mode

Und passend dazu wurde der neue „Expressive Mode“ für die ElevenAgents vorgestellt. Diese Funktion ermöglicht es Sprachagenten, auf einem nahezu menschlichen Niveau emotional und ausdrucksstark zu interagieren. Angetrieben wird das Ganze durch das hauseigene „Eleven v3 Conversational“-Sprachmodell und ein verbessertes „Turn-Taking-System“, das für flüssigere und natürlichere Dialoge sorgt. Die Latenz liegt bei nur 75 Millisekunden – das ist schon wirklich beeindruckend schnell für Echtzeit-Konversationen. Und die Demos klingen echt “echt”. Hier gibt es Beispiele.

Das ist besonders für Anwendungen im Kundenservice relevant, wo emotionale Intelligenz deeskalierend wirken und Vertrauen aufbauen kann. ElevenLabs zeigt damit, dass sie die frischen Investitionen auch direkt in spannende Produkte umsetzen. 

👨🏻‍⚖️ Perplexity Model Council

Die KI-Suchmaschine Perplexity hat mit dem „Model Council“ eine interessante neue Funktion für ihre „Max“-Abonnenten eingeführt. Damit können Nutzer eine einzelne Suchanfrage gleichzeitig an drei verschiedene KI-Modelle stellen – zum Beispiel Claude Opus 4.6, GPT-5.2 und Gemini 3.0. Die Ergebnisse werden dann von einem vierten „Synthesizer-Modell“ analysiert, das die Antworten zusammenführt, Übereinstimmungen sowie Unterschiede aufzeigt und eine konsolidierte, umfassendere Antwort liefert. 

Das Ziel ist es, die Genauigkeit der Suchergebnisse zu erhöhen und die Voreingenommenheit einzelner Modelle zu reduzieren. Für die KI-Branche ist das ein spannender Ansatz, um die Verlässlichkeit von KI-generierten Informationen zu verbessern. Perplexity Max kostet allerdings 200 Dollar im Monat – das ist schon eine Ansage und für den Preis muss die Funktion dann auch einen echten Mehrwert gegenüber der Nutzung der einzelnen Modelle bieten. Wir hören allgemein aktuell weniger von Perplexity, vermutlich hat das Unternehmen mittlerweile doch stark mit dem immer besseren Angebot der KI-Suche auch von den anderen Anbietern zu kämpfen. 

🇨🇳 GLM-5 von zAI

Und noch eine Meldung aus China: Das KI-Unternehmen Z.ai hat sein neuestes Flaggschiff-Modell, GLM-5, vorgestellt. Mit 744 Milliarden Parametern, von denen 40 Milliarden aktiv sind, ist es ein echtes Schwergewicht und zielt auf komplexe, von Agenten gesteuerte Aufgaben ab. In einigen Benchmarks übertrifft es sogar führende Modelle wie Gemini 3.0 Pro und GPT-5.2. 

GLM-5 ist als Open-Source-Modell unter der MIT-Lizenz frei verfügbar – hier bleiben die Chinesen also mal wieder ihrer Linie treu. Neben reinen Chat-Funktionen kann GLM-5 auch Büroaufgaben wie das Erstellen von formatierten Word-, PDF- und Excel-Dateien übernehmen. Das positioniert es als eine sehr leistungsstarke Alternative für den produktiven Einsatz und wir sind gespannt, ob sich ein damit auch ein weiterer chinesischer Anbieter etablieren kann. 

🚶🏻 xAI Mitgründer gehen

Weniger gute Nachrichten gibt es von Elon Musks KI-Unternehmen xAI. Kurz nacheinander haben zwei Mitgründer, Jimmy Ba und Tony Wu, das Unternehmen verlassen. Diese Abgänge reihen sich in eine Serie von Austritten weiterer Gründungsmitglieder wie Igor Babuschkin, Kyle Kosic und Christian Szegedy ein und fallen in eine turbulente Zeit für das Unternehmen, das erst kürzlich mit SpaceX fusionierte. 

Die Weggänge der Forscher, insbesondere von Jimmy Ba, der als einflussreich für die Entwicklung der „Grok“ KI-Modelle gilt, könnten eine erhebliche Schwächung für die Forschungs- und Entwicklungskapazitäten von xAI bedeuten. Zusätzlich zu den internen Unruhen sieht sich xAI weiterhin mit behördlichen Untersuchungen konfrontiert, da der „Grok“ Chatbot und Bildgenerator zur Erstellung von Deepfake-Pornografie missbraucht wurde. Das trübt so ein bisschen viele der positiven und innovativen Entwicklungen des Unternehmens aus den letzten Monaten und es bleibt spannend, wie es bei xAI weitergeht. 

🔂 OpenAI Hardware erst 2027

Wer auf das erste Hardware-Produkt von OpenAI gewartet hat, das in Zusammenarbeit mit dem ehemaligen Apple-Designchef Jony Ive entsteht, muss sich noch etwas gedulden. Die Markteinführung verzögert sich von Ende 2026 auf Anfang 2027. Bekannt wurde das Ganze durch Gerichtsakten im Rahmen eines Markenrechtsstreits. 

Bei dem Gerät soll es sich um ein taschengroßes, bildschirmloses Produkt handeln, das kontextbezogen auf seine Umgebung und die Aktivitäten des Nutzers reagieren kann. Sam Altman hat es intern als „das coolste Stück Technologie, das die Welt je gesehen hat“ beschrieben – aber das kennen wir ja von ihm. Konkrete Details zum Preis oder genauen Formfaktor sind weiterhin nicht bekannt. Wir halten euch natürlich auf dem Laufenden, sobald es da etwas Neues gibt. 

Ⓜ️ Meta rüstet auf

Zum Schluss noch ein Blick auf Meta, die eine umfassende Aufrüstung ihres KI-Angebots planen. Im Zentrum stehen die neuen KI-Modelle „Avocado“ und „Avocado Thinking“. Zudem deuten Funde auf die baldige Integration von App-Konnektoren für Dienste wie Gmail und Outlook hin, was eine Unterstützung des Model Context Protocol (MCP) nahelegen. 

Nach der Übernahme von Manus AI, über die wir ja auch schon berichtet haben, entwickelt Meta jetzt einen eigenen Browser-Agenten namens „Sierra“ sowie weitere Agenten-Funktionen. Ein „Big Brain“-Modus soll, ähnlich wie bei Konkurrenzprodukten, mehrere KI-Agenten parallel arbeiten lassen. Diese Offensive zeigt ganz klar Metas Ambitionen, die Funktionslücke zur Konkurrenz zu schließen. Ob die angekündigten Features aber am Ende so kommen und die Qualität der neuen Modelle überzeugt, bleibt abzuwarten. 

Autor

  • Profilbild von Timothy Meixner

    Timothy Meixner ist Mitgründer und Geschäftsführer der Meixner & Ruof UG. Als KI- und Office-Experte betreibt er zusammen mit Johannes Ruof den erfolgreichen YouTube-Kanal Digitale Profis (125.000+ Abonnent:innen).

    Alle Beiträge ansehen
Nach oben scrollen