Melde Dich für unseren Newsletter an und erhalte alle wichtigen News direkt in dein Postfach!
OpenAI hat wohl einiges an neuen Modellen in der Pipeline – vielleicht schon für heute, es gibt zwei neue, richtig starke Video-KIs von Runway und Kling und Google arbeitet an Verbesserungen für den Gemini Chatbot.
Alle wichtigen KI-News der Woche haben wir für Euch wie immer kompakt zusammengefasst.
❓ Wann kommt GPT-5.2?
OpenAI hat intern einen Code Red ausgerufen. Laut zuverlässigen Quellen ist beim ChatGPT Konzern aktuell alles auf Eis gelegt, was nicht direkt Verbesserungen des Kernprodukts und vor allem der Modelle betrifft. Das Unternehmen muss dringend aufholen, um nicht den Anschluss an Gemini, Claude und auch Grok zu verlieren, die aktuell gerade alle sehr stark sind. GPT-5.1 konnte dahingehend nicht überzeugen und deshalb steht wohl ein neues Modell-Release unmittelbar bevor.
In Notion wird aktuell schon ein neues OpenAI Modell getestet und alles deutet zum Stand jetzt, als wir das Update aufnehmen, auf ein Release noch heute oder auf jeden Fall in den nächsten Tagen hin. Das neue Modell wird wohl GPT-5.2 heißen und soll deutliche Verbesserungen mitbringen im Vergleich zum Vorgänger. Das muss es aber auch, denn sonst wird es schwierig nicht viele User von ChatGPT an die Konkurrenz zu verlieren.
🎇 Neue OpenAI Bild-Modelle
Aber nicht nur im Bereich Chat-Modell tut sich etwas: Wenn man der Meinung vieler Tester in der Design Arene und LMArena glauben darf, dann testet OpenAI aktuell auch zwei Varianten eines möglichen neuen Bild-Modells mit den Codenamen Chestnut und Hazelnut. Die mit diesen Modellen erzeugten Bilder sehen auf jeden Fall ziemlich gut aus und gehen stark in die Richtung von Nano Banana Pro.
Wir hatten es ja kürzlich schon erwähnt, dass OpenAI hier massiv unter Zugzwang steht und ein neues Bild-Modell überfällig ist. Die Frage ist, ob es ausreichen wird, wenn das neue Modell “nur” die Leistung von Googles Konkurrent hat oder etwas besser ist. Wir sind aber auf jeden Fall gespannt, ob da dieses Jahr noch etwas kommen wird oder das Release erst im Januar passiert.
🎥 Runway 4.5
Nachdem wir von der Video-KI Runway jetzt eine ganze Weile nichts gehört haben und der Markt eher so ein bisschen zwischen Google mit Veo 3 und vielen der asiatischen Anbieter aufgeteilt war, hat sich das Unternehmen jetzt auf beeindruckende Art und Weise zurückgemeldet mit einer neuen Version: Runway 4.5. Leider kann man das neue Modell aktuell noch nicht testen, auch nicht mit einem bezahlten Plan. Laut Runway befindet sich das Modell im Rollout und soll bald für alle verfügbar sein. Aber die Videos, die jetzt im Zuge der Ankündigung von Runway selbst und auch von Beta-Testern veröffentlich wurden, sehen absolut beeindruckend aus.
Und auch in unabhängigen Rankings wie beispielsweise Artificial Analysis konnte sich Runway 4.5 an die Spitze im Bereich Text to Video setzen, die Qualität ist definitiv da. Interessant ist, dass Runway immer noch mit einem ziemlich kleinen Team unterwegs ist. Nicolas Neubert, ein Mitarbeiter des Unternehmens hat es in seinem Ankündigunstweet schön formuliert: “We are David and we brought one hell of a slingshot”. Das Team hinter der Video-KI soll laut ihm in zwei Busse passen und dass so ein Unternehmen es nicht nur mit Google, OpenAI und Co. Aufnimmt, sondern diese sogar übertreffen kann – das ist echt spannend!
🆕 Updates bei Kling
Aber nicht nur bei Runway hat sich etwas getan: Kling, ein asiatischer Konkurrent der Video-KI hat in einer ganzen “Launch-Woche” jede Menge Neuerungen vorgestellt, inklusive Kling Video 01 und damit einem großen Update für die eigene Video-KI. Hier wurde vor allem betont, dass multimodaler Input verbessert wurde und über verschiedene Kamerablickwinkel die Konsistenz zwischen verschiedenen Aufnahmen gewährleistet werden kann. Passend dazu wurde auch Kling Image 01 vorgestellt und hier können beide neuen Modelle auch schon ausprobiert werden, ohne Rollout wie bei Runway.
Es wurde allerdings sogar noch ein weiteres neues Video-Modell mit Kling 2.6 vorgestellt, das jetzt auch natives Audio in den erstellen Videos unterstützt. Diese Funktion haben wir ja bei Veo 3 das erste Mal bekommen, auch Kling setzt das sehr gut um. Hier ist ein Beispiel von Tim von Theoretically Media. Das ist schon echt beeindruckend und es wird immer schwerer die KI-Videos von echten Aufnahmen zu unterscheiden.
👀 DeepSeek V3.2
Zwischen dem ganzen Hype um Gemini 3 und den Gerüchten um ein neues GPT-Modell ist es fast ein bisschen untergegangen: Schon am 1. Dezember hat DeepSeek ein neues Modell vorgestellt mit DeepSeek V3.2 bzw. Der Version V3.2 Speciale. Nachdem auch wir das KI-Unternehmen aus China so ein bisschen aus dem Auge verloren hatte, nachdem DeepSeek 3.1 nicht so wirklich an den riesigen Erfolg des R1 Modells anknüpfen konnte, melden sie sich jetzt offensichtlich auf beeindruckende Art und Weise zurück.
Laut den ersten Benchmarks und Erfahrungsberichten muss sich DeepSeek 3.2 nicht einmal vor Gemini 3 Pro wirklich verstecken. Klar es gibt immer ein paar Punkte hin und her, aber wir bewegen uns da mittlerweile auf einem so hohen Niveau, dass das wirklich Kleinigkeiten sind. Und man darf auch hier wieder nicht vergessen: Die DeepSeek Modelle sind nicht proprietär, sondern werden mit Open Weights auf Huggingface veröffentlicht. Man kann sich also – vorausgesetzt man verfügt über massive Rechenleistung – theoretisch ein Gemini 3 Pro Level Modell herunterladen und lokal verwenden. Das ist schon echt beeindruckend.
📣 Opal, Live & Projekte in Gemini
Nachdem es bei Google gerade im Vergleich zu OpenAI keinen großen Druck für ein neues Modell gibt und man sich so ein bisschen auf Gemini 3 ausruhen kann, sehen wir hier aktuell viel Bewegung in neuen Funktionen und Verbesserungen für den Gemini Chatbot selbst. Laut ersten jetzt aufgetauchten Screenshots ist es möglich, dass der Agent-Builder Opal mit dem man ja über Prompts ganz einfache Workflows bauen kann vielleicht direkt in Gemini integriert wird. Die Integration wird dabei als Super-Gem bezeichnet, also als eine Art Add-On. Die Gems bei Gemini, die so ein bisschen das Custom GPT Pendant sind, wurden ja seit der Einführung nicht mehr wirklich aktualisiert, vielleicht gibt es da jetzt mal wieder was Neues.
Gleichzeitig wurde eine Option im Gemini Chatbot gefunden mit der das Teilen des eigenen Bildschirms für Live-Übersetzungen möglich sein soll. Wir kennen die Live-Funktion von Gemini ja schon aus dem AI Studio, wo wir uns einfach mit der KI über das unterhalten können, was wir gerade auf dem Bildschirm sehen. Wenn diese Funktion jetzt auch auf die Gemini Website kommen würde – auch wenn vielleicht erst einmal nur zum Übersetzen, wäre das schon echt ein Upgrade.
Und zuletzt schaut sich Google vermutlich nochmal etwas bei OpenAI ab und integriert in den Gemini Chatbot auch die Möglichkeit Projekte zu erstellen. Damit kann man dann bestimmte Unterhaltungen in eine Art Ordnerstruktur packen und sich damit einfach besser organsisieren. Und ich muss sagen: Selbst wenn das keine weitere Funktion haben sollte, wäre es einfach schon eine schöne Verbesserung und man kann damit einfach den eigenen Verlauf ein bisschen aufräumen, also wäre durchaus zu begrüßen.
📢 Werbung in ChatGPT
Aufregung rund um ChatGPT – aber vermutlich erst einmal völlig unbegründet. In den letzten Wochen gab es immer wieder Berichte von verschiedenen, auch seriösen, Quellen, die angedeutet haben, dass OpenAI in ihrem Chatbot jetzt auf Werbung setzen will, um mehr Einnahmen zu generieren. Allerdings hat sich mittlerweile herausgestellt, dass es wohl falscher Alarm war und von seitens OpenAI wurde offiziell klargestellt, dass es aktuell keine Tests zur Anzeigenschaltung im Chatbot gibt. Man sei sich bewusst, dass die Leute ChatGPT vertrauen und alles, was man daran verändert, würde das auch in Zukunft respektieren.
Ein bisschen stellt sich die Frage, was die Formulierung “Aktuell wird es nicht getestet” jetzt wirklich heißt, ein kategorisches Nein ist es ja nicht. Und aktuell befindet sich OpenAI ja auch im Code Red Modus, denn anscheinend wurden alle Nebenprojekte auf Eis gelegt, bis man im Modellrennen wieder aufgeholt hat. Auf lange Sicht könnte OpenAI natürlich durchaus ein finanzielles Problem bekommen, wenn alle im kostenlosen Plan überhaupt nicht monetarisiert werden können. Wenn sich hier etwas neues ergibt, erfahrt ihr es bei uns aber natürlich sofort.
🏛️ Agentic AI Foundation
Unter der Linux Foundation wurde jetzt eine neue offene Organisation gegründet, die Agentic AI Foundation, bei der sich verschiedene große Unternehmen aus dem Bereich Tech und KI zusammentun, um das Thema voranzutreiben. Unter den Gründungsmitgliedern sind vor allem OpenAI und Anthropic, die jeweils direkt Teile ihrer eigenen Technologie “gespendet” haben, um diese in der Agentic AI Foundation transparent weiterzuentwickeln. Bei Anthropic war es das MCP-Protokoll, das ja schon in vielen KI-Tools eingesetzt wird. OpenAI hat ihr Agents.md Framework beigesteuert. Unter den 8 Platin-Mitgliedern sind aber auch die anderen Tech-Größen wie Google, Microsoft und Co. Vertreten.
Wir sind schon gespannt, ob die Foundation wirklich in Zukunft etwas bewegen wird und diese Projekte dann komplett offen und transparent weiterentwickelt werden. Es kann natürlich auch sein, dass es mal wieder eine Art PR-Stunt ist und die Unternehmen dann eben die wirklich beeindruckenden Dinge weiterhin intern hinter verschlossenen Türen vorantreiben.
