Die KI-News der Woche vom 18.12.2025

Die KI-News der Woche vom 18.12.2025

Melde Dich für unseren Newsletter an und erhalte alle wichtigen News direkt in dein Postfach!

Google stellt mit Disco ein richtig interessantes neues Tool für die Internetnutzung vor außerdem Gemini 3 Flash, OpenAI versucht mit dem GPT-5.2 Modell und einer neuen Bild-KI aufzuholen, NotebookLM wird direkt in den Gemini Chatbot integriert, bekommt einen Ultra-Plan und vieles mehr.

Alle wichtigen KI-News der Woche haben wir für Euch wie immer kompakt zusammengefasst.  

⚡️ Google Gemini 3 Flash

Starten wir direkt mit der neuesten Nachricht: Gestern hat Google auch die Flash-Variante, also das etwas kleinere, schneller und günstigere Modell der Gemini 3 Familie nachgeliefert. Bei den Benchmarks und der Leistung die mit veröffentlicht wurde, gibt es eigentlich keine großen Überraschungen. Das Flash Modell ist stark und ein absolut würdiger Nachfolger der 2.5 Variante, aber natürlich kommt es nicht an die Leistung des großen Bruders Gemini 3 Pro heran. Alle Zahlen sind natürlich im Artikel von Google auch nachzulesen, der in der Beschreibung verlinkt ist. 

Wir durften das Flash Modell schon seit ein paar Wochen vorab testen und können diese Einschätzung so auch persönlich bestätigen. Interessant ist die kleine Variante sicherlich vor allem für die Nutzung über die API, denn hier ist die Verwendung im Vergleich zu Pro sehr viel günstiger. Und je nachdem, für was man KI in den eigenen Anwendungen einsetzt, reicht die Leistung von Flash wirklich völlig aus. Für den persönlichen Einsatz im Gemini Chatbot greifen wir weiterhin lieber auf Pro zurück, einfach für das bisschen extra Leistung und Qualität in den Antworten. 

Trotzdem ist Flash für Google sicherlich finanziell sehr interessant, denn wenn man sich die Modellnutzungen über die API bei großen Anbietern anschaut, dann sind es da wirklich die kleinen, günstigen Modelle die dominieren. Und mit der Generation 3 hat Google jetzt auch für alle diese Kunden eben wieder ein State ot the Art Angebot. 

🪩 Neues KI-Experiment Disco

Direkt nochmal News von Google: Der Konzern hat mal wieder ein neues KI-Experiment veröffentlicht mit dem relativ lustigen Namen Disco. Das Tool, eine Art KI-Browser, sieht allerdings auf den ersten Blick wirklich sehr cool aus und geht mit dem ersten Feature in den Bereich Generative UI, die wir auch schon so ein bisschen mit den Gemini Experimenten Dynamic View und Visual Layout gesehen haben, die wir beide schon in Videos vorgestellt haben.

Bei Disco gibt es jetzt nämlich die Möglichkeit im Browser ein KI-generiertes Tab zu erstellen, dass uns eine Frage detailliert beantwortet, ein Spiel bietet oder mehr. Der Fantasie sind anscheinend keine Grenzen gesetzt. Wir haben ja schon ein paar Mal darüber geredet, dass es oft umständlich ist, für alles immer einen Chatbot zu nutzen, wenn man vielleicht gerade im Netz unterwegs ist und nur schnell eine Antwort will. Gleichzeitig überzeugen die KI-Browser wie Comet von Perplexity oder Atlas von OpenAI die breite Masse irgendwie auch nicht. 

Disco könnte da mit der Ad-Hoc Erstellung von kleinen Mini-Apps, die wirklich nützlich sind und über ein reines “Fass mir die aktuelle Website zusammen” hinausgehen einen Nerv treffen. Leider ist Disco aktuell als US only veröffentlicht und wir haben hier noch keinen Zugriff darauf.

🎇 GPT Image-1.5

Kurz vor dem Ende des Jahres hat OpenAI nochmal ein großes Release: Die neueste Version der eigenen Bild-KI mit dem Modellnamen Image-1.5. Und die ersten Schlagzeilen nach dem Release waren erst einmal richtig beeindruckend. Platz 1 in der Design Arena mit einem riesigen Vorsprung auf die Konkurrenz von Google und Black Forest Labs und auch in anderen Benchmarks konnte sich das Modell eigentlich überall an die Spitze setzen. Das Modell soll besser in allen Belangen sein, vor allem auch mit Text, dem Halten an Anweisungen und komplexen Renderbildern. Es sah also erst einmal so aus, als hätte OpenAI das Ruder kurz vor Schluss 2025 echt nochmal herumreißen können.  

Aber: Das Feedback der Community von Usern, die das neue Modell jetzt ausprobiert haben ist leider ganz anders. Egal, wo man schaut, Reddit, Twitter, andere Foren: Im Vibe Check, also der wirklichen Anwendungen, wo das Modell mit den Konkurrenten verglichen wird fällt es leider durch. Klar, die Bilder sind nicht schlecht, etwas anderes hätte man ja auch nicht erwartet, aber laut den ersten “echten” Meinungen sind sie bestenfalls auf dem Niveau von Nano Banana, oder sogar darunter.

Und das wäre völlig in Ordnung und hätte niemand wirklich kritisiert, Nano Banana ist ja ein wirklich starked Modell. Das Problem ist: GPT-Image 1.5 kam eben jetzt deutlich nach Nano Banana und nachdem wir seit Wochen von dem internen Code Red bei OpenAI hören, also diesem Panik-Modus, wo man versucht so schnell wie möglich Antworten auf die Konkurrenz-Modelle zu finden, um relevant zu bleiben. Und in dieser Situation ein Modell zu veröffentlichen, dass die Benchmarks wirklich dominiert, aber bei den Usern durchfällt – das sieht einfach nicht gut aus und hat vermutlich nicht den Effekt, den man sich beim ChatGPT Konzern erhofft hat.

🆕 GPT-5.2 ist da

Wir hatten es ja letzte Woche schon befürchtet: Kurz nachdem unser Update-Video live war, hat OpenAI die neueste Modellversion GPT-5.2 vorgestellt. Wir haben dazu übrigens auch am Sonntag schon ein etwas ausführlicheres Video veröffentlicht. Dort haben wir verschiedene Dinge getestet und uns selbst ein Bild von den Fähigkeiten des neuen Modells gemacht. Vieles ist durchaus gut, vor allem geht 5.2 sehr gut mit dem Phänomen der Halluzinationen um und behauptet, zumindest nach unserer Erfahrung, nicht einfach Dinge zu wissen. Die überragenden Werte in den Benchmarks, die OpenAI veröffentlicht hat, konnten wir noch nicht zu 100 Prozent nachvollziehen – aber es kommt auch wirklich immer sehr auf den Anwendungsfall an, also wofür setze ich das Modell tatsächlich ein. Viele der alltäglichen Prompts werden von fast allen neuen Modellen super beantwortet – da merkt man kaum einen Unterschied. 

GPT-5.2 ist aktuell für alle zahlenden User in ChatGPT und über die API verfügbar. Wir sind gespannt, ob es auch noch in den kostenlosen Plan kommt, dazu haben wir allerdings Stand jetzt keine Informationen. Und auch hier werden wir leider das Gefühl nicht los, dass es ein überhastetes Release war, einfach nur, um in den Benchmarks wieder vorne mitspielen zu können – auch wenn hier das Feedback der User nicht ganz so schlimm ist wie beim Bild-Modell. 

♨️ Flux 2 Max

Lustigerweise quasi gleichzeitig mit dem neuem GPT Bild-Modell hat auch Black Forest Labs das neueste Flaggschiff-Modell Flux 2 Max vorgestellt und kann sich auch in den Benchmarks sehr nah beim neuen OpenAI Modell und Nano Banana einreihen. Im Gegensatz zum neuen GPT-Modell ist aber auch das User Feedback für Flux 2 Max positiv und es scheint wirklich so, als könnte sich Black Forest Labs mit ihren Modellen in der Top 3 der Bild KIs etablieren, zumindest aktuell, nachdem von einigen Mitbewerben wie Midjourney ja jetzt lange nichts kam. 

Die Bilder die wir gesehen haben und im Playground selbst erzeugt haben – da kann man das neue Modell übrigens auch kostenlos testen – sind auf jeden Fall schon echt gut und können mit Nano Banana in vielen Fällen mithalten. Bei Text auf den Bildern gibt es hier teilweise mehr Probleme als bei der Konkurrenz, aber nichtsdestotrotz ein starkes Update. 

🎥 Wan 2.6

Die Alibaba Gruppe hat auch mal wieder etwas Neues für uns. Die Video-KI Wan ist hier in der neuesten Version 2.6 vorgestellt worden und bis zum 23. Dezember kann man auf der Wan Website selbst, die natürlich in der Beschreibung verlinkt ist mit 150 kostenlosen Credits pro Tag Videos erstellen lassen und sich so selbst ein Bild von der Qualität machen. Auf den ersten Blick kann Wan nicht so zu 100% mit den Ergebnissen der Konkurrenz auch von beispielsweise Kling über die wir ja letzte Woche berichtet haben, mithalten. Trotzdem ist das neue Modell auf jeden Fall eine Verbesserung und auch hier haben wir jetzt natives Audio in den erzeugten Videos mit drin. 

Die Clips können außerdem bis zu 15 Sekunden lang sein, das hebt Wan so ein bisschen von einigen Konkurrenten ab. Zudem gibt es natürlich die gewohnten Features wie First Frame – Last Frame für eine genaue Steuerung und die Möglichkeit Charaktere zu erschaffen, die dann in verschiedenen Video-Kreationen immer gleich aussehen sollen. 

Wie gesagt: Aktuell gibt es ein großzügiges kostenloses Kontingent, ein Video mit 10 Sekunden hat bei uns ca. 20 Credits gekostet mit dem 150 pro Tag kann man also durchaus ganz sinnvoll testen. 

📝 NotebookLM direkt in Gemini

Dass wir große Fans des KI-Tools NotebookLM sind ist ja kein Geheimnis. Jetzt gibt es eine richtig coole Neuigkeit, denn der Gemini Chatbot von Google bekommt die Möglichkeit, dass wir unsere Notebooks dort als Kontext für den Chat bereitstellen. Über den Button für die Anhänge kann man dann einfach ein Notebook auswählen und alle dort enthaltenen Informationen werden dann für die Unterhaltung bereitgestellt. Da wir auch persönlich diese Notebooks oft als einfach Sammlungen mit vielen, zueinander passenden Infos benutzen ist das wirklich eine coole, neue Funktion im Chat. 

Klar gibt es auch in den Notebooks selbst einen Chat-Bereich, aber in Gemini können wir dann beispielsweise auch mit dem Canvas arbeiten oder die ganzen anderen Tools noch mit den Informationen verwenden. Bei uns ist das schon live, also probiert es doch einfach mal aus! 

💶 NotebookLM bekommt Ultra Plan

Und nochmal News von NotebookLM. Das Tool bekommt jetzt auch eine Version für den Ultra-Plan von Googles KI. Bis jetzt konnte man ja schon NotebookLM Plus bekommen, wenn man den Pro-Plan hatte und dort waren die Limits, zum Beispiel auch für Quellen nochmal deutlich höher. Jetzt wird auch der teuerste Google-Plan zu NotebookLM gebracht und wer das Ultra-Abo bezahlt kann sich über noch mehr Generationen und wohl bis zu 600 Quellen pro Notebook freuen. Ob es das jetzt alleine für NotebookLM wert ist – vermutlich nicht. Aber der Ultra Plan, der ja auch Vorteile für den Gemini Chatbot und andere KI-Tools von Google beinhaltet, wird so defintiv nochmal um ein weiteres starkes Argument ergänzt. 

Trotzdem: Wir sprechen von echt viel Geld im Monat, also vermutlich bleibt es weiterhin erst einmal nur für die echten Google KI Power User relevant. 

🗣️ Google Translate mit KI

Ein weiteres Tool aus der Google Software Familie kann sich jetzt über deutliche Verbesserungen dank KI freuen, und das ist eigentlich überfällig: Google Translate. Hier wird ein laut Google neues State-of-the-Art Modell eingesetzt, um die Übersetzungen zu verbessern. Außerdem gibt neue Funktionen, wie das Lernen von Sprachen, smarte Übersetzungen auch beim Suchen und eine Live-Übersetzung. Vor allem die Live-Übersetzung sieht richtig nützlich aus, im Video sehen wir hier eine kurze Demo, wie das funktioniert.

Es wird ja echt höchste Zeit, dass Translate von den neuen Errungenschaften im Bereich KI profitiert und Google sitzt da eben auch an der Quelle mit den besten Modellen. Wir sind vor allem auch auf die Funktion zum Sprachen lernen gespannt – ob Google da vielleicht auch Apps wie Duolingo oder Babbel Konkurrenz machen kann? Schauen wir mal! 

✨ Gemini Voice Verbesserungen

Im selben Atemzug können wir direkt noch erwähnen, dass die Gemini App zwei wichtige Verbesserungen für den Sprachmodus bekommen hat. Zum einen wurde das Modell angepasst, sodass es nicht bei etwas längeren Sprechpausen, die wir als User machen direkt dazwischen grätscht und uns unterbricht. Das ist für die Usability auf jeden Fall Gold wert, denn ab und zu muss man als Mensch eben doch kurz nachdenken oder einfach kurz Luft holen und das berücksichtigt die KI jetzt auch.

Zum anderen gibt es einen Mute-Button für uns. So können wir uns während die KI antwortet stummschalten, damit nicht auch wir, oder Hintergrundgeräusche um ums herum wiederum die Künstliche Intelligenz unterbrechen und die Antwort so stoppen. Zwei Kleinigkeiten, aber wir haben in der Verwendung von Voice mit der App definitiv den Unterscheid bemerkt. 

🔀 Verzweigte Chats in der ChatGPT App

Aber auch die ChatGPT App hat ein kleines, aber feines Update bekommen. Auf der Website ist es ja schon eine Weile möglich, die eigenen Unterhaltungen zu verzweigen, das bedeutet sozusagen von einem Ausgangspunkt in mehrere, unterschiedliche Richtungen zu gehen. Das kann in vielen Fällen ganz nützlich sein und jetzt ist das auch in der ChatGPT App für Smartphones möglich.  

Gerade auch, wenn man vielleicht bei einem Folgeprompt die KI doch in die falsche Richtung geschickt hat, kann man so nochmal einen anderen Ansatz in einem neuen Chat starten, ohne den gesamten vorangegangenen Kontext zu verlieren. 

💸 ChatGPT App Monetarisierung

Und nochmal News von OpenAI. Nachdem die Apps für ChatGPT ja jetzt schon eine Weile angekündigt sind, ist das erste Dokument oder eine Ressource für die Monetarisierung dieser Apps veröffentlicht worden. Es wurde ja versprochen, dass Entwicklerinnen und Entwickler mit den eigenen Apps auch etwas verdienen können und in einem Support Artikel bei OpenAI gibt es dazu jetzt Informationen. 

Viel ist dort noch nicht enhalten, aber es scheint für den Moment so zu sein, dass es quasi eine Art In App Einkäufe geben kann, die man im besten Fall über die eigene Website oder eigene Kanäle abrechnet. Ein internes Checkout System existiert zwar anscheinend, allerdings zum jetzigen Stand nur für die Nutzung durch OpenAI Partner.

Autor

  • Profilbild von Timothy Meixner

    Timothy Meixner ist Mitgründer und Geschäftsführer der Meixner & Ruof UG. Als KI- und Office-Experte betreibt er zusammen mit Johannes Ruof den erfolgreichen YouTube-Kanal Digitale Profis (125.000+ Abonnent:innen).

    Alle Beiträge ansehen
Nach oben scrollen