Die KI-News der Woche vom 10.04.2025

Die KI-News der Woche vom 10.04.2025

Melde Dich für unseren Newsletter an und erhalte alle wichtigen News direkt in dein Postfach!

Google legt im KI-Rennen nach und stellt einige Neuheiten vor, Meta hat Probleme und OpenAI ändert seine Strategie.  

☁️ Google Cloud Next

Aktuell findet in Las Vegas die Cloud Next Konferenz von Google statt – eines der größten Events des Suchmaschinenkonzerns, bei dem in der Regel auch einiges an Neuerungen vorgestellt wird. Gestern Abend gab es die Keynote. Da es bei der Cloud Next auch generell um die Cloud-Infrastruktur von Google geht mit Security, Workspace und mehr, haben wir hier noch nicht viele reine KI-Updates bekommen, können diese Woche vermutlich aber noch ein paar Dinge erwarten.

Es wurde auch schon bestätigt, dass zum Beispiel Deep Research in Gemini jetzt für User mit Premiumplan mit dem Gemini 2.5 Pro Modell funktioniert und damit nochmal eine Schippe Qualität drauflegt. Außerdem wurde ein Gemini 2.5 Flash Modell angekündigt, das vor allem bei der Nutzung über die API eine perfekte Mischung zwischen Leistung und Performance bieten soll. Es wurde auch kurz über Chirp gesprochen, ein Modell zur Stimmsynthese und Lyria, mit dem Songs erstellt werden können – alles ohne viel wirkliche Demo, das müssen wir uns also mal in Ruhe anschauen.

Ziemlich interessant sah noch der neue Agentspace aus. Hier wird es für Unternehmen zukünftig möglich sein, in einem eigenen Bereich verschiedenste KI-Tools, Modelle und auch normale Apps wie die von Google Workspace, aber auch Konkurrenzprodukte wie zum Beispiel Outlook oder Microsofts Cloud Speicher OneDrive zentral mit KI zu bedienen.

Die Cloud Next geht den Rest der Woche noch weiter und wir sind schon sehr gespannt, was sonst noch so vorgestellt wird. Gemunkelt wird vor allem über ein Modell speziell für das Programmieren.

👨🏼‍💻 Firebase Studio

Obwohl diese Nachricht bei der Eröffnung der Cloud Next Konferenz gar nicht so richtig erwähnt wurde, sorgt ein neues Produkt von Google aktuell für Aufregung in der KI-Szene. Unter Firebase.studio bietet der Konzern jetzt nämlich einen Coding-Assistenten an, der es mit Cursor, Windsurf, Replit und Co. aufnehmen soll. Dabei handelt es sich aktuell um eine reine Web-App, in der man dann ein Projekt erstellen kann. Man kann sich für verschiedene Vorlagen entscheiden, also je nachdem, ob man eher eine Webseite oder ein Skript erstellen will und kann dann, in einem zweigeteilten Editor, den Code selbst bearbeiten, bzw. Die KI als Unterstützung heranziehen, um Änderungen automatisch durchzuführen, indem man einfach sagt, was man haben möchte. 

Kurz nach der Ankündigung ist das Tool aktuell ziemlich überlastet und bricht oft Operationen ab, oder macht die Änderungen nicht vollständig. Aber es lohnt sich vermutlich trotzdem Firebase Studio im Blick zu behalten, als ernstzunehmende Konkurrenz zu den jetzt schon existierenden KI-Code-Editoren. 

📱 Update für die Gemini Android App

Und schließlich noch eine gute Nachricht für alle Smartphone User: Google hat jetzt die Live-Kamera und Bildschirm Teilen Option in der Android App von Gemini freigeschalten. Das bedeutet wir können jetzt im Sprachmodus mit der KI darüber sprechen, was wir entweder mit dem Smartphone filmen oder das, was aktuell auf unserem Bildschirm zu sehen ist. Das ist ja eine Funktion, bei der sich die Geister noch stark scheiden. Für die einen ist es ein Traum, da man so direkt mit der KI über alles sprechen kann und eine wirklich gute Integration in den eigenen Alltag bekommt. Auf der anderen Seite gibt es natürlich nicht ganz ungerechtfertigte Bedenken, wenn man einem Modell, egal ob Gemini, GPT oder Claude quasi Zugriff auf alles gibt, was man selbst sieht oder auf dem Smartphone hat. Da muss man aber natürlich ganz klar sagen: Ich muss diese Option ja nicht verwenden, wenn ich das nicht möchte – nur im Zweifel aufpassen, dass mich niemand anderes filmt und die KI über mich ausfragt. 

⌨️ Quasar Alpha

Ein aktuell noch unbekanntes Modell sorgt momentan für viele Schlagzeilen in der KI-Welt. Quasar Alpha ist der Deckname dieses Modells, das auf der Plattform OpenRouter aktuell kostenlos verfügbar ist. Es scheint dabei sehr stark im Bereich Programmieren zu sein, aber auch in der allgemeinen Anwendung sind die ersten Tester überzeugt. Es gibt einige Demos in denen das Modell auf Grundlage von nur einem Prompt beeindruckende kleine Apps entwickelt hat. Dabei verfügt das geheime Modell über ein Kontextfenster von einer Million Token und antwortet unglaublich schnell. Beides könnten Anzeichen dafür sein, dass es sich möglicherweise um ein Gemini Modell handelt – vielleicht sogar das ominöse Gemini Coder Modell auf das alle sehnsüchtig warten – aber auch Gerüchte, dass es sich um ein unveröffentlichtes OpenAI Modell handelt, kann man finden. 

Wer dann am Ende tatsächlich dahintersteckt – ist ja eigentlich zweitrangig, aber wir sind definitiv schon sehr gespannt auf die Enthüllung dieses Modells und wie wir es dann am Ende auch einsetzen können – wer weiß, vielleicht ist es auch Teil der neuen Strategie von Anthropic. 

💰 Anthropic mit neuem Max-Plan

Anthropic bietet für den eigenen Chatbot Claude ab sofort, ähnlich wie OpenAI, nochmal einen größeren, bezahlten Plan an. Max heißt dieser neue Plan und wird in zwei Stufen angeboten, entweder mit 5-mal höheren Limits für 90€ pro Monat oder mit 20-mal höheren Limits für 180€. Auf beide Preise kommt aber für uns in Deutschland noch die Mehrwertsteuer von 19%. Neben den höheren Limits wirbt Anthropic übrigens auch mit früherem Zugriff auf neue Funktionen, aktuell scheint es da aber keinen Unterschied zu geben. Wir wissen, dass das Unternehmen gerade noch an der finalen Version eines richtigen Reasonings arbeitet, vielleicht wird das dann die erste Funktion, die hier relevant wird. Gleichzeitig muss man natürlich aufpassen, nicht die User mit einem normalen Pro-Plan zu sehr zu verärgern, wenn sie auf Neuerungen warten müssen – wir sind gespannt, wie es da weitergeht.

🛑 Planänderung bei OpenAI

Nachdem ja eigentlich angekündigt wurde, dass als nächstes großes Update das GPT-5 Modell kommen würde, das dann endlich einmal alles in einem Modell vereinen sollte, also sowohl die GPT-Familie als auch die Modelle mit Reasoning hat OpenAI den Plan mal wieder über den Haufen geworfen. Sam Altman hat auf Twitter angekündigt, dass jetzt doch noch das o3 Modell und ein neues o4-mini Modell kommen sollen und dass sie sich für GPT-5 noch etwas mehr Zeit nehmen, um alles richtig zu machen. Wir müssen uns also doch noch eine Weile mit den verwirrenden Modellnamen auseinandersetzen, die jetzt dann wieder richtig wild werden mit dem o4-mini Reasoning Modell – nicht zu verwechseln mit 4o-mini dem GPT-Modell ohne das Reasoning, das ja auch noch aktuell ist, vor allem im kostenlosen Plan. 

🐭 KI erzeugt Tom & Jerry Cartoons

Beim Thema Video-KI gab es mal wieder einen Durchbruch – der etwas anderen Art dieses Mal. Es geht nicht um einen neuen Anbieter oder die neuste Runway oder PikaLabs Version. In einem Paper hat ein Team aus Wissenschaftlern einen Ansatz vorgestellt, mit dem es ihnen gelungen ist, Clips mit einer Dauer von einer Minute zu erstellen, die wirklich sehr realistisch aussehende Szenen des Cartoons Tom und Jerry beinhalten. Dabei wurde ein neuer Ansatz gewählt, so genanntes Test Time Training, der es dem Modell erlauben soll, konstanter zu sein und Elemente auch über einen längeren Zeitraum mit Szenenwechseln, gleich zu behandeln. 

Die ersten Ergebnisse können sich auf jeden Fall sehen lassen. Das Team gibt klar zu, dass es immer noch Artefakte gibt, also diese kleinen unsauberen Stellen im Video, und auch die Videoqualität an sich besser sein könnte – das liegt aber laut Paper an dem relativ kleinen 5B Modell, das genutzt wurde. Der Hauptzweck des Experiments war ja über eine Minute halbwegs sinnvolle Videos zu erzeugen und das ist definitiv gelungen. 

🦙 Aufregung um Metas Llama 4

In einem etwas chaotischen Launch, den wir übrigens in einem eigenen Video schon besprochen haben, hat Meta letzten Samstag die neueste Generation ihrer offenen Llama-Modelle vorgestellt in den Varianten Scout und Maverick. Nachdem erst die Begeisterung groß war, vor allem über ein angebliches 10 Millionen Token Kontext Fenster, kam relativ schnell Kritik und Ernüchterung auf.

Zum einen waren die Modelle nicht in der Lage diesen Kontext wirklich zu nutzen, was aber schlimmer war: Meta hatte offensichtlich bei den guten Benchmarks aus der Chatbot Arena, die auch zur Promo genutzt wurden, ein kleines bisschen geschummelt und dort ein feinabgestimmtes Modell eingereicht, dass genau darauf ausgelegt war, von Menschen gut bewertet zu werden. Das wurde mittlerweile korrigiert und auch ein paar der ursprünglich richtig schwachen Benchmarks von unabhängigen Anbietern scheinen leicht nach oben zu gehen – es ist also möglicherweise nicht alles so negativ wie es in unserem Video dazu noch aussah. Trotzdem: Eine komplette Entwarnung für Meta ist das nicht, und wenn diese oder auch nächste Woche wirklich noch starke, neue Modelle kommen – dann sieht es im KI-Rennen nicht so gut aus für Mark Zuckerberg und Co. 

🤖 Grok 3 API

Das neueste Sprachmodell von xAI Grok 3 hat jetzt einen Zugriff über API bekommen, das bedeutet, dass jetzt auch Grok von Entwicklerinnen und Entwicklern für eigene Projekte eingesetzt werden kann. Darauf haben schon einige gewartet, die Ankündigung konnte jetzt aber nicht wirklich überzeugen. Denn Grok ist in der Nutzung deutlich teurer als beispielsweise das über alle Kategorien eigentlich besser bewertete Gemini 2.5. Die ersten User haben außerdem direkt kritisiert, dass ja ein Kontextfenster von einer Million Tokens versprochen wurde, über die API jetzt aber nur 132.000 verfügbar sind, was gerade für Anwendungen im Bereich Programmieren natürlich wieder ein Nachteil gegenüber anderen Modellen ist. 

Es stellt sich daher die Frage, warum sich das Team genau jetzt dazu entschieden hat diesen API-Zugriff anzubieten. 

Autor

  • Profilbild von Timothy Meixner

    Timothy Meixner ist Mitgründer und Geschäftsführer der Meixner & Ruof UG. Als KI- und Office-Experte betreibt er zusammen mit Johannes Ruof den erfolgreichen YouTube-Kanal Digitale Profis (125.000+ Abonnent:innen).

    Alle Beiträge ansehen
Nach oben scrollen