Die KI-News der Woche vom 10.06.2025

Die KI-News der Woche vom 10.06.2025

Melde Dich für unseren Newsletter an und erhalte alle wichtigen News direkt in dein Postfach!

ElevenLabs bringt mit der Version 3 noch bessere Stimmen und mehr Funktionen, Cursor veröffentlicht endlich die Version 1.0 ihrer Code-KI, Luma stellt eine neue KI-Video-Funktion vor und Google veröffentlicht eine Open Source Version von Deep Research.

🎤 ElevenLabs V3 Alpha

Nachdem wir im letzten Update erst über die neuen Conversational Agents von Elevenlabs gesprochen haben, wurde jetzt eine ganz neue Version der Stimm-KI veröffentlicht, die Version 3. Damit wurden neben der Verbesserung der Qualität auch einige neue Funktionen vorgestellt wie über 70 unterstützte Sprachen, Dialoge mit mehreren Sprechern und neue Tags für die erzeugten Stimmen, die Emotionen wie Lachen, Seufzen und so weiter generieren können.

Was besonders schön ist: Auf der Website kann man V3 aktuell in begrenztem Rahmen kostenlos ausprobieren, sogar ohne Login. Unter elevenlabs.io/de/v3 kann man, wenn man etwas nach unten scrollt in das Textfeld etwas eingeben und dann Stimme erzeugen lassen. Wenn man noch mehr machen will, kann man auch mit dem kostenlosen Plan aktuell schon die Version 3 verwenden, also wenn es euch interessiert, dann probiert es doch einfach mal aus. 

🦁 Gemini 2.5 Pro Goldmane

Google hat das sowieso schon unglaublich gute Gemini 2.5 Pro Modell nochmal verbessert und in der Version mit dem Codenamen “Goldmane” jetzt im Gemini Chatbot und in der API als aktuelles Modell zur Verfügung gestellt. Das Update hat sowohl in der Chatbot Arena, als auch in anderen unabhängigen Benchmarks nochmal deutliche Verbesserungen zum Vorgänger vorzuweisen und untermauert den Anspruch das aktuell beste Modell auf dem Markt zu sein. 

Interessanterweise ist das aber immer noch nicht die finale, wirkliche Gemini 2.5 Pro Version, sondern das Modell ist immer noch als Preview gekennzeichnet, was vermuten lässt, das wir vor dem finalen Release vielleicht sogar nochmal Verbesserungen bekommen. 

Das Google hier wirklich ernst macht, zeigt auch wie involviert der CEO Sundar Pichai aktuell beim Thema KI ist. Auch für das Goldmane Release hat er auf Twitter einen KI-generierten Löwen mit dem Kommentar “Gemini” gepostet und zeigt damit, dass das Thema Künstliche Intelligenz bei Google aktuell ganz oben auf der Liste der Prioritäten steht. 

📊 Neue Integrationen für ChatGPT

OpenAI hat eine ganze Reihe an neuen Integrationen für ChatGPT vorgestellt. Damit ist es möglich jetzt noch mehr Datenquellen mit dem Chatbot zu verbinden, sodass dieser auf die dort verfügbaren Informationen zugreifen kann und sie in Antworten mit einbeziehen. Die neuen Quellen sind unter anderem: Outlook, Teams, Google Drive, Gmail, Sharepoint und Dropbox, sowie einige weitere. 

Diese Funktion ist natürlich hilfreich, wenn man viel darauf angewiesen ist mit dem Kontext von vielen oder großen Dateien zu arbeiten, gleichzeitig muss man natürlich immer genau schauen, vor allem im Unternehmenskontext, inwiefern es erlaubt und möglich ist, dem Chatbot hier so weitreichenden Zugriff auf eine Vielzahl von Dokumenten zu geben.

Auch wenn in Teams-Plänen ja gewisse Datenschutz-Einstellungen automatisch aktiviert sind, sollte man die Verwendung dieser neuen Integrationen definitiv nochmal abklären, bevor es nachher irgendwelche Probleme gibt. Wenn das alles möglich ist, dann ist es aber sicherlich eine gute Unterstützung und kann dafür sorgen, dass man besser zugeschnittene Antworten von der KI bekommt, bzw. Vielleicht auch Informationen aus den eigenen Dateien extrahieren kann. 

🧑🏻‍💻 OpenAI Codex im Plus Plan

Neben den neuen Integrationen hat OpenAI auch angekündigt, dass die Programmierunterstützung Codex jetzt für ChatGPT-User mit einem Plus-Plan verfügbar ist. Möglicherweise ging das jetzt doch schneller als gedacht, nachdem Google ihr Konkurrenzprodukt Jules ja aktuell noch kostenlos für alle anbietet. 

Man findet Codex jetzt in der Seitenleiste relativ weit oben und wird beim Klick auf die Codex-Website weitergeleitet, also die Funktion ist nicht innerhalb von ChatGPT nutzbar. 

Dort gibt es beim ersten Anmelden ein kleines Onboarding und dann muss man das eigene Github-Profil mit Codex verbinden. Um die Programmier-KI zu verwenden, muss man also schon bestehende Projekte haben, innerhalb derer man dann Aufgaben an den Bot delegieren kann. Für viele Entwicklerinnen und Entwickler ist das aber sicherlich eine interessante Sache und man kann es ja einfach einmal ausprobieren, vielleicht mit einem Hobbyprojekt oder etwas, das aktuell noch nicht veröffentlicht ist 

Außerdem hat Codex insgesamt das erste, kleine Update bekommen und kann jetzt, wenn wir es erlauben auf das Internet zugreifen, um Informationen zu suchen oder etwas zu recherchieren. OpenAI selbst sagt aber, dass dieser Zugriff standardmäßig ausgeschalten ist und mit Vorsicht verwendet werden sollte. Man kann dafür auch beispielsweise genau definieren, welche Seiten durchsucht werden dürfen, um zu verhindern, dass die KI auf Grundlage von falschen Informationen fehlgeleitet wird.

🇫🇷 Mistral Code

Mistral ist aktuell wirklich in einer produktiven Phase und nach vielen Modell-Updates und neue Funktionen für den Le Chat wurde jetzt ein komplett neues Produkt mit dem Namen Mistral Code vorgestellt. Dabei handelt es sich, wie der Name vermutlich schon andeutet, um eine KI-Unterstützung für Programmierinnen und Programmierer, die allerdings ein bisschen anders gestaltet ist als beispielsweise Cursor oder Windsurf. Es ist nämlich kein eigenes Programm, sondern eine Erweiterung, die man in der eigenen Entwicklungsumgebung integrieren kann. 

Aktuell befindet sich Mistral Code in einer privaten Beta und kann von Testerinnen und Testern mit den IDEs von Jetbrains und in Visual Studio Code verwendet werden. Laut Mistral soll Code aber bald für alle verfügbar werden. Es kommen für verschiedene Zwecke sowohl die Codestral-Modelle als auch Devstral für agentische Funktionen und Mistral Medium für den Chat zum Einsatz. Wir sind schon gespannt auf die ersten Erfahrungsberichte, wie sich Mistral Code in der Praxis schlägt. 

📹 Modify Video von Luma

Es gibt mal wieder eine neue Funktion bei der Video-KI Luma. Modify Video heißt das neue Feature, das es erlaubt aus einer aufgenommenen Szene, vor allem einer bestimmten Bewegung einfach und schnell mit KI ein komplett anderes Video zu erstellen. Dieses “Umstylen“ ermöglicht es quasi eine Art “Budget-CGI” zu machen, vor allem für Hobbyfilmer und Creator ist das sicherlich eine coole Möglichkeit. 

Die gezeigten Beispiele verdeutlichen ziemlich gut, was mit Modify Video so alles möglich ist, der Kreativität sind hier eigentlich keine Grenzen gesetzt. Dabei muss auch nicht immer die komplette Szene verändert werden, in einigen Clips sieht man auch beispielsweise nur eine Outfit-Änderung oder dass etwas teilweise ersetzt wird. Auf jeden Fall eine spannende Funktion. 

💨 Veo 3 Fast

Bleiben wir noch kurz beim Thema KI-Video: Die Veo 3 Videos beeindrucken ja weiterhin das ganze Internet. Aber es gab schon erste Kritik von Usern, denn das Erzeugen von Videos mit der neuen Google KI war zum einen ziemlich teuer und zum anderen im Vergleich mit einigen Konkurrenten relativ langsam. Klar, die Qualität ist umso beeindruckender, aber vor allem für Hobbyuser ist der hohe Kostenfaktor natürlich ein Problem. 

Google hat aber schon reagiert und Veo 3 Fast vorgestellt, eine neue, etwas schlankere Version der KI, die aber trotzdem eine Auflösung von 720p mit Audio in den Videos erzeugen kann. Und hier kostet beispielsweise ein 8-Sekunden Clip über die API nur 20 Credits, statt 100 für die Vollversion. Die ersten Testerinnen und Tester sind von der Qualität trotzdem sehr begeistert, auch die “Light-Version” von Veo kann also überzeugen. 

🕵🏻‍♂️ Veo 3 in Manus

Und nochmal kurz Veo-News, denn die Video-KI wurde jetzt für alle Manus-User mit einem bezahlten Plan in den KI-Agenten integriert. Manus kann jetzt auch für die Berichte und Aufgaben Videos mit Veo 3 erstellen, was natürlich nochmal eine deutliche Verbesserung ist und für den ein oder anderen Anwendungsfall einen wirklichen Mehrwert bieten kann.

💻 Cursor Version 1 veröffentlicht

Cursor war eigentlich fast die erste richtig bekannte KI für das Programmieren oder “Vibe-Coding”. Mit diesem Programm kann man künstliche Intelligenz als sehr starke Unterstützung beim Entwickeln von jeglichen Anwendungen nutzen und dabei auf verschiedenste Modelle von OpenAI, Google, Anthropic und mehr zurückgreifen. Aber obwohl es Cursor bereits seit 2023 gibt wurde erst jetzt die Version 1.0 vorgestellt und damit das erste “richtige” Release. 

Mit dem Update hat Cursor nochmal einige beeindruckende, neue Funktionen bekommen wie einen Bug Bot, der im Hintergrund Fehler suchen und beheben kann oder Erinnerungen, die der KI dabei helfen, wichtige Vorgaben zu behalten und bei künftigen Aktionen zu berücksichtigen. Alles in allem steht Cursor aktuell ziemlich gut da, mit zuletzt berichteten 500 Millionen Dollar jährlichem Umsatz und wir sind gespannt auf die weitere Entwicklung. 

🔬 Open Source Deep Research von Google

Nachdem wir ja schon mit der AI Edge ein cooles Open Source Projekt von Google gesehen haben, mit dem man KI-Modelle lokal auf dem Smartphone ausführen kann ist jetzt schon wieder ohne große Ankündigungen ein weitere Open Source Projekt der Suchmaschinenkonzerns aufgetaucht. Es trägt den wundervollen Namen “Gemini Fullstack LangGraph Quickstart”. Das klingt jetzt erstmal nicht besonders schlüssig oder erklärt die Funktion direkt, aber im Prinzip haben wir hier eine Open Source Variante für eine eigene Deep Research Implementierung. Das bedeutet man kann eine App damit entwickeln, die über die API die Gemini-Modelle verwendet, auf die Google Suche zugreifen kann und damit die beliebten lange recherchierten, ausführlichen Berichte erstellen kann, wie wir sie aus ChatGPT oder dem Gemini Chatbot schon kennen. 

Klar: Es handelt sich dabei um ein Demo-Projekt und um eine eigene Version davon aufzusetzen braucht es schon ein bisschen technisches Know-How – kann jetzt vermutlich nicht jeder. Trotzdem ist es spannend zu sehen, dass Google hier offensichtlich zumindest im Anwendungsbereich auch aktuell viel der Open Source Szene zur Verfügung stellt. 

🎥 Bing Video

Microsoft hat für Bing die Möglichkeit vorgestellt auch Videos mit KI zu generieren. Dafür wird Sora von OpenAI genutzt, um 5-sekündige Clips zu erstellen. Der Launch ist allerdings mal wieder ein bisschen konfus, denn aktuell steht die Funktion nur in der Bing-App für Smartphones zur Verfügung. Dort findet man den Video Creator, wenn man unten rechts auf die Apps klickt und dann “Video-Ersteller” auswählt.  

Einstellen kann man aktuell nicht viel, die Dauer sind immer 5 Sekunden und das 9:16 Format also hochkant ist die einzige Option. Man bekommt 10 “Schnelle Kreationen”, die ziemlich zügig sind, danach muss man Microsoft Rewards Punkte dafür einlösen oder die Standard-Erstellung nutzen, die aber laut App “Mehrere Stunden pro Video” braucht. 

Die Qualität der erzeugten Videos hat uns ebenfalls nicht so wirklich überzeugt. Und wenn man das jetzt beispielsweise mit Veo 3 vergleicht, das trotz langer Zeit zum Generieren nicht mal ansatzweise “mehrere Stunden” braucht, dann ist das nicht wirklich beeindruckend.

Autor

  • Profilbild von Timothy Meixner

    Timothy Meixner ist Mitgründer und Geschäftsführer der Meixner & Ruof UG. Als KI- und Office-Experte betreibt er zusammen mit Johannes Ruof den erfolgreichen YouTube-Kanal Digitale Profis (125.000+ Abonnent:innen).

    Alle Beiträge ansehen
Nach oben scrollen