Die KI-News der Woche vom 01.07.2025

Die KI-News der Woche vom 01.07.2025

Melde Dich für unseren Newsletter an und erhalte alle wichtigen News direkt in dein Postfach!

Mark Zuckerberg und Meta werben aggressiv die Top-Forscher von OpenAI für ein eigenes Superintelligence-Team ab, Google bringt Imagen 4 kostenlos ins AI-Studio, ElevenLabs bekommt eine eigene App und auch im Bereich Video-KI gibt es mal wieder spannende Nachrichten. 

👤 Meta wildert beim OpenAI Team

Nachdem Meta ja vor allem bei ihrem letzten Release der Llama 4 Modelle außer Spott nicht viel erreichen konnte, will CEO Mark Zuckerberg mit einem neuen Superintelligence Team dafür sorgen, dass das Unternehmen im Bereich KI konkurrenzfähig bleibt. Dafür wurden jetzt einige der besten KI-Forscher vom Konkurrenten OpenAI abgeworben, unter anderem Trapit Bansal und Jiahui Yu, die maßgeblich die o-Modelle, also die Reasoning Familie beim ChatGPT Konzern entwickelt haben.  

Neben einem echten Zugewinn für Meta sind diese Nachrichten natürlich ein harter Schlag für OpenAI, der nicht schöngeredet wird. In einem mittlerweile gelöschten Tweet hat OpenAI Mitarbeiter Cheng Lu sich sehr enttäuscht gezeigt, dass die Führungsebene, diese Top-Leute nicht gehalten hat und sogar Mark Chen, der Chief Research Officer des Unternehmens sagt, es fühle sich an, als wäre jemand in ihr Haus eingebrochen und hätte etwas gestohlen. Er hat angekündigt, dass sich die Management-Ebene mit allen Betroffenen, die Angebote erhalten jetzt stärker unterhalten will und weitere Abwanderung verhindern. Ob das klappt, jetzt wo schon so viele wichtige Leute zu Meta gewandert sind, wird man sehen. 

Neben diesem aggressiven Abwerben hat Meta übrigens auch 14 Milliarden Dollar in das Unternehmen Scale AI von Alexander Wang, der jetzt das neue Superintelligence Team beim Facebook-Konzern leiten soll. Wir sind jedenfalls schon gespannt, ob diese riesigen Investitionen und personelle Aufstockung dafür sorgen können, dass das nächste Modell-Release etwas besser läuft. Es wird allerdings vermutlich noch etwas dauern, bis das neue Team ein fertiges Produkt vorstellen kann.  

🛒 Claude Business-Experiment

Anthropic hat ein kleines Experiment durchgeführt. Unter dem Namen Project Vend hat das Claude 3.7 Sonnet Modell die Kontrolle über einen eigenen, kleinen Shop, bzw. Einen Verkaufsautomaten im Büro bekommen und sollte mit 1000 Dollar Startkapital durch Verkäufe und Nachbestellungen ein erfolgreiches, profitables Business aufbauen.

Der Versuch ist aber grandios gescheitert, denn Claudius, so ist der Name des “Verkaufstalents”, hat es in kürzester Zeit geschafft pleite zu gehen. Die KI hat teilweise absurd hohe Angebote für günstige Produkte abgelehnt und es so nicht geschafft wirklich Umsatz einzufahren, dafür hat Claudius nach einer Frage nach einem Tungsten Würfel ein ganzes Sortiment von “Speziellen Metall-Items“ bestellt und diese teilweise sogar unter dem Wert verkauft. 

Anthropic betont, dass es auch ein bisschen daran lag, dass die Kundinnen und Kunden alles Angestellte waren, die natürlich darauf aus waren, ihren Spaß mit dem KI-Verkaufsautomaten zu haben, aber das Experiment zeigt trotzdem, dass künstliche Intelligenz vielleicht doch noch nicht alles kann.

🖼️ Imagen 4 im AI-Studio

Gute Nachrichten für alle Bild-KI-Enthusiasten. Google stellt die neuen Imagen 4 und Imagen 4 Ultra Modelle aktuell kostenlos im AI Studio zur Verfügung, sodass man ganz einfach und schnell Bilder mit dem aktuell besten Google Modell dafür erzeugen lassen kann. Man findet die Option unter Generate Media in der Seitenleiste und kann dann zwischen den beiden neuen Modellen und Imagen 3 umschalten. Außerdem gibt es die Möglichkeit das Format festzulegen. 

Google bleibt auch hier dem Ansatz treu, relativ großzügig zu sein, was das kostenlose Ausprobieren von State of the Art Modellen angeht. Genaue Limits werden nicht angegeben, aber wir haben schon viel mit Imagen experimentiert und sind noch nicht eingeschränkt worden. Die neuen Modelle wurden jetzt auch über die API verfügbar gemacht, dort kostet ein Bild mit Imagen 4 4 Cent und in der Ultra Variante 6 Cent. 

👾 Gemma 3n von Google

Nicht ganz so visuell beeindruckend, aber eigentlich noch spannender ist das neue Gemma 3n Modell von Google, das jetzt vorgestellt wurde. In der E4B-Variante ist es das erste Modell überhaupt mit unter 10 Milliarden Parametern, das eine Punktzahl von über 1300 in der Chatbot Arena erreichen konnte. Zum Vergleich: Das bedeutet das neue Modell spielt in derselben Liga, wie beispielsweise Claude 3 Opus oder Gemini 1.5 Pro. Das klingt jetzt vielleicht erstmal nicht so beeindruckend, aber der Punkt beim neuen Gemma Modell ist, dass es auf allen Geräten ab 2GB Ram lokal und offline ausführbar ist. Dabei bringt es außerdem noch Multimodalität mit und kann sowohl mit Text als auch Audio, Video und Bildern umgehen.  

Man muss dazu sagen: Dabei geht es nur um Input, also Gemma 3n kann selbst keine Inhalte außer Text erzeugen aber trotzdem: Ein so kleines Modell mit dieser Leistung, die ja sogar auf einem Smartphone abrufbar ist, ist schon sehr beeindruckend. Und wenn die Entwicklung so weitergeht und wir vielleicht schon in 1-2 Jahren die Leistung der heutigen Top-Modelle erreichen können, dann hat man die KI, die fast alles kann, einfach immer offline dabei. 

📼 Midjourney Video

Nachdem Midjourney ja schon lange in der Bilderstellung mit KI ganz oben mitmischt hat das Unternehmen jetzt relativ überraschend auch ein erstes, eigenes Video-Modell vorgestellt. Mit Midjourrney V1 Video kann man Bilder in 5-sekündige Videoclips verwandeln und bekommt dabei verschiedene Einstellungsmöglichkeiten, zum Beispiel dafür, wie viel Bewegung erzeugt werden soll. Die Clips können über Erweiterungen auf bis zu 20 Sekunden Länge gebracht werden und die ersten Beispiele sehen auf jeden Fall schon ziemlich cool aus.

Leider ist auch die Videoerzeugung bei Midjourney nicht umsonst, aber bereits im kleinsten Plan für 10 Dollar im Monat bei monatlicher Abrechnung enthalten. Das Video-Modell ist ein erster Schritt in die Richtung der Welt-Modelle, die Midjourney ja in ihrer Vision anstrebt und mit denen das kreative Erschaffen von ganzen Welten möglich werden soll. Bis dahin ist es natürlich noch ein weiter Weg, aber das Videomodell ist schonmal ein ersten Schritt weg vom reinen Bild-Tool. 

📹 Hailuo 02

Kommen wir vom Video-Newcomer zu einem der besten Anbieter in diesem Bereich. Hailuo AI hat mit ihrem neuen Video-Modell Hailuo 02 mal wieder bewiesen, warum sie bei KI-Videos ganz oben mitspielen. Die Qualität der Videos, die mit dieser KI erzeugt werden können ist wirklich sehr beeindruckend und es wurde das erste Mal geschafft, tatsächlich auch extreme Szenarien wie Akrobatik und Turnen fast fehlerfrei zu erzeugen. Hier haben ja eigentlich alle Modelle ihre Probleme, denn diese schnellen Bewegungen bieten natürlich unglaublich viel Raum für Fehltritte der KI. 

Hailuo scheint aber hier wirklich ein Durchbruch gelungen zu sein und das hat natürlich direkt zu einem neuen Trend geführt bei dem User verschiedenste Tiere zu Akrobaten oder olympischen Athleten gemacht haben. Was auf den ersten Blick einfach nur lustig aussieht ist aber wirklich ein Durchbruch im Bereich der Videoerzeugung mit KI und wir sind schon gespannt, ob und wann die anderen Anbieter hier nachziehen können. 

💻 Gemini CLI

Nach dem Erfolg von Claude Code und anderen, vergleichbaren Tools, die es Entwicklerinnen und Entwicklern ermöglicht haben, einfach in der Kommandozeile mit KI an Projekten zu arbeiten hat jetzt auch Google eine eigene Lösung vorgestellt: Gemini CLI. Mit diesem Programm kann man einfach im Terminal auf Gemini zugreifen und neben einer normalen Unterhaltung mit der KI natürlich auch in entsprechende Ordern wechseln und so beispielsweise Unterstützung beim Programmieren und in der Entwicklung bekommen. Google ermöglicht auch hier wieder, zumindest zum Start, einen sehr großzügigen, kostenlosen Einstieg mit aktuell 1000 kostenlosen Anfragen an das Gemini 2.5 Pro Modell – pro Tag! 

Damit wird sich der Konzern sicherlich auch hier einiges an Testerinnen und Testern sichern können, denn während einige der anderen Lösungen, zum Beispiel Claude Code, aktuell laut dem Feedback noch etwas besser sind, kann man diese oft überhaupt nicht kostenlos verwenden, im Gegenteil, die Nutzung wird sogar relativ schnell ziemlich teuer. Also auch hier mal wieder etwas, dass man auf jeden Fall ausprobieren sollte. Alle Anleitungen zu Installation und Verwendung gibt es hier. 

🕵🏻‍♂️ Cursor Agenten in App und Web

Die Vibe-Coding Software Cursor hat jetzt eine neue Funktion bekommen, die es Usern ermöglichen soll, einfach von unterwegs aus jederzeit mehrere Agenten mit verschiedenen Aufgaben zu beauftragen. Diese werden dann im Hintergrund ausgeführt und können später, vielleicht, wenn man an einem richtigen Arbeitsplatz ist, geprüft und übernommen werden, wenn das Ergebnis so ist wie gewünscht. Das funktioniert dabei sowohl im Browser als auch in der mobilen App von Cursor. 

Entwicklerinnen und Entwickler haben begeistert auf diese Neuerung reagiert, die im Prinzip so ein bisschen die Funktion von OpenAI Codex oder Googles Jules auch für Cursor ermöglicht. Eigentlich war die KI hier ja nur im Editor selbst verfügbar, jetzt können auch Cursor User einfach ihre Code-Speicherorte verbinden und jederzeit von unterwegs aus Aufgaben erstellen und ausführen lassen. 

📱 Elevenlabs app

Apropos unterwegs und Apps. ElevenLabs, einer der stärksten KIs für Text-to-Speech hat endlich eine eigene Smartphone App vorgestellt. Auch hier kann man jetzt jederzeit von unterwegs beeindruckend menschlich klingende Stimmen aus Text erzeugen lassen und diese direkt auf dem Handy weiterverwenden oder für später speichern. Im Vorstellungsvideo wurde dabei gezeigt, wie man erzeugtes Audio direkt in andere Apps exportieren kann und dort weiterverwenden. In Zeiten in denen viele ja schon lange, gerade im Social Media Bereich, Content auf dem Smartphone erstellen ist das sicherlich eine willkommene Möglichkeit das ganze etwas effizienter zu gestalten, ohne den Umweg über einen Computer für die Audio-Erzeugung gehen zu müssen. 

💰 Max-plan bei Perplexity

Nach OpenAI, Google und Anthropic wird es jetzt wohl auch bei Perplexity einen sehr teuren Plan für echte Power-User geben. Laut den ersten Leaks heißt dieser dann Perplexity Max und bietet sowohl unbegrenzten Zugriff auf die Labs Funktion, die besten Modelle und Vorabzugriff auf neue Features. Sehr viel mehr Informationen, auch über ein mögliches Release-Datum, haben wir aktuell nicht und auch die Veröffentlichung des neuen Comet-Browsers von Perplexity steht ja noch aus, es kann also durchaus sein, dass es noch eine ganze Weile dauern wird, bis der Max-Plan wirklich kommt. 

Mit so vielen Anbietern, die mittlerweile teure Pläne anbieten, wird es leider vor allem für Privatpersonen immer schwieriger überall mit den neuesten Funktionen am Ball zu bleiben. Bei den Pro-Versionen für ca. 20 Dollar im Monat konnte man ja vielleicht bei intensiver Nutzung noch 2-3 Abos bei unterschiedlichen Websites rechtfertigen, aber ich denke es wird kaum jemand jenseits von 500 Euro jeden Monat zahlen wollen, nur um bei verschiedenen KI-Anbietern das beste Model zu bekommen. 

🤖 Grok 4 kurz vor dem Release

Bei xAI scheint sich mal wieder etwas in Bezug auf ein Modell-Update zu tun. Nachdem es schon vor einiger Zeit immer wieder Gerüchte um ein 3.5 Modell gab, das aber nie veröffentlicht wurde, hat jetzt Elon Musk die Gerüchteküche wieder angeheizt und dieses Mal schon ziemlich konkret. In einem Tweet schrieb er, dass sie hart an Grok arbeiten, die neue Version wird direkt Grok 4 sein und angeblich schon kurz nach dem 4. Juli steht das Release bevor. 

Nachdem es ja um Grok immer wieder Schlagzeilen gibt, die problematisch sind, aber es an sich ein starkes Modell ist sind wir schon gespannt auf die neue Version, die ja auch mithilfe des Super-Rechenzentrums Colossus trainiert wird. Bei uns erfahrt ihr natürlich sofort, wenn es hier konkret wird, also falls nicht schon passiert, das Abo für den Kanal nicht vergessen. 

Autor

  • Profilbild von Timothy Meixner

    Timothy Meixner ist Mitgründer und Geschäftsführer der Meixner & Ruof UG. Als KI- und Office-Experte betreibt er zusammen mit Johannes Ruof den erfolgreichen YouTube-Kanal Digitale Profis (125.000+ Abonnent:innen).

    Alle Beiträge ansehen
Nach oben scrollen