Melde Dich für unseren Newsletter an und erhalte alle wichtigen News direkt in dein Postfach!
Anthropic veröffentlicht das neue Opus 4.5 Modell und es gibt mehr Updates bei Bild-KIs: Flux 2 legt im Rennen nach, aber Google steht schon mit interaktiven Bildern in den Startlöchern. ChatGPT recherchiert die besten Deals für uns und ein neuer KI-Roboter aus Deutschland wurde vorgestellt.
Alle wichtigen KI-News der Woche haben wir für Euch wie immer kompakt zusammengefasst.
🎆 Flux 2 veröffentlicht
Beim Thema Bild-KI ist aktuell wieder richtig Tempo drin. Nur wenige Tage nach dem Nano Banana Pro Release von Google haben wir jetzt auch das nächste große Update der sowieso schon starken Bild KI Flux von Black Forest Labs bekommen.
Flux steht ab sofort in der Version 2 zur Verfügung in unterschiedlichen Abstufungen. Man kann das im Playground von Black Forest Labs auch kostenlos testen und die verschiedenen Modelle nutzen. Wir haben das direkt mal ein bisschen ausprobiert und auch mit Nano Banana Pro verglichen. Die Outputs sind auf jeden Fall sehr gut und in vielen Bereichen sind die Unterschiede wirklich klein. Der einzige Punkt, den Google aktuell unserer Meinung nach deutlich besser macht ist Text auf den Bildern, hier sehen wir beispielsweise, dass bei Flux doch ein paar deutliche Fehler drin sind.
Stand heute haben wir Pro, Flex und Dev, wobei Pro die leistungsstärkste und proprietäre Variante ist. Das Flex-Modell ist laut Black Forest Labs dazu da, Entwicklerinnen und Entwicklern die volle Kontrolle über Outputs zu geben, also sicherlich vor allem für die Nutzung über die API interessant. Das Dev-Modell ist ein kleines 32B Modell, das Open Weights ist, also nicht wirklich Open Source, aber immerhin so ein bisschen. Es ist komplett auf Huggingface verfügbar und kann auch lokal betrieben werden.
Aktuell noch ausstehend ist das Flux 2 Klein Modell, das zumindest laut Website komplett Open Source sein soll mit einer Apache 2.0 Lizenz. Außer Coming Soon gibt es da aber aktuell noch keine genauen Infos, wir halten euch natürlich auf dem Laufenden.
🛍️ OpenAI Einkaufsrecherche
ChatGPT hat einen neuen Modus bekommen, mit dem wir jetzt gezielte Recherche für Produkte machen können, die wir uns kaufen wollen. “Recherche für Einkäufe” heißt die neue Funktion, die wir unter den Tools in unserem Prompt-Eingabefeld finden. Wenn wir diesen Modus aktivieren, dann startet der Bot eine etwas ausführlichere Recherche, vergleicht Preise und versucht uns die besten Deals anzubieten.
In unseren Versuchen hat das mal mehr, mal weniger gut geklappt, sodass wir sagen müssen zumindest aktuell scheint sich ein eigener Blick auf Preisvergleichsseiten wie Idealo und Co. Noch zu lohnen. Ziemlich cool ist dagegen die Funktionalität, wenn wir nicht konkret nach einem Produkt suchen. Denn dann kann ChatGPT uns Vorschläge machen und findet gemeinsam mit uns auch über interaktive Rückfragen ein passendes Produkt. All diese Funktionen haben wir übrigens für euch in einem eigenen Video schon ausführlich getestet.
✴️ Claude Opus 4.5
Nachdem wir ja Claude Sonnet 4.5 schon eine ganze Weile haben, hat Anthropic jetzt endlich auch ihr Flaggschiff Modell Opus auf die neueste Version aktualisiert. Und es scheint so, als hätten sie in der Zeit ganz ordentlich an Verbesserungen gearbeitet – inklusive einer sehr unerwarteten, aber schönen Überraschung.
Relativ wenig überraschend ist, dass Opus 4.5 vor allem im Bereich Coding, Software Engineering und Tool Use, also im Bereich des eigenständigen Arbeitens mal wieder neue Maßstäbe setzt – und das nur kurz nach dem Hammer von Gemini 3 Pro. Hier haben wir schon wieder ein paar Prozentpunkte extra bei den geläufigen Benchmarks, also Anthropic holt sich da die Krone wieder so ein bisschen zurück.
Ein Problem, dass die Modelle in der Vergangenheit aber hatten, war der Preis. Auch wenn sie vielleicht einen “Ticken” besser als die Konkurrenz waren – teilweise doppelte oder dreifache Kosten für die Nutzung über die API haben auch viele Entwicklerinnen und Entwickler eher zur Konkurrenz getrieben. Nicht mehr mit Opus 4.5: Im Vergleich zum Vorgänger wurden die Nutzungskosten gedrittelt und das wird echt spannend zu sehen, wie sich hier das Verhalten der Poweruser ändern wird. Denn die Leistung der Anthropic Modelle hat eigentlich nie jemand bestritten – sie waren nur einfach zu teuer.
Gerade in Claude Code – also dem eigenen Tool von Anthropic dürfte die Leistung des neuen Modells unglaublich gut, und jetzt eben auch bezahlbar sein. Die ersten Erfahrungsberichte werden sicherlich über die nächsten Tage und Wochen kommen, wir sind auf jeden Fall sehr gespannt. Wenn ihr das Modell schon einsetzt interessiert uns da natürlich auch eure Meinung, also schreibt es uns gerne in die Kommentare.
Ganz ohne zu bezahlen kann man das Modell leider nicht wirklich testen: Auch im Claude Chatbot selbst ist es nur den zahlenden Abonnenten vorbehalten. Ein bisschen schade und hier können Google und OpenAI dann wieder ein bisschen punkten. Anthropic hat aber sowieso verstärkt auf Unternehmenskunden gesetzt und diese Strategie scheint für sie auch aufzugehen.
💬 Gruppenchats bei ChatGPT
Und nochmal eine neue Funktion von ChatGPT. Ab sofort sind in allen Plänen auch Gruppenchats verfügbar. Das klingt erst einmal ein bisschen verwirrend, aber im Prinzip können wir hier einfach über einen Link andere Personen in eine Unterhaltung mit der KI einladen. OpenAI selbst sagt, damit kann man beispielsweise die Planung eines gemeinsamen Urlaubs angehen oder andere Projekte, die man mit mehreren anderen zusammen vorhat. Man kann sich im Chat ganz normal unterhalten, wie in einer Whatsapp Gruppe zum Beispiel, aber auch jederzeit mit @chatgpt die künstliche Intelligenz als Hilfe dazuholen, sodass der Bot auch Fragen beantworten, recherchieren und Infos bereitstellen kann.
Wir sind nicht ganz sicher, ob wir das wirklich nutzen werden, da selbst in unseren Tests zu zweit, das gefühlt durch den Mix aus unserer Unterhaltung und ChatGPT Antworten igrendwie ziemlich unübersichtlich wurde – aber vielleicht gibt es ja doch ein paar Anwendungsfälle in denen das sinnvoll sein könnte.
🖌️ Styles in Sora und ChatGPT?
Die Video-KI Sora von OpenAI hat eine neue Funktion bekommen mit vordefinierten Stilen, die man für die eigenen Videos jetzt nutzen kann. Das sind dabei zum Start Thanksgiving, Vintage, News, Selfie, Comic und Anime, wobei anscheinend schon mehr in Planung sind. Mit diesem Vorlagen werden die erzeugten Videos dann immer relativ gleich aussehen und ermöglichen mehr Konsistenz.
Das ist jetzt an sich nicht so spektakulär, gleichzeitig sind aber bei einigen Personen auch in ChatGPT Referenzen für Stile aufgetaucht, hier waren es Dinge wie Crayon, Chibi und Nightcam, außerdem vorgschlagene Prompts. Im Gegensatz zu Sora handelt es sich hier aber um die Bilderzeugungsfunktion und diese neue Features in Kombination mit einigen Gerüchten, die schon eine Weile die Runde machen legen nahe, dass wir nach Nano Banana Pro und jetzt Flux 2 vielleicht auch bald ein GPT-Image-2 bekommen könnten. Interessant ist ein Verweis darauf, dass man die eigenen Freunde featuren kann – vielleicht wird es also möglich sein, die Cameos, die es in der Sora App ja gibt also Vorlagen von Personen jetzt auch für Bilder zu nutzen.
🖼️ Interaktive Bilder bei Gemini
Ebenfalls zuerst nur Gerüchte und dann aber wieder direkt offiziell bestätigt ist auf der anderen Seite ein weiteres Update für Bilder im Gemini Chatbot von Google. Hier sollen ab sofort auch interaktive Bilder erzeugt werden, wie der offizielle Account auf Twitter gepostet hat. Es wird in diesem Fall nicht nur ein Bild erzeugt, sondern man kann auch verschiedene Elemente auf diesem Bild anklicken und bekommt dann direkt mehr Informationen von der KI.
Im gezeigten Beispiel wird so eine Pflanzenzelle erklärt und die verschiedenen Bestandteile der Zelle können nochmal detailliert studiert werden. Wir konnten es bei uns selbst noch nicht reproduzieren und haben bisher immer nur statische Bilder bekommen, die Funktion scheint sich aber offiziell im Rollout zu befinden.
📣 ChatGPT Voice Update
Heute haben wir mal wieder viel ChatGPT für euch im Update: Die letzte Funktion ist aber tatsächlich sehr hilfreich – zumindest unserer Meinung nach. Im Sprachmodus des Chatbots können wir jetzt eine neue Ansicht nutzen, in der wir nicht einfach nur diese Animation sehen, wie bisher, sondern live das Transkript mitlesen können. Wir haben also quasi die hybride Verwendung über die Sprache aber gleichzeitig mit visueller Ausgabe.
Ich finde das persönlich schon nur für den Text hilfreich, aber ChatGPT kann hier natürlich auch in anderen Modalitäten antworten, beispielsweise Karten und Produkte anzeigen, wenn das bei unseren Fragen relevant ist. Das ist absolut sinnvoll, vermutlich werden da aber die anderen Anbieter auch bald nachziehen. Es ist ja jetzt keine wirklich schwierig umzusetzende Funktionalität. Trotzdem schön, auch bei OpenAI mal wieder einen richtigen Treffer zu haben, da wir von vielen Updates in letzter Zeit nur so semi überzeugt waren.
Wer die neue Ansicht gar nicht mag, muss sie übrigens nicht nutzen. Man kann auch einfach über die Einstellungen bei der alten Ansicht mit der Animation bleiben.
🎶 Suno und Warner Music
Nachdem wir vor kurzem schon darüber berichtet haben, dass die Musik-KI Udio einen Deal mit der Universal Music Group gemacht hat, um einen Rechtsstreit beizulegen und in der Folge Downloads deaktiviert hat und es viel Ärger gab, ist es jetzt anscheinend auch bei Konkurrent Suno so weit. Statt UMG gibt es hier eine “Partnerschaft” mit der Warner Music Group, die gemeinsam die Zukunft von generierter Musik gestalten soll. In der Ankündigung wird direkt so ein bisschen beschwichtigt und gesagt, dass die Downloads nicht komplett deaktiviert werden. Aber: Es soll nur noch mit bezahlten Plänen möglich sein und auch dort wird es wohl Limits für die Zahl an Songs geben, die man einfach so herunterladen kann.
Also ich würde es mit der aktuellen Lage definitiv nicht empfehlen, sich hier auf irgendetwas zu verlassen, denn die Situation ist sehr undurchschaubar. Und wer weiß: Auch bei Udio wurden die Downloads ja komplett ohne Vorwarnung gesperrt, definitiv ausschließen würde ich es deshalb auch bei Suno nicht.
🦾 Roboter aus Deutschland
Wir haben ja immer mal wieder auch schon verschiedene humanoide Roboter mit KI vorgestellt. Jetzt ist irgendwie ziemlich aus dem Nichts ein neuer solcher Roboter aufgetaucht, der eine ganz interessante Eigenschaft hat: Er kommt nämlich aus Deutschland vom Unternehmen Agile Robots aus München.
Der Agile One ist knapp einen Meter fünfundsiebzig groß und ca. 70 Kilogramm schwer. Er ist speziell dafür entwickelt worden, in der Industrie Hand in Hand mit Menschen zu arbeiten. Er kann Lasten bis zu 20 Kilogramm tragen und bewegt sich mit gut sieben Stundenkilometern – also etwa so schnell wie ein zügig gehender Mensch. Dank seiner Hände mit fünf beweglichen Fingern und feinen Sensoren kann er sowohl kraftvoll zupacken als auch präzise Aufgaben übernehmen, wie etwa das Greifen von Schrauben.
Damit die Zusammenarbeit reibungslos klappt, setzt Agile Robots auf Sicherheit und Kommunikation: Der Roboter reagiert auf Sprache, nutzt ein Info-Display und soll durch ein freundliches Design mit animierten Augen weniger ‚leblos‘ wirken. Seine künstliche Intelligenz, die unter anderem strategisches Denken und Feinmotorik steuert, wurde unter Einhaltung europäischer Datenschutzstandards direkt in Deutschland trainiert. Produktionsstart des Agile One soll bereits Anfang 2026 sein, ebenfalls in Deutschland. Da werden wir definitiv ein Auge darauf behalten.
