Die KI-News der Woche vom 26.11.2024

Die KI-News der Woche vom 26.11.2024

Melde Dich für unseren Newsletter an und erhalte alle wichtigen News direkt in dein Postfach!

OpenAI und Google kämpfen um Platz 1 in der Chatbot-Arena, Anthropic bringt eine neue Innovation und Video-KI-Anbieter erweitern ihr Angebot um beeindruckende neue Tools und Funktionen. 

🖥️ Code Ordner bei Gemini

Im Gemini Chatbot von Google ist eine neue Funktion aufgetaucht: Code-Ordner Upload. Über diesen Button können wir ganze Ordner mit Code-Dateien und Projekten hochladen und mit dem Chatbot darüber sprechen. Laut ersten Erfahrungen scheint das bei großen Projekten noch einige Probleme zu haben, aber mit kleineren Code-Sammlungen kam die KI bei Nachfragen ganz gut klar.

Es ist ein Upload von Ordnern mit bis zu 1000 Dateien und bis zu einer Dateigröße von 100Mb möglich, also vielleicht wird da auch noch etwas daran gearbeitet. Interessant ist auch, dass die neue Funktion in keiner Update-Meldung auftaucht – sie war einfach da. 

🔬 NotebookLM verlässt das Labor

NotebookLM ist, über die letzten Wochen, glaube ich nicht nur eines unserer absoluten Lieblings-KI-Tools geworden. Euer Feedback und die unzähligen Views auf unseren Videos zu Googles KI-Experiment, egal ob Grundlagen oder Podcast-Erstellung zeigen: Hier hat das Unternehmen wirklich einen Nerv getroffen und ein unglaublich nützliches Projekt geschaffen.

Und es gibt gute Nachrichten: Nachdem ja schon seit einiger Zeit das Experiment-Label auf der Website selbst weggefallen ist, wurde jetzt zumindest ein offizieller Twitter Account von NotebookLM erstellt – es scheint also so, als wäre das KI-Tool wirklich gekommen, um zu bleiben. Schön zu sehen, dass sich NotebookLM so stark entwickelt hat und wir freuen uns schon auf jede Menge Updates, neue Funktionen und hoffentlich noch bessere Unterstützung auch für andere Sprachen bei den Podcasts. 

📹 Neue Funktionen bei RunwayML 

RunwayML hat aktuell einen richtigen Lauf und wir können im Prinzip jede Woche von einer neuen Funktion oder einem neuen Update bei der Video-KI berichten. Dieses Mal wurde die Expand Video Funktion vorgestellt, mithilfe derer wir ganz einfach das Format eines Videos verändern können, indem mehr Inhalt um das Ausgangsvideo herum erzeugt wird, quasi Video Outpainting, wenn wir mal bei der üblichen KI-Sprache bleiben wollen. Die ersten Beispiele dafür sehen absolut beeindruckend aus und gerade die Möglichkeit dadurch einmal aufgenommen Videos auch für ganz andere Geräte attraktiv zu machen, zum Beispiel ein Landscape Video auch für Smartphones zu nutzen, ist super. 

Aber das ist noch nicht alles. 

🎞️ Neue Bild-KI „Frames“ 

Es gibt nämlich noch eine spannendere Nachricht von Runway. Der Konzern hat jetzt nämlich ein eigenes Bild-KI-Modell mit dem Namen Frames vorgestellt. Dieses neue Tool ist noch nicht verfügbar und soll jetzt langsam ausgerollt werden. Aber Nicolas Neubert, ein Mitarbeiter von Runway, hat schon damit begonnen, auf Twitter seine ersten Generationen mit diesem neuen Modell zu teilen. Und da muss man sagen: Das sieht schon wirklich sehr, sehr gut aus. RunwayML allgemein ist ja ein Unternehmen, dass sich stark für Kunstschaffende einsetzt – das ganze Gründungsteam kommt im Prinzip aus der Richtung Film und nicht klassisch Informatik und Machine Learning und es gibt immer wieder kleine Film-Festivals mit Preisen für die Filmemacherinnen und Macher. 

Mit Frames schafft Runway jetzt laut Neubert eine weitere Möglichkeit bzw. Unterstützung für Künstlerinnen und Künstler sich selbst richtig auszudrücken mit der Hilfe von KI. Und der Name deutet es ja schon auch ein bisschen an: “Frames” ist sicherlich auch eine super Möglichkeit sich top Ausgangsbilder für die sehr gute Image-to-Video Funktion von Runway zu erstellen. Neubert spricht in einer Antwort auf einen Kommentar auch schon ein bisschen mysteriös von einem “Everything-Model”. Vielleicht kommt da also noch mehr auf uns zu! 

📺 Update bei LumaLabs

Aber auch die Konkurrenz schläft keineswegs und von LumaLabs, dem Unternehmen hinter der Video-KI Dream Machine gibt es ebenfalls Neues. Ganz ähnlich zu Runway wurde ein eigenes Bild-Modell mit dem Namen Photon vorgestellt und mit Dream Machine 1.6 ein komplett neu gedachtes System für kreative Köpfe mit jeder Menge neuer Funktionen wie Start und End Frames, konsistente Charaktere mit nur einem Referenzbild, Stilmischungen und einer neuen Brainstorm Funktion. 

LumaLabs scheint hier Runway also keineswegs das Feld zu überlassen und im Gegensatz zu Frames, das ja bis jetzt nur geteased wird ist Dream Machine 1.6 mit allen neuen Features ab sofort verfügbar. 

🥇 OpenAI und Google kämpfen um Platz 1

Die beiden KI-Unternehmen liefern sich aktuell einen heftigen Schlagabtausch mit den neuesten Modellen. Nachdem Google mit einer experimentellen Version von Gemini in der Chatbot-Arena alle GPT-Modelle schlagen konnte, legte OpenAI schnell nach und verbesserte das GPT4o-Modell, sodass man sich die Spitzenposition zurückholen konnte. Dann dauerte es aber wieder keine 24 Stunden, bis Google ein anderes experimentelles Gemini-Modell aus dem Hut gezaubert hat, das wiederum besser als das neue GPT4o-Modell war.

Fairerweise muss man dazu sagen, dass die Gemini-Modelle nur über AI Studio als Teil der API genutzt werden können – zumindest Stand jetzt – und nicht wie das neue GPT4o-Modell in einem ganz normalen Chatbot. Andererseits kann man davon ausgehen, dass es sich eben immer noch nicht um das finale Gemini 2.0 Modell handelt, von dem wir ja vermuten, dass es noch dieses Jahr in den Gemini-Chatbot kommen wird. 

Fraglich ist auch, wie wichtig diese paar Punkte Unterschied in einem nicht immer 100% aussagekräftigen Leaderboard wirklich sind und ob das für uns als User überhaupt Vorteile hat. Vielleicht lassen sich OpenAI und Google hier auch zu einem Schlagabtausch hinreißen und verlieren wichtigere Entwicklungen ein bisschen aus den Augen. Zum Beispiel bei Anthropic. 

💻 Claude Model Context Protocol

Der Konzern hinter dem Claude Chatbot hat nämlich neben dem kleinen Update für das Sonnet 3.5 Modell mehr Schlagzeilen mit neuen Tools und Anwendungen gemacht, egal ob Artifacts, Computer Use oder Visual PDFs. Jetzt hat Anthropic schon wieder etwas neues vorgestellt, das sogenannte Model Context Protocol oder kurz MCP. Mit diesem neuen Protokoll soll es relativ einfach sein, Claude Zugriff auf andere APIs und Programme zu geben. 

In einem kurzen Demovideo zeigt Alex Albert von Anthropic beispielsweise, wie er im Claude Chatbot eine Demo-HTML-Datei erstellt und Claude sich dann direkt aus dem Chat mit Github verbindet, ein Repository anlegt und ein Pull Request anlegt. Alles mit einem Prompt getriggert und vollautomatisch erledigt. Diese Art von Schnittstelle zwischen Chatbots und den Anwendungen und Programmen, in denen wir die Ergebnisse dann wirklich nutzen wollen, ist definitiv interessant und ein Schritt in die richtige Richtung. 

🖼️ ComfyUI Apps in Beta

Nachdem die Ankündigung schon vor einer Weile kam, werden jetzt die ersten Accounts für die neue Beta-Version der ComfyUI Mac und Windows Apps freigeschaltet. ComfyUI bietet im Prinzip die beste Oberfläche, um vor allem mit Bild-KI-Modellen lokal zu arbeiten und viele Einstellungen zu nutzen, wie beispielsweise Größe und Format der Bilder. Auch wenn das Programm auf den ersten Blick sehr abschreckend aussieht, muss man sagen: So einfach war es noch nie Bilder mit KI lokal auf dem eigenen Rechner zu erstellen – sofern man denn die Leistung dafür hat. 

ComfyUI werden wir Euch bald in einem eigenen Video genauer vorstellen und ein einsteigerfreundliches Tutorial machen, sodass ihr das einfach mal selbst ausprobieren könnt.

Autor

  • Timothy Meixner

    Timothy Meixner ist Mitgründer und Geschäftsführer der Meixner & Ruof UG. Als KI- und Office-Experte betreibt er zusammen mit Johannes Ruof den erfolgreichen YouTube-Kanal Digitale Profis (80.000+ Abonnent:innen).

    Alle Beiträge ansehen
Nach oben scrollen