Melde Dich für unseren Newsletter an und erhalte alle wichtigen News direkt in dein Postfach!
Google dominiert die KI-News und stiehlt OpenAI quasi an allen Fronten die Show und das während des 12 Days of OpenAI Adventskalenders, ein neues, cooles Tool ermöglicht den Vergleich von KI-Modellen in der Webentwicklung und es gibt eine ganze Reihe von Neuerungen bei NotebookLM.
🆕 Google Announcements
Google hat OpenAI kurz vor Weihnachten ein bisschen die Suppe versalzen. Mitten in den 12 Days of OpenAI, dem “Adventskalender” des ChatGPT Konzerns, hat Google jede Menge neue Ankündigungen gemacht, die es auf jeden Fall in sich haben.
Mit Gemini 2.0 Flash wurde die erste experimentelle Version der nächsten Modell-Generation jetzt offiziell veröffentlicht und überzeugt durch starke Antworte in rasend schneller Zeit. Aber nicht nur das: Es gibt neue Ansätze für KI-Agenten von Google und sogar eine Live-Unterhaltung über die Inhalte auf unserem Bildschirm ist jetzt direkt und kostenlos möglich.
Alle Ankündigungen von Google haben wir übrigens detailliert mit vielen Beispiele in einem eigenen Video für euch zusammengefasst, den Link dazu gibts natürlich in der Beschreibung.
🎄 OpenAI Adventskalender
Trotzdem gab es natürlich auch wieder Neues von OpenAI, die letzten Tage haben auch hier wieder Ankündigungen geliefert. Nach der Vorstellung von SORA wurde die Canvas Funktion jetzt für alle User auch ohne Plus-Plan freigeschalten. Laut ersten Berichten gibt es aber aktuell noch ziemlich strikte Limits für die Nutzung. Außerdem wurde die Integration von ChatGPT in Apple Intelligence vorgestellt, natürlich aber nicht bei uns. Relativ interessant war die Vorstellung der Live-Video Funktion mit dem Sprachmodus von ChatGPT, aber hier können wir das aktuell nicht nutzen und Google hat da ja schon vorgelegt und einen Tag früher diese Funktion möglich gemacht.
Am Freitag wurden Projekte vorgestellt, und damit schönerweise eine Funktion, die auch wir verwenden können. In einem Projekt in ChatGPT kann man Unterhaltungen, Informationen und Dateien gebündelt speichern, wenn man beispielsweise an etwas bestimmten arbeitet, eigentlich wirklich eine nützliche Funktion. Hier muss man allerdings sagen wirklich innovativ ist das auch nicht, denn Anthropics Chatbot Claude hat dieses Feature schon seit Monaten.
Und dann hatten wir gestern noch den Search Day von OpenAI, die Websuche ist jetzt für alle verfügbar und hat nochmals Updates, wie personalisierte Suchen bekommen, die dank Informationen, die ChatGPT über uns hat noch passendere Ergebnisse liefern sollen. Wie gut das funktioniert wird sich zeigen müssen. Heute Abend wird es laut OpenAI einen Mini-Dev-Day geben wir rechnen also mit einer Reihe von Ankündigungen die weniger ChatGPT und mehr die API-Nutzung betreffen werden.
📹 Google Veo 2
Während wir noch dabei sind SORA, die Video-KI von OpenAI zu testen, hat Google aber schon wieder zugeschlagen und mit VEO 2 die neue Version der eigenen Lösung für Video vorgestellt. Leider können wir – wie SORA aktuell auch – VEO 2 in Deutschland nicht direkt verwenden, aber wir haben einige Beispiele von seriösen Quellen mit Zugriff gesehen und müssen sagen, wir sind absolut beeindruckt. Ich blende hier einfach mal ein paar Videos ein und da sieht man schon, wie gut diese neue KI wirklich ist.
Google selbst hat auch ein interessantes Benchmark im Blogartikel aufgelistet, nämlich den direkten Vergleich der Outputs mit den führenden Konkurrenten – unter anderem auch SORA – und hier wurden einfach die Meinungen der menschlichen Testerinnen und Tester bewertet, sodass man sieht welche KI am meisten überzeugen konnte. Und hier hat VEO eigentlich überall die Nase vorn. Natürlich muss man sagen: Diese “Benchmarks” hat natürlich Google selbst erhoben und wie objektiv das dann ist, muss man sich schon überlegen. Aber auch die Beispiele, die wir jetzt seit gestern gesehen haben legen schon nahe, dass es sich hierbei um einen Top-Anwärter für die beste Video-KI handelt.
Übrigens: VEO unterstützt Video-Outputs mit bis zu 4k Auflösung – absolutes Alleinstellungsmerkmal, bei OpenAI bekommt man schon Full HD nur mit dem 200 Dollar Plan.
🖼️ Google Imagen 3 Update
Profitieren kann VEO übrigens sicherlich auch von der neuesten Version von Imagen 3 – Googles Bild-KI. Hier konnten wir tatsächlich mit einem VPN schon selbst darauf zugreifen, und ein paar Tests machen und wir sind wirklich beeindruckt. Die Bilder, die die leicht verbesserte Imagen 3 Version erstellt sehen wirklich top aus. Und wenn man jetzt bedenkt, dass VEO für die Videoerstellung unter anderem einen Text zu Bild zu Video Workflow verwendet, dann wird auch klar, warum viele der Videos so gut aussehen. Google macht OpenAI also das Leben an wirklich vielen Fronten schwer und wir sind gespannt, ob wir im Bereich Bild noch eine Antwort in Form von Dall-E 4 bekommen werden oder nicht.
🤖 Grok für alle umsonst
XAI hat den hauseigenen Chatbot Grok jetzt für alle User kostenlos gemacht. Auch ohne Premiumprofil bei X kann man jetzt die KI nutzen und sowohl chatten als auch Bilder erstellen lassen. Vor allem die Bilderzeugung scheint aktuell richtig stark zu sein und in unseren Versuchen wurden vor allem für realistische Bilder sehr starke Ergebnisse erzielt. Aktuell kann man keine Modelle mehr auswählen es ist also die Frage, ob die Bilder jetzt schon von der eigenen KI Aurora erzeugt werden – es sieht fast so aus. Egal, was man von X oder Elon Musk hält: Jetzt ist die Chance sich mal selbst ein Bild von den Fähigkeiten von Grok zu machen.
📃 Google Canvas für Deep Research
Eine der coolsten Nachrichten aus unserem Google Video war Deep Research, eine neue Funktion im Gemini Chatbot, die es der KI erlaubt nicht einfach nur schnell eine Antwort zu geben, sondern detailliert zu recherchieren. Dabei werden nicht selten bis zu 100 Websites nach aktuellen und belegbaren Informationen für die Anfrage durchsucht, das haben wir auch schon selbst erfolgreich ausprobiert. Aber Google arbeitet wohl schon daran, diese Funktion nochmals besser zu machen, denn es sind erste Screenshots eines Canvas für Deep Research aufgetaucht. Mit Canvas könnte man die recherchierten Informationen nochmals selbst berarbeiten und mit Gemini weiter kollaborativ zusammenarbeiten, um noch bessere Ergebnisse zu erzielen.
Es ist eine Art Editor zu sehen, mit dem man auch kinderleicht mit Überschriften und Formatierung arbeiten kann, sowie, was wir sehr interessant finden eine Synch with Drive Funktion. Wenn man die Dokumente so also direkt mit dem eigenen Cloud Speicher synchronisieren kann, fällt nochmal ein Zwischenschritt weg. Da Google ja sowohl den Gemini Bot als auch Cloud kontrolliert wäre eine solche Integration durchaus machbar und ein wichtiger Schritt für das Vereinfachen von Recherche mit KI.
🏟️ WebDev Arena
Über die Chatbot Arena haben wir hier auf dem Kanal ja schon öfter berichtet, vor allem, wenn es um eine schnelle Einordnung von neuen Modellen ging, die dort von Usern bewertet werden können. Seit einiger Zeit gibt es ein neues Projekt des Chatbot Arena Anbieters: die WebDev Arena. Mit diesem coolen Tool kann man verschiedene KI-Modelle im Bereich Webentwicklung gegeneinander antreten lassen und anonym bewerten, welches Modell die besten Ergebnisse liefert.
Jetzt sind die ersten belastbaren Ergebnisse aus dem Web Developer Battle der KIs da und mit einem klaren Sieger: Anthropics aktuelles Sonnet-Modell schlägt die Konkurrenz (ohne o1) hier um Längen mit ca. 200 Punkten Vorsprung. Und auch in unseren Versuchen muss ich sagen: die Prototypen, die wir von Sonnet bekommen haben waren immer die klaren Sieger.
Aber probiert das Tool auf jeden Fall mal aus. Man braucht keinen Account sondern kann einfach sagen, was man gerne hätte und schon liefern sich zwei zufällig gewählte Modelle einen Wettstreit. Macht auf jeden Fall eine Menge Spaß!
📒 NotebookLM Updates
Unser aller Lieblings-KI-Tool NotebookLM bekommt schon wieder neue Updates – und die haben es absolut in sich. Leider haben wir hier noch keinen Zugriff auf alle angekündigten Neuerungen, aber wir zeigen euch trotzdem schonmal, was bald möglich sein wird.
Zunächst einmal wurde die Maximalzahl an Quellen pro Notebook von 50 auf 300 erhöht – das funktioniert auch bei uns schon. Und das ist schon mega beeindruckend, wenn man überlegt, man kann jetzt bis zu 300 Links, PDFs oder YouTube Videos in einem Notebook verwenden und Fragen dazu stellen, neues Material generieren oder einen coolen Podcast erstellen.
Apropos Podcast: Hier wird es bald möglich sein, einzusteigen, also die Unterhaltung zu unterbrechen und eine Nachfrage zu stellen, die dann von den Hosts beantwortet wird – finden wir wirklich spannend und können kaum erwarten es auszuprobieren. Außerdem wird die Oberfläche angepasst und bekommt ein neues Layout, das sich immer an die aktuellen Bedürfnisse anpassen soll und einfach moderner aussieht. Auch das ist bei uns noch nicht live, aber laut Google selbst erfolgt der Rollout auch schrittweise.
Und dann noch eine sehr interessante Ankündigung: es wird wohl einen NotebookLM Plus Plan geben, der sich laut Google aber explizit an Unternehmen, Unis und andere Organisationen richten wird. Preise sind dafür aktuell nicht bekannt und es gibt noch wenige Infos, was dieser Plan bieten wird außer höhere Limits und die etwas kryptsiche Aussage “Zugriff auf Premiumfeatures”. Ab Anfang 2025 soll NotebookLM Plus auch im Google One AI Premium Plan enthalten sein, vielleicht erfahren wir spätestens da dann mehr.
⌛ Scaling Test Time bei Meta und Llama
Nur 10 Tage nach dem offiziellen Release des vollständigen o1-Modells von OpenAI gibt es einen vielversprechenden Ansatz im Open Source Bereich mit einer Variante von Llama 1B, die eine ähnliche Technik wie die Reasoner in ChatGPT nutzt. Scaling Test Time Compute heißt die Open Source Technik, die jetzt von Huggingface umgesetzt wurde. Auch hier wird dem Modell “mehr Zeit zum denken” gegeben, sodass also nicht direkt eine Antwort generiert wird, sondern das kleine Llama Modell erst einmal einen eigenen Gedankenweg erschafft.
Durch diese Optimierung konnte das Modell die 8B Variante, also ein Modell mit der achtfachen Zahl an Parametern übertreffen. Eine unglaubliche Leistung, die auch zeigt, dass der Open Source Bereich keineswegs durch die neuen Reasoning-Modelle abgehängt wird.