Die KI-News der Woche vom 18.11.2024

Die KI-News der Woche vom 18.11.2024

Melde Dich für unseren Newsletter an und erhalte alle wichtigen News direkt in dein Postfach!

OpenAI veröffentlicht SORA vielleicht noch in diesem Monat, Suno bekommt ein beeindruckendes Update, ChatGPT ist nicht mehr der beste Chatbot und wir kriegen wahrscheinlich schon bald die nächste KI Suchmaschine. Das und vieles mehr, gibt es diese Woche in unserem KI Update.

📹 Sora-Release schon in zwei Wochen?

Gerüchten zufolge könnte OpenAI bereits in dieser oder nächster Woche, die erste Version von SORA veröffentlichen – zumindest wenn man Runway-Mitgründer Cristobal Valenzuela glauben darf. Ob wir dann alle direkt Zugriff darauf bekommen oder es sich um ein zusätzliches Tool mit eigenem Preis handelt, können wir momentan noch nicht sicher sagen, aber dass es höchste Zeit wird, dass Sora erscheint, ist allgemein bekannt.

Konkurrenzprodukte von Runway, Kling und Co sind stellenweise bereits in ihrer Beta-Version in der Lage „bessere“ Ergebnisse zu erzeugen und OpenAI hat seit der Ankündigung lediglich sehr abstrakte Videos, die von Künstlern erzeugt wurden auf dem eigenen YouTube-Kanal hochgeladen. Und da sind wir skeptisch, ob es tatsächlich mit den aktuellen Marktführern mithalten kann, aber lassen uns natürlich gerne eines Besseren belehren.  

🧠 Microsoft stellt KI Chatbots mit unendlichem Gedächtnis in Aussicht

In einem spannenden Interview hat der CEO von Microsoft AI Mustafa Suleyman über ein Problem der heutigen Chatbots gesprochen und direkt auch eine Lösung in Aussicht gestellt. Suleyman bezog sich auf den Fakt, dass bei der Interaktion mit Chatbots wir momentan immer in einer Art Session, also einer Sitzung mit dem Bot arbeiten.

Das zeigt sich daran, dass wenn wir beispielsweise über eine Information aus einem Gespräch von vor zwei Monaten mit der KI sprechen wollen, sie daran in der Regel keine Erinnerungen hat, da sie mit einem begrenzten Speicher bzw. Gedächtnis arbeitet. Microsoft arbeitet aktuell aber an Chatbots, die ein nahezu grenzenloses Gedächtnis verwenden können und somit nie etwas vergessen, sondern immer mehr in der Lage sind sich auf ihr Gegenüber, also den Nutzer einzustellen. Das soll laut Suleyman nicht nur dazu führen, dass es zu besseren Ergebnissen und Ausgaben kommt, sondern eben auch zu einer angenehmeren Nutzererfahrung, die den User dazu verleitet mehr Zeit in die Arbeit mit der KI zu investieren, da es sich in Zukunft lohnen wird und wir nicht ständig den Bot an bestimmte Fakten erinnern müssen.  

🔙 Greg Brockman zurück bei OpenAI   

Greg Brockman, einer der Mitgründer von OpenAI, ist nach seinem Sabbatical wieder zurück beim ChatGPT-Konzern. Nachdem auch bei der Ankündigung von Brockman, dass er eine Weile Pause macht, viele spekuliert hatten, ob er das Unternehmen wie viele andere Mitgründer und Manager verlässt, scheint das also jetzt nicht der Fall zu sein. Brockman ist nicht nur ein Entwickler und Treiber der frühen Innovationen von OpenAI, sondern auch einer der engsten Vertrauten von CEO Sam Altman. Nach dessen Fast-Kündigung war Brockman derjenige, der sofort dabei war, gemeinsam mit seinem Chef zu Microsoft zu wechseln. Mit ihm hat Altman jetzt also wieder einen starken Partner an seiner Seite, was in den doch personell ziemlich wilden Zeiten sicherlich hilfreich ist. 

🎶 Suno v4 kurz vor Release 

Die beliebte Musik-KI Suno steht wohl kurz vor dem Release der neuesten Version 4. In vielen Videos, die aktuell kursieren, werden bereits erste Songs vorgestellt, die sich wirklich beeindrucken anhören. Hier ein Beispiel.

Suno macht das ziemlich geschickt und baut durch die von ausgewählten Partnern erstellten Musikstücke richtig Spannung auf, ohne ein konkretes Release-Datum zu nennen. Aber es kann wirklich nicht mehr lange dauern, wir sind schon sehr gespannt! 

📱Gemini App für iOS verfügbar

Google hat jetzt endlich auch für iOS User die eigene KI Gemini als richtige Standalone App verfügbar gemacht und nicht mehr nur als Teil der Google-App. Mit der App kommen direkt einige neue Features mit, zum Beispiel der neue Live-Voice-Modus von Gemini, der in unseren ersten Tests auf jeden Fall eine richtig ernstzunehmende Alternative zum Advanced Voice Modus von ChatGPT zu sein scheint und direkt bei uns verfügbar ist. 

Wir beschäftigen uns aktuell relativ intensiv mit der neuen Gemini App und werden da sicherlich in naher Zukunft noch mehr dazu berichten! 

🤖 OpenAI Agents näher als gedacht?

Agenten, also KI-Programme, die selbständig auch mehrstufige Aufgaben erledigen können, das ist eigentlich so ein bisschen die nächste Stufe von KI, die viele sich wünschen. Anthropic hat mit dem Computer-Use Tool jetzt einen ersten Versuch gewagt, der zwar schon gut funktioniert, wenn auch langsam. Klar, dass OpenAI das nicht lange auf sich sitzen lassen konnte, und jetzt haben wir erste Informationen über den „Operator“, einen neuen KI-Agenten von OpenAI, der laut ersten Leaks bereits im Januar als Research Preview verfügbar gemacht werden soll. 

Welche Fähigkeiten der Operator dann genau hat, ist unklar, es wurden Andeutungen in die Richtung Browsing und Code schreiben gemacht und damit eigentlich die üblichen, relativ „leichten“ Anwendungen, da es sich eben um begrenzte Programme handelt, die die KI verwenden muss und noch nicht ein komplettes Computersystem mit unterschiedlichsten Apps und Möglichkeiten. 

Aber wir lassen uns gerne überraschen, auch ChatGPT hat ja als Research Preview angefangen, also vielleicht kommt hier auch wirklich das nächste große Ding von OpenAI. 

🔎 Grok bekommt eigene Internetsuche

Der X-AI Chatbot Grok hat seit seiner Veröffentlichung ja immer mal wieder mit dem Thema der Desinformation zu kämpfen. Zufälligerweise nach der Präsidentschaftswahl, scheint der Bot jetzt bald Zugriff auf eine Websuche inklusive Quellenangaben zu bekommen. Auf den ersten Screenshots sieht die Oberfläche recht ähnlich zu Perplexity oder auch ChatGPT Search aus und da die Firma momentan sehr stark investiert, sollte man auch auf diesen Chatbot in Zukunft ein Auge haben, da wir hier vermutlich schon bald einige Updates sehen werden. Sobald, die neue Suche dann verfügbar ist, werden wir mal ein umfangreiches KI-Suchmaschinenvideo für Euch machen, in dem wir Perplexity, GPT Search, Gemini und Co miteinander vergleichen.

🥇 Neues Gemini-Modell schlägt OpenAI

Große Aufregung in der Welt der Sprachmodelle diese Woche. An der Spitze der Leaderboards der Chatbot Arena steht kein OpenAI Modell mehr. Eine experimentelle Version von Google Gemini hat alle GPT-Modelle inklusive der o1-Familie von den vorderen Rängen verdrängt und sich auf Platz 1 gesetzt. Die Nachricht kommt nur wenige Tage, nachdem so ein bisschen darüber geredet wurde, ob Google beim Gemini 2 Modell nicht abliefern kann und deshalb noch nichts gelauncht wurde.  

Damit hat der OpenAI Konkurrent jetzt erst einmal ein paar Zweifel ausgeräumt. Das neue Modell kann im AI Studio von Google bereits verwendet werden. Ob es sich dabei jetzt aber um Gemini 2 oder eine Vorstufe davon handelt, können wir aktuell nicht sagen. Im Gemini Chatbot ist aktuell nur das alte 1.5 Pro Modell als beste Variante verfügbar. 

🥐 Neue Modelle bei Mistral

Auch beim europäischen Konzern Mistral gibt es aktuell viel Bewegung. Im Le Chat, also der ChatGPT Alternative des Unternehmens wurde die Modellauswahl abgeschafft, zugunsten einer automatischen Selektion des besten Modells und es gibt erste Gerüchte um ein neues, multimodales Modell, das bald verfügbar sein soll, mit Bilderkennung, Bilderstellung und sogar möglicherweise einer Canvas-Funktion, die auf einem Screenshot geleaked wurde.

Mistral hat mit seinen neuen Top-Modellen ja den Open Source Bereich verlassen, was einerseits schade ist, andererseits scheint der Konzern seitdem große Fortschritte zu machen und auch ein starkes Closed Source Modell aus Europa würde dem internationalen Wettbewerb definitiv nicht schaden. Wir drücken also die Daumen und hoffen, dass wir das neue Modell schon bald für Euch testen können. 

⌨️ ChatGPT für Coding

Die Mac App von ChatGPT hat ein sehr interessantes neues Feature bekommen. Die KI auf dem Mac kann sich jetzt Programme anschauen und dabei helfen, in diesen Programmen zu arbeiten. Aktuell sind das ausschließlich Apps zum Programmieren, nämlich Visual Studio, Xcode, Terminal und iTerm2. ChatGPT kann sich den Inhalt, zum Beispiel Code ansehen, analysieren und Vorschläge zur Verbesserung machen.

Das ist ein sehr interessanter Schritt in die Richtung, die App nicht nur als Chatbot, sondern direkte, integrierte Hilfe zu haben und ich hoffe, dass hier bald mehr Apps und mehr Zugriff folgen werden. Auch außerhalb von Coding, zum Beispiel im Bereich Design oder ganz einfach Texterstellung und Bearbeitung gibt es hier einfach jede Menge Potenzial. 

🖥️ ChatGPT App für Windows

Aber auch für Windows User gibt es gute Neuigkeiten, was die App betrifft. Nach der Beta-Phase ist die ChatGPT-App jetzt auch für Windows im Store für alle verfügbar. Es sind leider nicht direkt alle Features enthalten, gerade beispielsweise die gerade angesprochene Coding-Unterstützung fehlt noch, aber ich denke, dass OpenAI sehr bemüht sein wird, hier die Unterschiede möglichst schnell anzugleichen, sodass alle diesselbe Erfahrung mit der App haben können. 

Autor

  • Timothy Meixner

    Timothy Meixner ist Mitgründer und Geschäftsführer der Meixner & Ruof UG. Als KI- und Office-Experte betreibt er zusammen mit Johannes Ruof den erfolgreichen YouTube-Kanal Digitale Profis (80.000+ Abonnent:innen).

    Alle Beiträge ansehen
Nach oben scrollen