Die KI-News der Woche vom 18.07.2024

Die KI-News der Woche vom 18.07.2024

Melde Dich für unseren Newsletter an und erhalte alle wichtigen News direkt in dein Postfach!

Apple, Nvidia und Anthropic haben ohne Einverständnis der Creator bei YouTube Videos und Transkripte für KI-Training geklaut, wir bekommen wahrscheinlich schon nächste Woche das wahrscheinlich beste und größte Open Source Modell aller Zeiten und bei OpenAI gibt es wohl einige geheime Projekte.

Alle wichtigen Nachrichten aus der KI Welt haben wir wie immer kurz und knapp zusammengefasst in unserem KI-News-Update.  

🦙 Llama 3 405B erscheint nächste Woche

Wir können mit Spannung in die nächste Woche gehen: Die Gerüchte und Vermtutungen verdichten sich, dass wir die nächste Version von Llama 3 von Meta – das große 405B Modell in den kommenden Tagen vorgestellt bekommen. Nachdem schon die kleinen Varianten des Modells extrem gut performen ist die Erwartungshaltung an das Unternehmen hoch und wir sind super gespannt, wie gut das neue Modell sein wird.  

Gleichzeitig wird es interessant zu sehen, ob auch die Top-Version der Llama 3 Familie den Open Source Status behält – darüber wurde im Vorfeld viel spekuliert, wir hoffen, das ist der Fall, denn es wäre wirklich schade, wenn auch Meta sich jetzt entscheidet, nur noch die Einsteigerversionen frei verfügbar zu machen. Denn wenn die 405B Variante ihre Benchmark Versprechungen hält, gäbe es auf einmal ein Open Source Modell mit einer Leistung, die vergleichbar mit GPT-4o ist.  

Leider gibt es in Bezug auf Meta noch einen kleinen Wermutstropfen: Laut Axios hat sich das Unternehmen dazu entschieden, kommende multimodale Modelle bis auf weiteres nicht in der EU zu veröffentlichen. Das könnte schon das jetzt kommende Llama-Modell betreffen. Interessanterweise geht es dabei nicht um den AI Act, also das KI-Gesetz der EU, vielmehr stört Meta sich an den Datenschutzbedingungen durch die DSGVO – mal schauen, was das noch wird. 

🪜 5 Stufen Plan von OpenAI

Laut unbekannten Quellen von Bloomberg gibt es bei der ChatGPT Firma einen 5-Stufen-Plan, nach dem sich KI weiterentwickeln wird. Der angebliche Plan sieht in etwa so aus und wir sehen, dass wir uns aktuell noch auf der ersten Stufe der Chatbots befinden, und dann in inkrementellen Schritten bis zur Stufe 5 kommen, in der eine KI anscheinend die komplette Arbeit einer ganzen Organisation vollständig erledigen kann. Das klingt ziemlich Science-Fiction mäßig und ist es wohl aktuell auch noch.

Der Plan wurde so zwar nicht offiziell bestätigt, aber es scheint Hand und Fuß zu haben, denn in anderen News von OpenAI spricht das Unternehmen ja immer wieder von der nächsten Stufe als KIs die Probleme ähnlich wie Menschen lösen können und das würde mit diesem Plan übereinstimmen, auch hier ist die Stufe 2 die sogenannten “Reasoners”, die genau diese Fähigkeiten haben sollen.

🍓 OpenAI: Project Strawberry

Hinter dem etwas merkwürdigen Namen Strawberry versteckt sich laut Reuters wohl ein aktuell noch „geheimes“ Projekt von OpenAI, das die nächste Stufe von KI – die eben angesprochenen Reasoners – einläuten soll.

Anscheinend ist Project Strawberry der Nachfolger oder die Weiterentwicklung des schon einmal durch die Medien gegangenen Q-Star Projekts und es handelt sich wohl um eine bahnbrechende neue Art von KI-Modellen, die in internen Demos für viel Begeisterung und Aufsehen gesorgt haben durch ihre Fähigkeit Probleme wie ein Mensch zu lösen.

Bei aller Begeisterung über diese möglichen Fortschritte bleibt aber abzuwarten, was dabei wirklich herauskommt. Es gab auch schon Stimmen innerhalb der KI-Szene, die sagen, nur weil ein Modell ein spezielles Problem wie ein Mensch lösen kann – Mathematik zum Beispiel – macht es das nicht wirklich schlauer, wenn es in anderen Bereichen versagt. Und auch Mira Murati von OpenAI war mit den Formulierungen in diesem Bereich in letzter Zeit vorsichtig. 

A Conversation with Mira Murati, CTO of OpenAI (Full Interview)

Hier sieht man zum Beispiel direkt die Begrenzung auf „specific tasks” und auch die Timeline “over the next few years” deutet an, dass wir vermutlich nicht noch diese Woche mit einem Riesen Breakthrough rechnen können. Wir sind trotzdem gespannt, was die neue Stufe dann am Ende mit sich bringt. 

📽️ Apple, Nvidia und Anthropic klauen bei YouTube

Es gab viel Aufregung um Enthüllungen, die belegen, dass sowohl Apple als auch Nvidia und Anthropic wohl ohne Einverstädnis von YouTube oder der Creator Tausende YouTube-Videos und Transkripte für das Training der eigenen KIs verwendet haben – insgesamt fast 200.000 Videos von knapp 50.000 Kanälen. Die Daten waren dabei ein Teil eines größeren Trainings-Sets mit dem Namen The Pile, das auch weitere Datenquellen enthält.

Die Reaktion der großen Firmen war jetzt ein simples: Die Nutzungsbedingungen von YouTube betreffen nur die Plattform selbst, die Daten in The Pile sind etwas anderes – also wurde die Verantwortung quasi weitergegeben. Ob sich dieser Konflikt so einfach lösen lassen wird, bleibt spannend, denn es sind auch sehr große Creator wie Mr. Beast oder Marques Brownlee betroffen, die nicht begeistert von diesem Ablauf sind.

📱 Claude jetzt auch als Android-App

Nach relativ langer Wartezeit ist es endlich so weit: Claude ist jetzt auch als Android App verfügbar. Nachdem schon im Mai dieses Jahres die iOS-Version veröffentlicht wurde, mit dem Hinweis, dass Android “bald” folgt, hat es dann doch noch eine ganze Weile gedauert.

Mit dem jetzt aktuell noch besseren neuen Sonnet Modell kommen ab sofort alle User in den Genuss Claude auch auf dem Smartphone zu nutzen. Ähnlich wie die Variante für iPhones bringt auch die Android-App keine wirklich neuen Features für den Chatbot mit – es ist aber natürlich trotzdem ein willkommenes Update. 

📼 Neue Videos von Sora

OpenAI hat in den letzten Tage eine ganze Reihe von Sora Showcase Videos auf dem eigenen YouTube-Kanal hochgeladen. Es handelt sich dabei aber eigentlich ausschließlich um künstlerische Projekte. Das soll nicht negativ klingen, aber es überspielt natürlich ganz gut die ein oder andere kleine Ungereimtheit, die die Video-KI noch mitbringt.

Tim Fu · Sora Showcase

Es wäre wirklich mal spannend mehr Projekte zu sehen, die sich mit realistischem Video beschäftigen und nicht alle paar Sekunden die Szenerie wechseln, um objektiv die Fähigkeiten von Sora besser beurteilen zu können. Auch wenn anscheinend doch einige Testpersonen jetzt Zugriff auf das Tool bekommen haben, gibt es über eine Veröffentlichung immer noch keine neuen Informationen. 

🤖 Neue Mistral Modelle: Mathstral und Codestral Mamba

Das französische KI-Unternehmen Mistral hat zwei neue, spezialisierte Modelle vorgestellt. Es handelt sich dabei um Mathstral, wie der Name unschwer erkennen lässt, ein Modell, das sich besonders gut für mathematische Probleme einsetzen lässt und das zeigen auch die dazu veröffentlichten Benchmarks deutlich. Das andere Modell trägt den Namen Codestral Mamba.

Ein Codestral Modell gab es ja bereits, das gut im Programmieren war, die neue Variante ist jetzt eine andere Art von Sprachmodell. Die Mamba Architektur unterscheidet sich von den üblicherweise verwendeten Transformer-Modellen durch eine eher lineare Herangehensweise. Mistral sagt, dass dadurch auch in dem kleineren Codestral Mamba Modell viel Potenzial als lokaler Assistent zur Coding-Unterstützung schlummert. 

⚔️ Neue Modelle von OpenAI und Google in der Chatbot-Arena

Wir haben in einem eigenen Video, das im nächsten Absatz natürlich verlinkt ist, schon darüber gesprochen, dass vier neue, bisher unbekannte Modelle als Tests in der Chatbot-Arena aufgetaucht sind. Upcoming-gpt-mini, eureka-chatbot und column-r und u. Der größte Aufreger war natürlich das gpt-mini Modell und viele Indizien sprechen dafür, dass es wirklich ein neues Small Language Model von OpenAI sein könnte, das vielleicht auch bald in ChatGPT verfügbar wird.

GPT-Mini - OpenAI testet neue KI | Ist upcoming-gpt-mini das neue, schnellere ChatGPT?

Eureka scheint wohl von Google zu stammen, möglicherweise ein Teil der Gemma 2 Familie und die Column Modelle sind aller Wahrscheinlichkeit nach spezialisierte Code-Modelle von Cohere, der Firma hinter Command R Plus, die sehr gute Open Source Modelle im Geschäftskontext macht.

🤖 Neue Funktionen bei Google Gemini

Google arbeitet offensichtlich mit Hochdruck an neuen Features für den eigenen Chatbot Gemini, die jetzt veröffentlicht werden sollen. Die Frage ist nur: Wie viel – wenn überhaupt – davon wieder bei uns in Deutschland ankommen wird. Es ist unter anderem die Rede von Imagen3 als neue Bild-KI – wir können hier die Funktion ja aber gar nicht nutzen.

Außerdem sollen die Gems – quasi die Custom GPTs von Gemini – vorgestellt werden und mehr Personalisierung durch eine Art Gedächtnis der KI steht im Raum.

Autor

  • Timothy Meixner

    Timothy Meixner ist Mitgründer und Geschäftsführer der Meixner & Ruof UG. Als KI- und Office-Experte betreibt er zusammen mit Johannes Ruof den erfolgreichen YouTube-Kanal Digitale Profis (80.000+ Abonnent:innen).

    Alle Beiträge ansehen
Nach oben scrollen