Melde Dich für unseren Newsletter an und erhalte alle wichtigen News direkt in dein Postfach!
Mozilla revolutioniert den Zugang zu Open-Source KI-Modellen, GPT-5 bekommt ein Erscheinungsdatum, Claude hat mit Projects jetzt eine Antwort auf Custom GPTs und auch Google stellt beeindruckende Neuerungen im KI-Bereich vor.
📰 Claude Projects
Nur kurze Zeit nach dem Release des neuen Claude 3.5 Sonnet Modells und der Artifacts-Funktion, die wir für Euch ja schon getestet haben, hat Anthropic schon wieder etwas Neues für uns. Projects heißt das Feature und es erlaubt uns dem Claude Chatbot Dateien als Wissensgrundlage zur Verfügung zu stellen und so quasi an einem „Projekt“ mit der KI zu arbeiten.
Neben den hochgeladenen Dateien können wir auch weitere Anweisungen an den Chatbot geben, wie er antworten oder sich verhalten soll. Zusammengefasst kann man eigentlich sagen: Claude hat jetzt auch Custom GPTs. Verfügbar ist das aktuell nur für Pro und Team User, also diejenigen mit einem bezahlten Abo für Claude.
🖥️ Gemini Nano kommt in den Chrome Browser
Google holt langsam aber sicher auf im KI-Rennen. Jetzt sind erste Videos von Anwendungen einer Gemini Nano Integration in Google Chrome aufgetaucht, die vermutlich in einer zukünftigen Version des Browsers Standard werden soll.
This is fast. Chrome running Gemini locally on my laptop. 2 lines of code. pic.twitter.com/R8twlDbUD2
— Morten Just (@mortenjust) June 24, 2024
Das kleine Nano-Modell läuft dabei komplett im Browser und funktioniert sogar offline – es werden also keinerlei Daten an Google geschickt. Die Geschwindigkeit, in der das Modell im Demovideo die Antworten erzeugt ist, beeindruckend – es wird quasi ohne Verzögerung Text erzeugt – wir sind schon sehr gespannt, wann das für alle verfügbar sein wird.
🤖 Llamafile von Mozilla demokratisiert KI
Mozilla, das Unternehmen, dass viele vermutlich vom Firefox Browser kennen und das seit Jahren ein Grundpfeiler der Open Source Community im Web ist, hat ein neues Projekt vorgestellt, das das Potenzial hat, KI wirklich zu demokratisieren und vor allem Open Source Modelle einfach zugänglich zu machen.
Llamafile heißt das neue Tool, das ohne Euch mit technischen Details zu langweilen, aus den öffentlich verfügbaren Code-Dateien der Open Source Modelle ganz einfach eine ausführbare Datei macht, die auf sechs Betriebssystemen, unter anderem natürlich Windows, Mac und Linux ohne Installation gestartet werden kann und es so ermöglicht mit diesen Sprachmodellen offline und mit maximaler Privatsphäre zu chatten.
Das an sich ist schon eine super Sache, aber es kommt noch besser. Das Mozilla-Team hat es durch einige clevere Programmiertricks geschafft, dass die Modelle viel besser und schneller auch auf normalen CPUs, also Prozessoren laufen und man keine teuren Grafikkarten braucht.
In einem Vortrag zum neuen Tool hat Justine Tunney erklärt, dass man mit einer 350 Dollar CPU und ein bisschen Arbeitsspeicher, den man auch günstig bekommt, Frontier Models, also wirklich die aktuellen Open Source Spitzenmodelle lokal verwenden kann – ohne Installation.
Und Stephen Hood, der Open Source AI Lead von Mozilla hat schon angeteasert, dass es durch weitere Projekte des Unternehmens vielleicht bald möglich sein könnte, mit nur einem Raspberry Pi 5 auch mit eigenen Dateien im Chat zu arbeiten und so wirklich persönliche, effektive KI zu kleinsten Preisen anonym zu nutzen.
Man kann Llamafile schon verwenden, und für diejenigen, die es direkt ausprobieren möchten, haben wir hier den Link zum GitHub Repo. Wir werden dazu bestimmt in der Zukunft ein ausführliches Tutorial auf dem Kanal hochladen. Es ist ein extrem spannendes Thema und wenn das Projekt die Versprechen halten kann, dann ist das wirklich ein absoluter GameChanger für die Open Source Community im Bereich Künstliche Intelligenz.
🗓️ GPT-5 kommt erst Ende 2025
In einem Interview mit Mira Murati von OpenAI haben wir möglicherweise einen Hinweis auf das Release-Datum von GPT-5 also dem neuen Frontier-Modell bekommen – und es wird wohl noch eine ganze Weile dauern. Murati hat zwar viel Leistung versprochen und gesagt GPT-3 hatte die Intelligenz eines Kleinkinds, GPT-4 war ein schlauer Highschool Schüler und GPT-5 wird für spezielle Anwendungen in etwa so intelligent sein wie ein promovierter Doktor– aber auf die Nachfrage des Reporters, wann das denn kommen wird mit einem eher verhaltenen ca. In anderthalb Jahren geantwortet.
Das wäre dann erst Ende 2025 und es kann natürlich auch gut sein, dass das Modell diese Trainingszeit eben auch braucht. Wir wären aber mittlerweile auch nicht mehr überrascht, wenn Muratis Chef Sam Altman nächste Woche wieder Gerüchte streut, dass das neue Modell in den Startlöchern steht.
🔇 ChatGPT Voice Update verzögert sich
Aber nicht nur GPT-5 dauert länger als erwartet – in einem neuen Update hat OpenAI auch bekannt gegeben, dass die neue Voice-Funktion, auf die alle gespannt warten, noch etwas auf sich warten lassen wird. Ursprünglich war ein Alpha-Test im Juni geplant, der jetzt aber schon nach hinten geschoben wurde. Und für alle User soll die neue Stimme erst im Herbst verfügbar werden – wenn überhaupt, denn auch dieses Datum wurde direkt nochmal relativiert damit, dass das genaue Release von Sicherheits- und Zuverlässigkeits-Standards abhängt, die das Unternehmen erfüllen möchte.
Gleichzeitig sind jetzt aber erste Screenshots von Usern der App aufgetaucht, die zum Alpha-Test eingeladen wurden – aber wirklich verwenden konnte die neue Voice-Funktion noch niemand von ihnen. Wir halten Euch natürlich auf dem Laufenden, wenn es etwas Neues gibt.
⌨️ ChatGPT Mac App jetzt für alle verfügbar
Auf Voice müssen wir also noch warten, es gibt aber auch eine gute Nachricht. Die Mac App von ChatGPT ist jetzt für alle Plus-User verfügbar und kann verwendet werden. Die App bietet die Möglichkeit, ChatGPT mit einem Tastaturkürzel jederzeit schnell zu öffnen und direkt in der App Screenshots zu machen und den Bot dazu zu befragen.
The ChatGPT desktop app for macOS is now available for all users.
— OpenAI (@OpenAI) June 25, 2024
Get faster access to ChatGPT to chat about email, screenshots, and anything on your screen with the Option + Space shortcut: https://t.co/2rEx3PmMqg pic.twitter.com/x9sT8AnjDm
Auch hier steht allerdings noch die beste Funktion aus, die beim OpenAI Event noch gezeigt wurde. Wir können immer noch nicht unseren Bildschirm-Inhalt an ChatGPT streamen und so direkt mit dem Chatbot zusammen arbeiten. Hier gibt es leider auch aktuell überhaupt keine Infos dazu, wann das funktionieren wird.
✏️ Figma bekommt KI-Funktionen
Die Design-Software Figma hat in einem neuen Update jede Menge KI-Funktionen bekommen, die das Erstellen und Bearbeiten von Prototypen erleichtern sollen. Im Demovideo sieht das auf jeden Fall beeindruckend aus.
Die KI kann ganze Designs auf Grundlage nur eines Prompts entwerfen, aus statischen Entwürfen interaktive Prototypen generieren und langweilige Platzhaltertexte mit kontextuell passendem Demo-Inhalt ersetzen, um Designs noch realistischer zu machen.
📊 Google stellt Gemma 2 Update vor
Google hat heute bei der Google IO in Berlin eine neue Version von Gemma vorgestellt, die laut Twitter ab heute für Wissenschaftler und Entwickler verfügbar sein soll. Das neue Modell gibt es in zwei Varianten. Einmal mit 9 und einmal 27 Milliarden Parametern und es soll sehr viel effizienter sein als der Vorgänger.
Wir konnten das Modell heute noch nicht für Euch ausprobieren, gehen aber davon aus, dass es nächste Woche dazu mehr Informationen geben wird. Auf Reddit haben einige User gepostet, dass sie die neue Variante auch schon kurzzeitig in der Chatbot-Arena auswählen konnten, aber bei uns war es zum Zeitpunkt der Aufnahme noch nicht verfügbar.
📽️ Toys’R’Us erzeugt Werbespot mit SORA
Nachdem auch wir ja regelmäßig begeistert von den neuen Fähigkeiten der Video-KI-Tools sind, hat die Spielzeugwarenkette Toys-R-Us jetzt mit SORA von OpenAI einen kompletten Werbespot erstellt und veröffentlicht. Und ich muss ganz ehrlich sein, dass ich selten so etwas Seelenloses gesehen habe wie diesen Clip.
Ich bin aufgrund meiner Arbeit dem ganzen KI-Thema gegenüber natürlich sehr offen und auch in den kreativen Bereichen finde ich den Einsatz von KI vermutlich weniger verwerflich als manch anderer, aber dieses Video hat die Welt nicht gebraucht. Vielleicht ist das jetzt auch nur meine Meinung, aber das war einfach nichts.
Es wirkt auf mich extrem kühl, steril und der Charme ist einfach nicht vorhanden. Insbesondere bei einem „emotionalen“ Thema wie Spielzeug würde man meinen, dass es vielleicht mehr Sinn machen würde, tatsächlich auch Menschen einzusetzen, deren Lächeln man irgendwie als echt wahrnimmt. Und wenn man darauf nicht zurückgreifen und unbedingt KI verwenden möchte, könnte man es immer noch als Zeichentrickclip machen. Da wäre die Diskrepanz zum echten vielleicht nicht so präsent.