Melde Dich für unseren Newsletter an und erhalte alle wichtigen News direkt in dein Postfach!
OpenAI veröffentlicht eventuell schon sehr bald das finale o1-Modell in ChatGPT und integriert die Suchmaschine „ChatGPT Search“ jetzt direkt im Chatbot. RunwayML revolutioniert mit neuen Funktionen weiter die Video-KI-Welt und Microsoft bietet möglicherweise als Erstes die Live-Chat-Funktion über Inhalte auf unserem Bildschirm an.
👀 O1 Leak am Wochenende
Über das Wochenende war für eine kurze Zeit lang das neue o1-Modell von ChatGPT nutzbar. Also nicht die Vorschauversion, die wir ja schon seit einer Weile testen können, sondern die Vollversion o1, die irgendwann dieses Jahr veröffentlicht werden soll und User, die schnell genug waren, konnten einfach durch das Anhängen von ?model= o1 an die URL das neue Modell verwenden, das auch das Hochladen von Anhängen für das Reasoning-Modell erlaubt hat.
Ziemlich spannend: Selbst in der kurzen Zeit, die das neue ChatGPT Modell – ob beabsichtigt oder nicht – online war, konnten Hacker bereits die Sicherheitsmaßnahmen knacken und ChatGPT dazu bringen eigentlich verbotene Inhalte zu generieren, in diesem Fall, wie man LSD herstellt. Das zeigt, wie leicht es immer noch ist, auch State of the Art Modelle zu ungewollten Ausgaben zu bewegen – für die Zukunft ein großes Problem, das dringend gelöst werden muss.
📝 Google Learn About
Eine neue Woche – ein neues, interessantes KI-Tool von Google, das nur für den US-Markt veröffentlicht wird. “Learn About” heißt das neueste Experiment des Konzerns, der gerade beim Thema KI so ein bisschen die übliche Google-Strategie anwendet. Viele, kleine Teams entwickeln neue Produkte und man schaut so ein bisschen, was gut ankommt. Bei Learn About dreht sich alles darum, dass User auf einfache Art und Weise mit nur wenigen Prompts mehr über ein bestimmtes Thema lernen können. Nach einer initialen Erklärung werden direkt Folgefragen und Deep Dives vorgeschlagen und man kann sich ganz einfach durchklicken.
Wir müssen ehrlich sagen, dass wir von vielen der neuen KI-Experimente von Google relativ überzeugt sind, man versucht sich hier an vielen Dingen, mit dem Ziel herauszufinden, wie künstliche Intelligenz eine möglichst große Hilfe sein kann. Gleichzeitig sind wir natürlich schon enttäuscht darüber, dass wir diese innovativen KI-Tools ohne VPN oder andere Hacks vielleicht nie selbst ausprobieren können – je nachdem, welche davon es wirklich über das Stadium eines Experiments hinaus schaffen.
🖼️ Continous Vision von Microsoft?
Seit Monaten warten alle darauf, dass wir endlich mal eine KI bekommen, mit der wir live über das chatten können, was gerade auf unserem Bildschirm passiert. OpenAI hat die Funktionalität bei der ersten Vorstellung des Advanced Voice Modus im Juli gezeigt, aber seitdem wurde nichts dergleichen verfügbar. Auch mit der Einführung des neuen Sprachassistenten bei uns gab es keine News in dieser Richtung.
Ausgerechnet Microsoft scheint jetzt vorzupreschen und hat auf Twitter ein kurzes Video veröffentlicht, das zwar nicht viel zeigt, aber eindeutig eine Funktion zum Teilen des Bildschirms mit Copilot und dann einer Unterhaltung mit dem KI-Assistenten über die Inhalte im Browser.
Das Video legt nahe, dass wir vermutlich bald mit dieser Funktion rechnen dürfen – dass es ausgerechnet im, von vielen eigentlich so ein bisschen abgeschriebenen, Copilot als Erstes passiert – das scheint ein bisschen unerwartet. Da Microsoft ja auch eng mit OpenAI zusammenarbeitet, könnte es durchaus sein, dass sich auch bei ChatGPT etwas in dieser Richtung tun könnte. Wir sind gespannt.
🔍 ChatGPT Search
Wenn wir gerade über ChatGPT sprechen, dann müssen wir natürlich auch die jetzt veröffentlichte Suche des OpenAI Chatbots ansprechen. Dazu haben wir bereits letzte Woche ein eigenes Videos auf dem Kanal veröffentlicht und sind bis jetzt … eher unbeeindruckt. Durch die neue Funktion kann ChatGPT jetzt das Internet nach Informationen durchsuchen und gibt diese in einem Suchmaschinen-ähnlichen Format mit Quellenangaben aus. Dabei werden aber allem Anschein nach die Partner des Unternehmens noch stark bevorzugt und die “Suchmaschine” liefert vielleicht nicht ganz so neutrale Ergebnisse.
Viele von euch haben bei unserem ChatGPT Search Video angemerkt, dass man auch bei Google für Anzeigen bezahlen kann und das stimmt. Im Gegensatz zu ChatGPT werden diese aber klar gekennzeichnet und Google ist auch nicht die einzige Suchmaschine der Welt.
Ob OpenAI jetzt tatsächlich bewusst bestimmte Verlage bevorzugt oder sie einfach aufgrund von Urheberrechtsbeschwerden zu einem gewissen Grad eingeschränkt sind, bei den Ausgaben der Inhalte, wissen wir Stand heute nicht. Beides wäre denkbar.
📄 Visual PDFs und Analysis Tool in Claude
Anthropic tritt weiter aufs Gaspedal. Auch wenn wir immer noch keine Informationen zu einem Claude 3.5 Opus Modell haben und aktuell es wohl so aussieht als gäbe es hier in naher Zukunft wenig Hoffnung, bringt der Konzern weiter neue, und sehr nützliche Funktionen in den Claude Chatbot.
Zunächst wurde das Analysis-Tool als Feature Preview vorgestellt. Mit diesem Werkzeug kann Claude entsprechende Daten, beispielsweise aus einer CSV-Datei, schnell analysieren und daraus visuell sehr ansprechende, interaktive Dashboards erstellen. Das bietet sich natürlich besonders für Bereiche wie Marketing oder Produktmanager an, die viel mit Daten hantieren, die leicht verständlich und übersichtlich aufbereitet werden müssen.
Relativ passend dazu wurde kurz darauf die Visual PDFs Funktion veröffentlicht. Mit diesem Tool kann der Chatbot jetzt auch Bilder, Schaubilder, etc. In einer hochgeladenen PDF-Datei lesen und die Informationen daraus korrekt erfassen und weiterverarbeiten. Das konnten manche andere Anbieter zwar bereits, aber die neue Funktion bei Claude überzeugt in den ersten Tests durch eine wirklich sehr hohe Zuverlässigkeit, was gerade bei längeren PDFs sehr hilfreich ist. Laut Anthropic werden aktuell eine PDFs mit einer Länge von bis zu 100 Seiten für die neue Funktion unterstützt – da kann man also schon relativ viel machen.
💻 Google unter Druck
Auch wenn ChatGPT Search uns – zumindest aktuell – noch nicht überzeugen kann. Der Suchmaschinenriese Google gerät zunehmend unter Druck von seiten der KI-Konkurrenz. Nachdem OpenAI direkt auch eine Chrome-Erweiterung mit anbietet, die die Standardgooglesuche durch ChatGPT ersetzt, gibt es dieselbe Erweiterung jetzt auch für den KI-Suchmaschinen-Vorreiter Perplexity. Mit einer einfachen Erweiterung aus dem Chrome Web Store wird Perplexity als Standardsuche in Chrome gesetzt und im Vergleich zu ChatGPT Search haben wir hier eben schon ein relativ ausgereiftes und starkes Produkt.
Google muss also aufpassen, hier nicht zu viel Marktanteil zu verlieren. Auch wenn das aktuell noch relativ unwahrscheinlich scheint, denn der Suchmaschinenkonzern hat hier wirklich ein komfortables Polster – ausruhen sollten sie sich darauf nicht.
✏️ Act-One von RunwayML
In einem eigenen Video haben wir euch schon die neue Act-One Funktion von RunwayML vorgestellt – das ist natürlich hier in der Beschreibung auch direkt verlinkt. Mit diesem absoluten Gamechanger im Bereich KI-Video ist es möglich ganz einfach, die Mundbewegungen und Mimik eines Ausgangsvideos auf ein Bild zu übertragen und die Ergebnisse sind wirklich beeindruckend.
Vor allem, wenn man sich das Behind the scenes anschaut, wird klar, wie gut das umgesetzt ist. Hier sieht man auch, dass beide Charaktere von nur einem Schauspieler gesteuert werden, lediglich die Stimme wird ersetzt.
Unsere eigenen Tests findet ihr bei unserem Video und soviel sei gesagt: Auch in unseren Versuchen hat das echt gut geklappt. Act-One ist aber nicht die einzige Neuerung bei RunwayML.
📹 Advanced Camera Control von RunwayML
Neben dem Motion Capture Hammer hat das Unternehmen auch eine verbesserte Version der Kamerakontrolle mit dem Namen Advanced Camera Control vorgestellt. Eine große Schwierigkeit beim Erstellen von KI-generierten Video ist eben auch immer die Bewegungen der Kamera richtig zu beeinflussen und hier hilft diese Funktion enormen.
Über verschiedene Möglichkeiten für Zoom, Panning oder Drehungen soll durch die jetzt nochmal verbesserte Kontrolle fast alles an Shots möglich sein. Runway ist auch hier einer der Vorreiter der Branche und hat seit der Einführung der Motion Brush einiges bewegen können.