Melde Dich für unseren Newsletter an und erhalte alle wichtigen News direkt in dein Postfach!
Es gibt schon wieder Update bei ChatGPT und den neuen o1-Modellen, Microsoft hat nach sehr langer Funkstille die zweite Welle der Copilot Funktionen vorgestellt und Runway bringt die lange erhoffte Video to Video Funktion in die Generation 3.
💬 Mehr Nachrichten für das o1-Modell und Shortcuts
ChatGPT befindet sich weiter im Wandel. Nach der Vorstellung der neuen o1-Modelle wurden schon nach wenigen Tagen, die ziemlich strikten Limits angehoben. Für das o1-mini Modell haben wir jetzt statt 50 Nachrichten pro Woche, 50 Nachrichten pro Tag, als deutlich mehr. Beim o1-preview Modell ist die Steigerung nicht ganz so extrem, aber das Limit wurde immerhin von 30 Nachrichten pro Woche auf 50 Nachrichten pro Woche angehoben. Das ist auf jeden Fall schön zu sehen.
Außerdem sind neue Shortcut-Befehle in ChatGPT verfügbar, die schon so ein bisschen andeuten, in welche Richtung der Chatbot sich entwickelt. Wenn man im Nachrichtenfenster einen Forward-Slash eingibt, dann hat man aktuell drei Auswahlmöglichkeiten: Bilderzeugung mit Dall-E, Web-Suche oder Reasoning mit o1, die schnell die richtige KI für einen auswählen. An sich praktisch, aber vermutlich nur eine Vorstufe, denn ChatGPT wird bald dazu in der Lage sein, in einem “Automatischen” Modus selbst zu entscheiden, welches Modell und welche Funktionen für die Anfrage am besten geeignet sind. Damit wird das Tool noch leichter zu bedienen sein und wir sind schon gespannt, wann es so weit ist.
🤖 Neue Funktionen für Microsoft Copilot
Nachdem wir lange nichts mehr vom Microsoft Copilot gehört haben, wurden jetzt eine ganze Reihe neuer Funktionen für die Integration in die 365-Programme vorgestellt – die wir aber leider mal wieder nicht direkt selbst testen konnten.
Grob zusammengefasst sind die folgenden Funktionen jetzt neu:
Der Copilot-Chat wurde in Biz-Chat umbenannt – ansonsten hat sich aber nicht viel geändert. Es gibt aber noch eine neue Funktion mit dem Namen Pages. Damit kann man jetzt Ausgaben der KI einfach in einer Art Dokument speichern und dieses dann auch mit anderen Personen teilen und leicht zusammenarbeiten. Schon vom Design erkennt man relativ schnell, dass die “Pages” sehr ähnlich zu Microsoft Loop sind und auf Basis des Programms funktionieren.
Der Copilot in Excel ist jetzt wohl allgemein verfügbar und nicht mehr in der Vorschau-Phase, auch wenn das für uns wie gesagt nicht der Fall zu sein scheint, zumindest bis jetzt. Man kann jetzt endlich auch mit normalen Daten außerhalb von Tabellen arbeiten und Python wurde nativ in Excel integriert. Copilot kann automatisch für uns Python-Code schreiben und ausführen und bringt damit nochmal mehr Möglichkeit in die Software.
In PowerPoint gibt es einen neuen Narrative Builder, der das Erstellen von Präsentationen vereinfachen soll und was wir relativ gut finden, die Möglichkeit endlich eigene Vorlagen, beispielsweise vom Unternehmen zu verwenden, um die KI-Präsentationen zu erstellen.
In Teams gab es nur kleine Verbesserungen, sodass Copilot jetzt über Transkripte und Chats befragt werden kann und in Word wurde das Einbinden von externen Dokumenten etwas verbessert.
Im Mail-Programm Outlook kann die KI jetzt E-Mails priorisieren, entweder automatisch oder durch Regeln, die wir Copilot nach und nach beibringen, durch eigene Einordnungen unserer Nachrichten.
Die wahrscheinlich nützlichste Neuerung in einem 365 Programm betrifft OneDrive, also den Cloudspeicher, der endlich auch eine Copilot-Funktion bekommt. Damit sollen wir in der Lage sein, alle Dateien zu durchsuchen, Informationen aus unterschiedlichen Dokumenten schnell zu finden und mehr. Auch das konnten wir noch nicht testen, aber anscheinend soll das bis Ende September überall verfügbar sein.
Für die größte Aufregung haben aber vermutlich die Copilot Agents gesorgt – die aber unserer Meinung nach völlig falsch benannt sind. Im Bereich KI denken wir bei Agents ja immer an wirklich eigenständige Systeme, die über mehrere Schritte Aufgaben planen und erledigen können. Und um ehrlich zu sein, scheint Microsoft daran auch zu arbeiten. Aber das, was jetzt mit dem Agent Builder als super einfache und schnelle Möglichkeit eigene Agents zu erstellen angepriesen wird – sind einfach nur Custom GPTs. Die Integration von Informationen aus Sharepoint und das Respektieren von unternehmensinternen Richtlinien und Regeln sind natürlich nett.
Aber im Prinzip sehen wir hier genau die Oberfläche, die wir innerhalb von ChatGPT schon seit fast einem Jahr kennen und verwenden können. Ob das jetzt wirklich so ein wahnsinniger Durchbruch ist – da muss Microsoft uns erst davon überzeugen.
📽️ Runway jetzt mit Video-to-Video
RunwayML, eine der beliebtesten Video-KIs hat jetzt für die aktuelle Version 3 die Video-to-Video Funktion vorgestellt, ein Feature, das viele bis jetzt vermisst hatten. Wir haben es ja immer mal wieder schon gesagt: Text-to-Video, so beeindruckend es auch ist, liefert oft eben keine planbaren oder guten Ergebnisse, die Funktion aus einem Standbild ein Video zu machen verbessert das enorm.
Die jetzt eingeführte Video-to-Video Funktion ist zwar etwas eingeschränkt, da wir eben ein Video als Ausgangsmaterial brauchen, aber dann ist die Änderung des Stils ein Kinderspiel und diese Anwendung ist für viele enorm nützlich. Aus einem einzigen Shot können wir jetzt ganz einfach verschiedenste Versionen generieren und die Ergebnisse, die wir bis jetzt online gesehen haben sind wirklich beeindruckend.
🆕 Pixtral-Modell jetzt im LeChat von Mistral
Letzte Woche hatten wir kurz über das neue multimodale Open Source Modell von Mistral berichtet, dazu nur ein kleines Update: Pixtral ist jetzt im hauseigenen Chatbot von Mistral Le Chat einfach und kostenlos nutzbar. Damit kann man mit dem neuen Modell experimentieren und eigene Erfahrungen machen. Wir waren etwas enttäuscht, dass es keine Möglichkeit gibt Bilder zu erstellen, auch wenn wir davon eigentlich ausgegangen sind. Mit hochgeladenen Dateien und auch Bildern kommt das neue Modell aber gut klar und die Computer Vision Fähigkeiten sind auf den ersten Blick wirklich gut.
🆓 Kostenloser API-Plan bei Mistral
Es gibt noch eine weitere, coole Nachricht von Mistral. Das Unternehmen hat für die Nutzung der API jetzt einen kostenlosen Plan eingeführt und die Preise für die Verwendung der anderen Modelle stark gesenkt. Klar, die Mistral-Modelle sind nicht ganz auf dem Niveau der neuen GPT-Familie, aber sie bieten trotzdem eine für sehr viele Anwendungen absolut ausreichende Leistung.
Und für viele Unternehmen, gerade bei uns ist es eben ein Riesen-Vorteil, wenn das Unternehmen, dass die Anfragen verarbeitet in Frankreich sitzt und nicht in den USA. Daher denken wir ist dieses Angebot auf jeden Fall attraktiv und vor allem kleinere Unternehmen oder Einzelpersonen können im neuen kostenlosen Plan einfach mit der API experimentieren und Erfahrungen sammeln.
🎮 Game Gen O
Eine Nachricht, bei der wir noch nicht genau wissen, wie beeindruckend oder unscheinbar sie ist, kommt von Tencent mit dem sogenannten Gamegen-o Modell, das anscheinend Videospiele generieren kann. Es sind aktuell nur einige Videos verfügbar, kurzzeitig gab es auch eine Projektseite und ein Repository auf GitHub, die aber gestern wieder verschwunden sind. Es ist uns nicht ganz klar, ob es sich beim Output der KI wirklich um spielbare Welten handelt oder um eine ähnliche Video-Erzeugung wie beim Game-N-Gen Modell, das ja das Spiel Doom als Video generiert hat.
Alles in allem scheint aber auch die Entwicklung in diese Richtung der KI Fahrt aufzunehmen und es ist wirklich spannend zu sehen, welche unterschiedlichen Bereiche mittlerweile die Technologie austesten, und Anwendungen suchen.
🤖 OpenAI Agents
Nach den relativ sichergestellten News zu Kurzbefehlen und der automatischen Modell-Auswahl bei ChatGPT berichten wir kurz auch noch über die neuesten, etwas vagen Gerüchte aus der Richtung OpenAI. Sam Altman hat relativ aus dem Nichts einen alten Artikel des Unternehmens mit den Zielen gepostet mit dem Kommentar: “incredible outperformance on goal 3, even though it took awhile:” Also die Richtung “das Ziel 3 wurde “über-erfüllt” auch wenn es eine Weile gedauert hat.
Wenn man dann in den Artikel schaut, dann sieht man, dass Ziel 3 lautet “Build an agent with useful natural language understanding” und dass dieser Agent eigenständig handeln und nachfragen soll. Ob wir uns also schon bald auf eine weitere Neuerung aus dem Hause OpenAI freuen können? Das können wir noch nicht sicher sagen, schließlich warten wir auch immer noch auf die Einführung des neuen Voice-Modus und die Ankündigungen sind jetzt mittlerweile schon echt lange her.