Melde Dich für unseren Newsletter an und erhalte alle wichtigen News direkt in dein Postfach!
Google liefert mit seinem neuen Update im AI-Studio endlich eine Funktion auf die wir seit Jahren warten, OpenAI warnt vor betrügerischen Reasoning Modellen und Claude wird dank eines Pokemon Spiels zum erfolgreichen Streamer.
🆕 Gemma 3 von Google
Nachdem Google uns ja mit den eigenen Gemini-Modellen in letzter Zeit immer stärker überzeugen konnte, legt das Unternehmen jetzt auch bei der anderen Modell-Reihe Gemma nach und bringt mit Gemma 3 die neusten Versionen dieser “offenen” KI-Modelle in verschiedenen Größen auf den Markt. Die Leistung hat sich deutlich verbessert und Google betont in der eigenen Vorstellung vor allem den Fakt, dass man dieses neue 27B-Modell auf nur einer Grafikkarte betreiben kann. Gut, die eine Grafikkarte soll eine Nvidia H100 sein. Hat jetzt nicht jeder von unser gerade eine daheim, aber es ist natürlich trotzdem in Kombination mit den angegebenen Benchmarks für ein Modell dieser Größe ziemlich beeindruckend.
Und es ist natürlich auch schön zu sehen, dass Google hier weiter ein Modell anbietet, dass zum Download zur Verfügung steht und lokal genutzt werden kann. Man muss allerdings ein bisschen einschränkend schon anmerken, dass es hier kein absolutes Open Source Modell ist, da Google einige Einschränkungen definiert. Es wird hier deutlich vorgeschrieben, für was das Modell verwendet werden darf und für was nicht. Da sind einige Konkurrenten natürlich deutlich freizügiger, was die offenen Modelle betrifft.
🤖 Manus AI
Nach DeepSeek gibt es jetzt die nächste KI-Sensation aus China – Manus heißt ein neues Tool, das aktuell überall gehyped wird und der erste “richtige” KI-Agent sein soll. Aber was heißt das überhaupt und was steckt hinter Manus? Laut den Entwicklern ist Manus der erste Agent, der quasi alle Aufgaben für uns erledigen kann, also eine Art Allrounder. Egal, ob es darum geht Dokumente zu klassifizieren und zu bewerten, den Immobilienmarkt zu analysieren oder interaktive Websiten zu erstellen und zu veröffentlichen. Wir müssen Manus einfach nur eine Aufgabe geben und die KI erledigt alles von selbst. Dazu verwendet das Tool eine eigene Umgebung in der Cloud, das heißt, wir können Manus einfach eine Aufgabe geben und dann etwas anderes tun. Sobald wir ein Ergebnis haben oder die KI eine Nachfrage hat, werden wir benachrichtigt.
Das klingt alles wirklich spannend und ist aktuell für eine begrenzte Anzahl von Usern kostenlos nutzbar. Wir sind natürlich schon auf der Warteliste, aber haben leider noch keinen Zugriff. Deshalb wollen wir euch das hier natürlich schonmal vorstellen, aber halten uns mit einer finalen Einschätzung noch zurück. Es gibt online viele coole Beispiele, aber wir wollen es für euch natürlich selbst testen und beurteilen. Dazu wird es sicherlich dann, wenn es soweit ist ein eigenes, ausführliches Video von uns geben.
⚡ Gemini Flash 2.0 Experimental
Neben dem ganzen Trubel um das neue Gemma 3 Modell ist eine andere Neuigkeit von Google fast ein bisschen untergegangen. Wir finden aber, das ist sogar fast noch cooler. Im AI-Studio haben wir jetzt nämlich Zugriff auf ein neues Gemini 2.0 Flash Experimental Modell bekommen, dass eine richtig spannende, neue Fähigkeit hat: Bilder und Text komplett nativ miteinander zu verwenden. Das klingt erst einmal ein bisschen kompliziert, aber es ermöglicht richtig coole Sachen.
So kann man zum Beispiel eine Antwort erstellen, die sowohl konsistente Bilder als auch Texte dazu enthält, beispielsweise eine Geschichte schreiben lassen und gleichzeitig illustrieren.
Oder man kann Bilder ganz gezielt weiter bearbeiten und das Modell nimmt dabei nur die Änderungen vor, die wir wollen, zum Beispiel den Arm eines Charakters heben oder etwas Neues zu einem Bild hinzufügen. Damit kommt Google mit einem solchen Modell OpenAI zuvor, schon Mitte letzten Jahres hatte Greg Brockman über die Image-Fähigkeiten von GPT-4o gesprochen – aber seitdem kam vom ChatGPT Konzern nichts an Updates für die eigenen Bild-KIs. Mal schauen, ob dieser Move von Google die Konkurrenz belebt und wir bald mehr solcher Modelle sehen werden.
📒 Updates für NotebookLM
Auch eines unserer Lieblingstools von Google, NotebookLM, bekommt weiterhin schöne Neuerung. Jetzt wurde endlich das Feature bestätigt, dass die Zitate, die wir ja im Chat mit der KI schon bekommen, die genau auf die Quelle verweisen und so das ganze belegbar machen, auch in den Notizen gespeichert werden. Wenn ich jetzt also eine Antwort aus dem Chat speichere, dann werden auch in der gespeicherten Versionen Links mit den Quellen an den entsprechenden Stellen eingefügt, sodass man jederzeit prüfen kann, woher die Informationen stammen.
Laut ersten Leaks sind auch schon weitere Funktionen in Arbeit, unter anderem eine bevorzugte Sprache, die man einstellen kann, und worauf wir besonders gespannt sind, wohl eine Integration der Deep Research Funktion. Wenn das kommen sollte und wir wirklich direkt innerhalb von NotebookLM zig Quellen durchsuchen und recherchieren lassen können und die Inhalte direkt speichern und weiter damit arbeiten – das wäre wirklich unglaublich.
😈 OpenAI warnt vor “Fake-Gedankengängen”
OpenAI hat eine interessante Erfahrung in Bezug auf Reasoning Modelle geteilt. Reasoning Modelle zeigen ja oft eine Art Gedankengang bevor sie ihre Ausgaben erstellen. Insbesondere bei DeepSeek R1 hat man das ja ganz gut nachverfolgen können und es wirkt ja auch sehr menschlich, wenn man diesen Monolog verfolgt und mitliest, wie sich die KI Mühe gibt uns nicht zu enttäuschen.
Jetzt hat die Firma hinter ChatGPT festgestellt, dass unter Umständen die KI hier auch zu einer gewissen Manipulation neigen kann. Und zwar hat man in einigen Versuchen bestimmte Anreize mitgegeben schneller zu einem gewünschten Ergebnis zu kommen und dann überwacht, ob das Modell sich aufgrund der erhöhten Motivation vielleicht etwas flexibler verhält, was die moralischen Instruktionen angeht – also beispielsweise fragwürdige Zwischenschritte macht, nicht zu sehr auf gewisse Sicherheitsmaßnahmen achtet und allgemein sich eben etwas rücksichtsloser verhält. Tatsächlich ist es zum Teil genauso gekommen.
Die KI ging stellenweise sogar so weit, in den ausgeschriebenen “Gedanken” bewusst über die eigenen Absichten zu täuschen und zu lügen. Also so nach dem Motto, wir fragen die KI hast du dieses Ergebnis auf legalem Weg bekommen? Und die KI antwortet mit Ja natürlich, obwohl sie einige sehr grenzwertige Entscheidungen getroffen hat. Was wir daraus lernen, ist, dass wir zwar manchmal zu einem besseren Ergebnis kommen können, wenn wir der KI beispielsweise eine Belohnung versprechen, wir aber aufgrund dieser Belohnung dann Gefahr laufen, dass die KI uns anfängt zu täuschen. Ein Verhalten, dass definitiv schon fast menschlich wirkt – leider nicht im positiven Sinne.
👾 Claude spielt Pokemon
Nicht mehr wirklich neu, aber trotzdem eine Nachricht, die wir euch in dieser sonst eher ruhigen Woche nicht vorenthalten wollen: Anthropic hat das beste Benchmark aller Zeiten eingeführt und spielt mit ihrem Chatbot Claude auf der Streaming-Plattform Twitch Pokemon. Man kann dabei der KI live zusehen, wie sie versucht, der beste Trainer aller Zeiten zu werden und die Top-4 zu schlagen. Immer mal wieder kommt Claude dabei ein bisschen weiter und lernt dazu, wie man das Spiel schlagen kann.
Wenn es so weiter geht, wird Anthropic damit wahrscheinlich nebenbei zum erfolgreichsten Streamer aller Zeiten, denn egal, wann wir es gecheckt haben, sind immer ein paar Hundert bis mehrere Tausend Zuschauer dabei und feuern die KI an. Es ist auch wirklich sehr unterhaltsam, vor allem die Live-Kommentare zu lesen, wenn etwas besonders gut klappt oder sich Claude mal wieder im Kreis dreht.
⌨️ ChatGPT Operator jetzt auch in der EU
Nachdem der Operator Agent bei uns ja seit dem Launch nicht offiziell verfügbar war, wurde jetzt nach der aktuell anscheinend üblichen Wartezeit das EU-Embargo aufgehoben und OpenAI macht das Tool jetzt auch allen Usern mit Pro-Plan bei uns zugänglich. Wir sind wirklich nicht ganz sicher, was hinter dieser verzögerten Release-Taktik steckt – vielleicht ist es auch ganz simple Auslastungskontrolle, aber mit Regulierung und Gesetzen hat es definitiv nichts zu tun. Leider ist der Operator momentan nur im Pro-Plan enthalten – zumindest für den Moment. Wir halten euch natürlich auf dem Laufenden, wenn auch Plus-User Zugriff erhalten.
💻 Updates für die OpenAI API
Aber apropos Agenten: OpenAI hat eine ganze Reihe an Updates für die eigene API angekündigt. Mit diesen Neuerungen sollen Entwicklerinnen und Entwickler besser in der Lage sein, auch selbst eigene Agenten mit den Tools von OpenAI zu bauen. Dazu gibt es hauptsächlich drei neue Tools: Websuche, Dateisuche und Computer Use. Damit sind die Modelle in der Lage sowohl öffentliche Daten im Internet zu suchen, private, bereitgestellte Daten über die Dateisuche und mit Computer Use kann ein solches System Aktionen auf einem Rechner selbstständig ausführen. Damit werden natürlich einige Dinge ermöglicht, die so vielleicht nicht einfach umsetzbar wären, für Agenten, die ja selbständig arbeiten sollen aber unerlässlich sind.
Dazu passend wurde übrigens auch eine neue Responses API veröffentlicht, die weniger das klassische Text in, Text out System bedient, sondern auch mit den neuen Modalitäten und Agenten-Fähigkeiten umgehen kann. Außerdem wurde das experimentelle Swarm Framework für die Arbeit mit mehreren KI-Agenten jetzt “professionalisiert” und steht als Agents SDK zur Verfügung.