Die KI-News der Woche vom 27.05.2026

5 Minuten Lesezeit

Melde Dich für unseren Newsletter an und erhalte alle wichtigen News direkt in dein Postfach!

ChatGPT soll ab sofort mit direktem Kontozugriff die Finanzen verwalten, Andrej Karpathy geht zu Anthropic und vielleicht kommt das Mythos-Modell bald in Claude Code.

Alle wichtigen KI-News der Woche haben wir für euch wie immer kompakt zusammengefasst.

🤖 Qwen 3.7 Max

Den Anfang macht Alibaba mit Qwen 3.7 Max. Alibaba positioniert das Modell ganz klar für die Agenten-Ära: also nicht nur Chatten, sondern Code schreiben, debuggen, Office-Workflows automatisieren und komplexe Aufgaben über viele Schritte hinweg bearbeiten. Eigentlich genau das, was wir gerade bei allen Anbietern sehen. Laut Alibaba soll Qwen 3.7 Max Aufgaben mit hunderten oder sogar tausenden Aktionen stemmen können.

Die auffälligste Zahl: Alibaba spricht in der Ankündigung von bis zu 35 Stunden kontinuierlicher autonomer Ausführung und mehr als 1.000 Tool-Calls ohne Performance-Abfall. Das ist natürlich erst mal eine Herstellerangabe, aber die Richtung ist spannend. Der Fokus liegt nicht mehr nur darauf, ob ein Modell in einem Benchmark ein paar Prozent besser ist, sondern ob es als stabiler Kern für echte Agenten-Workflows taugt.

Für Entwicklerinnen und Entwickler soll Qwen 3.7 Max über Alibaba Model Studio verfügbar werden. Interessant ist auch, dass Alibaba das Modell in seinem Full-Stack-KI-Update explizit für verschiedene Agent-Frameworks positioniert. Im Qwen-Post auf X wird außerdem sichtbar, wie stark Alibaba das Modell als Werkzeug für Agenten-Workflows vermarktet. Die Praxisfrage bleibt aber: Die Benchmarks chinesischer Modelle sind häufig beeindruckend, im Alltag wirken sie manchmal noch nicht ganz so konstant wie die Top-Modelle von OpenAI, Anthropic und Google.

🧠 Andrej Karpathy geht zu Anthropic

Kommen wir zu einem ziemlich großen Personalwechsel: Andrej Karpathy geht zu Anthropic. Karpathy war Gründungsmitglied bei OpenAI, später AI Director bei Tesla und ist für viele in der KI-Szene auch einer der wichtigsten Erklärer moderner Deep-Learning-Systeme.

Laut seinem eigenen Post geht es für ihn bei Anthropic zurück in Forschung und Entwicklung. Axios berichtet außerdem, dass Karpathy im Pre-Training-Team von Anthropic starten soll. Das ist der Bereich, in dem die großen Trainingsläufe entstehen, die Claude seine grundlegenden Fähigkeiten geben. Spannend ist daran: Anthropic holt hier nicht einfach einen prominenten Namen für die Außenwirkung, sondern sehr gezielt jemanden, der sowohl Modelltheorie als auch große Trainingspraxis versteht.

Für Anthropic ist das ein starkes Signal im Talentrennen mit OpenAI, Google und xAI. Und inhaltlich passt es zur aktuellen Richtung: Claude soll nicht nur als Produkt besser werden, sondern offenbar auch stärker dabei helfen, die nächste Generation von Claude zu erforschen. Ob daraus kurzfristig sichtbare Produktverbesserungen entstehen, muss man abwarten. Strategisch ist der Wechsel aber definitiv relevant.

💸 Finanzen in ChatGPT

OpenAI baut ChatGPT weiter in Richtung persönlicher Assistent aus. Neu ist eine Finanzfunktion in ChatGPT, zunächst als Preview für Pro-Nutzer in den USA, auf Web und iOS. Nutzer können ihre Finanzkonten verbinden, Ausgaben, Rechnungen, Abos, Vermögen und Investments in einem Dashboard sehen und ChatGPT Fragen dazu stellen.

Die Kontoverbindung läuft über Plaid, laut OpenAI mit Unterstützung für mehr als 12.000 Finanzinstitute. Intuit soll später dazukommen. Wichtig ist aber die Einschränkung: ChatGPT kann helfen, die eigene Finanzlage zu verstehen, Muster zu erkennen und Szenarien durchzudenken. Es kann aber kein Geld bewegen, keine Rechnungen bezahlen, keine Trades ausführen, keine Steuererklärung einreichen und ersetzt auch keine Finanz-, Steuer- oder Rechtsberatung.

Für uns in Deutschland ist das erst mal vor allem ein Blick in die Richtung, in die ChatGPT als Produkt geht. Wenn ein Modell nicht mehr nur allgemeine Tipps gibt, sondern echten persönlichen Kontext einbezieht, werden die Antworten viel nützlicher. Gleichzeitig wird Datenschutz deutlich wichtiger, weil Finanzdaten zu den sensibelsten Informationen gehören, die man einem KI-System geben kann.

📱 Codex in der ChatGPT App

OpenAI bringt Codex in die ChatGPT Mobile App. Die Idee ist: Codex arbeitet weiter auf eurem Rechner, Mac mini oder einer Remote-Umgebung, und ihr könnt vom Handy aus reinschauen, Anweisungen geben, Entscheidungen treffen oder Aktionen freigeben.

Das ist gerade für längere Coding-Agent-Aufgaben interessant. Ihr müsst also nicht die ganze Zeit am Rechner sitzen, wenn Codex gerade Tests laufen lässt, Diffs vorbereitet oder bei einer Aufgabe eine Freigabe braucht. Auf dem Handy könnt ihr Threads weiterführen, Terminal-Ausgaben, Screenshots, Testergebnisse und Diffs prüfen und zwischen verbundenen Hosts wechseln.

Der Haken: Für das Mobile-Setup braucht man aktuell die Codex App auf macOS. Windows soll später folgen. Außerdem muss der Host wach, online und mit Codex verbunden bleiben. In der Dokumentation zu Remote Connections beschreibt OpenAI die Einrichtung genauer. Trotzdem ist das ein ziemlich klarer Schritt: Coding-Agenten werden nicht mehr als reine Desktop-Tools gedacht, sondern als längere Arbeitsprozesse, die man zwischendurch remote steuert.

🛡️ Mythos vor Release?

Bei Anthropic gibt es neue Hinweise rund um Mythos. Wichtig vorweg: Offiziell verfügbar ist Mythos nicht allgemein. Anthropic nutzt Claude Mythos Preview aktuell im Rahmen von Project Glasswing, also einem stark eingeschränkten Sicherheitsprogramm mit ausgewählten Partnern.

Offiziell bestätigt ist: Anthropic sagt in einem ersten Glasswing-Update, dass Mythos Preview zusammen mit rund 50 Partnern mehr als 10.000 hoch- oder kritisch eingestufte Schwachstellen in wichtiger Software gefunden hat. Außerdem scannt Anthropic Open-Source-Projekte und spricht dort von tausenden potenziellen Schwachstellen, die aber erst menschlich geprüft, gemeldet und gepatcht werden müssen. Genau das ist auch der kritische Punkt: Schwachstellen zu finden wird mit solchen Modellen offenbar viel leichter. Sie sauber zu validieren und zu schließen bleibt aber harte Arbeit.

TestingCatalog berichtet jetzt zusätzlich über Hinweise auf ein mögliches „Mythos 1“ mit Preview-Label für Claude Code und Claude Security. Das ist noch nicht offiziell bestätigt und sollte deshalb als Leak behandelt werden. Gleichzeitig passt es zu Anthropics eigener Aussage, dass man Mythos-Klasse-Modelle in Zukunft breiter verfügbar machen will, sobald stärkere Schutzmaßnahmen stehen. Also: kein normaler Release diese Woche, aber sehr deutliche Bewegung in Richtung Produktisierung.

💻 Composer 2.5 in Cursor

Cursor hat Composer 2.5 veröffentlicht. Das Modell ist ab sofort in der Coding-KI verfügbar und soll gegenüber Composer 2 intelligenter, zuverlässiger und besser für längere Coding-Aufgaben sein. Cursor beschreibt vor allem Verbesserungen bei komplexen Anweisungen, langfristiger Arbeit und angenehmerem Verhalten im Zusammenspiel mit Entwicklern.

Technisch spannend: Composer 2.5 basiert auf demselben Open-Source-Checkpoint wie Composer 2, nämlich Moonshots Kimi K2.5. Cursor hat aber deutlich stärker auf synthetische Aufgaben, Reinforcement Learning und gezieltes textliches Feedback gesetzt. Vereinfacht gesagt: Das Modell soll bei langen Tool- und Code-Rollouts besser lernen, wo genau es sich falsch verhalten hat, statt nur am Ende eine grobe Erfolgs- oder Fehlerbewertung zu bekommen.

Auch preislich ist das interessant. Composer 2.5 kostet 50 Cent pro Million Input Tokens und 2,50 Dollar pro Million Output Tokens. Die schnellere Variante liegt bei 3 Dollar Input und 15 Dollar Output pro Million Tokens und ist standardmäßig aktiv. TestingCatalog hebt vor allem die deutlich bessere Kosteneffizienz hervor. Das zeigt, dass Cursor nicht nur eine Oberfläche für fremde Modelle sein will, sondern zunehmend eigene Modellkompetenz aufbaut.

Autor

Johannes Ruof
Johannes Ruof ist Mitgründer und Geschäftsführer der Meixner & Ruof UG. Als KI- und Office-Experte betreibt er zusammen mit Timothy Meixner den erfolgreichen YouTube-Kanal Digitale Profis (125.000+ Abonnent:innen).
Alle Beiträge ansehen

Digitale Profis