Die KI-News der Woche vom 01.07.2026

8 Minuten Lesezeit

Melde Dich für unseren Newsletter an und erhalte alle wichtigen News direkt in dein Postfach!

GPT-5.6 wird direkt zum Start ausgebremst, Fable könnte dafür zurückkommen, Anthropic wirft Alibaba KI-Klau vor, und OpenAI zeigt seinen ersten eigenen Chip.

Alle wichtigen KI-News der Woche haben wir für euch wie immer kompakt zusammengefasst.

🚦 GPT-5.6 gebremst

Den Anfang macht OpenAI. Das Unternehmen hat GPT-5.6 vorgestellt, aber nicht so, wie man es von einem großen Modelllaunch erwarten würde. Die neue Reihe besteht aus Sol, Terra und Luna. Sol ist das Flaggschiff, Terra soll der ausgewogene Alltagsmodus sein, und Luna ist die schnellere und günstigere Variante. Laut OpenAI ist Sol das stärkste Modell des Unternehmens, mit neuen Modi für besonders starkes Reasoning und mit deutlichen Fortschritten bei Coding, Biologie und Cybersecurity.

Der Haken: Der öffentliche Rollout ist erstmal gebremst. OpenAI schreibt selbst, dass die US-Regierung vorab über die Fähigkeiten informiert wurde und darum gebeten hat, zunächst nur eine kleine Gruppe vertrauenswürdiger Partner zuzulassen. Reuters, TechCrunch und die Financial Times berichten entsprechend über einen ungewöhnlich eingeschränkten Start.

OpenAI stuft die GPT-5.6-Familie laut System Card in Biochemie und Cybersecurity, also genau diesen kritischen Themen, als “High” ein, aber nicht als “Critical”. Das heißt übersetzt: sehr leistungsfähig, mit neuen Sicherheitsmaßnahmen, aber aus OpenAIs Sicht noch nicht in der höchsten Risikoklasse. Trotzdem sieht man hier ziemlich klar, wohin sich Frontier-Modelle bewegen: Es geht nicht mehr nur um Benchmarks, sondern auch darum, wer solche Modelle wann überhaupt nutzen darf. Aber apropos Fable 5, da kommen wir direkt zum nächsten Thema.

🔄 Kommt Fable bald zurück?

Die US-Regierung hatte Anthropic ja am 12. Juni angewiesen, den Zugriff auf Fable 5 und Mythos 5 für ausländische Staatsbürger zu sperren. Anthropic hat daraufhin beide Modelle komplett offline genommen, weil das praktisch nicht umzusetzen war.

Jetzt scheint sich die Lage etwas zu entspannen. Laut Reuters-nahen Berichten darf Mythos 5 wieder begrenzt für ausgewählte US-User bereitgestellt werden. Und Axios berichtet, dass Fable 5 offenbar ebenfalls bald zurückkommen könnte, möglicherweise schon in der kommenden Woche. Das ist aber noch nicht final: Pentagon und NSA sollen laut Axios weiterhin grünes Licht geben müssen. Auch Reuters greift diese mögliche Rückkehr auf.

Für User ist vor allem offen, wie Fable zurückkommt. Gibt es wieder Zugriff für normale Claude-Abos? Kommen zusätzliche Identitätschecks? Wird es eine regionale Begrenzung geben? Genau das weiß man leider noch nicht. Sobald sich da etwas tut, bleibt das Thema natürlich relevant.

🤖 Claude Sonnet 5 ist da

Da die KI-Unternehmen mal wieder keine Rücksicht auf unsere Planung oder Urlaube nehmen, gibt es kurz noch ein Anthropic-Update. Anthropic hat Claude Sonnet 5 vorgestellt. Das ist natürlich nicht das absolute Spitzenmodell wie Fable oder Mythos, sondern ein Upgrade für das Alltags-Modell: schnell, günstiger, für Coding, Agenten, Recherche und normale Wissensarbeit. Die Modellübersicht findet ihr in der Claude-Dokumentation.

Interessant ist aber auch, was sich für Entwickler ändert. Manuelles Extended Thinking fällt weg, Sampling-Parameter wie Temperature oder Top-P können nicht mehr frei gesetzt werden, und Sonnet 5 nutzt einen neuen Tokenizer, der bei gleichem Text ungefähr 30 Prozent mehr Tokens erzeugen kann. Pro Token bleibt der Standardpreis laut Anthropic-Preisseite zwar bei 3 Dollar Input und 15 Dollar Output pro Million Tokens, bis Ende August gibt es aber Einführungspreise von 2 und 10 Dollar. Trotzdem können Anfragen teurer werden, wenn sie durch den neuen Tokenizer größer ausfallen.

Für normale Claude-Nutzer ist Sonnet 5 vor allem spannend, weil es laut Axios jetzt zum Standardmodell für Free- und Pro-Nutzer wird und auch für Max, Team und Enterprise verfügbar ist. Damit bringt Anthropic mehr Agenten- und Coding-Leistung in die Breite – und vor allem verfügbar im Gegensatz zur Mythos-Klasse.

🇨🇳 Wird Claude von China kopiert?

Bleiben wir noch kurz bei Anthropic. Das Unternehmen wirft Alibaba vor, Claude in großem Stil für sogenanntes Model Distillation genutzt zu haben. Laut einem Brief an US-Senatoren sollen Betreiber mit Verbindungen zu Alibaba und dem Qwen-Team fast 25.000 Fake-Accounts genutzt und zwischen April und Juni rund 28,8 Millionen Interaktionen mit Claude erzeugt haben. Darüber berichten unter anderem Reuters, das Wall Street Journal und die Financial Times.

Wichtig: Das sind erst einmal Vorwürfe von Anthropic, keine unabhängig bewiesenen Fakten. Alibaba hat dazu nach den zugänglichen Berichten zunächst nicht Stellung genommen. Der Kern des Vorwurfs ist aber spannend: Distillation bedeutet, dass ein Modell aus den Ausgaben eines stärkeren Modells lernt. Das kann legitim sein, wenn ein Anbieter seine eigenen Modelle komprimiert. Problematisch wird es, wenn ein Konkurrent massenhaft Antworten abgreift, um Fähigkeiten billiger nachzubauen. Tom’s Hardware ordnet die genannten Zahlen und Vorwürfe ebenfalls ein.

Interessant ist unserer Meinung nach auch, dass ausgerechnet Anthropic diesen Vorfall an die US-Regierung meldet – denn damit wird ja im Prinzip eine der großen Sorgen des Landes, dass die mächtige Technologie in die Hände autoritärer Regimes gelangen kann, komplett bestätigt.

⏱️ Google drosselt Meta

Kommen wir zu Google und Meta. Laut Financial Times hat Google Metas Nutzung von Gemini-Modellen begrenzt, weil Meta mehr Rechenkapazität wollte, als Google liefern konnte. Reuters hat den Bericht ebenfalls aufgegriffen, ebenso New Straits Times.

Meta ist selbst einer der größten KI-Investoren der Welt und baut eigene Modelle, eigene Infrastruktur und eigene Chips. Gleichzeitig nutzt Meta offenbar weiterhin externe Modelle wie Gemini für interne Projekte, etwa für Coding, Support-Workflows oder Sicherheitsautomatisierung. Wenn Google dann drosselt, geht es nicht nur um einen API-Limit-Hinweis, sondern um verzögerte interne KI-Projekte bei einem der größten Tech-Konzerne der Welt.

Die Lektion ist ziemlich klar: Selbst Big Tech ist nicht unbegrenzt mit Rechenleistung versorgt. Und die großen Anbieter sind gleichzeitig Partner, Kunden und Konkurrenten.

🌶️ OpenAIs erster Chip

OpenAI hat zusammen mit Broadcom den ersten eigenen Chip vorgestellt. Er heißt Jalapeño und ist kein Trainingschip, sondern ein Inference-Beschleuniger. Also genau für den Teil, bei dem ein fertiges Modell eure Anfragen beantwortet. Das ist wirtschaftlich extrem wichtig, weil bei Produkten wie ChatGPT, Codex und API-Nutzung jeder Token Geld und Strom kostet.

OpenAI sagt, Jalapeño sei in nur neun Monaten entwickelt worden, unterstützt durch OpenAI-Modelle selbst. Auch Broadcom spricht von einem LLM-optimierten Intelligence Processor. Erste Samples laufen im Labor, unter anderem mit GPT-5.3-Codex-Spark. Konkrete Benchmarks gibt es noch nicht, OpenAI und Broadcom sprechen aber von deutlich besserer Performance pro Watt als aktuelle Spitzenhardware. Darüber berichten auch Reuters, TechCrunch und Tom’s Hardware.

Strategisch ist das ein großer Schritt. OpenAI baut nicht mehr nur Modelle und Produkte, sondern rückt tiefer in die Infrastruktur: Chips, Kernel, Netzwerk, Rechenzentren. Das reduziert nicht sofort die Abhängigkeit von Nvidia, vor allem nicht beim Training. Aber bei Inference kann ein eigener, effizienter Chip langfristig massiv auf Kosten, Latenz und Verfügbarkeit einzahlen. Das zeigt nicht zuletzt auch Google, die ja in ihrer neuesten Chip-Generation ebenfalls in Training und Inference unterscheiden.

🏗️ Nvidias GPU-Großdeal

Aber während OpenAI eigene Chips zeigt, verkauft Nvidia weiter in Größenordnungen, bei denen einem kurz schwindelig wird. Das australische Unternehmen Firmus Technologies hat eine strategische Partnerschaft mit Nvidia angekündigt. Geplant ist ein 360-Megawatt-AI-Factory-Campus in Batam, Indonesien, mit bis zu 170.000 Nvidia-Chips für die Jahre 2027 und 2028. Darüber berichten unter anderem Reuters, The Australian und Business Recorder.

Das Interessante ist die Zielgruppe: Firmus will vor allem sogenannten AI-Natives und kleineren, schnell wachsenden KI-Firmen Zugang zu Rechenleistung geben, die sonst vor allem die ganz großen Plattformen bekommen. Ob das am Ende wirklich die Compute-Kosten demokratisiert oder einfach nur ein weiterer riesiger Nvidia-Absatzkanal wird, muss man sehen. Aber es zeigt erneut: Der Markt wird nicht kleiner. Alle bauen, mieten und reservieren GPU-Kapazität Jahre im Voraus.

🧠 Wichtige Google KI-Forscher wechseln

Wichtige Personalien gab es auch noch: Google verliert gleich zwei extrem prominente KI-Forscher. John Jumper verlässt Google DeepMind und geht zu Anthropic. Jumper ist einer der Köpfe hinter AlphaFold und hat 2024 gemeinsam mit Demis Hassabis den Nobelpreis für Chemie bekommen. Jumper selbst hat den Wechsel auch auf X kommentiert. Welche Rolle er bei Anthropic genau übernimmt, ist noch offen. Auch TechCrunch und Business Insider berichten über den Wechsel.

Und fast parallel wurde berichtet, dass Noam Shazeer Google in Richtung OpenAI verlässt. Shazeer war Co-Lead von Gemini, Mitgründer von Character.AI und einer der Autoren des Transformer-Papers “Attention Is All You Need”, also einem der Grundbausteine moderner Sprachmodelle. Besonders bitter für Google: Shazeer war erst 2024 im Rahmen des großen Character.AI-Deals zurückgeholt worden.

Warum ist das relevant? Weil die führenden KI-Labore nicht nur um Grafikkarten, Daten und Kunden kämpfen, sondern um eine sehr kleine Gruppe von unglaublich intelligenten Menschen, die wirklich große Modell- und Forschungsprogramme prägen können. Anthropic gewinnt mit Jumper einen der wichtigsten Namen für KI in der Wissenschaft, OpenAI mit Shazeer einen zentralen Kopf für Foundation Models. Für Google ist das nach der Gemini-Aufholjagd ein deutliches Signal: Der Talentkrieg in der KI-Welt ist noch lange nicht vorbei.

📉 Billionen-IPO wackelt

OpenAIs möglicher Börsengang wackelt offenbar. Mehrere Berichte schreiben, dass Berater Sam Altman nahelegen, mit einem IPO bis 2027 zu warten. Der Hintergrund ist nicht nur die allgemeine Unsicherheit im KI-Markt, sondern auch der holprige Börsenstart von SpaceX. Die Aktie war nach dem IPO stark gestiegen, danach aber deutlich korrigiert worden. Dazu berichten unter anderem Bloomberg Law, Forbes und Investor’s Business Daily.

OpenAI hatte ja bereits vertraulich IPO-Unterlagen eingereicht. In früheren Reuters-Berichten war von einer möglichen Bewertung von bis zu einer Billion US-Dollar die Rede. Genau diese Bewertung dürfte aber nur funktionieren, wenn der Markt extrem aufnahmefähig bleibt. Und OpenAI hat, anders als Google, Microsoft oder Meta, nicht dieselben gewaltigen Cashflows aus Werbung, Cloud oder Enterprise-Software, um seine KI-Infrastruktur einfach aus dem laufenden Geschäft zu finanzieren.

Dazu kommt jetzt die regulatorische Unsicherheit rund um GPT-5.6. Reuters berichtet, dass die US-Regierung OpenAI um eine gestaffelte Veröffentlichung neuer Modellinformationen gebeten haben soll. Wenn der Staat bei Modell-Releases mitredet, ist das für Investoren ein neuer Risikofaktor. Ein späterer IPO wäre also nicht automatisch ein Drama, sondern vielleicht einfach die pragmatische Entscheidung: erst mehr Umsatz, klarere Regeln und stabilere Märkte, dann der ganz große Börsengang.

🇪🇺 Anthropic nach Europa?

Zum Schluss noch Europa. Laut Reuters und Bloomberg-Berichten lobbyiert Österreich dafür, dass Europa eine Rolle beim Hosting oder Zugang zu Anthropic-Technologie bekommt, nachdem die US-Beschränkungen rund um Fable und Mythos gezeigt haben, wie abhängig europäische Firmen von amerikanischen Entscheidungen sind. Auch Channel NewsAsia und die Kronen Zeitung greifen das Thema auf.

Das heißt nicht, dass Anthropic morgen seinen Hauptsitz nach Wien verlegt. Es geht eher um die strategische Frage: Können europäische Kunden, Behörden und Firmen Zugriff auf wichtige KI-Modelle behalten, wenn Washington aus Sicherheitsgründen den Export oder die Nutzung beschränkt? Genau diese Frage ist nach dem Anthropic-Fall deutlich realer geworden. Reuters hat diese breitere Sorge europäischer Firmen vor US-Beschränkungen ebenfalls eingeordnet, und auch die Financial Times beschreibt die wachsende strategische Unsicherheit.

Für Europa ist das ein Weckruf. Einerseits will man Zugang zu den besten Modellen aus den USA. Andererseits wächst der Druck, eigene Modelle, eigene Rechenzentren und eigene rechtliche Strukturen aufzubauen. Sonst kann ein politischer Beschluss in Washington plötzlich europäische KI-Projekte ausbremsen. Ob Österreichs Vorstoß mehr wird als ein politisches Signal, ist noch offen. Aber das Thema KI-Souveränität ist damit wieder ein Stück weniger abstrakt.

Autor

Johannes Ruof
Johannes Ruof ist Mitgründer und Geschäftsführer der Meixner & Ruof UG. Als KI- und Office-Experte betreibt er zusammen mit Timothy Meixner den erfolgreichen YouTube-Kanal Digitale Profis (125.000+ Abonnent:innen).
Alle Beiträge ansehen

Digitale Profis