Claude 3.7 Sonnet – Dieses KI-Modell ist ein Gamechanger

Claude 3.7 Sonnet – Dieses KI-Modell ist ein Gamechanger

Das Warten hat endlich ein Ende! Und die Begeisterung ist schon jetzt riesig, denn Anthropic hat nach über einem halben Jahr endlich das neueste KI-Modell auf den Markt gebracht: Claude Sonnet 3.7. Die beste Nachricht vorweg: Es ist ab sofort für alle Nutzer verfügbar, auch in Europa, und das im kostenlosen Plan – bis auf eine einzige Funktion sogar komplett gratis! Aber der Reihe nach. Was genau hat Anthropic uns da präsentiert?

Entgegen vieler Spekulationen ist es weder Claude Opus noch Sonnet 4 geworden, sondern eben Claude Sonnet 3.7. Ein spannendes Hybridmodell, das nicht nur normal antworten kann, sondern optional auch einen „Thinking-Prozess“ oder Reasoning-Modus besitzt. In diesem Modus denkt das Modell erst über die Frage und eine mögliche Antwort nach, bevor es antwortet.

In puncto Namensgebung reiht sich Anthropic mit Sonnet 3.7 nahtlos in die Angewohnheit anderer KI-Unternehmen ein, neue Modelle möglichst umständlich und wenig nachvollziehbar zu benennen. Doch hier enden die Gemeinsamkeiten. Denn Sonnet 3.7 scheint grundlegend anders konzipiert zu sein als alles, was wir aktuell auf dem Markt sehen.

Fokus auf Stärken statt Wettrennen um Platz 1

Was bedeutet das konkret? Ein Blick auf die von Anthropic veröffentlichten Benchmarks liefert erste Hinweise. Bei einigen Vergleichen mit anderen State-of-the-Art-Modellen wie O3 Mini, DeepSeek R1 oder Croc 3 sind auf den ersten Blick keine bahnbrechenden Verbesserungen erkennbar.

Benchmark Tabelle von Sonnet 3.7 im Vergleich mit anderen State of the Art KI-Modellen
Ein Benchmark fällt hier ein bisschen auf – Agentic Coding

Aber ein Wert sticht sofort ins Auge: Die Leistung im Agentic Coding, also der Fähigkeit des Modells, als Programmierassistent zu unterstützen. Hier distanziert sich Sonnet 3.7 mit einem enormen Vorsprung vom gesamten Feld.

Leistung des Sonnet 3.7 Modells in SWE Verified Coding. Das Modell schlägt alle Konkurrenten um ca. 20%
Der Abstand zur Konkurrenz ist in diesem Bereich enorm

Diese Grafik macht den Vorsprung noch deutlicher. Anders als OpenAI oder xAI scheint Anthropic aktuell kein Interesse daran zu haben, sich an diesem sinnlosen Wettstreit um die Spitzenposition in der Chatbot-Arena zu beteiligen.

Stattdessen konzentriert man sich auf die eigenen Stärken und baut diese gezielt aus. Schon das ältere Sonnet 3.5-Modell, das in der schnelllebigen KI-Welt bereits ein „biblisches Alter“ erreicht hat, war bei vielen Entwicklern oft die erste Wahl – unabhängig davon, ob OpenAI-Modelle auf dem Papier vermeintlich besser sind. Und jetzt legt Anthropic mit Sonnet 3.7 in diesem Bereich noch einmal eine Schippe drauf.

Scaffold – Was steckt dahinter?

Vielleicht noch ein kurzer Hinweis zum Vermerk „Scaffold“ in den Benchmarks, da diese Frage vermutlich aufkommen wird.

Der Unterschied mit und ohne Custom Scaffold im SWE Benchmark
Diese Differenz mit Scaffold hat für ein bisschen Verwirrung gesorgt

Vereinfacht gesagt erhält das Modell hierbei von Anthropic zwei zusätzliche Tools: Zum einen kann es Code-Dateien selbst bearbeiten, zum anderen Terminalbefehle ausführen. Das erweitert die agentischen Fähigkeiten des Modells erheblich, da es Aufgaben selbstständig erledigen kann, anstatt den Nutzer bei jedem Schritt zur Interaktion aufzufordern (z.B. „Kopiere bitte diesen Text in die Datei“ oder „Führe diesen Befehl aus“).

Sofort loslegen: Sonnet 3.7 im Claude Chatbot testen

Wie bereits erwähnt, ist das neue Modell sofort für alle verfügbar – sowohl über die API als auch im Claude Chatbot selbst. Unter claude.ai – der Website des Claude Chatbots kann man Sonnet 3.7 einfach ausprobieren.. Auf der Startseite finden Sie in der Modellauswahl direkt das neue Modell.

Modellauswahl auf der Claude Startseite mit dem neuen Sonnet 3.7 Modell mit oder ohne Extended Thinking
Hier können wir das neue Modell und Extended Thinking auswählen

Beim Ausklappen des Dropdown-Menüs sieht man direkt einen wichtigen Unterschied: Sie können zwischen dem normalen Modus (ohne Reasoning) und dem Extended-Modus (mit Reasoning) wählen. Der Extended-Modus, der „gut für Mathe- und Coding-Challenges“ sein soll, nutzt den Reasoning-Prozess von Claude.

Wichtig zu beachten: Der Extended-Modus ist aktuell nur im Professional-Plan, also im kostenpflichtigen Abo, enthalten. Alles andere, also das Basismodell ohne Thinking/Reasoning, können wir aber komplett kostenlos nutzen.

Kleines Easter Egg zum Start: Der Strawberry-Test

Um das Reasoning des Modells direkt zu demonstrieren, hat das Anthropic Team ein kleines Easter Egg eingebaut. Ein bekannter Test für Reasoning-Modelle ist die Frage nach der Anzahl des Buchstabens „R“ im Wort „Strawberry“. Gib diesen Prompt einfach mal auf Englisch ein: „How many ‚r‘ are in Strawberry?“.

Easter Egg Artifact von Claude bei der Frage nach den R in Strawberry
Statt einer Antwort müssen wir uns das mit dem Artifact selbst beibringen

Claude reagiert prompt und erstellt ein interaktives „Artefakt“ – eine kleine App mit dem Wort „Strawberry“. Klicken Sie auf die App, um die Antwort zu erhalten. Und tatsächlich: Die Buchstaben „R“ werden hervorgehoben, und die korrekte Antwort „drei“ wird angezeigt.

Um zu überprüfen, ob das Modell mehr als nur eine vorgegebene Antwort ausgibt, ändern wir die Challenge und stellen die Frage auf Deutsch: „Wie viele E sind in Erdbeere?“. Auch hier liefert Claude die korrekte Antwort: „vier“. Die Positionen der „E“s im Wort „Erdbeere“ werden sogar im Denkprozess detailliert aufgeschlüsselt.

Korrekte Antworte auf die Frage wieviele e in Erdbeere sind
Auch den deutschen „Intelligenztest“ besteht Sonnet 3.7

Tetris im Chatbot: Sonnet 3.7 als Spieleentwickler

Doch Claude Sonnet 3.7 soll ja vor allem im Programmieren stark sein. Um das zu testen, erstellen wir einen neuen Chat und geben den simplen Prompt ein: „Bitte programmiere ein voll funktionsfähiges Tetris-Spiel für mich, das ich direkt hier spielen kann.“ Auch hier wählen wir zunächst den Extended-Modus mit Thinking.

Screenshot eines von Claude erzeugten Tetris-Spiel Artifacts mit dem Prompt und der Antwort des Chatbots
Mit nur einem kurzen Prompt bekommen wir ein vollständiges Spiel

Und tatsächlich – in kurzer Zeit präsentiert Claude ein spielbares Tetris-Spiel direkt im Chatbot! Mit Pfeiltasten lässt sich das Spiel steuern, Steine drehen, und Punkte sammeln. Beeindruckend! Interessanterweise funktioniert das Ganze auch ohne den Extended-Modus. Ein Test mit dem normalen 3.7-Modell liefert sogar ein optisch noch ansprechenderes Tetris-Spiel mit Vorschau des nächsten Steins und zusätzlichen Steuerungsmöglichkeiten (Leertaste für sofortiges Fallenlassen). Das Spiel ist voll funktionsfähig, inklusive Punktezählung und Levelanzeige.

Ein Blick in den generierten Code offenbart ein umfangreiches Programm, das aus diesem simplen Prompt entstanden ist. Das Erstaunliche: Das erstellte Spiel lässt sich sogar veröffentlichen und teilen! Über den „Publish“-Button generiert Claude einen Link, über den jeder das Tetris-Spiel im Browser spielen kann. Eine beeindruckende Demonstration der Code-Fähigkeiten von Sonnet 3.7.

GitHub-Integration und Claude Code: Coding auf dem nächsten Level

Neben den beeindruckenden Chatbot-Fähigkeiten gibt es eine weitere spannende Neuerung: GitHub-Integration. Im Chatbot-Menü finden wir neben Datei- und Bild-Upload nun auch die Option, den Claude-Chatbot mit GitHub zu verbinden. So können wir direkt mit der KI über den Code in unseren GitHub-Projekten sprechen und zusammenarbeiten.

Die Github Integration im Claude Chatbot
Mit diesem Button können wir unser GitHub Konto mit Claude verknüpfen

Claude Code – Ein kleines, aber mächtiges CLI-Tool

Doch das ist noch nicht alles. Anthropic hat mit Claude Code ein weiteres Tool vorgestellt, das die Code-Fähigkeiten von Sonnet 3.7 auf die nächste Stufe hebt. Claude Code ermöglicht es, die Fähigkeiten des Modells direkt im Terminal zu nutzen.

Introducing Claude Code

Ein kurzer Blick in die Demo von Anthropic zeigt, wie einfach das funktioniert: Claude Code findet selbstständig die relevanten Dateien für Code-Änderungen, schlägt Code-Anpassungen vor, erklärt seinen Denkprozess und setzt die Änderungen nach Bestätigung durch den Nutzer um. Claude Code befindet sich aktuell in der Beta-Phase (Research Preview). Die Nutzung erfordert das Herunterladen und die Verknüpfung mit dem eigenen Anthropic-Konto und wird über die normalen API-Preise abgerechnet. Positiv: Die API-Kosten sind im Vergleich zu Sonnet 3.5 unverändert geblieben.

Ein ausführlicher Test von Claude Code steht noch aus, aber das Potenzial dieses Tools ist enorm. Für alle, die mit Code arbeiten, könnte Claude Code eine revolutionäre Arbeitserleichterung bedeuten.

Fazit: Ein Game Changer für Programmierer und mehr

Auch wenn Programmierung nicht für jeden relevant ist, ist das neue Angebot von Anthropic im Bereich Agentic Coding ein echter Game Changer. Sonnet 3.7 und insbesondere die Tools wie Claude Code bieten Programmierern eine unglaubliche Unterstützung und Arbeitserleichterung.

Sonnet 3.7 ist aber nicht nur für Entwickler interessant. Auch für alle, die eine Alternative zu OpenAI, Google oder XAI suchen, ist das neue Modell einen Blick wert.

Ausblick in die Zukunft: Die Kollaborations-Ära der KI

"Roadmap" von Anthropic mit verschiedenen Phasen von KI-Modellen als Assistenten, jetzt 2025 Kollaborateure und 2027 Pioniere
So sieht die „Roadmap“ von Anthropic aktuell aus

Ein Blick auf die Prognose von Anthropic zeigt, dass Sonnet 3.7 das erste Modell der sogenannten Kollaborations-Ära einläutet – die nächste Stufe nach den einfachen KI-Assistenten. Bis 2027 soll dann die Ära der KI-Pioniere erreicht werden, die Probleme noch effektiver und in kürzester Zeit lösen sollen. Die Zukunft der KI bleibt spannend!

Autor

  • Profilbild von Johannes Ruof

    Johannes Ruof ist Mitgründer und Geschäftsführer der Meixner & Ruof UG. Als KI- und Office-Experte betreibt er zusammen mit Timothy Meixner den erfolgreichen YouTube-Kanal Digitale Profis (125.000+ Abonnent:innen).

    Alle Beiträge ansehen
Nach oben scrollen