Melde Dich für unseren Newsletter an und erhalte alle wichtigen News direkt in dein Postfach!
Donald Trump macht KI zum Pflichtfach in Schulen, OpenAI greift bei einem ChatGPT Update richtig daneben und bringt Shopping Funktion, Google etabliert sich still und leise an der Spitze und eine neue Stimm-KI sorgt für Aufregung.
🏫 Trump macht KI in Schulen zur Priorität
Donald Trump hat per Dekret beschlossen, dass KI zu einer Priorität in Schulen werden soll. Die Vereinigten Staaten wollen damit ihre Führungsrolle im Bereich der künstlichen Intelligenz sichern, indem sie bereits frühzeitig KI-Kompetenzen fördern. Dafür sollen Schülerinnen und Schüler ab dem Kindergartenalter bis zur Berufsausbildung grundlegende KI-Kenntnisse erwerben, wobei auch Lehrkräfte umfassend geschult und mit passenden Ressourcen ausgestattet werden. Eine neu eingerichteter White House Taskforce soll die Koordination dieser Maßnahmen übernehmen, Programme für die Integration von KI in den Unterricht entwickeln und eine landesweite „Presidential Artificial Intelligence Challenge“ veranstalten, um das Interesse an KI zu stärken und Talente zu fördern. Zudem sollen öffentliche und private Partnerschaften Ressourcen für K-12-Bildung bereitstellen, bestehende Fördermittel gezielt genutzt und neue Lehr- und Ausbildungsangebote geschaffen werden. K-12 Bildung bezeichnet in den USA einfach die Ausbildung der Kinder von der Vorschule bis zum Abschluss.
Parallel dazu sollen gezielte Programme die Ausbildung von Lehrkräften in KI vorantreiben und den Einsatz von KI-Technologien im Unterricht verbessern. Auch Berufsbildung und Weiterbildung sollen angepasst werden: Ziel ist es, jungen Menschen den Zugang zu hochwertigen KI-Zertifizierungen und dualen Ausbildungsprogrammen zu erleichtern und langfristig eine in KI geschulte, innovationsfähige Gesellschaft aufzubauen.
🆕 Qwen 3 veröffentlicht
Es gibt eine neue Generation der Qwen-Modelle, die jetzt vorgestellt wurden und direkt im Qwen Chatbot verwendet werden können. Diese chinesischen Open Weight Modelle können dabei in den ersten Benchmarks auf jeden Fall überzeugen und müssen sich aktuell nur den wirklich besten Modellen wie Gemini 2.5 Pro geschlagen geben. Es gibt insgesamt vier Abstufungen der Modelle, zwei Mixture of Experts Modelle mit 235 bzw. 30 Milliarden Parametern, sowie ein 32B und 4B Modell am unteren Ende des Leistungsspektrums.
Interessant bei den neuen Qwen-Modellen ist der Hybrid-Ansatz, das bedeutet es sind keine reinen Reasoning-Modelle, können aber Reasoning verwenden, wenn gewünscht. Hier haben wir dann zumindest im Qwen Chatbot auch die Möglichkeit ziemlich genau zu definieren, wie viel das Modell “nachdenken” soll, bevor die finale Antwort gegeben wird.
In Demo-Videos haben wir auch gesehen, dass Qwen in der Lage ist Tools zu verwenden, vermutlich über das MCP-Protokoll, um gewisse Aufgaben zu erledigen, beispielsweise wurde ein Balkendiagram auf Grundlage von recherchierten Daten erstellt.
Die Modelle kann man wie gesagt unter chat.qwen.ai direkt testen, sie sind aber auch beispielsweise auf Huggingface verfügbar und man kann zum Beispiel das kleine 4B Modell auch lokal mit einem Programm wie LMStudio ausprobieren.
🖥️ Werbe-Drama bei Perplexity
Die KI-Suchmaschine hat aktuell ein paar eher negative Schlagzeilen gemacht. Es ist ja jetzt schon eine Weile bekannt, dass Perplexity einen eigenen KI-Browser mit dem Namen “Comet” auf den Markt bringen möchte. Laut jetzt aufgetauchten Informationen soll dieser aber wohl ein paar mögliche Probleme damit haben, dass jede Menge Daten über das Verhalten der User gesammelt werden sollen, um extrem personalisierte Werbeanzeigen ausspielen zu können. Fairerweise hat der CEO Aravind Srinivas das nur in einem Podcast theoretisch durchgespielt, aber die Bedenken sind jetzt natürlich da. Auch wenn vielleicht nicht direkt für jeden diese Werbung angezeigt wird – die Daten sollen offensichtlich gesammelt werden.
Nach dieser Neuigkeit gab es jedenfall eine Menge negatives Feedback und viele User haben angekündigt, den Browser so nicht verwenden zu wollen. Was es nicht besser gemacht hat, ist dass der Chef Srinivas anstatt sachlich Stellung zu nehmen auf Twitter nur die Journalisten beleidigt und anderen Twitter-Usern vorgeworfen hat, auf Sensationsjournalismus hereinzufallen. Eine professionelle Reaktion auf Kritik sieht jedenfalls anders aus. Comet steht übrigens auch vor anderen Problemen und der Launch wurde jetzt schon mehrfach verzögert, also schauen wir mal, was dann am Ende dabei herauskommen wird.
🛒 Shopping ohne Werbung in ChatGPT
In ChatGPT wurde jetzt ein ähnliches Feature veröffentlicht, denn bei Websuchen mit dem GPT-4o Modell gibt es ab sofort eine “Shopping”-Funktion, über die direkt Produkte angezeigt werden, die für den User relevant sein könnten. Es gibt aber einen großen Unterschied zu Perplexitys geplanten Ads, denn diese Produkte sind tatsächlich keine platzierten Placements, sondern von ChatGPT ausgewählte Vorschläge. Bei Verkäufen, die über diese Produktplatzierungen geschehen, bekommt OpenAI auch keine Kommission oder ähnliches.
Chef Sam Altman hat ja immer wieder eine relativ klare, ablehnende Haltung gegenüber Werbung innerhalb von ChatGPT kommuniziert und dabei scheint es aktuell zu bleiben. Ist für den Konzern mit dem kürzlichen Rekord-Investment von zig Milliarden Dollar aber auch aktuell relativ leicht, auf zusätzliche Einnahmequellen zu verzichten.
⛔ ChatGPT Update-Fail
Aber auch bei OpenAI läuft nicht immer alles gut, das hat ein fehlgeleitetes Update des GPT-4o Modells über das Wochenende gezeigt. Nachdem alles, wie wir es schon gewohnt sind, mit einer ominösen Ankündigung von Sam Altman auf Twitter angefangen hat, gab es relativ schnell das erste, etwas unsichere Feedback von Usern. Denn ChatGPT hat mit diesem neuen Modell wirklich alles, was man eingegeben hat als “perfekt”, “unglaublich genial” und “sensationell” befunden. Man konnte die schlechteste Geschäftsidee aller Zeiten pitchen und der Bot hat einem freudig erklärt, dass man sofort Geld in diesen Plan investieren sollte und die Idee unglaublich gut sei.
Einige fanden das natürlich toll, einen Gesprächspartner zu haben, der immer zustimmt. Aber es war aber im Prinzip eine wirklich unverantwortliche Verstärkung einer der größten KI-Risiken aktuell, nämlich eine Echokammer zu schaffen. Gerade für anfällige Personen ist es echt gefährlich einen “menschlich” wirkenden Gesprächspartner zu haben, der immer zustimmt und alles gut findet, was man sagt, denn mit der Realität hat das dann eben oft leider gar nichts zu tun.
Und – die Kritik ist bei OpenAI angekommen. Schon kurze Zeit nach den ersten Meldungen wurden Anpassungen vorgenommen und das Team arbeitet aktuell weiter daran, die richtige Balance wiederzufinden. Man kann also davon ausgehen, dass sich die Persönlichkeit des Standardmodells über die nächste Zeit noch ein bisschen verändern wird.
✅ Aufgaben in ChatGPT
Auch in der Modellauswahl bei ChatGPT hat sich einiges getan und es sieht zumindest mal ein bisschen aufgeräumter aus. Wenn wir mit einem Premiumplan oben auf das Dropdown klicken, sehen wir zunächst einmal nur noch das Standard GPT-4o Modell, o3 und die beiden o4 Varianten. Die Research Preview von GPT-4.5 wurde interessanterweise in den Abschnitt “Mehr Modelle” verschoben, was dazu geführt hat, das manche User befürchten, das Modell wird vielleicht bald nicht mehr verfügbar sein. Davon gehen wir allerdings aktuell nicht aus.
Interessant ist, dass das Modell für die geplanten Aufgaben komplett verschwunden ist, aber keine Angst: Es ist weiterhin möglich, diese Tasks zu nutzen. Sie funktionieren jetzt mit dem o3 und den o4-Modelle und müssen einfach im Prompt eingefordert werden. Wenn ich also schreibe: “Schicke mir jeden Tag um 12 Uhr eine motivierende Nachricht”, dann erkennt ChatGPT meine Intention und erstellt die Aufgabe für mich, die ich dann wie gewohnt verwalten und bearbeiten kann.
🥇 Gemini 2.5 Pro behauptet sich weiter
Aber bei all diesen Nachrichten rund um OpenAI und ChatGPT sollten wir Google weiterhin nicht aus dem Auge verlieren, denn der Konzern macht mit Gemini 2.5 weiter nur positive Schlagzeilen. Es wurde jetzt auch das verbesserte Flash-Modell auf die neue Version aktualisiert und kann in seiner Preisklasse eigentlich alles schlagen. Gemini 2.5 Pro dagegegen schafft aktuell beim Pokemon-Benchmark neue Maßstäbe und hat alle 8 Orden eingesammelt – jetzt stehen nur noch die Top 4 an und dann hat die KI das Spiel komplett durchgeschafft!
Und sogar in einer Umfage im Subreddit von OpenAI nach dem aktuell besten Modell behauptet sich Google mit einem ziemlich deutlichen Vorsprung vor allen anderen Modellen auf Platz 1. Das Verrückte daran ist, dass wir aktuell vermuten, dass Google sogar ein bisschen etwas zurückhält, denn am 20. Mai startet die eigene I/O Konferenz, auf der man sicherlich auch im Bereich KI nochmal eine Schippe drauflegen will und vielleicht sogar neue Modelle vorstellen. Es gibt ja noch einige maskierte Modelle in diversen Vergleichen, die möglicherweise Gemini-Versionen sein könnten. Wir sind auf jeden Fall gespannt!
🤖 KI-Agentenfirma scheitert grandios
Forscher der Carnegie Mellon University führten ein Experiment durch, bei dem eine fiktive Softwarefirma vollständig mit KI-Agenten von Unternehmen wie Google, OpenAI, Anthropic und Meta besetzt wurde. Diese KI-Modelle übernahmen Aufgaben wie Softwareentwicklung, Finanzanalysen und Projektmanagement, mussten typische Arbeitsabläufe bewältigen und mit simulierten Kollegen zusammenarbeiten. Die Ergebnisse waren katastrophal: Selbst das beste Modell, Claude 3.5 Sonnet von Anthropic, schaffte nur 24 % der Aufgaben, während andere Modelle noch schlechter abschnitten und dabei teure, umständliche Prozesse durchliefen.
Die Studie zeigte, dass KI-Agenten derzeit an mangelndem gesunden Menschenverstand, schwachen sozialen Fähigkeiten und schlechter Internetnavigation scheitern. Manche KIs griffen sogar zu absurden Tricks, wie das Umbenennen von Nutzern im Chatsystem, um Aufgaben vorzutäuschen. Während KI-Modelle bei kleinen Aufgaben punktuell nützlich sein können, sind sie weit von der Fähigkeit entfernt, komplexe menschliche Arbeit zu ersetzen. Das Fazit: Trotz großer Versprechen der Tech-Industrie sind KI-Agenten noch lange keine ernsthafte Konkurrenz für menschliche Arbeitskräfte.
🗣️ Stimm-KI Nari sorgt für Aufsehen
Komplett aus dem Nichts ist mal wieder eine neue Stimm-KI aufgetaucht. Das Modell mit dem Namen Nari wurde dabei interessanterweise von nur zwei Personen ohne jegliche große Investition entwickelt. Das klingt erst einmal unglaublich, man muss dazu sagen, dass die beiden durch Google unterstützt wurden. Im Rahmen des Cloud Research Programms wurden ihnen TPUs, also die “KI-Chips” von Google zur Verfügung gestellt, um an Nari zu arbeiten. Das Ergebnis kann sich auf jeden Fall sehen, bzw. hören lassen.
Man kann Nari aktuell kostenlos, beispielsweise auf Huggingface testen, den Link dazu gibt es natürlich in der Videobeschreibung. Hier kann man dann einfach den Dialog, sowie “Regieanweisungen” beispielsweise Lachen oder Ähnliches eingeben und schon wir das Audio erzeugt. Leider funktioniert das aktuell nur auf Englisch wirklich gut, aber da können sich die Ergebnisse wirklich hören lassen.