Melde Dich für unseren Newsletter an und erhalte alle wichtigen News direkt in dein Postfach!
Canva kauft eine der besten Bild-KIs, es gibt neue, beeindruckende Updates für Musik und Video-KIs, Meta stellt ein neues beeindruckendes Open Source KI-Tool vor und bei Apple gibt es Verzögerungen für die eigene KI.
Wie immer haben wir die wichtigsten Nachrichten aus der Welt der Künstlichen Intelligenz für Euch zusammengefasst.
🛠️ Segment Anything 2 von Meta
Meta hat die zweite Version von Segment Anything vorgestellt. Wer sich nicht mehr daran erinnert, was das ist: Mit dieser Technologie konnte man bisher schon auf Bildern einzelne Objekte ganz leicht erkennen und bearbeiten oder entfernen. Mit der neuen Version funktioniert das Ganze jetzt sogar mit Videos. In Rekordgeschwindigkeit werden Dinge erkannt und über das komplette Video getrackt. Man kann die Technologie sogar hier selbst ausprobieren. Wir haben ein bisschen damit herumgespielt und es ist sehr beeindrucken wie schnell und präzise das funktioniert.
Sogar das Tracken von mehreren Objekten in einem Video funktioniert super und man kann in der Demo schon mit verschiedenen Einstellungen experimentieren, zum Beispiel Dinge dynamisch verpixeln, was natürlich ein super Use Case dafür ist oder aber auch künstlerisch arbeiten, indem beispielsweise die Farben aus dem Hintergrund entfernt werden oder ähnliches. Probiert das auf jeden Fall mal aus, es ist kostenlos, man braucht keinen Account und es macht jede Menge Spaß!
Wichtiger Hinweis auch noch an dieser Stelle: Meta bleibt auch bei SAM 2 der Open Source Linie treu – das komplette Projekt ist öffentlich. Man könnte mittlerweile fast sagen, dass der Facebook Konzern eigentlich OpenAI ist.
🎆 Canva kauft Leonardo.ai
Das Online-Design-Tool Canva hat in einem Super-Deal eine der besten Bild-KIs auf dem Markt gekauft – Leonardo.ai. Die Kaufsumme ist aktuell noch nicht bekannt, aber es soll wohl ein Mix aus Cash und Aktien sein. Leonardo wird komplett in Canva integriert und wird dort genau wie bisher weiter agieren mit dem kompletten Team inklusive Führungsebene.
Das ist natürlich für Canva ein super Investment, denn Leonardo hat neben der reinen Bilderzeugung auch schon eine ganze Reihe von anderen KI-Tools im Bereich Bild und Animation, die jetzt dann bald in Canva verfügbar sein dürften. Wieviel davon am Ende Geld kosten wird und welche Funktionen vielleicht auch für kostenlose User verwendbar sind müssen wir aktuell abwarten.
🎶 Udio bekommt ein Update
Die Musik-KI Udio hat ein Mega-Update bekommen und steht jetzt in der Version 1.5 zur Verfügung. Die Qualität der Songs hat sich damit nochmal deutlich verbessert. Neben besserer Musik kann Udio jetzt unter Anderem auch STEMS also einzelne Spuren der erzeugten Tracks exportieren, die Remix-Funktion wurde verbessert und man kann direkt aus dem KI-Tool Videos mit Lyrics der Songs exportieren.
Zu den Neuerungen mit verbesserter Qualität und neuen Funktionen haben wir ein eigenes Video produziert.
📏 GPT-4o Long Output Alpha
Sehr interessante News von OpenAI: In einer Ankündigung auf der Website wird eine neue Version von GPT-4o mit einem sogenannten “Long Output” von 64.000 Token vorgestellt, die ab sofort für Alpha User zur Verfügung steht. Die doch begrenzte Länge des Outputs von Chatbots ist ein großer Kritikpunkt, der viele Anwendungen gerade auch im Coding-Bereich schwierig macht.
Wenn die Ausgaben und Antworten wirklich bis zu 64.000 Tokens enthalten könnten würde das für eine Antwort vermutlich irgendwo zwischen 70 und 100 Seiten Text liegen – grob geschätzt. Damit wären nochmal beeindruckendere Use Cases möglich – ob dabei die Antworten sinnvoll bleiben und kohärent, das wird spannend zu sehen.
🏆 Olympia setzt auf KI
Olympia 2024 ist das erste groß angelegte Sportereignis der Welt, bei dem KI flächendeckend eingesetzt wird. Unter anderem wird versucht mithilfe von KI-Tools die Teilnehmenden vor negativen Reaktionen auf Social Media zu schützen, damit sie sich ausschließlich auf den Wettbewerb konzentrieren können.
Ihnen wird außerdem über die Athlete365 Plattform mithilfe von Intel ein Chatbot zur Seite gestellt, der ihnen dabei helfen soll sich in Paris zurecht zu finden und Antworten auf häufig gestellte Fragen liefert. Das Feedback ist laut der Organisation ausgesprochen positiv und es ist schön zu sehen, dass so eine große Organisation an dieser Stelle der neuen Technologie gegenüber aufgeschlossen ist.
KI wird aber nicht nur zur Unterstützung der Athleten, sondern auch für die automatische Erstellung von Highlight Videos eingesetzt. Alles in allem ist es bisher auf jeden Fall ein Erfolgsprojekt und ich bin mir sicher, dass man in Zukunft auch bei anderen Sportereignissen verstärkt auf KI setzen wird und wer weiß, vielleicht wird ja beim nächsten Fußballturnier dann endlich der Videoschiedsrichter ersetzt und die KI erkennt dann etwas zuverlässiger, wenn ein Handspiel passiert.
🎥 Runway Gen3 Alpha jetzt auch mit Image to Video
Nachdem die dritte Generation der Video-KI RunwayML schon eine Weile verfügbar ist, wurde jetzt auch endlich die lang erwartete Image-To-Video Funktion freigeschalten, die es uns erlaubt nicht nur Videos aus Text-Prompts zu erzeugen, sondern auch auf Grundlage eines Bilds eine Animation zu erstellen.
Es ist absolut beeindrucken, was wir im Bereich Video gerade für Sprünge machen – übrigens bekommt ihr hier auf dem Channel auch schon bald unser Tutorial für Kling.ai, dass sich ja viele von euch letzte Woche gewünscht haben. Wer das also nicht verpassen will, lässt am Besten ein Abo da, falls noch nicht passiert.
🏆 Mango setzt auf KI-Models
Die spanische Kleidungsfirma Mango hat bekanntgegeben für eine Kampagne, die sich primär an Teenager richten soll, auf virtuelle Models zu setzen. Das heißt, die Kleidung ist zwar echt, das Model selbst aber vollkommen KI-generiert. Damit ist Mango eins der ersten Unternehmen, die öffentlich einen Feldversuch mit KI-Models starten.
Tatsächlich sehen die Anzeigen jetzt nicht wirklich anders aus, als es die mit echten Menschen tun und vor allem, wenn man bedenkt, dass diese Anzeigen oft auch einfach auf Plakaten oder ähnlichem sind, dann bezweifel ich, dass man hier einen großen Unterschied erkennen würde. Also scheint die Model-Branche, die nächste zu sein, die der KI-Revolution zum Opfer fallen wird.
🍎 Apple Intelligence verzögert sich
Das Release von Apple Intelligence wurde jetzt offiziell auf die iOS Version 18.1 verschoben, die im Oktober diesen Jahres erscheinen wird. Damit wurde der Start der neuen KI nochmal mindestens einen Monat nach hinten verlegt. Die Beta-Version für die Geräte ist aber heute erschienen, allerdings ohne die neue Version von Siri und nicht für alle von uns in Europa.
Ersten Tests zufolge scheint das Update ganz gut anzukommen, aber es hat noch niemanden wirklich vom Hocker gehauen. Vor allem mit dem Siri Update hat sich Apple keinen Gefallen getan – die Oberfläche wurde nämlich aktualisiert aber die Funktion noch nicht. Das hat einfach nur dazu geführt, dass die meisten denken, Siri 2.0 ist genauso schlecht wie die alte Version.
🏆 Google KI holt Silber bei Mathe-Olympiade
Zwei neue Google KI-Modelle mit den Namen AlphaProof und AlphaGeometry 2 haben bei der Internationalen Mathe Olympiade 28 von mögichen 42 Punkten erreicht und konnten damit quasi eine Silbermedaille im Wettbewerb gewinnen – nur 60 menschliche Mathematiker waren besser.
Das klingt erst einmal sehr abstrakt aber zeigt riesige Fortschritte, denn Mathe ist auch eins der Themen, in denen KI traditionell schlecht ist, siehe die Beispiele in denen Chatbots behaupten 9.11 wäre größer als 9.9. Um diese Leistung im schwierigsten Mathe-Wettbewerb der Welt zu erreichen muss Google hier also etwas grundlegend anders gemacht haben – die Antworten wurden sogar von anderen Teilnehmern gewürdigt.
Gleichzeitig muss man erwähnen, dass die KIs von 6 Aufgaben, die zu lösen sind, zwei überhaupt nicht gelöst haben und für mindestens eine weitere trotz der massiven Rechenleistung 60 Stunden gebraucht hat, was sehr viel länger ist, als die anderen Teilnehmenden eigentlich an Zeit bekommen. Hier kann man argumentieren, dass in dieser Zeit vielleicht auch viele Menschen dann besser abgeschnitten hätten.
🏆 Open Source Modelle holen auf
In einer aktuellen Grafik über die Leistung von KI-Modellen im MMLU Benchmark sieht man deutlich, wie stark die Open Source Modelle in letzter Zeit die Lücke zu den kommerziellen Counterparts geschlossen haben.
I don’t think this graph means what folks think it means
— Ethan Mollick (@emollick) July 24, 2024
What it means:
1) Open models got good
2) MMLU is bad, saturated
3) Scaling holds for now, frontier models are giant models, open or not
4) GPT-4 was an outlier
It doesn’t mean AI development is slowing. That isn’t clear pic.twitter.com/ckADfDSzMe
Vor allem das neue 405B Llama Modell hat hier quasi für Gleichstand bei der Leistung gesorgt. Noch sieht man hier auch, dass im Bereich KI mehr immer noch mehr ist. Während kleinere Modelle zwar auch besser werden, können sie mit den massiven Frontier-Modellen mit viel mehr Parametern nicht mithalten. Und laut Aussagen unter anderem von Microsoft CTO Kevin Scott sind wir bei dieser Skalierung noch nicht an eine Grenze gestoßen.
Die Zukunft wird interessant und ob Firmen wie OpenAI und Anthropic sich mit ihren geschlossenen Modellen weiter an der Spitze halten können hängt jetzt stark davon ab, wie viel mehr Leistung die nächsten Iterationen haben werden. Wenn Meta mit seinen Open Source Modellen die Leistung weiter mitgeht wird es schwierig zu rechtfertigen, warum irgendjemand ein geschlossenes Modell verwenden sollte – gerade im geschäftlichen und öffentlichen Umfeld. Und das muss den großen Anbietern auf jeden Fall Sorgen machen denn…
💸 OpenAI verbrennt Geld
Auch wenn OpenAI bereits Umsatz mit den eigenen Produkten macht, scheint es aktuell nicht danach auszusehen, dass das Unternehmen profitabel ist. Laut ersten Schätzungen wird die Firma hinter ChatGPT für Training und das Betreiben der eigenen Modelle im Jahr 2024 7 Milliarden US Dollar ausgeben müssen – dafür reichen die eigenen Einnahmen von aktuell geschätzt ca. 3-5 Milliarden US Dollar nicht ganz.
Natürlich muss man hier Schwarzmalern, die sagen, dass ist die Insolvenz von OpenAI klar widersprechen: Es gibt immer noch riesige Investments und durch den Erfolg wird es vermutlich auch noch mehr Geld für OpenAI geben. Aber trotzdem: Die Mittel, die Sam Altman und seine Firma haben sind nicht mit dem zu vergleichen, was beispielsweise Meta in die Weiterentwicklung der eigenen KI-Projekte stecken kann und will.
Und auch Microsoft als größter Investor bei OpenAI muss sich auf Dauer natürlich überlegen, ob man das Geld wirklich komplett in eine externe Firma stecken möchte oder selbst mehr investieren.
🔎 SearchGPT
Aber es ist nicht alles negativ: Letzte Woche haben wir in einem eigenen Video, das wir euch natürlich auch verlinkt haben gezeigt, dass OpenAI mit SearchGPT ein neues Produkt – eine eigene Suchmaschine – an den Start bringt.
Aktuell gibt es für den Prototyp nur eine Warteliste, auf die man sich setzen kann. Aber mit diesem direkten Angriff gegen Google könnte sich das Unternehmen nochmal einen Vorteil verschaffen und noch mehr User erreichen.