Die KI-News der Woche vom 11.04.2024

6 Minuten Lesezeit

Melde Dich für unseren Newsletter an und erhalte alle wichtigen News direkt in dein Postfach!

🎧 Udio – KI-Musik besser als Suno?

Man hört jetzt ja immer wieder von KI Tools, die täuschend echt klingende Musik erzeugen können. Suno AI wird da immer sehr gerne als Beispiel genannt und auch wir haben euch die KI ja in einem eigenen Video vor einiger Zeit bereits vorgestellt. Jetzt hat Suno ein enormes Upgrade bekommen und generiert in seiner neuesten Version V3 wirklich beeindruckende Musik.

Diese Woche ist allerdings ein neues Tool aufgetaucht, mit dem Namen Udio – abgeleitet von Studio, das in seiner Qualität gefühlt noch einmal etwas besser als Suno ist.

Am 09.04.2024 wurde Udio als Beta auch für alle zugänglich gemacht. Ihr könnt es direkt auf Udio.com testen. Man kann bis zu 1200 Songs pro Monat generieren und das Ganze kostet dabei aktuell nichts. Daran wird sich sicherlich in der Zukunft etwas ändern, aber aktuell bietet das Tool damit wirklich jede Menge Möglichkeiten.

🔊 Stable Audio 2.0

Beim ganzen Hype um Suno 3 und die neuen Leaks von Udio sollten wir aber trotzdem Stable Audio nicht vergessen. In der neu vorgestellten Version 2 kann das Tool jetzt bis zu 3 Minuten lange Musikstücke komponieren und auch hier hat die Qualität nochmal einen ordentlichen Sprung nach vorne gemacht.

Stable Audio erzeugt, Stand jetzt, nur instrumentale Musik, also ohne Lyrics, aber auch dafür gibt es natürlich jede Menge Anwendungsbereiche. Überzeugt Euch am besten selbst, Stable Audio kann kostenlos getestet werden.

🖱️ Jony Ive und Sam Altman entwickeln KI-Gerät

Einer der berühmtesten Designer der Tech-Welt Jony Ive, der unter anderem für Apple am iMac, dem iPhone, iPod, MacBook, iPad und mehr gearbeitet hat, hat sich bereits 2019 von Apple getrennt und ein eigenes Unternehmen gegründet.

Jetzt arbeiten Ive und OpenAI CEO Sam Altman wohl gemeinsam an einem eigenen KI-Gerät und sind momentan dabei Investoren für ihr Großprojekt zu rekrutieren. Unter anderem scheint wohl Emerson Capital, die Firma von Steve Jobs Witwe Laurene Powell Jobs unter den Interessenten zu sein.

Wenn man bedenkt, dass Ive tatsächlich als der Designer des ersten iPhones gilt, dann darf man natürlich enorm gespannt sein, wie das finale Gerät dann aussehen wird.

Von einem Marktstart sind wir mit Sicherheit noch weit entfernt, aber man erkennt schon langsam den Trend zu den KI-Wearables. Wir haben ja in der Vergangenheit schon über den AI Pin von Humane oder den Rabbit R1 berichtet, aber bei diesen Firmen handelt es sich eben nicht um die Schwergewichte der Techbranche.

Allein die Symbolwirkung Jony Ive für das dann erste KI Gerät von OpenAI gewinnen zu können ist natürlich kaum vorstellbar. Mein persönlicher Wunsch für das Projekt ist, dass Ive sich darauf besinnt, wie er den Mac G3 damals designt hat und wir endlich wieder mehr bunt transparente Geräte bekommen.

🎬 Google Vids und weitere News von Google

Im Rahmen von Google Cloud Next, eine Veranstaltung des Konzerns für das Vorstellen von Neuigkeiten, gab es ein paar interessante News im Bereich KI. Ins Auge gefallen ist uns dabei vor allem Google Vids, ein neues Tool für die Erstellung von Videos mit KI. Dabei geht es weniger um reine Text-to-Video KIs wie Sora oder Runway, sondern um die Erstellung von z.B. Marketingvideos, auch auf Grundlage von existierenden Skripten oder anderen visuellen Materialien. Bis jetzt gab es nur eine kurz Demo, wie das aussehen könnte, wir sind gespannt, wie es hier weitergeht.

Neben Vids wurden neue animierte Bilder mit Imagen 2.0 gezeigt, hier sehen wir allerdings noch etwas Luft nach oben, da bei den unteren Beispielen auf den zweiten Blick recht schnell erkennbar ist, dass künstliche Intelligenz im Spiel war.

Auch interessant: Das Gemini 1.5 Pro Modell ist in der Web-Plattform Vertex AI jetzt für alle User verfügbar, da werden wir euch in Zukunft sicherlich auch von unseren ersten Tests mit dem riesigen 1.000.000 Token Kontext berichten können.

👁️ GPT4-Turbo bekommt durch Update Vision

GPT4-Turbo hat jetzt auch die Vision Fähigkeit bekommen und kann mit der neuen Version des Modells von Entwicklern über die API verwendet werden. Interessanterweise wurde im Twitterpost der Entwicklungsabteilung des Unternehmens als ein Beispiel dafür Devin genannt, die Programmier-KI mit den Agent-Fähigkeiten, die für eine Riesen-Aufregung in der Szene gesorgt hat. Zu großen Teilen scheint also wirklich auch hinter Devin GPT zu stecken, wie wir in unserem Video damals schon vermutet haben. Aber auch das beliebte Skizzier-Tool TLDRAW verwendet GPT4-Turbo mit Vision.

DEVIN IST DIE ZUKUNFT VON KI | Ist Devin die erste Stufe von AGI? | KI Tool erledigt deine Arbeit

Dieses Video auf YouTube ansehen

Ein bisschen seltsam waren die Formulierungen des Hauptaccounts von OpenAI und einigen führenden Mitarbeitenden, die im gleichen Atemzug gesagt haben, das Modell selbst sei nochmals deutlich verbessert worden und die neue Version wird jetzt auch in ChatGPT ausgerollt. Genaue Infos darüber, um was für Verbesserungen es geht, gibt es aber keine und auch keinen Blogpost zum Thema – wie es bei OpenAI mit großen Updates eigentlich üblich war. Wir sind gespannt, ob sich das Modell in ChatGPT über die nächsten Tage und Wochen verbessern wird.

🎼 Spotify AI Playlists

Spotify testet aktuell in Australien und dem UK eine KI Funktion in der iOS und Android App mit deren Hilfe man sich auf Basis von Text Prompts Playlists erstellen lassen kann.

Neben den klassischen Informationen wie Länge und Genre kann man mithilfe der neuen KI Funktion in natürlicher Sprache Stimmungen beschreiben oder ein Ziel vorgeben, dass man mit der Playlist erreichen möchte, Motivation für den Sport, Entspannung etc.

Um hier möglichst gute auf den User zugeschnittene Ergebnisse zu erzielen, verwendet Spotify neben Large Language Modellen auch die eigene Technologie, welche in der Vergangenheit für personalisierte Vorschläge aufgrund des eigenen Verhaltens verwendet wurde.

Es klingt auf jeden Fall nach einer runden Sache und ich bin gespannt, wann wir das Feature auch in Deutschland erhalten.

🤖 Cohere Coral mit Command R+

Das Unternehmen Cohere hat sein neuestes Sprachmodell Command R Plus vorgestellt. Das sagt vielen von Euch vermutlich erst einmal nicht viel, aber es handelt sich dabei schon wenige Tage nach der Veröffentlichung um die neue Nummer Eins bei den Open Source Modellen.

In der Chatbot-Arena konnte Command R Plus sogar GPT-4 jetzt hinter sich lassen und auch wir haben in unseren Tests wirklich top Ergebnisse bekommen.

CLAUDE 3 ODER DOCH GPT-4? - Kostenlos & ohne Account die besten Chatbots vergleichen | Chatbot Arena

Dieses Video auf YouTube ansehen

Man kann das Modell übrigens entweder in der Chatbot-Arena oder bei Cohere selbst kostenfrei ausprobieren und sich selbst davon überzeugen.

🖼️ Apple & Shutterstock Partnerschaft

Apple hat diese Woche eine Zusammenarbeit mit Shutterstock verkündet. Shutterstock ist einer der größten Anbieter für Stock-Fotografie, Videos und mehr. Apple möchte diesen enormen Katalog dafür verwenden, die eigenen KI-Modelle, insbesondere diejenigen, die sich mit Bild, Video und Audio beschäftigen, zu trainieren. Neben Apple haben auch Meta und Alphabet bereits ähnliche Partnerschaften mit Shutterstock geschlossen. Gerüchten zufolge soll Apples Plan allerdings mehr darauf abzielen, KI-Funktionen auf beispielsweise iPhones zu verbessern und nicht unbedingt ein eigenes KI-Modell im Sinne von ChatGPT auf Basis dieser Daten entwickelt werden.

Allgemein ist Apple momentan sehr daran interessiert, Partnerschaften mit Medienhäusern, Verlagen und sogar TV-Sendern abzuschließen, um sich selbst einen Vorteil im KI-Rennen in Bezug auf aktuelle Trainingsdaten zu verschaffen. Wie man an den vielen Gerichtsverfahren sieht, die gegen OpenAI und andere Anbieter von KI-Modellen laufen, macht das natürlich auch Sinn.

📺 OpenAI und Google trainieren KI-Modelle mit YouTube Videos

Laut einer Recherche der NYT, wurden wohl GPT-4 als auch einige ungenannte Google KI Modelle mit transkribierten YouTube-Videos trainiert. Zu einem gewissen Grad ist das natürlich auch sinnvoll, wenn man bedenkt, welche Menge an Informationen auf der Plattform verfügbar ist, aber es ist doch etwas fragwürdig, wenn Creator auf YouTube unwissentlich mit ihren Videos KI Modelle trainieren, ohne dem jemals zugestimmt zu haben.

Wer weiß, vielleicht gibt es ja sogar einige unserer Videos, die dafür verwendet wurden. Wir sind auf jeden Fall gespannt, was bei der Recherche der Times noch alles ans Tageslicht kommen wird.

Autor

Timothy Meixner
Timothy Meixner ist Mitgründer und Geschäftsführer der Meixner & Ruof UG. Als KI- und Office-Experte betreibt er zusammen mit Johannes Ruof den erfolgreichen YouTube-Kanal Digitale Profis (125.000+ Abonnent:innen).
Alle Beiträge ansehen

Digitale Profis