Die KI-News der Woche vom 16.05.2024

Die KI-News der Woche vom 16.05.2024

Melde Dich für unseren Newsletter an und erhalte alle wichtigen News direkt in dein Postfach!

OpenAI stellt beim Spring Event mit dem neuen GPT-4 Omni Modell die KI-Welt mal wieder auf den Kopf und Google versucht einen Tag später mit der I/O Konferenz nachzuziehen. Anthropic hat währenddessen still und leise den eigenen Chatbot endlich auch bei uns frei zugänglich gemacht und es gibt beeindruckende Entwicklungen in der Robotik sowie bei KI-Tools für Audio- und Video-Erzeugung.

Ich glaube ich verspreche nicht zuviel, wenn ich sage dieses KI-Update hat es mal wieder richtig in sich!

💻 OpenAI Spring Event – GPT4-O

Im Spring Update hat OpenAI eine neue verbesserte Version von ChatGPT vorgestellt, mit den Namen GPT-4o oder GPT-4 Omni. Dabei handelt es sich um ein multimodales Modell, das ab jetzt für alle kostenlos verfügbar gemacht wird.

Außerdem wurde eine ChatGPT Desktop App angekündigt und beeindruckende Neuerungen für ChatGPT Voice und ChatGPT Vision vorgestellt.

Neue Funktionen von ChatGPT ab jetzt kostenlos für alle! OpenAI stellt GPT-4o Modell vor: GPT-4 Omni

Alle Informationen und Neuerungen haben wir in diesem Video für Euch zusammengefasst.

🔎 Google I/O 2024

Einen Tag später gab es die Entwicklerkonferenz I/O von Google und auch hier hat sich alles ums Thema KI gedreht. Im Gegensatz zu OpenAI hat Google aber eine Menge neuer Updates und Tools vorgestellt – quasi nichts davon kann man aber unmittelbar verwenden und bei vielen Dingen stellt sich die Frage, ob es auf Deutsch oder allgemein hier bei uns in der EU überhaupt in absehbarer Zeit kommen wird.

Auch alles, was auf der Google I/O vorgestellt wurde, haben wir in einem extra Video besprochen, um hier den Rahmen nicht zu sprengen.

Neue KI-Tools bei der Google I/O 24: KI-Suche, SORA-Konkurrent, Gemini Updates, neue Bild-KI Imagen3

🍏 Apple bringt ChatGPT auf das iPhone

Nachdem viele von uns immer noch auf eine eigene KI warten, scheint der iPhone-Hersteller keinen Druck von außen zu spüren und lieber auf externe Unterstützung zu setzen. Laut Bloomberg steht Apple kurz vor der Einigung mit OpenAI und wird die Partnerschaft offiziell im Juni bei der alljährlichen Entwicklerkonferenz WWDC bekannt geben.  

Der Journalist Mark Gurman, der sich bei Bloomberg mit allem rund um den iPhone-Konzern beschäftigt vermutet, dass Apple eigentlich gar kein Interesse daran hat, einen eigenen Chatbot zu entwickeln. Es soll wohl weiter an einem eigenen KI-Modell gearbeitet werden, das aber mehr dazu eingesetzt werden dürfte, die Produkte allgemein smarter zu machen, also Verbindungen zwischen Apps, Vorschläge, etc. 

Gleichzeitig weiß Apple, dass die eigene Zielgruppe natürlich eine hohe Erwartung hat, vor allem nach den beeindruckenden Demos von GPT4-O und der neuen Voice Funktion. Und genauso, wie man einen Milliarden-Deal mit Google für die Suche hat, wird es jetzt wohl den Chatbot-Deal mit OpenAI geben. 

🎤 ElevenLabs macht jetzt Musik

Nachdem wir mit Suno und Udio ja schon zwei richtig gute KI-Tools für das Generieren von Songs haben wird es wohl schon bald einen weiteren, sehr ernstzunehmenden Konkurrenten geben. ElevenLabs, das KI-Tools zur Erzeugung von extrem realistischen Stimmen, hat angekündigt jetzt auch in diesen Bereich zu expandieren und auf Twitter einige Beispiele als Vorschau für das neue Tool geteilt.

Es ist natürlich klar, dass ElevenLabs mit Stimmen extrem gut umgehen kann und da liegt dieser Schritt nicht wirklich fern. Aktuell gibt es außer den Demos noch keine weiteren Infos bezüglich einem Datum, oder ob das Ganze auch kostenlos verwendbar sein wird, wir halten euch aber selbstverstädnlich auf dem Laufenden. 

💰 Udio gibt Preise und Audio Inpainting bekannt

Bleiben wir kurz bei Musik-KI-Tools. Udio hat jetzt nach der öffentlichen Beta-Phase eine Preisstruktur für das eigene Angebot festgelegt. Die gute Nachricht zuerst: Es wird weiterhin einen großzügigen kostenlosen Plan geben mit 10 Credits, die jeden Tag aufgefüllt werden und zusätzlich einmalig 100 Credits pro Monat. Wenn man bedenkt, dass jede Generation bei Udio nur 1 Credit kostet, kommt man damit für die gelegentliche Nutzung als Hobby weiterhin gut durch. 

Die bezahlten Pläne starten bei 10 Dollar pro Monat und bieten aber neben mehr Generationen sogar noch mehr Funktionen. Das erste neue Feature, das jetzt schon vorgestellt wurde, ist Inpainting für das erzeugte Audio. Die Funktion, die man normalerweise von Bild-KIs kennt, dort kann man damit Teile eines Bilds ändern oder neu generieren, funktioniert bei Audio auch extrem gut.

Man kann mit dem Audio-Inpainting Teile eines Songs bearbeiten, andere Texte einfügen oder die Instrumente ändern, ohne den Rest der Musik zu beeinflussen. Diese Funktion ist aber wie gesagt nur in den bezahlten Plänen von Udio enthalten. 

👥 Connected Apps in ChatGPT

Ein weiteres, möglicherweise in den Startlöchern stehendes Feature für ChatGPT wurde beim Spring Event gar nicht erwähnt und das ist die Möglichkeit andere Apps über eine Funktion namens Connected Apps zu verwenden.

Aktuell scheint sich das auf Cloud Speicher zu beschränken, in einem ersten geleakten Video sieht man beispielsweise wie Dateien aus Google Drive oder Microsoft OneDrive direkt in ChatGPT referenziert werden können und damit im Chat weitergearbeitet wird. Da OpenAI selbst dazu gar nichts gesagt hat, gibt es aber leider keine genaue Timeline, wann wir uns darauf freuen können. 

🇩🇪 Anthropic bringt Claude endlich nach Deutschland

Nach langer Wartezeit haben wir endlich auch in Deutschland Zugriff auf den Chatbot Claude von Anthropic. Vorbei sind die Zeiten, in denen wir POE, einen VPN oder ähnliche Programme verwenden mussten, um das Modell testen zu können. Claude gilt als einer der vielversprechendsten Chatbots und ernstzunehmende Konkurrenz für OpenAI.

Man kann die KI entweder im Browser oder auf dem iPhone kostenlos verwenden und ausprobieren. Allerdings benötigt man eine E-Mailadresse und eine Telefonnummer, um den Account zu bestätigen. Wir werden Claude auf jeden Fall ausgiebig für Euch testen und ein eigenes Video dazu auf dem Channel hochladen. Also abonnieren nicht vergessen, wenn ihr das nicht verpassen wollt.  

⌨️ Anthropic stellt Prompt Generator vor

Neben diesen sehr coolen News hat Anthropic aber auch im Playground ein neues Tool hinzugefügt, mit dem man bessere Prompts für KI-Chatbots erzeugen lassen kann. Man gibt dabei einfach ein, was man gerne machen würde und die KI formuliert daraus einen umfassenden Prompt mit Platzhaltern, den wir danach dann verwenden können. 

Ausprobieren kann man das Ganze unter console.anthropic.com. Wichtig: Die Erzeugung dieser Prompts benutzt die API von Anthropic und ist damit kostenpflichtig. Aktuell bekommt man aber bei der Anmeldung einmalig ein Guthaben von 5 Dollar gutgeschrieben und kann dieser verwenden, um den Prompt Generator zu testen. Man muss dabei auch keine Zahlungsmittel angeben oder ein Abo abschließen, sondern kann mit dem “Startguthaben” unverbindlich arbeiten. 

🤖 Unitree stellt günstigen Roboter vor

Das chinesische Robotik-Unternehmen Unitree hat einen neuen humanoiden Roboter vorgestellt, der gegen Figure 01, Optimus von Tesla und andere Konkurrenten antreten soll.  

Die Funktionen sind vergleichbar mit denen der anderen Roboter und im Demovideo selbst ist nicht wirklich etwas Besonderes zu sehen, dass wir so nicht schon bei der Vorstellung anderer Roboter gesehen haben. Was die Version von Unitree so besonders macht ist der Preis, der mit 16.000 Dollar eine echte Ansage ist.  

Der Roboter selbst ist 35 Kilogramm schwer und lässt sich relativ kompakt zusammenklappen, wodurch er natürlich auch in seinen möglichen Anwendungen sehr vielfältig sein dürfte, da er beispielsweise von Rettungsdiensten problemlos transportiert werden könnte.  

Eine positive Anmerkung an dieser Stelle. Der Roboter zeigt die Handlungen in Echtzeit und es wurde nicht getrickst wie bei manch anderer Vorstellung. 

Unitree Introducing | Unitree G1 Humanoid Agent | AI Avatar | Price from $16K

📽️ Krea AI erstellt ganze Videos aus Keyframes

Krea.AI hat ein eigenes Tool zur Erzeugung von Videos auf Basis von sogenannten Keyframes und Textprompts vorgestellt. Keyframes sind Schnappschüsse aus einem Video, die dann mithilfe von KI zusammengeführt werden. Man hat also beispielsweise ein Porträt von einem Mann und ein Bild einer Maske. Mithilfe des Tools von Krea wird jetzt eine Animation erstellt, die diese beiden Bilder miteinander verbindet und man kann das Video dann mit Textprompts erweitern und so die Animation weiterbearbeiten. 

Ebenso kann man das Format sowie die Dauer des Videos problemlos anpassen.   

Die Qualität sieht auf jeden Fall schon mal sehr ordentlich aus. Wir werden das nochmal in naher Zukunft genauer unter die Lupe nehmen und einigen ausgiebigen Tests unterziehen.  

Autor

  • Timothy Meixner

    Timothy Meixner ist Mitgründer und Geschäftsführer der Meixner & Ruof UG. Als KI- und Office-Experte betreibt er zusammen mit Johannes Ruof den erfolgreichen YouTube-Kanal Digitale Profis (80.000+ Abonnent:innen).

    Alle Beiträge ansehen
Nach oben scrollen