Die KI-News der Woche vom 11.07.2024

Die KI-News der Woche vom 11.07.2024

Melde Dich für unseren Newsletter an und erhalte alle wichtigen News direkt in dein Postfach!

Stimmen zu klonen wird immer einfacher, OpenAI legt sich mit Elevenlabs an, verbietet China den Zugriff auf die API und es gibt ein neue Informationen zu Apple Intelligence.

👻 Terif.ai

Ein Entwickler hat auf Twitter ein neues Mini-KI-Tool vorgestellt, das im Dialog in nur ca. Einer Minute schafft die Stimme des Gegenübers zu klonen und sich dann mit dieser Stimme weiter unterhält. Das Tool heißt passenderweise Terif.ai, eine Anspielung auf “Terrify” also in Schrecken versetzen und der Name passt ziemlich gut finden wird.

Es ist wirklich erschreckend, wie leicht es mit KI heute möglich ist, mit ein paar Wörtern Klone zu erstellen, die gerade zum Beispiel über eine Telefonleitung eigentlich nicht vom Original zu unterscheiden sind. Aman, der Entwickler, ist übrigens eigentlich der Gründer einer Firma, die bei der Erkennung dieser Fake-Stimmen helfen möchte und hat das Projekt eigentlich als Marketing-Aktion für die eigene Lösung gebaut. 

Wer sich traut, kann das Ganze auf Terif.ai ausprobieren, wir schauen aber hier einfach kurz in die Demo von Aman selbst:

📰 OpenAI bringt Text to Speech in API und Playground

OpenAI hat relativ unbemerkt ein neues Feature in die API gebracht und im Playground kann man das direkt ausprobieren. Es handelt sich dabei um Text to Speech, das bedeutet wir können einfach Text eingeben und dieser wird dann für uns vertont und kann als Audio-Datei heruntergeladen werden – also eigentlich genau das, was auch ElevenLabs macht.

Es gibt bei OpenAI aktuell dafür 6 Stimmen zur Auswahl, interessanterweise sind das andere Stimmen, als die, die wir aktuell in ChatGPT haben, vielleicht schon eine Vorschau auf den neuen Voice-Mode – falls der denn irgendwann noch kommt! Die neue Funktion klappt aber ziemlich gut, wir haben das mal mit einem KI-generierten Skript ausprobiert und in ca. 20-30 Sekunden wurde uns eine 4-minütige Audio-Datei erstellt, die schon ziemlich gut klingt.

Für diese Datei haben wir 6 Cent bezahlt, also auch was die Kosten angeht ist das neue Feature interessant, vor allem, da man hier eben nur die Nutzung bezahlt und nicht wie beispielsweise bei anderen Anbietern jeden Monat einen fixen Betrag. Wer also eher wenig damit arbeitet kommt hier bestimmt günstiger weg. 

🌃 AI Health Coach von Altman und Huffington

OpenAI CEO Sam Altman und Arrianna Huffington arbeiten gemeinsam an einem neuen KI-Projekt, das ein virtueller Gesundheitscoach sein soll. Mit dem Unternehmen Thrive AI Health soll die KI entwickelt werden, die laut Huffington mit den besten medizischen Studien trainiert wurde und außerdem Zugang zu sämtlichen personenbezogenen Gesundheitsdaten bekommt, die man als User freigibt.

Es ist auf der einen Seite schön zu sehen, dass hier vielleicht man wieder eine praktische Anwendung mit künstlicher Intelligenz entsteht – auf der anderen Seite sind natürlich genau diese Daten, also über die eigene Gesundheit, Krankheiten und so weiter doch sehr sensibel und ob ich das alles einem Unternehmen quasi zur Verfügung stellen möchte, ist eine gute Frage.

Und nicht nur das – auch Fehlinformationen, die ein solcher Bot ausgibt können natürlich gravierende Folgen haben. Insofern ist es spannend, wie Thrive diese Problematik lösen möchte, um hier nicht Gefahr zu laufen sich rechtlich angreifbar zu machen.  

🖥️ Artifacts bekommen neue Funktionen

Dass wir von der neuen Artifacts-Funktion von Claude begeistert sind, ist kein Geheimnis und wir stehen damit sicher auch nicht alleine da. Aber was uns bisher gefehlt hat, war die Möglichkeit die erstellten Artifacts mit anderen teilen zu können. Das ging nicht nur uns so und Anthropic hat prompt reagiert. Man kann jetzt ganz einfach die erstellten Anwendungen mit anderen teilen und sie sogar remixen, also weiterentwickeln.

Das beste daran ist, dass wir nicht einmal eingeloggt sein müssen, um ein Artifact zu testen. Probiert doch mal unser unfertiges Color Catcher Game aus. Hier bieten sich unglaublich viele Anwendungsgebiete, vom schnellen Design eines Prototyps bis hin zur Erstellung eines Quizzes für eine Schulklasse. Anthropic hat hier wirklich mal wieder abgeliefert und wir sind gespannt, was das Unternehmen in der nahen Zukunft noch für Überraschungen parat hält.  

🤖 POE Web Apps

Auch Poe geht jetzt in eine interaktivere Richtung und bietet seit Neuestem die Möglichkeit Web Apps direkt im Chat mit KI-Modellen zu entwickeln, direkt auszuprobieren und mit anderen zu teilen. Leider funktioniert das aber nur, wenn man einen Premiumplan für Poe hat, der aktuell 20 Dollar im Monat kostet.

Es gibt allerdings einige Demos online, viele davon vom Poe-Team, die das neue Feature schmackhaft machen sollen. Besonders gut funktioniert das natürlich mit Modellen, die gut programmieren können, also gerade GPT-4o, die Claude Modelle oder Gemini 1.5 Pro. 

So cool die Funktion auch ist muss man aber sagen: Das Timing ist eher unglücklich, da die Entwicklung dieser Apps ja mit Claude und Artifacts sogar ohne Premium-Plan möglich ist – und auch dort können wir, wie wir gerade gesehen haben ja jetzt die fertigen Apps teilen und weiterverarbeiten. 

🗓️ OpenAI blockt China

China ist in den letzten Wochen und Monaten immer mehr zu einem großen Player im KI-Markt geworden und es gibt jede Menge neue Tools, die aus China auch zu uns kommen, zum Beispiel die Video-KI Kling. OpenAI hat jetzt offiziell den Zugang zu den eigenen Modellen via API für China blockiert. Das ist ein interessanter Schritt und zeigt vielleicht auch ein bisschen Sorge des Konzerns davor, dass die eigene Technologie hier abgekupfert werden könnte.

Passend dazu wurde jetzt bekannt, dass ein Hacker wohl schon Anfang letzten Jahres Zugriff auf interne Kommunikation von OpenAI bekommen hat und einiges an Informationen über das Design der Technologien klauen konnte. Das hat Ängste geschürt, dass wenn eine individuelle Person dazu in der Lage war, auch China so Industriespionage betreiben könnte.

Ob beide Ereignisse jetzt zusammenhängen ist natürlich nur Spekulation, aber es ist doch bemerkenswert, dass OpenAI diesen Schritt geht – vor allem, wenn man bedenkt, dass der Zugriff auf ChatGPT aus China sowieso nur über VPNs möglich war, da die Regierungsfirewall die Website blockiert hat. 

🔇 Apple Intelligence Update und Veröffentlichung

Zu Apple Intelligence haben wir jetzt auch endlich ein paar neue Informationen und zwar war bisher ja nicht so richtig klar, welche Funktionen wann freigeschalten werden. Die Kommunikation von Apple war jetzt hier auch leider nicht optimal, aber Stand jetzt ist, dass wir im Herbst mit iOS18 die ersten KI-Features bekommen, d.h. GPT-Integration, Genmoji und andere Funktionen, die zunächst mal nur auf Englisch verfügbar sein werden.

Das eigentliche Upgrade, auf das der Großteil von uns wartet, Siri mit KI und Bildschirmverständnis, wird laut Mark Gurman, einem echten Apple Insider erst im Frühling mit dem iOS 18.4 Update erscheinen. Das ist natürlich schade, aber jetzt haben wir wenigstens mal ein grobes Zeitfenster mit dem wir rechnen können. Eine Sache die bisher auch noch nicht ganz geklärt zu sein scheint, ist ob es gewisse Funktionen geben wird, die nur gegen Bezahlung verfügbar sind.

Hier gibt es aktuell keine klare Aussage, es würde mich aber nicht überraschen, wenn Apple hier dann doch die ein oder andere Premiumfunktion zu verkaufen versucht.   

⌨️ Odyssey – Video KI für Profis

Es gibt schon wieder News aus der Welt der Video-KI, allerdings dieses Mal ein bisschen etwas anderes. Odyssey heißt die neue KI, die aktuell für Aufregung sorgt und deren Entwickler sich mit dem Tool direkt an Hollywood und die großen Filmproduktionen der Welt richten.

Im Gegensatz zu anderen Tools, soll mit Odyssey möglich sein, individuelle Shots genau zu beschreiben und zu verändern, einzelne Elemente auszutauschen und sogar dieselbe Szene aus verschiedenen Winkeln einzufangen. Bis jetzt gibt es nur die Demo-Videos von den Entwicklern selbst auf der Website odyssey.systems zu sehen, aber die sehen beeindruckend aus.

Wenn das wirklich alles so klappt, dann könnte das ein interessanter, neuer Ansatz sein, der durchaus vielversprechend ist. Denn das Tool wird auch so beworben, dass es sich nahtlos in existierende Prozesse der Filmindustrie integrieren lässt – das ist natürlich auch ein Alleinstellungsmerkmal. 

✏️ Figma nimmt KI Funktionen zurück und will Userdaten für Trainingszwecke nutzen

Das Prototyping und Design Tool Figma hatte vor kurzem beeindruckende KI-Features vorgestellt, mit denen man via Textprompt komplette Designs von Webseiten, Apps und anderen Anwendungen erstellen konnte. Außerdem musste man nicht einmal mehr die Interaktivität selbst einfügen, also wenn ein Button beispielsweise auf die Homepage verlinken sollte, hat die KI das automatisch erkannt und den entsprechenden Link hinter den Button gepackt.

Jetzt musste das Unternehmen die Funktionen aber bis auf weiteres zurücknehmen, da bei der Anfrage eine Wetter-App zu erstellen, die KI ein sehr vertrautes Design verwendet hat und das auf eine relativ zuverlässige Art. Das Design war quasi identisch mit dem Design der Wetter-App auf iOS und das schmeckt einem Konzern wie Apple natürlich gar nicht.

CTO Kris Rasmussen hat in einem Interview außerdem die vage Antwort gegeben, dass er es nicht sicher sagen könnte, ob die Apple Designs für das Training der KI verwendet wurden, was jetzt nicht unbedingt wie ein klares Dementi für mich klingt.  

Des Weiteren hat Figma bekannt gegeben ab dem 15.8. ihr eigenes KI-Modell auf Basis der Userprojekte zu trainieren. Das heißt im Klartext, dass Figma die Designs und Projekte von Nutzern verwendet, um zukünftige KI-Funktionen und somit dann auch die Erstellung von Designs zu entwickeln. Man hat zwar die Möglichkeit diesem Training zu widersprechen, es ist standardmäßig aber aktiviert, was ganz ähnlich wie es bei Meta der Fall war, für mich keine seriöse Art mit KI umzugehen ist und ich für meinen Teil würde diesem Training auf jeden Fall widersprechen.  

Wie ihr der Nutzung eurer Daten widersprechen könnt findet ihr hier.

Autor

  • Timothy Meixner

    Timothy Meixner ist Mitgründer und Geschäftsführer der Meixner & Ruof UG. Als KI- und Office-Experte betreibt er zusammen mit Johannes Ruof den erfolgreichen YouTube-Kanal Digitale Profis (80.000+ Abonnent:innen).

    Alle Beiträge ansehen
Nach oben scrollen