Die KI-News der Woche vom 04.04.2024

Die KI-News der Woche vom 04.04.2024

Melde Dich für unseren Newsletter an und erhalte alle wichtigen News direkt in dein Postfach!

❌ Zeit Gemini Advanced zu kündigen

Vor ziemlich genau zwei Monaten haben wir in einem Video Euch darauf aufmerksam gemacht, dass es Googles KI für zwei Monate kostenlos in der Premiumvariante gibt. Jetzt sind diese zwei Monate allerdings fast verstrichen und wer nicht möchte, dass sich das Abo verlängert, sollte nicht vergessen in den nächsten Tagen zu kündigen.

Gemini hat in Deutschland seit dem 20.2. kein Update mehr erhalten und kann momentan einfach in keiner Weise überzeugen, weshalb wir zum jetzigen Zeitpunkt keinen Grund für ein Premium-Abo sehen und unseren Plan bis auf Weiteres ebenfalls stilllegen werden – zumindest bis Google endlich zur Sache kommt und ein ansprechendes Upgrade für Gemini vorstellt.

Wenn das dann hoffentlich irgendwann der Fall ist, erfahrt ihr das natürlich bei uns als Erstes.

🖼️ Inpainting ab jetzt in ChatGPT dank Dall-E 3

Seit dieser Woche kann man in Dall E sogenanntes Inpainting anwenden, um Teile eines erzeugten Bildes anzupassen und zu verändern. Wir haben hier zum Beispiel ein Bild von einem Porsche genommen und die Farbe des Autos zu rot geändert. Auch wenn hier jetzt sich schon das ganze Auto etwas verändert hat, kann man deutlich erkennen, dass der Hintergrund von der Änderung nicht betroffen war.  

Zwei fast identische Bilder eines Porsche am Strand, einmal silber, einmal rot und leicht verändert. Der Hintergrund ist identisch.

Wenn man etwas präziser markiert, was man ändern möchte, dann sind hier auf jeden Fall gute Ergebnisse zu erzielen und es ist schön zu sehen, dass OpenAI diese Features jetzt auch direkt in ChatGPT anbietet.  

🗣️ Voice Engine von OpenAI

OpenAI hat in einem Blogbeitrag erste Erfahrungen und Tests mit einem KI-Tool gezeigt, mit dem man auf Basis von 15 Sekunden Stimmproben Stimmen klonen kann. Das Modell mit dem Namen Voice Engine soll in seiner Qualität so gut sein, dass es aktuell bewusst nicht der Öffentlichkeit zugänglich gemacht wird. 

Momentan steht es lediglich ausgewählten Partner-Unternehmen zur Verfügung. Unter anderem Spotify nutzt die Technologie, um bekannte Podcasts auf andere Sprachen zu übersetzen.  

Wir haben alle wichtigen Infos zu Voice Engine für Euch in einem eigenen Video zusammengefasst. 

ERSCHRECKEND GUT! | Voice Engine von OpenAI klont Stimmen in 15 Sekunden | Besser als ElevenLabs?

🎬 Sora geht nach Hollywood

OpenAI befindet sich momentan auf einer Art Promo-Tour und preist das Tool in Hollywood an. Verstärkt wird in den neuen Demovideos der Fokus darauf gelegt, dass die KI in der Lage ist fiktive Dinge zu erstellen, die täuschend echt aussehen und somit eine echte Alternative zu kostenintensiver CGI Technologie bietet.

Vor allem durch die Einfachheit der Bedienung, einfach aus Text, Videos erstellen zu lassen bietet einige Vorteile gegenüber der vorherrschenden Alternative und die Perspektive ist für das Unternehmen hinter ChatGPT sehr vielversprechend, da die meisten Personen, die das Tool testen konnten, absolut begeistert von seiner Qualität sind.

KI ÜBERNIMMT HOLLYWOOD | OpenAI SORA Update macht die Filmbranche sprachlos

Und als kleine Randnotiz für diejenigen, die es interessiert, wissen wir jetzt endlich auch, wie lange es dauert, bis Sora ein Video erstellt hat. Aktuell dauert es wohl knapp 12 Minuten, um eine Minute Video mit Sora zu erzeugen. Allerdings benötigt man dafür eine NVidia H100, eine Grafikkarte für knapp 35.000 €. Hier gibt es also auf jeden Fall noch einiges zu tun, bis wir zuhause auf unserem eigenen Computer solche Clips erstellen können. 

😇 Hume stellt emotional intelligente KI vor

Die Firma Hume hat mit EVI, kurz für Empathic Voice Interface ein sehr interessantes neues KI-Projekt im Bereiche Voice-to-Voice vorgestellt. Es ist ein Chatbot, mit dem wir uns ausschließlich unterhalten können und der mit einigen Parametern und verschiedenen Stimmlagen in der Lage sein soll, empathisch und emotional auf unsere Unterhaltung zu reagieren. Leider funktioniert das aktuell nur auf Englisch.

Meet the Empathic Voice Interface (EVI) – the first AI with emotional intelligence

Wir sehen hier immer eine Mischung aus verschiedenen Adjektiven, die die Stimmlage beeinflussen und oben rechts ein Spektrum, wo wir uns als Sprecher und der Bot gerade bewegen. Getestet werden kann das alles ohne Account unter demo.hume.ai.

🆓 ChatGPT kann man jetzt ohne Account nutzen

OpenAI möchte, dass noch mehr Menschen ChatGPT nutzen und hat am Montag, den 1. April angekündigt, dass die kostenfreie Version mit GPT-3.5 jetzt Schritt für Schritt ohne Account nutzbar werden soll unter der Website chatgpt.com.

Das Datum hat natürlich erst einmal auch einen Aprilscherz nahegelegt, aber bis jetzt wurde nichts dergleichen aufgelöst und auch der Blogartikel mit der Ankündigung existiert weiterhin.

Das wäre natürlich ein schöner Schritt, zumal auch ohne Account die Verwendung der Chats für das Training ausgeschalten werden kann, sodass auch User mit großen Datenschutzbedenken die KI mal ausprobieren können.

💰 Google denkt über kostenpflichtige KI-Suche nach

Laut der Financial Times denkt Google darüber nach eine kostenpflichtige KI-gestützte Suche anzubieten. Dieser Schritt wäre für Google ein Novum und wir sind gespannt, wie das Ganze dann in der Praxis aussehen würde.

Aktuell scheint es so, als könnte die Premium-Suchmaschine ein Teil des Gemini Advanced Abos werden, welches dann vielleicht mit dieser Zusatzfunktion endlich das Geld wert ist. Aber ob es tatsächlich eine Verbesserung zu den momentan kostenlosen KI-Suchen wie Perplexity, die ja schon sehr gut funktionieren, darstellen wird müssen wir erst einmal abwarten. 

👤 Grok 1.5

XAI, die KI-Firma von Elon Musk, hat am 28. März ihr neues Modell mit dem Namen Grok-1.5 angekündigt, das ab sofort ausgewählten Usern auf X zur Verfügung stehen soll. Die Benchmarks zeigen eine deutliche Verbesserung zum ersten Modell, wobei laut Fußnoten die Testwerte für GPT-4 aus dem März letzten Jahres stammen – da gab es seitdem natürlich auch eine gewisse Steigerung.

Die größte Verbesserung des Modells soll wohl beim Verarbeiten von langem Kontext liegen – auch hier sieht die eigene Grafik mit einer100-prozentigen Erfolgsquote für uns doch ein bisschen zu gut aus – mal schauen, wie das Modell dann am Ende wirklich performt. 

🍏 Apple stellt neues KI-Modell für iPhones vor: ReALM

Nur kurze Zeit, nachdem Gespräche von Apple mit Google und anderen Unternehmen über mögliche Integration von Drittanbieter-Lösungen für KI publik wurden, gibt es jetzt mal wieder etwas positivere Nachrichten aus der Sparte Künstliche Intelligenz beim iPhone Konzern.

Laut einem neu veröffentlichten Paper wurde ein neues Modell mit dem Namen ReALM entwickelt, das neben einer Aufgabe, die der User stellt, den aktuellen Kontext des Bildschirms mit einbeziehen kann. Zum Beispiel habe ich auf meinem iPhone eine Website geöffnet und kann einfach sagen, ruf bei diesem Unternehmen an und der Assistent soll das umsetzen können.

Für die getesteten Anwendungen soll ReALM sogar besser funktioniert haben als GPT-4. 

Es gibt aktuell aber keinerlei Demos oder anderes Anschauungsmaterial, nur das veröffentlichte Paper also bleibt abzuwarten, ob wir vielleicht im Juni bei der Entwicklerkonferenz mehr darüber erfahren und ob das alles wirklich so gut funktioniert. 

📂 Copilot bekommt Datei-Upload

Auch Microsoft Copilot hat diese Woche einige Updates bekommen. So kann man jetzt auch als unregistrierter Nutzer den Datei-Upload verwenden und mit der KI über beispielsweise den Inhalt einer Excel Datei sprechen. Allerdings sei an dieser Stelle gesagt, dass das Update noch nicht bei allen verfügbar ist und wir selbst es auf zwei Rechnern haben, auf einem dritten ist allerdings noch alles beim alten und keine Uploadfunktion vorhanden. Hier heißt es also geduldig bleiben.  

💵 100 Milliarden Projekt „Stargate“ von Microsoft und OpenAI

Es ist vermutlich eins der ambitioniertesten Projekte aller Zeiten. Microsoft und OpenAI wollen unter dem Namen Project Stargate ein Netzwerk von Rechenzentren als Infrastruktur für die eigenen KI Anwendungen aufbauen und planen dafür mit bis zu 115 Mrd. Dollar. Das Projekt soll 2030 abgeschlossen sein und bereits 2026 soll ein kleines Netzwerk davon an den Start gehen. Es handelt sich hier wie gesagt nicht um den einen Supercomputer, der physisch an irgendeinem festen Standort steht, sondern um ein riesiges Netzwerk von Rechenzentren, die alle miteinander arbeiten und so die größtmögliche Rechenleistung bereitstellen.  

Wir wissen mittlerweile alle wie enorm die benötigte Rechenleistung von KI-Tools ist und auch wenn man hier mit Sicherheit in Zukunft einiges in Bezug auf die Effizienz der Software optimieren wird, zeigt das Investment, dass Microsoft sich hier im Hardware-Bereich gegenüber der Konkurrenz absichern möchte.  

Dieses Vorgehen wurde auch durch die jüngsten Investitionen in europäische Rechenzentren bestärkt, welche der Firma ermöglichen zukünftig auch EU-konforme Datenzentren für ihre Kunden aus Europa bereitzustellen, womit das Unternehmen hinter Windows einen weiteren Schritt in Richtung globaler Dominanz im KI-Markt gegangen ist.

Autor

  • Timothy Meixner

    Timothy Meixner ist Mitgründer und Geschäftsführer der Meixner & Ruof UG. Als KI- und Office-Experte betreibt er zusammen mit Johannes Ruof den erfolgreichen YouTube-Kanal Digitale Profis (80.000+ Abonnent:innen).

Nach oben scrollen