Die KI-News der Woche vom 29.08.2024

Die KI-News der Woche vom 29.08.2024

Melde Dich für unseren Newsletter an und erhalte alle wichtigen News direkt in dein Postfach!

Alexa wird zum Premium Produkt, Midjourney macht jetzt bald Hardware, Upgrades für Gemini und Orion ist der Name des neuen Megaprojekts von OpenAI. Es ist diese Woche wirklich wahnsinnig viel passiert in der KI-Szene aber wie immer haben wir alles wichtige kompakt zusammengefasst.

🗣️ Neue Alexa KI ab Oktober

Nachdem eine neue Version des Amazon Sprachassistenten Alexa eigentlich für September diesen Jahres geplant war, wird die Veröffentlichung jetzt wohl erst im Oktober kommen. Das ist natürlich keine gigantische Verspätung aber eine andere jetzt durchgesickerte Information sorgt für Unmut bei vielen Echo und Alexa-Usern. Die neue verbesserte KI wird wohl nicht einfach für alle verfügbar sein, sondern einen monatlichen Abo-Preis von ca. 10$, bei uns dann schätzungsweise 10€ kosten. 

Das geht aus internen Dokumenten hervor, die der Washington Post vorliegen. Etwas merkwürdig, dass der Leak ausgerechnet von dem News-Outlet kommt, das Amazon-Chef Jeff Bezos gehört, aber na gut. 

Die neue Version wird als Remarkable Alexa, als bemerkenswerte Version bezeichnet und soll wohl ein Zusatzangebot sein, denn die kostenfreie Version, die dann Classic Alexa heißen wird, gibt es weiterhin. Die Funktionen, die wir jetzt schon von unseren Amazon-Geräten kennen, wird es weiterhin gratis geben. Es bleibt spannend zu sehen, wie gut die Remarkable Version wirklich sein wird und ob dieser Unterschied einen monatlichen Extra-Preis wirklich wert ist. 

💸 Neue Investitionen von OpenAI

OpenAI ist gerade aktiv dabei, neue Investoren und Geld zu sammeln. Laut einem Bericht des Wall Street Journals sind neben bereits investierten Unternehmen wie Microsoft auch sowohl Apple, als auch Nvidia in Gesprächen über Investitionen in das ChatGPT Unternehmen.

Dabei strebt der Konzern rund um Chef Sam Altman eine Bewertung von 100 Milliarden US-Dollar an, was nochmal eine gewaltige Steigerung wäre. Und wenn wirklich Apple und Nvidia, oder auch nur einer von beiden, als Investor dazukommen würde – das sendet ein klares Signal an die Konkurrenz, dass sie sich wirklich warm anziehen müssen, denn neben Geld sind das natürlich auch unbezahlbare Kontakte.

⚡ Cerebras Inference bringt Echtzeit-KI

Nachdem uns Groq vor einiger Zeit mit unglaublich schnellen Antworten von KI-Modellen geschockt hat, die durch eigene, spezielle Chips möglich wurden, gibt es jetzt einen neuen Konkurrenten auf diesem Gebiet und gegen Cerebras, so heißt das Unternehmen, sieht selbst Groq aus wie eine Schnecke. Mit 1800 Token pro Sekunde soll Cerebras Antworten vom Llama 3.1 8B Modell erzeugen und wirbt dementsprechend mit Instant AI, also KI in Echtzeit. 

Bis zu einer Million Token sind übrigens pro Monat bei Cerebras kostenlos und wir haben das heute Morgen direkt ausprobiert. Und was soll ich sagen: Es sind keine leeren Versprechungen, beim 8B Modell sieht man den Stream der Antwort gar nicht mehr – sie ist einfach da. Und auch das 70B, also das größere Modell, läuft mit bis zu 450 Token pro Sekunde, das sind wirklich unglaubliche Geschwindigkeiten. Hier könnt ihr selbst mal mit der KI chatten.

Cerebras selbst sagt, dass Skalierung kein Problem ist und bietet die Inference mit den Chips auch über eine API an – für 60 Cent pro Million Tokens, also viel günstiger als andere Anbieter. Inference ist übrigens vereinfacht gesagt nur der Fachbegriff für das Verarbeiten von Anfragen durch eine KI. 

Das ist auf jeden Fall sehr spannend für alle KI-Anwendungen, in denen Verzögerung und Geschwindigkeit eine große Rolle spielen. 

🕹️ Midjourney kündigt Hardware an

Der Bild-KI-Anbieter Midjourney hat eine für viele, vermutlich, merkwürdige Ankündigung gemacht. Auf dem X-Account wurde veröffentlicht, dass sie jetzt offiziell an Hardware arbeiten. Aber was für eine Art Hardware soll ein Unternehmen entwickeln, das sich mit Bild-KI beschäftigt? 

Für alle, die das nächste unnütze KI-Wearable befürchten, haben wir aber gute Nachrichten: Das wird es bei Midjourney nicht werden, denn auf eine Nachfrage zu dem Thema antwortet der X-Account mit einem etwas kryptischen “Is it wearable if you have to go inside of it?”.  

Wer unsere News schon lange verfolgt, der weiß, dass es bei Midjourney und vor allem dem Chef David Holz schon lange die Vision gibt in das Geschäft von 3D Welten und Virtual Reality einzusteigen. Schon im Februar 2024 haben wir über ein mysteriöses Projekt mit dem Namen The Orb berichtet, für dessen Umsetzung ein Head of Hardware eingestellt wurde – Ahmad Abbas, der davor bei Apple für das Vision-Pro Team gearbeitet hat. 

Es scheint also so, als würde es langsam ernst und wir sind gespannt, was das Unternehmen hier aus dem Hut zaubern wird. 

🤖 Gemini von Google bekommt zwei Upgrades

In einer Mail, die von Google auch in Deutschland an alle Kundinnen und Kunden verschickt wurde, ist von zwei Mega-Updates die Rede: Erstens soll es jetzt eine Custom GPT Alternative in Gemini geben, die sogenannten Gems, also angepasste Versionen des Bots. Auf den ersten Blick können die Gems allerdings nicht wirklich viel. Man kann einen Namen und eine Anweisung eingeben, also einen Systemprompt – mehr scheint aktuell zumindest bei uns in Deutschland nicht möglich zu sein. Wir werden das für euch aber auch noch genauer unter die Lupe nehmen. 

Noch trauriger wird es bei der zweiten Ankündigung: Sogar in der deutschen Mail wird groß das neue Imagen 3 Modell beworben, mit dem jetzt in Gemini beeindruckende Bilder erstellt werden können. Klingt ja wirklich super… aber natürlich ist das bei uns nicht verfügbar. Weder mit Imagen 3, 2 noch sonst irgendwie kann man mit Gemini in Deutschland Bilder erstellen, der Bot kann weiterhin nur Text, auch in der bezahlten Version.  

Und auch wenn wir ganz ehrlich sagen müssen, dass das Gemini-Modell selbst mittlerweile anständige Antworten liefert und nicht mehr so schlecht ist wie zu Beginn – diese Kommunikation von Google geht überhaupt nicht. Sowohl in der deutschen Mail, als auch im deutschen Artikel zu den News groß von Bilderzeugung mit dem tollen, neuen Modell sprechen, und nur als kleine Fußnote im Artikel die Zusatzinfo zu verstecken, dass die Verfügbarkeit je nach Land und Sprache variiert ist schlicht und einfach Täuschung. Umso schlimmer, dass die Aussage aus den Überschriften von vielen News Outlets auch bei uns in Deutschland einfach ungeprüft übernommen wird. 

Hier würden wir uns in Zukunft auf jeden Fall ein bisschen mehr Ehrlichkeit und Transparenz wünschen. 

💫 Was ist Orion von OpenAI?

Es gibt neue Gerüchte um ein neues Flaggschiffmodell vom ChatGPT Unternehmen, das wohl den Namen Orion tragen soll – etwas ganz Neues im Vergleich zur GPT-Modellfamilie und damit vielleicht wirklich auch ein großer Schritt nach vorne? 

Viel wissen wir aktuell noch nicht über das Modell, aber in einem Artikel von The Information wurde jetzt berichtet, dass das gesamte Q-Star bzw. Project Strawberry Geheimnis wohl eigentlich nur dazu da ist, um synthetische Trainingsdaten für das “eigentliche” neue Modell – Orion – zu erzeugen. 

Trotzdem könnte es sein, dass auch wir Strawberry bald mal selbst ausprobieren können, noch bevor das neue Modell erscheint. Als Timeline wird dafür “vielleicht im Herbst” genannt. Strawberry wurde von OpenAI wohl schon Angestellten des FBI und anderen Sicherheitsbeamten in den USA zur Verfügung gestellt und kann in Chatbot-Form funktionieren. Ob es wirklich auch an die Öffentlichkeit kommen wird, das ist aber aktuell reine Spekulation. 

Was das neue Modell Orion angeht: Hier dürfen wir ziemlich sicher damit rechnen, dass es irgendwann verfügbar gemacht wird, aber aktuell müssen wir noch nicht viel erwarten. Als Zeitrahmen für eine erste öffentliche Demo – also wirklich nur das Zeigen der neuen Fähigkeiten – wird aktuell von den Quellen von The Information November bis Dezember genannt. Das würde sich vermutlich mit einem Dev Day von OpenAI decken, dort sind Ankündigungen ja üblich. Wir halten euch natürlich auf dem Laufenden, wenn neue Informationen ans Licht kommen. 

🍏 Apple Event am 9. September

Apple hat die Einladungen für das jährliche iPhone Event verschickt, das am 9. September stattfinden wird. Bei diesem Event wird die neue iPhone-Generation vorgestellt, dieses Jahr also 16 und außerdem die neue Version der iOS-Software mit der Nummer 18. Für uns ist das natürlich interessant, da mit der neuen Version auch Apple Intelligence an den Start kommen wird – oder vielleicht auch nicht – denn zuletzt war immer wieder von Verspätungen und vorerst nicht verfügbaren Funktionen die Rede. 

Und wir stimmen vielen von euch natürlich auch zu, die frustriert sind, da überhaupt nicht klar ist, ob und wann Apple Intelligence bei uns in der EU kommen wird. Gleichzeitig ist es aber interessant zu sehen, wie der letzte der Tech-Giganten das Thema KI angeht und wir hoffen immer noch, dass es Apple auch durch die Kooperation mit OpenAI und möglicherweise bald auch anderen Anbietern schafft, hier Fortschritte zu machen. 

🤳🏻 Artifacts von Anthropic für alle verfügbar

Die beliebte Artifacts Funktion des Claude Chatbots von Anthropic ist jetzt für alle User als richtiges Feature verfügbar. Mit den Artifacts ist es möglich direkt im Chat kleine Apps zu entwickeln, interaktive Dashboards, Artikel und Schaubilder zu erstellen und vieles mehr – der Fantasie sind eigentlich keine Grenzen gesetzt. 

Besonders cool: Im Zuge des Updates sind die Artifacts jetzt auch in den mobilen Apps, sowohl für iOS als auch für Android verfügbar und man kann sie bequem von unterwegs aus nutzen. Für uns sind die Artifacts eins der innovativsten, wenn auch eigentlich einfachen Features der aktuellen Top-KIs. Durch die einfache Integration einer “Code”-Ebene direkt im Chatbot, die sich einfach interaktiver anfühlt als beispielsweis Advanced Data Analysis kann Claude sich hier deutlich von der Konkurrenz absetzen. 

🤖 Aleph Alpha stellt mit Pharia neues Modell vor

Auch die deutsche KI Hoffnung Aleph Alpha hat ein neues Modell mit dem Namen Pharia vorgestellt. Wir haben bisher verschiedene Meinungen dazugehört und aufgrund der kontroversen Schlagzeilen, die das Unternehmen in den letzten Wochen über sich ergehen lassen musste, möchten wir an dieser Stelle uns an Spekulationen über die Leistungsfähigkeit des Modells nicht beteiligen.  

Die Fakten sind, dass es sich um zwei Versionen eines 7B Modells handelt, welche für die DSGVO-konforme Anwendung von vornehmlich Behörden und Unternehmen ausgelegt sind.  

Wir haben bisher nicht die Möglichkeit gehabt, es selbst zu testen, aber haben uns auf jeden Fall auch direkt an Aleph Alpha gewandt, um hoffentlich bald ein paar weitere Informationen für euch aus erster Hand zu bekommen.  

💬 Claude System Prompts veröffentlicht

Nochmal News von Anthropic: Auf einer eigenen Seite auf der Homepage hat der Claude-Macher jetzt die Systemprompts für die eigenen KI-Modelle veröffentlicht. Dort kann jetzt jederzeit nachverfolgt werden, welche Anweisungen die unterschiedlichen Claude Bots befolgen, was sehr interessant ist. Man sieht auch direkt auf der Website, wann die Systemprompts das letzte Mal aktualisiert wurden, Stand jetzt also im Juli. 

Alex Albert, der bei Anthropic für Developer Relations zuständig ist, hat auf X verkündet, dass diese Transparenz ein fester Bestandteil wird und man so wirklich jederzeit nachvollziehen kann, wie das Unternehmen die eigenen Anweisungen verbessert und verfeinert. An sich ist das wirklich interessante Information, vor allem, wenn man selbst auch mit Systemprompts für eigene KIs arbeitet oder bei Chatbots, die die Funktion unterstützen. Dann kann man sich hier quasi professionelle Inspiration holen. 

🎮 KI-Team baut Doom ohne Game Engine nach

In einem wirklichen Durchbruch ist es einem Forschungsteam von Google Research, Google Deepmind und der Tel Aviv University gelungen, den Videospiel Klassiker Doom quasi durch eine KI simulieren zu lassen. Das Ganze ist dabei so überzeugend, dass sogar menschliche Tester bei kurzen Ausschnitte kaum besser als der Zufall erkennen konnten, ob es sich um das echte oder das simulierte Spiel handelt. 

Es wurde dabei in zwei Schritten gearbeitet. Zunächst hat ein KI-Agent das Spiel verstanden und gelernt und im zweiten Schritt hat ein Diffusionsmodell, also eine Bild-KI basierend auf dem bisherigen Verlauf immer den nächsten Frame erzeugt – bei im Schnitt 20 Frames pro Sekunde, mit denen das Spiel ablief eine wirklich krasse Leistung – auch für ein doch grafisch eher unaufwendiges Spiel wie Doom. 

Dabei ist es nicht nur eine reine Videosimulation, die durch die Welt führt, sondern auch Zählen von Gesundheit und Munition, Aufheben von Waffen, Angreifen von Gegnern, Beschädigen von Objekten und Öffnen von Türen können von GameNGen korrekt gezeigt werden. Die Simulationen waren dabei bis zu zweieinhalb Minuten lang. Der Name deutet es ja schon ein bisschen an, es ist eine Art Wortspiel mit Game Engine, denn die braucht es anscheinend zumindest für Doom schon nicht mehr – wirklich ein cooles Projekt und wir sind gespannt, was in diesem Bereich die Zukunft bringen wird. 

Autor

  • Timothy Meixner

    Timothy Meixner ist Mitgründer und Geschäftsführer der Meixner & Ruof UG. Als KI- und Office-Experte betreibt er zusammen mit Johannes Ruof den erfolgreichen YouTube-Kanal Digitale Profis (80.000+ Abonnent:innen).

    Alle Beiträge ansehen
Nach oben scrollen