Die KI-News der Woche vom 15.03.2024

Die KI-News der Woche vom 15.03.2024

👨🏼‍💻 Devin – KI Software-Entwickler

In einem eigenen Video haben wir euch diese Woche ja schon Devin vorgestellt. Eine KI die in der Lage ist eigenständig Software zu entwickeln und sogar Aufträge erledigen kann.

Hierfür verwendet das Tool einen eigenen Browser, mit dem es sich Informationen beschafft, einen Code Editor, in dem es das Programm schreibt und natürlich auch eine Konsole in der weitere Informationen und Fehler dem Bot ausgegeben werden. Als User kann man während dem Prozess die ganze Zeit mit der KI chatten und ihr weitere Anweisungen .

🤖 Figure 01 – KI-Roboter mit OpenAI Technologie

Figure.ai ein Robotik-Startup, das schon vor einiger Zeit eine Menge Investitionen von unter anderem OpenAI, Microsoft und Jeff Bezos einsammeln konnte hat ein neues Demo-Video des eigenen Roboters mit dem Namen Figure 01 vorgestellt. Im Video wird gezeigt, wie Figure 01 unter anderem dank Vision und GPT eine Unterhaltung mit einem Menschen führt und simultan verschiedene Anweisungen umsetzen kann.

Durch die Voice-Integration von OpenAI wirkt die Unterhaltung extrem menschlich und es ist beeindruckend, wie gut sich Figure 01 im Gespräch und den zeitgleich ausgeführten Aktionen zurechtfindet. Wenn Dich das interessiert, schau doch auch unser Video dazu an!

🎬 Wann kommt SORA?

OpenAI CTO Mira Murati hat in ihrem Interview mit dem Wall Street Journal eine überraschende Timeline angekündigt für die Veröffentlichung von Sora als öffentlich zugängliches Tool. Auf die Frage der Reporterin hat sie folgendes gesagt:

“I’m hoping, definitely this year. But could be a few months”

Das ist natürlich eine Ansage, mit der wir so nicht gerechnet haben. Insbesondere da ein paar Tage zuvor das Sora-Team sich in einem Interview mit dem Tech-Youtuber Marquess Brownlee ganz anders geäußert hat. 

SORA bleibt laut ihnen aktuell ein Forschungsprojekt und wird in absehbarer Zeit nicht für normale User nutzbar sein. Das Team arbeitet weiter hart an Verbesserungen und weiteren Features, will aber auch direkt eine Möglichkeit einbauen, dass die KI-generierten Videos als solche erkennbar bleiben – auch wenn sie vielleicht optisch gar nicht mehr von echten zu unterscheiden sind. Das ist auf jeden Fall ein wichtiger Schritt, denn gerade KI-Videos stellen eben doch eine große Gefahr in Bezug auf Desinformation dar. 

Ob jetzt die Aussage von ihrer Vorgesetzten so mit dem Team abgesprochen war oder es sich hier einfach um eine übereifrige Aussage der Chefin handelt – können wir momentan noch nicht sagen und OpenAI hat bisher keine weiteren Aussagen oder Richtigstellungen veröffentlicht.  

🌅 Midjourney Consistent Characters

Die aktuelle beste Bild-Erzeugungs-KI Midjourney hat ein riesiges Update bekommen und bietet jetzt die Möglichkeit sogenannte Consistent Characters – also gleichbleibende Charaktere zu erstellen. Das ist eine Funktion, die immer mehr gefragt wird, denn sie ermöglicht es Bilder von denselben Personen in unterschiedlichsten Posen und Szenarien zu generieren, wie es auch bei den berüchtigten KI-Influencern gemacht wird.

Midjourney setzt das ganze mit einem neuen Parameter um, der entweder nur das Gesicht oder auch Outfits und andere Merkmale beibehält. Die ersten Ergebnisse sind wirklich beeindruckend – besonders spannend ist, dass die Charaktere sogar über verschiedene Bild-Stile wirklich gut umgesetzt werden, beispielsweise als Foto oder Illustration. 

📋 Neues OpenAI Board mit Sam Altman

OpenAI hat in einer Ankündigung vier neue Board-Mitglieder vorgestellt. Dieser “Verwaltungsrat” des aktuell wahrscheinlich wichtigsten KI-Unternehmens wird jetzt um Dr. Sue Desmond-Hellmann, ehemalige Geschäftsführerin der Bill and Melinda Gates Foundation, Nicole Seligman, ehemalige Chefjustiziarin von Sony Corporation und Fidji Simo, die Geschäftsführerin von Instacart ergänzt.  

Für viel Aufregung sorgte allerdings die letzte Personalie, denn auch Sam Altman der Chef von OpenAI wird zukünftig ein Teil des Boards sein. Nach der ganzen, teilweise sicherlich berechtigten Kritik an OpenAI in den letzten Tagen und Wochen ist das eine interessante Entscheidung, die die Machtposition von Altman – und damit eben einer individuellen Person – innerhalb des Unternehmens nochmals untermauert. 

🤖 Inflection 2.5

Eines der bis jetzt etwas unbekannteren KI-Unternehmen Inflection hat ihr neues Modell mit dem Namen Inflection 2.5 vorgestellt und damit für viel Aufregung gesorgt. Das neue Modell performt nämlich laut ersten Benchmarks annähernd auf GPT-4 Niveau und reiht sich damit ganz oben im Ranking der besten KIs ein. Und nicht nur das: Man kann das neue Modell auch bei uns in Deutschland schon jetzt komplett kostenlos nutzen – mit dem hauseigenen Chatbot namens Pi. 

Wir haben den Chatbot Pi als KI-Tool der Woche auf unserem YouTube-Kanal vorgestellt, das Video findest du hier!

🌌 Stable Diffusion 3 Research Paper

Kurze Zeit nach der Ankündigung des neuen Bild-Modells von Stability.ai wurde jetzt die wissenschaftliche Grundlage von Stable Diffusion 3 veröffentlicht, in der nochmal genauer erklärt wird, wie die neue KI funktioniert. Es wurden außerdem jede Menge neue Beispiele gezeigt, die die neuen Fähigkeiten demonstrieren sollen.

Besonders beeindruckend ist, wie das neue Modell mit Schrift umgeht, denn hier wird der Text abgetrennt vom Bild behandelt und das scheint wirklich extrem gut zu funktionieren. Wir sind gespannt, wie das in der Praxis dann klappen wird. 

✈️ Kostenloser Copilot Chat bekommt GPT-4 Turbo

Die kostenlose Version des Copilot Chats von Microsoft bekommt jetzt auch das aktuellste OpenAI Modell GPT-4 Turbo. Das wurde auf Twitter vom Unternehmen angekündigt, das Update wird über die nächsten Tage langsam an alle kostenlosen User ausgerollt. Pro User können sich weiter zwischen dem GPT-4 Modell und der Turbo Variante entscheiden. 

💻 Microsoft bringt erste KI-PCs

Microsoft will anscheinend noch bis Ende diesen Monats die ersten neuen KI-PCs vorstellen. Im Gespräch sind ein Surface Tablet und ein Laptop. Die neuen Geräte sollen mit neuen Intel Core Ultra oder Qualcomm Snapdragon X Elite Prozessoren ausgestattet sein, um bestmöglich für jegliche KI-Anwendungen gerüstet zu sein.

Beim Surface Laptop wird außerdem wie schon vermutet eine neue Taste für den Microsoft Copilot verbaut werden, die die künstliche Intelligenz jederzeit in den Vordergrund bringen kann. 

🤖 Google Gemini Updates

Gemini von Google wird weiter aktualisiert, aber wir warten trotzdem noch auf die ersten für uns wirklich brauchbaren Updates. Aktuell wurde die Integration in Workspace, also zum Beispiel Gmail auch hierzulande freigeschalten – allerdings nur, wenn man englische Sprache verwendet und auch deutsche Texte, zum Beispiel für einen Email-Entwurf können so noch nicht erzeugt werden.

Außerdem gibt es jetzt das sogenannte Inline Editing, mit dem einzelne Teile einer Gemini Antwort ausgewählt werden können und angepasst, gekürzt oder umgeschrieben werden. Auch das funktioniert leider nur, wenn die Sprache englisch ist. 

🎮 Google Genie

Google hat ein neues KI-Modell mit dem Namen Genie vorgestellt. Mit dieser neuen KI können aus einfachen Bildvorlagen oder sogar reinen Text-Prompts mit einem Zwischenschritt über Imagen2 interaktive Welten erstellt werden. Das bedeutet im Prinzip bekommt man eine Videospiel-Welt erzeugt, in der man sich mit einem Spieler frei bewegen kann.

Natürlich sieht das jetzt noch nicht extrem fortschrittlich aus, aber allein der Fakt, dass aus einem statischen Bild so etwas erzeugt wird, ist sehr beeindruckend. Und wie immer beim Thema KI: Das ist die schlechteste Form, in der das Modell jemals sein wird, also in diesem Bereich sind wir auch sehr gespannt, was in einem oder zwei Jahren möglich sein wird. 

👁️ xAI wird Open Source

Nach seinen Vorwürfen in Richtung OpenAI hat Elon Musk angekündigt, den Chatbot Grok seiner Firma x.ai zu opensourcen – noch diese Woche. Zuvor wurde von vielen Seiten kritisiert, dass er im Prinzip genau dasselbe macht wie OpenAI – abgesehen davon, dass im Firmennamen eben kein “Open” steht – aber das macht es nicht wirklich besser.

Musk hat aber auch nichts dazu gesagt, was genau oder welche Teile von Grok ab jetzt Open Source sein sollen – wir müssen also abwarten ob das wirklich so kommt oder ob es mal wieder nur ein PR-Stunt ist. 

Autor

  • Johannes Ruof

    Johannes Ruof ist Mitgründer und Geschäftsführer der Meixner & Ruof UG. Als KI- und Office-Experte betreibt er zusammen mit Timothy Meixner den erfolgreichen YouTube-Kanal Digitale Profis (80.000+ Abonnent:innen).

Nach oben scrollen