Figure 01 – Der KI-Roboter mit OpenAI Technologie

Figure 01 – Der KI-Roboter mit OpenAI Technologie

OpenAI hat in ein Robotik Startup mit dem Namen Figure investiert. Jetzt hat die Firma hinter ChatGPT eine erste Demo veröffentlicht, die zeigt, dass das Unternehmen sich nicht nur finanziell an Figure beteiligt, sondern auch die eigene Technologie in die Roboter integriert werden soll. 

Hier ist das gesamte Demo-Video:

Figure Status Update - OpenAI Speech-to-Speech Reasoning

Im Video sehen wir den Roboter-Prototypen in einer Art Küche stehen. Er führt eine ganz normale Unterhaltung mit einem Menschen und führt ganz nebenbei auch noch verschiedenste Aufgaben aus, wie einen Apfel übergeben, Müll wegräumen oder Geschirr zum Trocknen einräumen.

Der Roboter ist in der Lage mithilfe der Technologie von GPT die Eingabe der Person auszuwerten, die eigene Umgebung zu analysieren und auf Basis dieser gesammelten Daten eine reflektierte Entscheidung zu treffen, die in diesem Kontext den meisten Sinn ergibt. Es verhält sich also ähnlich wie bei einer normalen Interaktion mit ChatGPT. 

Der Unterschied ist, dass eben statt einer einfachen Text oder Audioausgabe ein komplexer Bewegungsablauf erstellt wird, der nahezu ohne Verzögerung passiert. Dieses Resultat ist auch eigentlich das Beeindruckendste am ganzen Video. Die Geschwindigkeit in der die Informationen verarbeitet werden, ist bahnbrechend.

Wie funktioniert der KI-Roboter?

Der Roboter-Prototyp heißt Figure 01 und verwendet einiges an beeindruckender Technologie. Neben der menschlichen Form, die Figure laut eigenen Angaben bewusst gewählt hat, um eben genau die Aufgaben möglichst gut erledigen zu können, die auch ein Mensch ausführt, steckt Figure 01 komplett voll mit der aktuell besten Technik und Top-KI-Modellen. 

Figure 01 verwendet Kameras, die den Input, also das, was der Roboter sieht an das Vision Modell von OpenAI weitergeben und gleichzeitig verarbeiten eigene neuronale Netze von Figure die Bilder, um ein perfektes Bild der Umgebung zu bekommen.  

Wer schon einmal mit dem Voice-Chat von ChatGPT in der App gearbeitet hat, der weiß auch um die unglaublichen Fähigkeiten von Whisper in Kombination mit den neuesten GPT-Modellen. Genau diese Kombination wird auch hier eingesetzt, sodass Figure 01 jederzeit Informationen aufnehmen und unglaublich schnell und kompetent darauf reagieren kann.

Ist das wirklich echt?

So beeindruckend es ist, einen Roboter zu sehen, der eigenständig Entscheidungen treffen kann und auch zwischen den Zeilen liest. Man muss im gleichen Atemzug festhalten, dass diese Demo-Videos immer in einer kontrollierten Umgebung aufgenommen werden.

Der Roboter steht vor einer Kücheninsel auf der sich keine Gegenstände befinden, die für die Demo irrelevant wären. Damit wird natürlich dafür gesorgt, dass der Ablauf nicht durch irgendwelche Fremdkörper gestört wird. Das soll keineswegs heißen, dass die Aktionen des Roboters nicht beeindruckend sind, es ist aber in dieser Situation eher als eine Art Prototyp – ein Proof of Concept – zu behandeln. 

Wenn wir den Roboter in einen komplett anderen Raum stellen, mit einem gefüllten Tisch und ganz andere Dinge wissen wollen – dann kann es gut sein, dass das Ergebnis sehr viel weniger beeindruckend ausfällt. 

In der Variante, die wir hier sehen, könnte man solche Roboter trotzdem für sehr spezielle Aufgaben einsetzen und das ist an sich auch kein Kritikpunkt. Es macht sicherlich Sinn zunächst einmal in einer kontrollierten Umgebung die verschiedenen Abläufe zu testen und Daten zu erheben. Anschließend kann man diese dann auswerten und die Technologie optimieren und das Gelernte mithilfe von weiteren Trainings in die Software einbauen.

Ersetzt die KI jetzt alle Jobs?

Nachdem wir gestern erst mit Devin eine KI vorgestellt haben, die anscheinend die komplette Software-Branche gefährdet gibt es direkt danach Figure 01. Wir sehen auch euer Feedback und verstehen sehr gut, dass diese schnellen Entwicklungen einigen Angst machen. Es scheint fast, als gäbe es jede Woche neue Innovationen und mehr und mehr Jobs geraten in Gefahr. 

Auf der anderen Seite ist dieser Fortschritt eigentlich nicht mehr aufzuhalten und wir sollten stattdessen versuchen das Beste daraus zu machen. Gerade bei Figure 01 gibt es mittelfristig sicherlich einige Potenziale, gerade auch in sehr körperlichen, gefährlichen Aufgaben, die man sich als Menschheit vielleicht gar nicht so ungern abgeben würde.

Und hier müssten die Roboter auch gar nicht diese weitergehenden Anforderungen erfüllen, sich in komplett fremden Umgebungen zurechtzufinden, wenn ein bestimmter Arbeitsplatz samt Aufgabengebiet gut antrainiert werden kann. 

Klar, auch das sind natürlich Jobs, die vielleicht verloren gehen. Aber im Zuge von Innovationen und Entwicklungen werden in der Regel auch immer neue Jobs entstehen. Es ist absolut nichts Neues mehr, dass in Produktionslinien Maschinen und Roboter eingesetzt werden und auch diese Technologien sind sicherlich insgesamt gesehen eine positive Entwicklung – auch wenn sie vielleicht zunächst einmal ein paar Arbeitsplätze gekostet haben.

Wirkliche allumfassende künstliche Intelligenz, die uns als Menschen komplett überflüssig macht, ist immer noch sehr weit entfernt – wenn es überhaupt dazu kommt. Und bis dahin freuen wir uns über Entwicklungen und Innovationen, die hauptsächlich darauf abzielen eine Unterstützung zu sein.

Weitere Demos von Figure 01

Es gab auch vor der OpenAI Demo schon einige Videos, in denen andere Anwendungen von Figure 01 gezeigt wurde. Hier haben wir nochmal die Videos eingebunden, falls Dich interessiert, was der Roboter sonst so alles kann.

Figure 01 kocht Kaffee

Figure Status Update - AI Trained Coffee Demo

Figure 01 führt autonom eine Aufgabe aus

Figure Status Update - Real World Task

Autor

  • Johannes Ruof

    Johannes Ruof ist Mitgründer und Geschäftsführer der Meixner & Ruof UG. Als KI- und Office-Experte betreibt er zusammen mit Timothy Meixner den erfolgreichen YouTube-Kanal Digitale Profis (80.000+ Abonnent:innen).

    Alle Beiträge ansehen
Nach oben scrollen