Melde Dich für unseren Newsletter an und erhalte alle wichtigen News direkt in dein Postfach!
Nachdem es zwei Wochen relativ ruhig war, meldet sich jetzt die Sparte der Bild-KIs mit richtig vielen, beeindruckenden News zurück. Nachdem Flux schon für viel Aufregung gesorgt hat, legt Ideogram mit der Version 2 des eigenen Modells nach und Midjourney ist endlich ohne Discord für alle auf der Website verfügbar – sogar für kurze Zeit umsonst! Außerdem scheint Imagen 3 von Google ebenfalls deutliche Verbesserungen zu zeigen.
Wie immer haben wir die wichtigsten Nachrichten aus der Welt der Künstlichen Intelligenz für Euch zusammengefasst.
💡 Ideogram stellt Version 2 vor
Nachdem Ideogram schon bei der ersten Veröffentlichung der eigenen Bild-KI für Aufsehen gesorgt hat, da es der erste Anbieter war, der mit Text auf Bildern richtig gut klargekommen ist, wird jetzt nachgelegt und die Version 2 des Modells ist live. Neben einer deutlich verbesserten Bild-Qualität gibt es jetzt außerdem ein paar coole neue Optionen bei der Bilderzeugung, es kann zum Beispiel eine Farbpalette für das Bild festgelegt werden und man kann verschiedene Stile auswählen, zum Beispiel für Realismus oder Design.
Zusätzlich wurde die Magic Prompt Option verbessert unsere Prompts bzw. Übersetzt sie für die KI auf Englisch, wenn wir beim Eingeben eine andere Sprache verwenden.
🖥️ Die Website von Midjourney für alle
Nachdem es jetzt doch gefühlt ewig lange gedauert hat, von der ersten Ankündigung der Website über verschiedenste Phasen des Rollouts, in denen erst nur wirkliche Power-User von Midjourney und dann am Ende alle mit mehr als 100 Bild-Generationen die neue Oberfläche nutzen konnten, ist es jetzt endlich soweit: Wir können ab sofort alle, auch mit einem komplett neuen Account die Website der Bild-KI verwenden und müssen uns nicht mit dem Discord-Server beschäftigen.
Das Beste daran: Es war seit kurz nach dem Release nicht mehr möglich Midjourney kostenfrei zu testen. Im Zuge der neuen Website gibt es jetzt allerdings wieder für kurze Zeit ein Kontingent mit 25 Bildern, die absolut gratis erzeugt werden können – ohne Angabe von Zahlungsinformationen.
Also wer nochmal Lust hat, auch diese KI auszuprobieren ist jetzt am Besten schnell und beansprucht die kostenlosen Credits direkt.
🅧 Beeindruckendes Release von Grok 2
Mit dem Twitter-, oder mittlerweile wohl besser gesagt „X“-Chatbot Grok haben wir selbst noch gar nicht so viel experimentiert. Das könnte sich jetzt aber ändern, denn es wurde die neue Version Grok 2 vorgestellt und die ersten Reaktionen sind durchweg positiv.
Der Bot wurde in letzter Zeit in der Chatbot-Arena unter dem Namen „sus-column-r“ getestet und mit dem Release wurden auch die dort gesammelten Daten öffentlich. Laut den Ergebnissen kann Grok 2 sowohl Claude 3.5 Sonnet als auch GPT-4-Turbo schlagen – wenn auch nicht das neueste GPT-Modell.
Gleichzeitig haben wir ja in letzter Zeit auch berechtigte Kritik am Verfahren der Chatbot-Arena geäußert, aber das ändert vermutlich nichts daran, dass wir hier ein SOTA-KI-Modell von X bekommen haben.
Es gibt sogar noch einen Bonus: Grok 2 kann Bilder erzeugen und nutzt dafür interessanterweise die neue Bild-KI Flux von Blackforestlabs über die wir letzte Woche erstmals berichtet hatten. Die ersten Bilder, die von X-Usern gepostet wurden, sehen auf jeden Fall beeindruckend aus.
Gleichzeitig gab es viel Aufruhr darüber, denn es wurden doch einige relativ kontroverse Bilder erzeugt. Das ist tatsächlich möglich, denn Grok zensiert unsere Eingaben nicht und Flux selbst ist als Bild-KI auch ohne Filter nutzbar.
🎥 Dream Machine 1.5 von Luma
Nachdem wir die letzten Wochen schon viele News im Bereich Video-KI hatten, gibt es auch dieses Mal ein kleines Update. Dream Machine von Luma Labs wurde auf die neue Version 1.5 aktualisiert und konnte damit nochmals einen deutlichen Qualitäts-Sprung machen.
Erste Beispiele sehen wirklich beeindruckend aus und damit zieht der nächste Anbieter mit den Updates von Runway und Co. Mit. Vor allem die jetzt auch wieder immer besseren Bild-KIs in Kombination mit der Image to Video Funktion, die die Video-KIs mitbringen sorgt aktuell für richtig coole Videos, die teilweise unglaublich realistisch aussehen. Und durch den Input eines Bilds statt Text ist es eben sehr viel einfacher den finalen Look des Videos zu bestimmen.
🗃️ Prompt-Caching von Anthropic
Anthropic hat für die eigene API ein neues Feature mit dem Namen Prompt Caching vorgestellt. Diese Funktion erlaubt es einen Prompt oder Teile davon zwischenzuspeichern und so Zeit und Geld bei der Verwendung der KI zu sparen.
Ein Tester hat es relativ passend mit der Bestellung bei einem Café verglichen. Ohne Prompt Caching ist es so, als wenn man jeden Tag in ein anderes Café geht und immer die komplette Bestellung vortragen muss. Mit der neuen Funktion geht man einfach ins eigene Stamm-Cafe und bestellt „Das Übliche“.
Den meisten Sinn hat das natürlich bei extrem langen Prompts. Anthropic selbst nennt als Beispiel das Arbeiten mit einem Buch dessen Inhalt komplett in den Cache geladen wird. Dann muss nicht für jede Frage dieser ganze Kontext neu geladen werden und damit spart man ca. 10 Sekunden Zeit bis zur Erstellung der Antwort und wohl um die 90% der Kosten für die API.
🔎 Made by Google mit KI-News
Google hat beim Made by Google Event einige Neuerung in Bezug auf die nächste Generation der Pixel-Geräte vorgestellt und natürlich durften Updates beim Thema KI nicht fehlen – wenn auch nur relativ kleine Schritte gemacht wurden.
Es wurden wieder mal Extensions also Erweiterungen gezeigt für Gmail, Maps, YouTube und Co. die jetzt wohl auch auf den Pixel-Geräten funktionieren werden. Außerdem die relativ nahtlose Integration von Gemini in die Benutzung, die KI kann verwendet werden um kontextuelle Insights zu bieten, je nachdem, was man gerade auf dem Bildschirm hat.
Relativ interessant scheint das Gemini Live Feature zu sein, das durch langes Halten des Power-Buttons aktiviert wird und über Sprache eine intuitive Nutzung der künstlichen Intelligenz ermöglichen soll. Auf der Bühne hatte das wieder nicht so gut geklappt – Google hat dieses Mal wohl nichts im Voraus aufgenommen und versucht so zu schummeln, was dann aber dazu geführt hat, dass Gemini zweimal versagt hat. Ist natürlich eine ehrliche Präsentation – wenn auch vielleicht nicht so beeindruckend wie gewünscht.
Das Feature soll sowohl für Android als auch für iOS Smartphones möglich sein – wie das dann aussieht und ob es für uns in Europa überhaupt kommen wird, da sind wir gespannt.
🤳🏻 Erste Bilder von Imagen 3 aufgetaucht
Mehr News von Google: Es sind erste Bilder aufgetaucht, die mit der neuen Version der Bild-KI Imagen des Suchmaschinenkonzerns erstellt wurde und die Meinungen sind relativ eindeutig. Es scheint einen weiteren Konkurrenten für die beste Bild-KI zu geben.
Imagen 3 🏄♂️
— Jimmy Apples 🍎/acc (@apples_jimmy) August 15, 2024
Credit Anonymous.
I use dalle a lot for photoshop inspiration and touch ups, magnific upscaler helps but Google really took it to the next level.
Flux for the memes. pic.twitter.com/QX7uglQAki
In diesem Thread auf X gibt es einige weitere Vergleiche von Imagen 3, Midjourney und FLUX und es ist wirklich beeindruckend, wie gut die Ergebnisse von allen drei KIs auch für anspruchsvolle Prompts schon sind
🤖 Spekulationen um OpenAI und aktualisierte GPT-4o Version
Nachdem OpenAI erst kürzlich das GPT-4o Modell in der API aktualisiert hatte, gab es in den letzten Tagen vor allem auf X jede Menge Spekulationen über ein mögliches neues Frontier-Modell des ChatGPT-Unternehmens. Das Meiste davon scheint für uns allerdings reiner Hype ohne wirklich begründete Indizien zu sein – aber wer weiß.
Jetzt wurde allerdings auch still und leise das Modell in ChatGPT auf die Version GPT-4o-latest aktualisiert, die eine andere Version von GPT sein soll. Die neue ChatGPT-Version konnte sich in der Chatbot-Arena den ersten Platz zurückholen und scheint damit wieder eine kleine Verbesserung zu sein.
Gleichzeitig steigt der Frust über die vielen unterschiedlichen und doch gleichen Modell, die OpenAI mittlerweile auf den Markt wirft und die die Übersicht schwer machen, was überhaupt Sache ist, relativ gut zusammengefasst in diesem X-Thread.
Why does the ranking going around say ChatGPT-4o-latest-2024-08-08 …… which is not a model OpenAI has mentioned or documented anywhere? pic.twitter.com/d5g5RTPBvF
— Benjamin De Kraker 🏴☠️ (@BenjaminDEKR) August 14, 2024
🤖 Nichts Neues bei SearchGPT
Nachdem die Ankündigung der OpenAI Suchmaschine SearchGPT jetzt auch schon eine Weile her ist und wir alle seitdem auf der Warteliste hoffen, bald Zugang zu bekommen gibt es jetzt wohl erstmal eine ernüchternde Nachricht.
In einem Update hat OpenAI den meisten Personen auf der Warteliste jetzt lediglich mitgeteilt, dass die ersten Spots gefüllt wurden und man geduldig sein soll. In der Mail klingt es außerdem so, als würden vielleicht gar nicht alle Zugang zur Suchmaschine bekommen, sondern lediglich auf die Funktionen, die in ChatGPT übernommen werden sollen. Auch wenn wir es selbst leider noch nicht ausprobieren konnten gibt es seitdem natürlich einige erste Erfahrungsberichte. Die ersten Meinungen sind aber eher zurückhaltend, SearchGPT gibt wohl immer eine fixe Liste von 12 Links zusätzlich zur KI-Zusammenfassung aus, die aber gar nicht alle im Text verwendet oder referenziert werden. Außerdem werden zwanzig Bilder angezeigt, die oft nichts oder wenig mit der Frage zu tun haben und sich teilweise auch wiederholen.
Wir sind gespannt und halten euch natürlich auf dem Laufenden.