GPT-4 und die neuesten Entwicklungen in der KI
In der Welt der künstlichen Intelligenz gab es in dieser Woche 11 bedeutende Entwicklungen, von denen jede wahrscheinlich ein eigenes Video verdient hätte. Aber nur für euch werde ich versuchen, alles hier abzudecken. Von der Skalierung von GPT-4 um das 100-fache bis zur stabilen Beluga 2.2 Senatsanhörung - lasst uns in die neuesten Entwicklungen in der KI eintauchen.
RT2: Das Verständnis der Welt
RT2, das meiner Meinung nach auch R2D2 oder C-3PO genannt werden könnte, beginnt die Welt zu verstehen. In dieser Demonstration wurde RT2 gebeten, ein ausgestorbenes Tier aufzuheben, und wie ihr sehen könnt, hat es den Dinosaurier aufgehoben. Das ist nicht nur die Manipulation eines Objekts, das es zuvor noch nie gesehen hat, sondern auch ein logischer Schritt, der für mich äußerst beeindruckend ist. Es musste das Sprachverständnis haben, um "ausgestorbenes Tier" mit diesem Plastikdinosaurier zu verknüpfen.
Roboter bei Google und anderswo wurden früher durch eine spezifische, hochdetaillierte Liste von Anweisungen programmiert. Aber jetzt könnten Roboter anstelle von spezifischen Aufgaben einzeln programmiert zu werden ein KI-Sprachmodell verwenden, genauer gesagt ein Vision-Sprachmodell. Das Vision-Sprachmodell würde auf webbasierten Daten vortrainiert, nicht nur Text, sondern auch Bilder, und dann auf Robotikdaten feinabgestimmt werden. Es wurde dann zu dem, was Google ein visuelles Sprachaktionsmodell nennt, das einen Roboter steuern kann. Dadurch konnte es Aufgaben wie "Hebe die leere Cola-Dose auf" verstehen, und in einer Szene, die an 2001: Odyssee im Weltraum erinnert, wurde dem robotischen Transformer 2 die Aufgabe gegeben, einen Nagel einzuschlagen. Er hebt dann den Stein auf, und weil sein Gehirn Teil des Sprachmodells ist, verbesserten sich Dinge wie Gedankengänge tatsächlich, als er gezwungen wurde, einen Zwischenplan vor der Ausführung von Aktionen auszugeben. Es wurde viel besser in den beteiligten Aufgaben.
Mustafa Suleimans Enthüllung
In einem Interview mit Barons sagte Mustafa Suleiman, der Leiter von Inflection AI, dass sie Modelle trainieren werden, die 10-mal größer sind als das hochmoderne GPT-4 und dann 100-mal größer als GPT-4. So sehen die Dinge in den nächsten 18 Monaten aus. Er fuhr fort zu sagen, dass es absolut atemberaubend sein wird und dass es einen erheblichen Unterschied machen wird. Das ist eine Vermutung, aber Inflection AI verfügt über 22.000 H100-GPUs, und aufgrund eines Lecks würde Suleiman die ungefähre Größe von GPT-4 kennen. Mit all dem Wissen, das er hat, sagt er, dass er in den nächsten 18 Monaten ein Modell trainieren wird, das 10 bis 100 Mal größer ist als GPT-4.
Runway Gen 2
Die rasante Entwicklung von KI-Videos ist unglaublich. Dies ist Runway Gen 2, und lasst mich euch 16 Sekunden von Barbie Oppenheimer zeigen, was Andre Carpathy als Filmmaking 2.0 bezeichnet.
Sam Altman und der Gott der Skalierung
In einem ausgezeichneten Artikel in The Atlantic von Ross Anderson mit dem Titel "Weiß Sam Altman, was er erschafft?", der hinter einer Paywall liegt, habe ich einige der Höhepunkte herausgepickt. In Anlehnung an Suleiman zitiert der Artikel, dass Sam Altman und seine Forscher auf 10 verschiedene Arten deutlich gemacht haben, dass sie dem Gott der Skalierung huldigen. Sie wollen immer größer werden, um zu sehen, wohin dieses Paradigma führt. Sie glauben, dass Google innerhalb von Monaten Gemini enthüllen wird, und sie sagen: "Wir bereiten uns im Grunde immer auf einen Lauf vor", und das bezieht sich auf GPT-5.
Echtzeit-Spracherkennung für Gehörlose
Echtzeit-Spracherkennung für gehörlose Menschen ist jetzt für weniger als 100 US-Dollar erhältlich. Untertitel für die reale Welt sind jetzt möglich.
KI-Stimmen können flüstern
KI-Stimmen können jetzt flüstern.
Stable Beluga 2
Stable Beluga 2 ist konkurrenzfähig mit GPT-3.5 und steht an der Spitze der offenen LLM-Rangliste.
Universeller Jailbreak für große LLMs
Forscher haben einen universellen Jailbreak für große LLMs veröffentlicht, der es ermöglicht, eine nahezu unbegrenzte Anzahl solcher Angriffe zu erstellen.
Bio-Risiko
KI könnte einer viel größeren Anzahl von Akteuren ermöglichen, Biologie missbräuchlich zu nutzen. Anthropics ist besorgt, dass KI zum Missbrauch von Biologie beitragen könnte.
Fazit
Dies sind nur einige der neuesten Entwicklungen in der KI. Während wir voranschreiten, müssen wir uns der Risiken und Vorteile von KI bewusst sein. Wir müssen die KI-Lieferkette und die LLMs selbst sichern. Wir müssen uns auch der Möglichkeit bewusst sein, dass KI zum Missbrauch von Biologie beitragen kann. Die Zukunft der KI ist aufregend, aber wir müssen vorsichtig vorgehen.
Höhepunkte
- RT2 beginnt die Welt zu verstehen.
- Mustafa Suleiman plant, in den nächsten 18 Monaten Modelle zu trainieren, die 10 bis 100 Mal größer sind als GPT-4.
- Echtzeit-Spracherkennung für gehörlose Menschen ist jetzt für weniger als 100 US-Dollar erhältlich.
- KI-Stimmen können jetzt flüstern.
- Stable Beluga 2 ist konkurrenzfähig mit GPT-3.5 und steht an der Spitze der offenen LLM-Rangliste.
- Forscher haben einen universellen Jailbreak für große LLMs veröffentlicht, der es ermöglicht, eine nahezu unbegrenzte Anzahl solcher Angriffe zu erstellen.
- KI könnte einer viel größeren Anzahl von Akteuren ermöglichen, Biologie missbräuchlich zu nutzen.
FAQ
F: Was ist RT2?
A: RT2 ist ein Roboter, der dabei ist, die Welt zu verstehen.
F: Was ist Mustafa Suleimans Plan?
A: Mustafa Suleiman plant, in den nächsten 18 Monaten Modelle zu trainieren, die 10 bis 100 Mal größer sind als GPT-4.
F: Was ist Echtzeit-Spracherkennung für gehörlose Menschen?
A: Echtzeit-Spracherkennung für gehörlose Menschen ist jetzt für weniger als 100 US-Dollar erhältlich.
F: Was ist Stable Beluga 2?
A: Stable Beluga 2 ist konkurrenzfähig mit GPT-3.5 und steht an der Spitze der offenen LLM-Rangliste.
F: Was ist der universelle Jailbreak für große LLMs?
A: Forscher haben einen universellen Jailbreak für große LLMs veröffentlicht, der es ermöglicht, eine nahezu unbegrenzte Anzahl solcher Angriffe zu erstellen.
F: Was ist das Potenzial von KI, zum Missbrauch von Biologie beizutragen?
A: KI könnte einer viel größeren Anzahl von Akteuren ermöglichen, Biologie missbräuchlich zu nutzen.