GPT-4とAIの最新動向
人工知能の世界では、今週11の主要な進展がありました。それぞれが完全なビデオに値するかもしれませんが、皆さんのためにここで全てをカバーしようと思います。GPT-4を100倍にスケーリングすることから、安定したBeluga 2.2の上院証言まで、AIの最新動向について見ていきましょう。
RT2: 世界の理解
私が知る限り、RT2はR2D2やC-3POと呼ばれてもおかしくないほど、世界を理解し始めています。このデモンストレーションでは、RT2に絶滅した動物を持ち上げるように頼んだところ、恐竜を持ち上げました。それはただ見たことのないオブジェクトを操作するだけでなく、私にとっては非常に印象的な論理的な飛躍をしています。RT2は、「絶滅した動物」という言葉をこのプラスチックの恐竜に結びつけるための言語理解を持っている必要があります。Googleや他の場所のロボットは、特定の詳細な指示のリストでプログラムされていましたが、今では個々の特定のタスクのためにプログラムされるのではなく、AI言語モデル、具体的にはビジョン言語モデルを使用することができます。ビジョン言語モデルは、テキストだけでなく画像も含むウェブスケールのデータで事前トレーニングされ、その後ロボティクスデータで微調整されます。それから、Googleはそれをロボットを制御することができるビジュアル言語アクションモデルと呼んでいます。これにより、「空のソーダ缶を取り上げる」といったタスクを理解することができるようになりました。そして、2001年宇宙の旅のようなシーンで、ロボットのトランスフォーマー2には釘を打つという課題が与えられました。それから岩を持ち上げ、その脳が言語モデルの一部であるため、行動を実行する前に中間計画を出力するようになると、思考の連鎖のようなものが実際にパフォーマンスを向上させました。タスクの遂行能力が大幅に向上しました。
ムスタファ・スレイマンの予測
Inflection AIの責任者であるムスタファ・スレイマンは、最先端のGPT-4よりも10倍大きなモデルを訓練し、それから100倍大きなモデルを訓練する予定だと述べました。それが次の18ヶ月間の見通しです。彼はさらに、それは絶対に驚くべきことになり、目を覆うほど異なるものになるだろうと述べました。これは推測に過ぎませんが、Inflection AIは22,000のh100 GPUを保有しており、リークがあったため、スレイマンはGPT-4のおおよそのサイズを知っているでしょう。彼は自身が次の18ヶ月間にGPT-4よりも10倍から100倍大きなモデルを訓練するつもりだと言っています。これはAIのゲームを変える重要な進展です。
聴覚障害者のためのリアルタイム音声転写
聴覚障害者のためのリアルタイム音声転写が100ドル以下で利用可能になりました。デバイスを使用することで、視野内で話されたすべての言葉の字幕をリアルタイムで表示することができます。同時に、話者の唇や環境、その他の周囲の情報も良好に把握することができます。もちろん、これは多言語にも対応しており、私にとっては本当に素晴らしいものです。
AIの声がささやけるように
AIの声がささやけるようになりました。このアップグレードされたテキスト読み上げ技術は、声を届けることに苦労する人々にとっても素晴らしいものになるでしょう。もちろん、オーディオやビデオ、テキストが非常に優れているため、何が本物かを判断するのはますます難しくなっています。さらに、OpenAI自体もAIによって書かれたテキストを検出することを諦めています。
大規模LLMのためのユニバーサルジェイルブレイク
研究者たちは、大規模LLMのためのユニバーサルジェイルブレイクを公開し、ほぼ無制限の数の攻撃を作成することができるようにしました。これらはLlama2などのオープンソースのLLMを標的にするために作られましたが、Chat GPT BardやClaudeなどのクローズドソースの一般に利用可能なチャットボットにも適用できることがわかりました。これは教育システムに重大な影響を与える可能性のある重要な進展です。
生物リスクに関する上院証言
Anthropicsの責任者であるダリオ・アマダイ氏は、AIが生物学の誤用を広範な範囲の関与者に可能にする可能性に懸念を抱いています。Anthropicsは、世界クラスの生物安全保障専門家との協力を通じて、AIが生物学の誤用にどのように寄与する可能性があるかについての集中的な研究を遂行してきました。現在、バイオウェポンの製造における特定の手順には、Googleや教科書では見つけることができない知識が必要であり、高度な専門知識が必要です。私たちは、今日のAIツールがこれらの手順の一部を補完することができることを見つけましたが、それは不完全で信頼性に欠けるものです。言い換えれば、これらは危険の最初の芽を示しています。ただし、今日のシステムを2〜3年後に予想されるシステムに単純に推移させると、AIシステムがすべての欠落部分を補完し、多くの関与者が大規模な生物学的攻撃を実行できるリスクが大幅に高まるという重大なリスクがあると結論付けました。これはアメリカの国家安全保障にとって深刻な脅威を表すと考えています。
まとめ
まとめると、AIの最新の進展は興味深く、懸念すべきものです。RT2が世界を理解する能力から、ムスタファ・スレイマンがGPT-4よりも10倍から100倍大きなモデルを予測するまで、AIの未来は急速に進化しています。聴覚障害者のためのリアルタイム音声転写やささやくことができるAIの声は、AIが私たちの世界を変えている例の一部です。ただし、大規模LLMのためのユニバーサルジェイルブレイクやAIが生物学の誤用に寄与する可能性は、対処しなければならない重要な懸念です。これから先に進むにあたり、AIの潜在的なリスクと利益を考慮し、それがより大きな善のために使用されるようにすることが重要です。
参考資料
- OpenAI
- Anthropics
- MIT
- Harvard
よくある質問
Q: RT2とは何ですか?
A: RT2は世界を理解し始めるロボットです。デモンストレーションでは、絶滅した動物を持ち上