AIニュースのまとめ:GPT-4.5のリーク、オープンソースモデル、そしてAIファーストハードウェア
今年も終わりに近づくにつれ、AIの世界は活気づいています。GPT-4.5のリークやオープンソースモデル、AIファーストハードウェアなど、取り上げるべき話題がたくさんあります。この記事では、AIの世界での最新かつ最も素晴らしい進展について詳しく見ていきましょう。
🤖 GPT-4.5のリーク
まず最初に話すべきは、GPT-4.5のリークです。もし前回のAIニュース動画をご覧になった方なら、RedditでGPT-4.5のリークが出ていることをご存知かもしれません。リークは本物のように見え、人々の話題と推測を呼びましたが、OpenAIのCEOであるサム・ティマンはそのリークは本物ではないと確認しました。しかし、このリークの後、サム・ティマンの否定にもかかわらず、ChatGPTは自身をGPT-4.5 Turboと呼ぶようになりました。これは非常に奇妙です。これにより、GPT-4.5が既に秘密のブラインドテストとしてバックグラウンドで実行されているのに誰も気づいていないのではないかと多くの人々が考えるようになりました。さらに、OpenAIのスティーブン・ヘルも「覚悟しておくがいい、AGIがやってくる」とツイートし、まるでGPT-5やGPT-4.5が驚異的な能力を持ってリリースされるかのようなAIのハイプが広まりました。
現在、私はこのGPT-4.5 Turboの不具合を再現することができません。それは人々が必ずしも嘘をついているわけではないと言いたいのですが、この問題は開発者によって解決されたように思います。いずれにせよ、GPT-4.5やGPT-5についてはかなりのハイプが巻き起こっているようです。皆さんの意見や推測を、以下のコメントでお聞かせいただければと思います。
🌐 オープンソースモデル
次に、オープンソースモデルについて話しましょう。オープンソースの開発者たちが大胆な主張をしています。Open Chatは「世界最高のオープンソース7Bサイズの大規模言語モデル」であるOpen Chat 3.5を紹介しています。彼らはこのモデルが無料版のChatGPTやGPT-3を凌駕していると主張しています。「世界最高」と言うのは非常に印象的です。また、このモデルは70億のパラメータを持っており、無料版のChatGPTよりも小さく、多くのマシンでローカルに非常に高速に実行できるはずです。
このアップデートは主にコーディングのパフォーマンスに焦点を当てており、大規模言語モデルにとってますます重要になっているコーディングのパフォーマンスを向上させ、多くの領域でより優れたものにしています。ほとんどのベンチマークでは、Open Chatは実際には無料のChatGPT 3.5と同等か、わずかに優れています。ただし、MML UとBBH cootではかなり負けてしまいます。しかし、人間の評価では非常に強いリードを持っています。
このモデルの素晴らしいところは、完全にオープンソースであることです。もちろん、Open Chatチームのウェブサイトで完全に無料で利用できます。通常のChatGPTでは得られない設定である温度を変更することもできます。システムのプロンプトを取得することもでき、右側にプロンプトを保存して収集することもできます。このモデルによる生成は非常に高速ですし、完全に無料で利用できるという点でも非常に優れています。これらの小規模モデルは非常に優れてきています。
🚀 AIファーストハードウェア
さて、AIファーストハードウェアについて話しましょう。通常、AIはGPUまたはグラフィック処理ユニットで実行されますが、これらはAI用に設計されたものではありませんが、現時点では最も優れた技術です。しかし、これは今すぐ変わります。Nvidiaなどの企業がAIファーストのチップに取り組んでいることは間違いありません。TwitterでLonus Ekin Stamが指摘するように、EtchedはTransformerアーキテクチャをチップに焼き付けることで、世界で最もパワフルなサーバーを作成しています。それは1つのことを非常にうまくこなすだけですが、その優れた性能がわかります。
この新しいハードウェアは、AIができることを劇的に向上させるでしょう。これは、現在のAI技術で可能な科学小説のアイデアを実現するための技術です。Etched AIとNvidiaに素晴らしい仕事をしていただきました。
🎶 AI生成音楽
実際にMicrosoftはSunno AIと提携しており、Bing ChatやMicrosoft Co-Pilotを使用してSunno AIを使って音楽を生成することができます。これはMicrosoft Co-Pilotのプラグインとして提供されています。Stable Audioという同じ会社がStable Diffusionを作成したこともあり、新しいモデルをリリースしていますが、現時点ではProユーザーのみでテスト中です。
🎨 AI生成アート
最後に、AI生成アートについて話しましょう。Domo AIは現在大変注目されています。これにより、ほとんどのビデオの芸術的スタイルを変更することができます。以前にもスタイルの転送はありましたが、このレベル、このクオリティではありませんでした。これにより、創造的な可能性は無限大です。
メリットとデメリット
メリット:
- オープンソースモデルがより強力でアクセスしやすくなっています
- AIファーストハードウェアにより、多くの科学小説のアイデアが実現可能になります
- AI生成音楽とアートがより印象的でアクセスしやすくなっています
デメリット:
- オープンソースモデルに関する安全上の懸念
- AIが悪意のある目的で使用される可能性
ハイライト
- GPT-4.5のリークが多くのハイプと推測を引き起こしています
- Open Chat 3.5などのオープンソースモデルがより強力でアクセスしやすくなっています
- AIファーストハードウェアがAIの可能性を革新します
- AI生成音楽とアートがより印象的でアクセスしやすくなっています
FAQ
Q: GPT-4.5とは何ですか?
A: GPT-4.5はOpenAIが開発中の噂されている大規模言語モデルです。
Q: Open Chat 3.5とは何ですか?
A: Open Chat 3.5は、世界最高とされるオープンソースの7Bサイズの大規模言語モデルです。
Q: Domo AIとは何ですか?
A: Domo AIは、ビデオの芸術的スタイルを変更することができるAIツールです。
リソース:
- Open Chat: https://openai.com/blog/openai-api/
- Etched AI: https://etched.ai/
- Sunno AI: https://sunno.ai/
- Stable Audio: https://stable.audio/
- Domo AI: https://domoai.co/