2025年2月2月17日20:00(太平洋時間、2月18日13:00 日本時間)に、イーロンマスク氏のxAIからGrokシリーズの新しいモデルGrok 3が公開され、全世界から注目が集まっています。今回はそんなGrok-3についての発表から押さえておきたいポイントを解説していきます。
Grokはイーロンマスク氏のxAIによって開発されている生成AIで、ウェブ版だけでなく、X(旧Twitter)上でもチャットボットとして利用することができます。すべてのXユーザーがGrok-2を使用できるようになったのが2024年12月からでした。Grok-2は2024年8月にリリースされており、約半年でのアップデートになります。
GrokExplore Grok, the AI by xAI designed to answer nearly any quex.ai
一つ目は、Xのリアルタイムの情報にアクセスできる唯一の生成AIであるということです。これにより、最新のニュース、話題に関しても答えることが可能です。
二つ目は、ほかの生成AIが答えられない質問に関しても答えられる点です。例えばChatGPTは、暴力的な表現や差別的な表現、性的に不快な表現などを不適切表現として回答してくれませんが、xAIはそんな賛否が分かれるトピックについても回答してくれます。
三つめは、「Fun Mode」と「Regular Mode」の二つを選ぶことができ、「Fun Mode」ではユーモアを交えて回答してくれます。
xAIは、2023年7月から2024年12月までで、Grok 1からGrok 2へと急速に進化しました。しかし、Grok 2のトレーニングの際、8000個のGPUを効率的に利用するのに苦労し、冷却や電力の問題に直面しました。この課題を克服するため、xAIは自社でデータセンターを拡張し、122日間で10万個のGPUを構築しました。その後さらに拡張させ、92日間で20万個のGPUを稼働させました。これは、完全接続されたNVIDIAのH100 GPUクラスターとしては最大規模だとされています。
この巨大GPUクラスタはcolossusと呼ばれるスーパーコンピューターを衛生士、大きな計算資源となっています。スケーリング則といわれる、学習データと、計算量と、ニューラルネットワークのサイズという三つの要素を増やし続ければ、AIの性能は無限に上昇し続けるという法則の通り、この巨大な計算資源はGrok-3への進化につながりました。
このような大規模なGPU環境によるスケーリング則がGrokの進化を加速させる原動力となりました。
すでに100万個のGPUの投入が示唆されおり、より大規模で複雑な学習を可能にし、更なる進化が期待できます。一方で、高性能なGPUの価値は年々上がっており、その中で100万個独占されてしまう場合、更なる高騰やGPUの枯渇で他国の研究機関や、会社はますます高性能なGPUを手に入れられなくなってしまうことも想定されます。
Grok 3の性能は、数学、化学、コーディングのベンチマークテストや、Chatbot Arenaの指標で実証されています。
数学においては、DeepSeekを上回り、他のモデルを圧倒するスコアを記録しました。科学の分野でも、これまで強みを発揮していたClaudeを上回る結果を出しています。コーディングに関しても、DeepSeekを超える性能を示し、総合的に見てトップレベルの性能を持つAIモデルと言えます。
また、複数のAIが同じ質問に回答し、人間がその性能を評価する「チャットボットアリーナ」において、Grok-3は初めて1400点を超えるスコアを獲得しました。このスコアは、OpenAIやGoogleが公開している最良の推論モデルを上回るものであり、Grok-3の優れた性能を裏付けています。
Reasonigは「推論」、Test Timeは「計算資源の量」を表しています。巨大な計算資源を生かし、繰り返し推論を行い試行錯誤することでいわゆる「推論時スケーリング則」によって推論の結果も上昇します。結果は下の図のようになり、総則な処理の代わりに精度を落としたminiモデルでさえ今までのモデルの性能を越している分野も存在します。
Grok 3は、今後も継続的な改善が予定されており、ユーザーは、ほぼ毎日、その進化を実感できるとイーロン・マスク氏は述べています。xAIは、今後以下のようなことを予定している。
音声モードでは、Grokとの会話がより自然で人間らしくなることが期待されます。さらに、前のモデルであるGrok-2をオープンソース化することで、マスク氏の掲げるAI技術の民主化と透明性の向上に大きく貢献しています。
一つ目は、地球から火星への軌道モデルを3Dアニメーションで描画するという課題である。デモでは、宇宙船が地球を出発して火星へ向かい、タイミングを見計らって地球へ帰還するまでの過程を数値解析を交えながらリアルタイムに表示する様子が示される。軌道に関連する基礎的な物理法則を踏まえたうえで、ケプラー方程式の解法を用いていることがコードから推測され、実行結果も整合性のあるアニメーションとして可視化されていた。実際の宇宙航空業務では膨大な計算と試行が必要となるが、Grok-3を活用すれば人間が行う手間を大幅に削減し、素早くパラメータを調整して試行を重ねることが可能になる。研究者が理論を検証するときや、宇宙開発企業が実際の飛行計画のシミュレーションを行う場合にも有用であると考えられる。
次の活用例は、新しいゲームの開発である。従来から人気のある落ち物パズル“Tetris”と、同色の宝石を消していく“Bejeweled”の要素を組み合わせるよう指示されると、Grok-3はオリジナルのプログラムを即座に生成し、実行可能なゲームとして提示した。落ちてくるブロックの並び方や、3つ以上の同色パネルを揃えると一気に消えるシステムが融合されており、一見すると全く別のコンセプトになっていることがわかる。しかも、同様の指示を繰り返すたびに、ルールや画面演出が微妙に異なるバリエーションを生み出す例も確認され、Grok-3がクリエイティブな要素に関してもかなり柔軟に対応できることを示した。こうした創造性と実装力の両立は、エンターテインメント分野だけでなく、製品デザインや試作段階のプロトタイピングを飛躍的に効率化する可能性を秘めている。
生成AIとして成長していくGrok 3ですが、単なる言語モデルの進化にとどまらず、イーロン・マスク氏が運営する他の企業との連携、特に宇宙開発との融合が視野に入っています。SpaceXとの協業を通じて、宇宙探査や火星移住計画にGrok 3のAI技術を応用することが期待されています。例えば、宇宙船の自動制御システムや、宇宙空間での資源探査、あるいは火星基地での生活支援など、Grok 3が活躍できる場面は多岐にわたります。また、Grok 3は、テスラが開発するロボット「Optimus」や自動運転の自動車にも搭載される可能性があります。OptimusにGrok 3の高度な推論能力を付与することで、より複雑なタスクを自律的に実行できる汎用ロボットの実現が期待できますし、より高度な推論能力を持った自動運転自動車はより安全になるといえるでしょう。つまり、Grok 3は、単なるAIアシスタントではなく、宇宙開発やロボット工学・自動運転といった最先端分野を牽引し、xAI社のビジョンである「宇宙の真理を理解すること」がGrokによってどのように進歩するか期待が高まります。
株式会社メイトではこれからも引き続き最新のAI関連のニュースをキャッチし、わかりやすくお伝えしていきます。
AIについての知識をつけたい方、AIを導入・活用したい方などご相談がございましたらお気軽にお問い合わせください。
常に変化し、成長を続けていく組織を一緒に創るメンバーを探しています。
MATEでは、多様なバックグラウンドを持ったメンバーが活躍しています。
ご興味を持っていただいた方は、ぜひ採用ページをご覧ください。