OpenAIは2025年2月27日、これまでで最も大規模かつ高性能なチャット向けモデル「GPT-4.5」の研究プレビューを公開しました。これは、同社の強力なSTEM分野に特化した推論モデルを基盤としつつ、より汎用的な目的で設計された最新のAIモデルです。同日より、世界中のChatGPT ProユーザーとAPIの有料ティアの開発者が利用可能となり、その驚異的な能力の一端を体験することができます。
GPT-4.5は、事前学習と事後学習のスケーリングをさらに進化させたモデルです。特に注目すべきは、教師なし学習をスケールアップした点であり、これによりパターン認識、関連性の整理、そしてリーズニングを経ることなく創造的な洞察を生成する能力が向上しました。
OpenAIは、AIの能力向上にはリーズニングと教師なし学習という2つの補完的なパラダイムのスケールアップが重要であると考えています。リーズニングのスケールアップは、モデルが応答する前に思考の連鎖(Chain of Thought)を学習させることで、複雑なSTEMや論理的な問題を解決できるようにするアプローチであり、OpenAI o1やOpenAI o3-miniなどがその例です。一方、教師なし学習のスケールアップは、「世界モデル」(現実世界の知識)の精度と直感を向上させることを目指します。
GPT-4.5は、コンピューティングリソースとデータの拡張に加え、アーキテクチャと最適化の革新によってこの教師なし学習のスケールアップを実現しました。その結果、幅広い知識と深い世界理解を備え、誤った情報を生成する「ハルシネーション」の頻度が低減し、広範なトピックにおいてより信頼性の高い応答が可能となっています。
初期テストでは、GPT-4.5との対話がより自然に感じられることが示されています。これは、より広い知識ベース、ユーザーの意図を汲み取る能力の向上、そして進化した「EQ(心の知能指数)」によるものです。
SimpleQAというLLMの事実性を評価する指標においても、GPT-4.5は高い精度を示し、ハルシネーションの発生率が低いことが確認されています。また、人間のテスターとの比較評価においても、GPT-4.5はGPT-4oよりも好まれる傾向にあり、より深い世界理解と協調性の向上が評価されています。
GPT-4.5は、人間の意図をより正確に理解し、微妙なニュアンスや暗黙の期待を高度な「EQ」で読み取ることができます。これにより、アイデアを自然に統合し、温かみのある直感的な会話が実現します。さらに、美的感覚や創造性にも優れ、特に文章作成やデザインの支援において高い能力を発揮することが期待されています。
本記事では、GPT 4.5と他のモデル(GPT-4)との比較も行っています。その結果、GPT 4.5はクリエイティブな文章の生成において、他のモデルよりも優れた性能を発揮することが示されています。
例えば、「劇的なストーリの小説のあらすじを書いて」と指示した場合、GPT-4.5は文章表現が洗練されており、感情に訴えかける文章を生成できることが示されています。
GPT-4.5は、応答する前に深く思考するわけではないため、OpenAI o1のようなリーズニングに特化したモデルとは異なります。しかし、GPT-4.5のような事前学習を通じて高度な知識と知性を獲得したモデルは、将来的にはリーズニングやツール活用能力を持つエージェントの、より強固な基盤となることが期待されています。OpenAIは、リーズニングが将来のモデルの中核となる性能であると位置づけており、今後事前学習とリーズニングという2つのアプローチが互いを補完していくと考えています。
OpenAIは、モデルの能力向上に伴い、安全性への取り組みも強化しています。GPT-4.5は、新たな監督手法を取り入れた学習を実施しており、従来の教師ありファインチューニング(SFT)や、人間のフィードバックを活用した強化学習(RLHF)と組み合わせています。これらの手法は、GPT-4oのトレーニングでも使用されたものであり、より高度な未来のモデルを適切に調整するための基盤となります。
GPT-4.5の公開前には、Preparedness Frameworkに基づいて一連の安全性テストが実施され、安全性リスクの大幅な増加は見られなかったことが報告されています。テストは、禁止コンテンツ、脱獄、モデルの誤り、説得力、モデルの自律性といった特定のリスク領域に焦点を当てて行われました。
現在、GPT-4.5はChatGPT Proプランのユーザー向けに提供されており、Web、モバイル、デスクトップ版のモデルピッカーから選択して利用できます。GPT-4.5は、最新の情報にアクセスできる検索機能や、ファイルや画像のアップロード、キャンバス機能を利用したライティングやコーディング作業にも対応しています。ただし、現時点では音声モード、動画、画面共有などのマルチモーダル機能は利用できません。
また、GPT-4.5はChat Completions API、Assistants API、Batch APIを通じて、すべての有料利用ティアの開発者向けにプレビュー提供されています。関数呼び出し、Structured Outputs、ストリーミング、システムメッセージといった主要な機能に加え、画像入力を活用したビジョン機能もサポートしています。初期テストの結果、GPT-4.5は特に感情知能と創造性の高さを活かしたアプリケーションに適しており、文章作成支援、コミュニケーション、学習、コーチング、ブレインストーミングなどの分野での有用性が期待されています。
ただし、GPT-4.5は非常に大規模で計算負荷の高いモデルであり、GPT-4oよりもコストがかかるため、APIでの長期提供については、実際の利用状況やユーザーからのフィードバックに基づいて検討される予定です。
GPT-4.5が標準的な学術ベンチマークで示した結果は以下の通りです。これらの結果は、教師なし学習の単純なスケーリングによっても、GPT-4oなどの従来モデルと比較して性能が向上していることを示しています。
GPT-4.5の登場は、AI技術の新たな可能性を示すものです。教師なし学習の最前線を切り拓くこのモデルは、より自然な対話、幅広い知識と深い理解、そして創造的な問題解決能力を備えています。OpenAIは、ユーザーの創造力によって、GPT-4.5の新たな能力や想定外の活用方法が発見されることを期待しており、今後も教師なし学習の最先端を探求していく方針です。
GPT-4.5は、現時点では一部のユーザーと開発者のみが利用可能ですが、その革新的な能力は、今後のAI技術の発展に大きな影響を与えることは間違いありません。 今後、より多くの人々がGPT-4.5の恩恵を受けられるようになることが期待されます。
株式会社メイトでは、そんなAIエージェントや生成AIについての最新情報をいち早くキャッチアップし、発信していきます。AIについての講義、導入、AIを組み込んだシステム開発など、お問い合わせやご相談をお待ちしております。
常に変化し、成長を続けていく組織を一緒に創るメンバーを探しています。
MATEでは、多様なバックグラウンドを持ったメンバーが活躍しています。
ご興味を持っていただいた方は、ぜひ採用ページをご覧ください。