OpenAI、o1シリーズを発表:高度な思考能力を備えた新型「ストロベリー」モデル

2024年9月12日、OpenAIは待望の「プロジェクト・ストロベリー」のもと、新たなAIモデルシリーズ「OpenAI o1」を発表しました。モデルo1-previewとo1-miniは、AIの飛躍的な進歩を象徴するもので、特にコーディング、法的分析、戦略的問題解決などの分野において、複雑な推論タスクを従来よりも適切に処理できるように設計されています。

OpenAIの研究リーダーであるジェリー・トゥオレク氏は、「o1のトレーニングは、その前身とは根本的に異なっている」と説明しています。データからパターンを模倣するように訓練されたこれまでのモデルとは異なり、o1は強化学習アプローチを採用しています。このアプローチでは、人間の思考プロセスに似た段階的な「思考の連鎖」を通じてクエリを処理するようにモデルを促す報酬とペナルティのシステムが用いられています。Tworek氏は、その進歩を認めながらも、モデルの幻覚が減少している一方で、「幻覚が解決されたとは言えない」と認めています。

O1モデルは推論能力の向上を目的として設計されていますが、機能面やコスト面で制限があり、現在もテスト段階にあります。OpenAIの最高研究責任者であるボブ・マックルー氏は、過去の命名規則についてユーモアを交えて次のように述べています。「正直に言うと、私たちは伝統的にネーミングが下手だと思います。」そして、「私たちがやっていることを世界に伝える、より新しく、よりまともな名前の始まりになることを期待しています。」と述べています。

これらの新しいモデルは、GPT-4oなどの以前のバージョンよりも反応が遅く、回答を出すまでに平均で約10秒の遅延がある。この遅い反応時間は、回答を出す前に問題について「考える」能力が強化されたことによるもので、出力の深さと正確性を向上させることを目的としている。速度面での潜在的な欠点があるものの、この機能は、法律や医療など、詳細な分析や慎重な推論を必要とする業界にとって大きな価値をもたらす。

しかし、この高度な機能に関連するコストは注目に値します。OpenAI o1の価格は、入力トークン100万個あたり15ドル、出力トークン100万個あたり60ドルで、これまでのモデルよりも大幅に高くなっています。この価格は、頻繁に大量の使用を必要とする小規模な企業や個人ユーザーにとっては、法外な価格となる可能性があります。

さらに、o1モデルは現在、ウェブブラウジングやファイルおよび画像分析には対応しておらず、画像分析機能はまだ検討段階にある。2024年9月17日の最新アップデートによると、ユーザーは毎週送信できるメッセージ数にも制限があり、o1-previewでは週50クエリ、o1-miniモデルでは1日50クエリという制限が最近設定された。

OpenAIは、o1の能力を検証するために、さまざまな厳しい条件下でテストを行いました。注目すべき成果として、このモデルは国際数学オリンピックの予選試験の問題の83%を解き、GPT-4oを大幅に上回る結果を出しました。さらに、プログラミングコンテスト「Codeforces」では、o1は参加者の89パーセンタイルにランクインしました。GitHubは、AIコーディングアシスタント「GitHub Copilot」でo1を使用した際のポジティブなフィードバックを報告しており、特にアルゴリズムとアプリケーションコードの最適化に役立ったとのことです。

こうした有望な結果にもかかわらず、OpenAIは慎重な姿勢を崩していない。OpenAIの研究科学者であるノーム・ブラウン氏は、X上で「o1は強化学習によって訓練されている」と述べ、このモデルは「思考のプライベートな連鎖を経て反応する前に『考える』」ようにインセンティブが与えられており、正しい答えには報酬が与えられるが、エラーにはペナルティが課せられると説明した。同氏は、新しい最適化アルゴリズムと、推論データで強化された特別に管理されたデータセットが、モデルの能力を向上させたと強調した。

OpenAIがo1の改良を続ける一方で、AI分野での競争が激化する中、より利用しやすく手頃な価格にするという課題が残っています。しかし、この組織は、今後のアップデートにより、このモデルの汎用性が広がり、運用コストが削減され、AI業界に新たな基準が打ち立てられると楽観視しています。