Anthropicは2026年4月24日、次世代フラッグシップモデル「Claude 4」を正式発表した。主要ベンチマーク19項目のうち14項目でGPT-5を上回る結果を叩き出し、AI業界に大きな衝撃を与えている。
01
GPT-5を凌駕するベンチマーク結果
GPT-5を凌駕するベンチマーク結果
Anthropicが公開したデータによると、Claude 4は総合知識、コーディング、科学的推論の各領域でGPT-5を上回る優位性を示した。特に日本語読解(JGLUE)における性能向上が著しい。
| ベンチマーク項目 | Claude 4 | GPT-5 |
|---|---|---|
| MMLU(総合知識) | 91.2% | 89.8% |
| HumanEval(コード) | 94.5% | 92.1% |
| GPQA(大学院レベル科学) | 76.8% | 71.3% |
| 日本語読解(JGLUE) | 88.4% | 85.7% |
02
新機能「Extended Thinking」の衝撃
新機能「Extended Thinking」の衝撃
Claude 4の目玉機能が「Extended Thinking」だ。指示内容の複雑さに応じてAIが思考時間を確保し、GPT-5の「o1」シリーズを上回る深い推論を可能にする。
- 短い質問:数秒でレスポンス。
- 複雑な問題:1〜2分間の思考プロセス。
- 重要な意思決定:最大10分間の深い思考。
03
プラン別の料金体系
プラン別の料金体系
API料金はGPT-5と同水準に抑えられており、性能向上を加味すると実質的な値下げと言える設定となっている。
| プラン | 料金 | 特徴 |
|---|---|---|
| Claude Free | 無料 | 1日5メッセージまで |
| Claude Pro | $20/月 | 無制限・Opus 4利用可 |
| Claude Max | $80/月 | Extended Thinking無制限 |
| API | $5/M tokens | 開発者向け |
04
業界の反応と日本での展開
業界の反応と日本での展開
- OpenAI:Sam Altman氏が「競争は健全だ」とコメント。
- Google:Gemini 3の前倒し発表の可能性が浮上。
- 日本国内:2026年4月24日より即日利用可能。ビジネスシェアの移動が予想される。
05
まとめ
まとめ
Claude 4の登場でLLM業界の勢力図は塗り替えられようとしている。特に日本語の文脈理解や敬語処理の精度向上は凄まじく、ビジネスユースにおいて外せない選択肢となるだろう。

コメント