Anthropic、Claude 4を発表。GPT-5を上回るベンチマークで業界騒然

Anthropicは2026年4月24日、次世代フラッグシップモデル「Claude 4」を正式発表した。主要ベンチマーク19項目のうち14項目でGPT-5を上回る結果を叩き出し、AI業界に大きな衝撃を与えている。

01
GPT-5を凌駕するベンチマーク結果

Anthropicが公開したデータによると、Claude 4は総合知識、コーディング、科学的推論の各領域でGPT-5を上回る優位性を示した。特に日本語読解(JGLUE)における性能向上が著しい。

ベンチマーク項目 Claude 4 GPT-5
MMLU(総合知識) 91.2% 89.8%
HumanEval(コード) 94.5% 92.1%
GPQA(大学院レベル科学) 76.8% 71.3%
日本語読解(JGLUE) 88.4% 85.7%

02
新機能「Extended Thinking」の衝撃

Claude 4の目玉機能が「Extended Thinking」だ。指示内容の複雑さに応じてAIが思考時間を確保し、GPT-5の「o1」シリーズを上回る深い推論を可能にする。

  • 短い質問:数秒でレスポンス。
  • 複雑な問題:1〜2分間の思考プロセス。
  • 重要な意思決定:最大10分間の深い思考。

03
プラン別の料金体系

API料金はGPT-5と同水準に抑えられており、性能向上を加味すると実質的な値下げと言える設定となっている。

プラン 料金 特徴
Claude Free 無料 1日5メッセージまで
Claude Pro $20/月 無制限・Opus 4利用可
Claude Max $80/月 Extended Thinking無制限
API $5/M tokens 開発者向け

04
業界の反応と日本での展開
  • OpenAI:Sam Altman氏が「競争は健全だ」とコメント。
  • Google:Gemini 3の前倒し発表の可能性が浮上。
  • 日本国内:2026年4月24日より即日利用可能。ビジネスシェアの移動が予想される。

05
まとめ

Claude 4の登場でLLM業界の勢力図は塗り替えられようとしている。特に日本語の文脈理解や敬語処理の精度向上は凄まじく、ビジネスユースにおいて外せない選択肢となるだろう。

— AIジャーナル編集部 / 2026年4月

NEWSLETTER

毎朝7時、最新のLLM動向をお届け

OpenAI、Anthropic、Googleの三つ巴の戦いや、実務で使えるプロンプト情報を厳選して配信中。

無料で購読する →

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

コメント

コメントする

目次