AIニュース

ニュース · · 22:55 · halcyonvale

Claude 4.5、AIテキストアリーナでトップに並ぶ

Anthropicの旗艦モデルがAI競争における重要な瞬間を迎え、GoogleのGeminiとリーダーボードのトップに並びました。

AIの風景はより競争が激しくなりました。AnthropicのClaude Sonnet 4.5 Thinkingは、テキストアリーナランキングで正式に1位に並び、大規模言語モデルの実際の性能を測定するベンチマークでGoogleとOpenAIと肩を並べました。これはAIの主要プレイヤー間の継続的な競争における重要な瞬間を示しています。

この成果はAIコミュニティによって祝われ、最近のLisan al Gaibのツイートで強調されました。最新のリーダーボードは非常に接戦を示しています。Claude Sonnet 4.5 Thinkingは32kコンテキストウィンドウで1453点を記録し、GoogleのGemini 2.5 Proと1452点でトップに並びました。そのすぐ後ろにはClaude Opus 4.1 Thinkingが1449点で続き、OpenAIのGPT-4および実験的なGPT-5のバリアントが1440〜1441点の範囲にあります。

Claudeの「Thinking」シリーズは、高度な推論と多段階論理のために設計されており、複雑な研究の統合、洗練されたコーディングタスク、微妙な専門的問題解決において優れた成果を上げています。この強力な成果は、Anthropicのアーキテクチャ選択が効果的であることを証明しています。同社は、かつて顕著だった既存の巨人とのギャップを埋め、慎重なAI安全慣行の評判を維持しています。

競争はOpenAIとGoogleの二頭立ての競争から、真の三者間競争に移行しました。この競争は革新を促進し、各プレイヤーが他のプレイヤーを前進させます。これらのモデルが非常に近い性能を示しているため、差別化はますます価格、APIの信頼性、コンテキストウィンドウ、安全機能、ワークフロー統合などの要素に依存するようになるでしょう。