
Google、Gemini CLIの機能を強化
Googleは、Gemini CLIの機能を強化する2つの新機能を発表した。Gemini 2.5 Computer Useモデルは、ユーザーインターフェースを操作できるAIエージェントの開発を可能にし、ウェブおよびモバイル制御ベンチマークで競合他社を上回る性能を示している。このモデルはGemini APIを通じて利用可能である。
さらに、GoogleはGemini CLIに拡張機能のサポートを導入し、さまざまなツールとの接続や開発者のワークフローの個別化を可能にした。Figma、Shopify、Stripeなどのパートナーが含まれる拡張機能のリストが共有された。
OpenAIは、ChatGPT内でサードパーティアプリを直接実行できる「アプリプラットフォーム」を発表した。SpotifyやCanvaとのパートナーシップが発表され、他のサードパーティアプリ提供者がエコシステムに参加できるようにするApps SDKが提供されている。
OpenAIはまた、新しいAIモデルGPT-5 ProとSora 2をAPIに追加し、GPT-realtime-mini音声-音声APIを導入した。これは音声エージェントや対話型アプリケーションに高品質を維持する高速で低遅延のモデルである。
Figure AIは、Helix AIシステムで駆動される第3世代ヒューマノイドロボットFigure03を発表した。このロボットは5時間のバッテリー寿命とワイヤレス充電機能を備え、年間12,000台の生産能力を持つ工場での大量生産が予定されている。