AIニュース

ニュース · · 12:14 · auroraloom

Gemini Live: AI機能の拡張とアクセス性の向上

Googleの自律型AIアシスタントGemini Liveが、音声理解を改善し、地図などのサービスへのアクセスを強化しました。

Googleの製品責任者リック・オスターローが「Made by Google」イベントで「ゲームチェンジングフォン」と呼んだ新しいPixel 10には、明らかにより多くの人工知能が含まれています。GeminiはGoogleスマートフォンの深く統合された部分です。しかし、GeminiというAIモデルは、ヘッドフォン、スマートウォッチ、間もなく車やテレビでも利用可能で、ホーム設定でも活用できます。自律型Gemini Liveアプリも更新を受けています。これは、さらに役立ち楽しいAIアシスタントになる予定です。

Gemini Liveはカメラレンズが見るものを見ます。同時にAIと話し、質問することができます。新しい機能として、Geminiは画像内の個々のオブジェクトを強調表示できます。例えば、スパイスラックの前でどのスパイスが別のものを代替できるかを尋ねると、Geminiは適合すると思われるものを円で囲みます。ブログ投稿では、欠けているクミンをコリアンダーで代替できる例を示しています。

しかし、これは適切なツールを探すときや、どの靴が服装により合うか分からないときにも役立つでしょう。スタイルアドバイザーGeminiです。この機能はVisual Guidanceと呼ばれ、Pixel 10デバイスにすぐに提供されます。他のAndroidデバイスも数週間以内にこれに続く予定です。しかし、これがドイツにもすぐに適用されるかどうかは明確ではありません。

しかし、Googleのイベントが何かを示すなら、Gemini Liveは間もなくフォーミュラ1ドライバーやプロバスケットボール選手になることを簡単にするでしょう。しかし、レーシングドライバーのランド・ノリスとバスケットボール選手のヤニス・アデトクンボが役割を交換するビデオは、両者が諦めることで終わります。

Gemini Liveは今やGoogleカレンダー、Keep、Tasksにもアクセスできます。したがって、Geminiを通じて他のアプリで予定を入力し、買い物リストを作成し、タスクやリマインダーを作成できます。メッセージ、スマートフォン自体、時計も間もなく追加される予定で、Googleマップも含まれます。

Gemini Liveと同様に、すべての機能は自然言語を使用してアクセスできます。Gemini自体、つまりAIモデルは、今後数週間で更新を受け、言語能力が大幅に改善される予定です。これには、Geminiにもっとゆっくり話すよう頼んだり、面白い方言や劇的なトーンで話すよう頼む機能が含まれます。

注意深いAI愛好家は、これがAIグラスに最適だと考えるでしょう。明らかにGoogleはまだ終わっていません。イベントの冒頭で、オスターローはそれに取り組んでいると言います。だから、もう長くはかからないでしょう。