Google「Gemini Omni」発表、自分のアバターで動画主演も可能に

　自分のアバターで動画主演、ついに解禁。

　Googleが動画生成AIで一気に攻めてきました。Google I/O 2026にあわせて、新しい生成AIモデルファミリー「Gemini Omni」を正式発表しています。最初のモデルは「Gemini Omni Flash」で、Googleのブログ「Introducing Gemini Omni」が伝えています。

　Gemini Omniは、テキスト・画像・音声・動画を組み合わせて入力でき、出力はまず動画からスタート。Googleは「Geminiの推論能力と、メディアモデルのレンダリング能力を組み合わせた新モデル」と説明しています。歴史や科学、文化的な文脈までGeminiの実世界知識を踏まえて動画を作れるとのこと。さらに物理面の理解も底上げしたとアピールしており、重力や運動エネルギー、流体力学といった「動きのリアルさ」をより直感的に扱えるようになったそうです。

　平たく言えば、「ボールを投げたらどう飛ぶか」「水をこぼしたらどう広がるか」みたいな当たり前の挙動こそが、これまでの動画生成AIには地味に鬼門でした。Omniはそこをちゃんと押さえに行った、ということですね。

　動画編集は自然言語の会話形式で進めます。「背景を変えて」「キャラクターを追加して」「スタイルを変えて」みたいな指示を複数ターン重ねながら、シーンの一貫性を保って仕上げていけるとのこと。

　もう一つの目玉が「AI avatar」（自分そっくりのデジタル分身）。自分の顔と声を記録し、自分のアバターで動画を作れます。なお、Gemini Appsのヘルプでは、個人アカウントで使うにはGoogle AIプランが必要で、18歳以上が対象、現在はEEA、スイス、英国では利用できず、英語のみ対応とされています。音声や発話の改変については「責任ある展開のため引き続きテスト中」とのことで、ここは慎重ペースだそうです。

　生成動画にはGoogleの不可視電子透かし「SynthID」（AI生成と分かる目に見えないマーカー）が埋め込まれます。DeepMindの説明では、Gemini app、Google Flow、YouTubeでOmniを使って作成・編集されたコンテンツには、SynthIDに加えてC2PA Content Credentialsも含まれるとのこと。検証機能については、Gemini appやGoogle Search、Gemini in Chromeなどに順次広がると説明されています。AI生成動画が出回る時代、見分ける側の導線も並走させる構えですね。

　Gemini appとGoogle Flowでは、Google AI Plus / Pro / Ultra加入者向けに本日から全世界で展開。ただし、機能はプランや地域によって異なる可能性があります。YouTube Shorts RemixとYouTube Create Appでは、5月19日から無料で順次展開します。開発者・企業向けAPIは今後数週間で提供予定。

　無料で触れる窓口はYouTube Shorts RemixとYouTube Create App。とりあえず短尺でOmniによるリミックスやアバター表現を試してみるあたりが、個人的なファーストアクションになりそうです。長尺、画像・音声出力、API公開と次の動きが控えるなか、動画生成AIのカジュアル化が一段進むかもしれないですね。Soraの意志を継ぐことになるのかも。

Google Pixel製品を購入する [AD] グーグル公式Amazonストア