![]()
自分のアバターで動画主演、ついに解禁。
Googleが動画生成AIで一気に攻めてきました。Google I/O 2026にあわせて、新しい生成AIモデルファミリー「Gemini Omni」を正式発表しています。最初のモデルは「Gemini Omni Flash」で、Googleのブログ「Introducing Gemini Omni」が伝えています。
Gemini Omniは、テキスト・画像・音声・動画を組み合わせて入力でき、出力はまず動画からスタート。Googleは「Geminiの推論能力と、メディアモデルのレンダリング能力を組み合わせた新モデル」と説明しています。歴史や科学、文化的な文脈までGeminiの実世界知識を踏まえて動画を作れるとのこと。さらに物理面の理解も底上げしたとアピールしており、重力や運動エネルギー、流体力学といった「動きのリアルさ」をより直感的に扱えるようになったそうです。
平たく言えば、「ボールを投げたらどう飛ぶか」「水をこぼしたらどう広がるか」みたいな当たり前の挙動こそが、これまでの動画生成AIには地味に鬼門でした。Omniはそこをちゃんと押さえに行った、ということですね。
動画編集は自然言語の会話形式で進めます。「背景を変えて」「キャラクターを追加して」「スタイルを変えて」みたいな指示を複数ターン重ねながら、シーンの一貫性を保って仕上げていけるとのこと。
もう一つの目玉が「AI avatar」(自分そっくりのデジタル分身)。自分の顔と声を記録し、自分のアバターで動画を作れます。なお、Gemini Appsのヘルプでは、個人アカウントで使うにはGoogle AIプランが必要で、18歳以上が対象、現在はEEA、スイス、英国では利用できず、英語のみ対応とされています。音声や発話の改変については「責任ある展開のため引き続きテスト中」とのことで、ここは慎重ペースだそうです。
生成動画にはGoogleの不可視電子透かし「SynthID」(AI生成と分かる目に見えないマーカー)が埋め込まれます。DeepMindの説明では、Gemini app、Google Flow、YouTubeでOmniを使って作成・編集されたコンテンツには、SynthIDに加えてC2PA Content Credentialsも含まれるとのこと。検証機能については、Gemini appやGoogle Search、Gemini in Chromeなどに順次広がると説明されています。AI生成動画が出回る時代、見分ける側の導線も並走させる構えですね。
Gemini appとGoogle Flowでは、Google AI Plus / Pro / Ultra加入者向けに本日から全世界で展開。ただし、機能はプランや地域によって異なる可能性があります。YouTube Shorts RemixとYouTube Create Appでは、5月19日から無料で順次展開します。開発者・企業向けAPIは今後数週間で提供予定。
無料で触れる窓口はYouTube Shorts RemixとYouTube Create App。とりあえず短尺でOmniによるリミックスやアバター表現を試してみるあたりが、個人的なファーストアクションになりそうです。長尺、画像・音声出力、API公開と次の動きが控えるなか、動画生成AIのカジュアル化が一段進むかもしれないですね。Soraの意志を継ぐことになるのかも。




































