Googleの秘密兵器?I/O直前にGemini Omni動画生成モデルがリーク

Fanch AIon 3 days ago

Google Gemini Omni AI動画生成 vs Seedance

AI動画生成の勢力図が猛スピードで変化しています。注目を集めるGoogle I/Oの数日前、新たな最強モデルが浮上したと報じられました。それがGemini Omniです。

一部のGeminiユーザーによって発見されたこの「オムニモーダル」なブレイクスルーは、GoogleがSeedance 2.0などのモデルによる現在の支配的な状況に挑む準備ができていることを示唆しています。今回のリーク情報の全貌と、これがFanch AIのようなAI動画制作プラットフォームの未来に何を意味するのかを解説します。

「Nano Banana」から「Omni Video」へ

内部関係者によると、Googleはこれを動画における**「Nano Bananaの瞬間」**と呼んでいるそうです。補足すると、「Nano Banana」とは、以前に画像生成の品質を飛躍的に向上させ、世界中を驚かせたモデルの社内コードネームです。

Googleは今、動画生成において同じカードを切ろうとしています。初期の生成結果は驚異的です。あるユーザーは、*「教授が黒板に三角関数の証明を書きながら、各ステップを詳細に説明している」*というプロンプトを成功させました。Gemini Omni 三角関数教授のデモ

これらの初期生成に見られる時間的整合性と論理的な展開は、従来のモデルからの大きな飛躍を示しており、Seedance 2.0の優位性を直接脅かすものです。

独占リーク:Gemini Omniのデモ映像

話題の理由を理解するには、実際に見てみるのが一番です。以下は、最新版のGemini Omniによって生成されたリーク動画です。

Gemini Omniの高忠実度動画生成の独占リーク映像。

これまでSeedance 2.0が業界をリードしてきましたが、LLMの推論能力と動画拡散モデルを統合したGemini Omniの登場は、真のAI動画戦争の幕開けを意味します。

Gemini Omniとは何か?(リークされた仕様)

Gemini OmniはVeoの進化版であり、Geminiエコシステムに完全に統合されているようです。単独のツールとは異なり、Omniは真のマルチモーダルとして設計されています。

リークされた主な機能:

  • チャットベースの動画編集: ユーザーは自然言語で動画を編集可能。チャットインターフェースを通じて、透かしの削除、オブジェクトの置き換え、シーン全体のRemixが行えます。
  • バージョンの階層化: Gemini Omni Flash(速度最適化)と Gemini Omni Pro(品質最適化)の2つのバージョンが存在するとの噂です。
  • 厳しい利用制限: 現在、このモデルは非常に限定的なテスト段階にあります。一部の報告では、高品質な動画をたった2本生成するだけで、1日の利用枠の約86%を消費してしまうとのことです。

エコシステムの統合

Googleの方向性は明確です。それは**「統合」**です。VeoとNano Bananaが別々に存在する時代は終わりました。特化型モデルをGemini Omniに組み込むことで、Googleはテキスト、画像、動画を同時に理解し生成できる単一のシステムを構築しています。

これがFanch AIユーザーにとって意味すること

Fanch AIでは、ユーザーが常に最先端のAIにアクセスできるよう、これらの動向を監視しています。Googleが厳しい生成制限を持つ閉鎖的なエコシステムを目指す一方で、Fanch AIは、ボトルネックなしに様々なモデルのAIメディアを比較、作成、改良できるオールインワン・ハブであり続けます。

Gemini Omniは競合を打ち負かすのか? その答えは来週のGoogle I/Oで明らかになるでしょう。一つ確かなことは、AIの真の「動画時代」が正式に到来したということです。


Google I/Oの基調講演後の完全な技術解説については、Fanch AIブログを引き続きチェックしてください。

Googleの秘密兵器?I/O直前にGemini Omni動画生成モデルがリーク