谷歌的秘密武器？Gemini Omni 视频模型 I/O 大会前遭泄露

Fanch AIon 2 months ago

谷歌 Gemini Omni AI 视频生成对比 Seedance

AI 视频领域的格局正在以惊人的速度发生变化。就在备受瞩目的 Google I/O 大会前几天，据传一个全新的巨头浮出水面：Gemini Omni。

这一“全模态”突破最初由少数 Gemini 用户发现，这表明谷歌已准备好挑战 Seedance 2.0 等模型目前的垄断地位。以下是我们对此次泄露的全部了解，以及它对 Fanch AI 等 AI 视频创作平台的未来意味着什么。

从“Nano Banana”到“Omni Video”

据内部人士透露，谷歌内部将此称为视频领域的**“Nano Banana 时刻”**。作为背景，“Nano Banana”是谷歌此前一个图像生成模型的内部代号，该模型曾以其惊人的图像质量飞跃震惊了所有人。

现在，谷歌在视频领域打出了同样的牌。早期的结果令人惊叹：一位用户成功输入了提示词：“一位教授在黑板上写下三角函数证明，并详细解释每一个步骤。” Gemini Omni 三角函数教授演示

这些早期生成结果中的时序一致性和逻辑连贯性表明，它比之前的迭代有了重大飞跃，直接威胁到了 Seedance 2.0 保持的领先地位。

眼见为实。以下是最新版 Gemini Omni 生成的泄露演示视频：

独家泄露的 Gemini Omni 高保真视频生成画面。

尽管 Seedance 2.0 一直处于领先地位，但 Gemini Omni 将大语言模型 (LLM) 推理与视频扩散技术相结合，标志着 AI 视频大战的真正开启。

Gemini Omni 似乎是 Veo 的进化版，现在已完全集成到 Gemini 生态系统中。与独立工具不同，Omni 被设计为真正的多模态模型。

谷歌的方向很明确：大一统。 不再是一边 Veo 一边 Nano Banana。通过将专用模型整合到 Gemini Omni 中，谷歌正在创建一个能够同时理解和生成文本、图像和视频的单一系统。

在 Fanch AI，我们密切关注这些发展，以确保我们的用户始终能够使用最前沿的 AI 技术。虽然谷歌致力于打造具有严格生成配额的封闭生态系统，但 Fanch AI 依然是您的一站式核心枢纽。在这里，您可以跨越不同模型来对比、创作和完善 AI 媒体作品，摆脱单一平台的限制。

Gemini Omni 会终结竞争吗？ 我们将在下周的 Google I/O 上揭晓答案。但有一点是肯定的：AI 的真正“视频时代”已经正式到来。

请持续关注 Fanch AI 博客，我们将在 Google I/O 主题演讲后提供全面的技术拆解。