谷歌的秘密武器?Gemini Omni 视频模型 I/O 大会前遭泄露

Fanch AIon 3 days ago

谷歌的秘密武器?Gemini Omni 视频模型 I/O 大会前遭泄露

谷歌 Gemini Omni AI 视频生成对比 Seedance

AI 视频领域的格局正在以惊人的速度发生变化。就在备受瞩目的 Google I/O 大会前几天,据传一个全新的巨头浮出水面:Gemini Omni

这一“全模态”突破最初由少数 Gemini 用户发现,这表明谷歌已准备好挑战 Seedance 2.0 等模型目前的垄断地位。以下是我们对此次泄露的全部了解,以及它对 Fanch AI 等 AI 视频创作平台的未来意味着什么。

从“Nano Banana”到“Omni Video”

据内部人士透露,谷歌内部将此称为视频领域的**“Nano Banana 时刻”**。作为背景,“Nano Banana”是谷歌此前一个图像生成模型的内部代号,该模型曾以其惊人的图像质量飞跃震惊了所有人。

现在,谷歌在视频领域打出了同样的牌。早期的结果令人惊叹:一位用户成功输入了提示词:“一位教授在黑板上写下三角函数证明,并详细解释每一个步骤。” Gemini Omni 三角函数教授演示

这些早期生成结果中的时序一致性和逻辑连贯性表明,它比之前的迭代有了重大飞跃,直接威胁到了 Seedance 2.0 保持的领先地位。

独家泄露:Gemini Omni 实机演示

眼见为实。以下是最新版 Gemini Omni 生成的泄露演示视频:

独家泄露的 Gemini Omni 高保真视频生成画面。

尽管 Seedance 2.0 一直处于领先地位,但 Gemini Omni 将大语言模型 (LLM) 推理与视频扩散技术相结合,标志着 AI 视频大战的真正开启。

什么是 Gemini Omni?(泄露参数)

Gemini Omni 似乎是 Veo 的进化版,现在已完全集成到 Gemini 生态系统中。与独立工具不同,Omni 被设计为真正的多模态模型。

泄露的核心功能:

  • 基于对话的视频编辑: 用户可以通过自然语言修改视频——通过聊天界面去除水印、替换对象或对整个场景进行 Remix 重组。
  • 版本分级: 传言指出将有两个版本——Gemini Omni Flash(速度优化)和 Gemini Omni Pro(质量优化)。
  • 严格的配额: 目前,该模型处于极度严格的测试阶段。有报道称,仅生成 2 个高质量视频就会消耗用户近 86% 的每日配额。

统一生态系统

谷歌的方向很明确:大一统。 不再是一边 Veo 一边 Nano Banana。通过将专用模型整合到 Gemini Omni 中,谷歌正在创建一个能够同时理解和生成文本、图像和视频的单一系统。

这对 Fanch AI 用户意味着什么

Fanch AI,我们密切关注这些发展,以确保我们的用户始终能够使用最前沿的 AI 技术。虽然谷歌致力于打造具有严格生成配额的封闭生态系统,但 Fanch AI 依然是您的一站式核心枢纽。在这里,您可以跨越不同模型来对比、创作和完善 AI 媒体作品,摆脱单一平台的限制。

Gemini Omni 会终结竞争吗? 我们将在下周的 Google I/O 上揭晓答案。但有一点是肯定的:AI 的真正“视频时代”已经正式到来。


请持续关注 Fanch AI 博客,我们将在 Google I/O 主题演讲后提供全面的技术拆解。

谷歌的秘密武器?Gemini Omni 视频模型 I/O 大会前遭泄露