- 博客
- 谷歌的秘密武器?Gemini Omni 视频模型 I/O 大会前遭泄露
谷歌的秘密武器?Gemini Omni 视频模型 I/O 大会前遭泄露
谷歌的秘密武器?Gemini Omni 视频模型 I/O 大会前遭泄露

AI 视频领域的格局正在以惊人的速度发生变化。就在备受瞩目的 Google I/O 大会前几天,据传一个全新的巨头浮出水面:Gemini Omni。
这一“全模态”突破最初由少数 Gemini 用户发现,这表明谷歌已准备好挑战 Seedance 2.0 等模型目前的垄断地位。以下是我们对此次泄露的全部了解,以及它对 Fanch AI 等 AI 视频创作平台的未来意味着什么。
从“Nano Banana”到“Omni Video”
据内部人士透露,谷歌内部将此称为视频领域的**“Nano Banana 时刻”**。作为背景,“Nano Banana”是谷歌此前一个图像生成模型的内部代号,该模型曾以其惊人的图像质量飞跃震惊了所有人。
现在,谷歌在视频领域打出了同样的牌。早期的结果令人惊叹:一位用户成功输入了提示词:“一位教授在黑板上写下三角函数证明,并详细解释每一个步骤。” 
这些早期生成结果中的时序一致性和逻辑连贯性表明,它比之前的迭代有了重大飞跃,直接威胁到了 Seedance 2.0 保持的领先地位。
独家泄露:Gemini Omni 实机演示
眼见为实。以下是最新版 Gemini Omni 生成的泄露演示视频:
尽管 Seedance 2.0 一直处于领先地位,但 Gemini Omni 将大语言模型 (LLM) 推理与视频扩散技术相结合,标志着 AI 视频大战的真正开启。
什么是 Gemini Omni?(泄露参数)
Gemini Omni 似乎是 Veo 的进化版,现在已完全集成到 Gemini 生态系统中。与独立工具不同,Omni 被设计为真正的多模态模型。
泄露的核心功能:
- 基于对话的视频编辑: 用户可以通过自然语言修改视频——通过聊天界面去除水印、替换对象或对整个场景进行 Remix 重组。
- 版本分级: 传言指出将有两个版本——Gemini Omni Flash(速度优化)和 Gemini Omni Pro(质量优化)。
- 严格的配额: 目前,该模型处于极度严格的测试阶段。有报道称,仅生成 2 个高质量视频就会消耗用户近 86% 的每日配额。
统一生态系统
谷歌的方向很明确:大一统。 不再是一边 Veo 一边 Nano Banana。通过将专用模型整合到 Gemini Omni 中,谷歌正在创建一个能够同时理解和生成文本、图像和视频的单一系统。
这对 Fanch AI 用户意味着什么
在 Fanch AI,我们密切关注这些发展,以确保我们的用户始终能够使用最前沿的 AI 技术。虽然谷歌致力于打造具有严格生成配额的封闭生态系统,但 Fanch AI 依然是您的一站式核心枢纽。在这里,您可以跨越不同模型来对比、创作和完善 AI 媒体作品,摆脱单一平台的限制。
Gemini Omni 会终结竞争吗? 我们将在下周的 Google I/O 上揭晓答案。但有一点是肯定的:AI 的真正“视频时代”已经正式到来。
请持续关注 Fanch AI 博客,我们将在 Google I/O 主题演讲后提供全面的技术拆解。
