谷歌发布 Nano Banana 2 Lite 和视频模型 Omni Flash:生图 4 秒,系列最快最便宜
- 谷歌发布 Nano Banana 2 Lite(模型代号 gemini-3.1-flash-lite-image),是 Nano Banana 系列目前最快、最便宜的生图模型:4秒出一张图,每千张图0.034美元。
- 谷歌首次向开发者开放视频模型 Gemini Omni Flash(gemini-omni-flash-preview),支持文本、图片、视频混合输入的视频生成与对话式编辑,定价每秒视频0.10美元,与 Veo 3.1 Fast 相同。
- 两款模型可以串联:先用 Nano Banana 2 Lite 生图,再交给 Omni Flash 变成动态视频,靠 Interactions API 保留会话上下文,最多可连续叠加3轮编辑。
- Nano Banana 2 Lite 已同步上线 AI Studio、Gemini API、Gemini Enterprise Agent Platform,以及 Search AI Mode、Gemini App、NotebookLM、Google Photos 等消费端产品。
- Omni Flash 目前只支持生成10秒视频,且暂不支持上传音频参考和场景扩展,换镜头时角色一致性也还不稳定。
谷歌这次同时放出两个新模型
谷歌于2026年6月30日宣布向开发者开放两款新模型:图像生成模型 Nano Banana 2 Lite,和视频生成/编辑模型 Gemini Omni Flash。
一张官方动图,看清「快」和「便宜」差多少
官方给出的这张基准动图,把横轴放价格、纵轴放延迟,Nano Banana 2 Lite 的位置越靠左下,就代表越快、越便宜。
官方补充:虽然主打速度,Nano Banana 2 Lite 在提示词遵循、角色一致性、图中文字清晰度这几项上仍保持可用水平,不是靠砍质量来换速度。
Nano Banana 现在分四档,该用哪个
加上这次的 Lite,Nano Banana 一共四档。它们不是简单的高中低配,而是按「速度、质量、可控性」的取舍分工,先看清各自定位再挑。
| 档位 | 模型代号 | 定位 |
|---|---|---|
| Nano Banana 2 Lite | Gemini 3.1 Flash Lite Image | 主打速度。为接近实时、高吞吐的批量场景优化,延迟压到最低 |
| Nano Banana 2 | Gemini 3.1 Flash Image | 通用主力。在更低延迟下给到高质量,性能和成本平衡最好 |
| Nano Banana Pro | Gemini 3 Pro Image | 专业复杂场景。控制力和推理最强,适合准确比速度更重要的活 |
| Nano Banana(初代) | Gemini 2.5 Flash Image | 官方标注的 legacy 老款,建议升级到 Lite 换质量、速度、成本三方面提升 |
Lite 不是阉割版,而是官方给初代 Nano Banana 用户的推荐替换项。原文写明「现在就能换过来,直接在关键性能维度上获益」,换句话说初代用户升级 Lite 属于官方建议的默认动作。
视频模型第一次能「对话着改」了
Omni Flash 是谷歌在 I/O 上亮过相的模型,这次第一次通过 API 交到开发者手里。它把 Gemini 的多模态理解和视频生成、编辑接在一起,能一边听自然语言指令一边改视频。官方点了四项能力,下面切开逐个看。
过去要「生成视频 + 再修改」,往往得拼两套系统。Omni Flash 把生成和对话式编辑放进同一个模型:你用一句话下指令,它就在已生成的片段上接着改,不用重写完整提示词。
生成视频后不用重新写完整提示词,直接用一句自然语言指令去改已经生成的片段。
生成时可以同时把图片、文字、视频都喂给模型当参考素材,让角色长相、场景细节在整个过程里保持一致。
Omni 会调用 Gemini 掌握的历史、生物、叙事逻辑等知识,让画面内容合理、故事说得通。
用简单的提示,就能把文字、图形直接对应到视频里的动作时间点。
像和一个已经看过片子的剪辑师聊天:你说一句,他就照着改,不用每次把要求从头讲一遍。这就是「对话式编辑」和过去「每改一次都重写提示词」的区别。
两个模型怎么接起来用
官方说,真正好用的地方在于把两个模型串成一条链:先用 Nano Banana 2 Lite 快速出图,把这张图当参考传给 Omni Flash,让它动起来变成视频,再靠 Interactions API 记住上下文,接着对话式地连改。
这里的关键是 Interactions API 的多轮会话上下文:模型会记住之前几轮生成的是哪一张图、哪一段视频,你可以像聊天一样一步步接着改,最多连续叠加3轮,不用每轮从头写提示词。
类似 Photoshop 的历史记录:你说「再给这张加个滤镜」,模型知道你说的是刚才那一张,不用你重新指认。三轮编辑,就是这条历史记录最多能往前接三步。
官方给了三个可直接玩的 demo
这三个 demo app 就是这条链路的具体落地,都能在 AI Studio 里直接改着用。
这对做产品的人意味着什么
把上面的能力落到实处,这次发布实际解锁了三类场景。
一,生图成本压到每千张约 $0.034(约合人民币两毛四)、4秒一张。批量出图、快速试错这类产品原型,可以用更低预算跑起来,试错的边际成本变得很低。
二,视频生成加对话式编辑第一次通过 API 直接开放。开发者不用再自己拼接「生成模型」和「编辑工具」两套系统,一个 API 就能又生成又改。
三,图生视频可以链式调用。先出图、再变视频、还能连改3轮,这催生了换装修效果、地标漫游、电商展示视频这类交互型应用,官方三个 demo 就是样板。
现在还做不到什么
Omni Flash 目前是公开预览版,官方自己列了几条限制,先知道边界再上手,别对能力预期过高。
- 单次视频生成上限10秒,官方称更长时长即将支持。
- 在 Gemini API 里,这个模型暂不支持上传音频参考,也不支持场景扩展。
- 3秒以内的视频参考,API 的 schema 收得下,但模型目前处理不了。
- 换镜头或平移运镜时,角色一致性还有局限,官方称在改进中。
顺带一提:水印与内容溯源
新价格和同类比,差在哪
用具体数字收尾。Nano Banana 2 Lite 的落点是「系列里最快最便宜」,Omni Flash 的落点是「和 Veo 3.1 Fast 同价」,这两条是这次发布最硬的价格信号。
视频每秒定价:Omni Flash 与 Veo 3.1 Fast 持平
换句话说,谷歌把这个首次开放的视频模型,直接定在了和现有 Veo 3.1 Fast 相同的每秒价位上。生图侧,Nano Banana 2 Lite 则是官方明确点名、建议初代 Nano Banana 用户直接替换的最快最便宜档位。
It's our recommended replacement for developers currently using our first version of Nano Banana, you can swap it out now for immediate benefits across key performance dimensions. 谷歌官方博客,2026-06-30