产品发布 · 小互解读

谷歌发布 Nano Banana 2 Lite 和视频模型 Omni Flash:生图 4 秒,系列最快最便宜

生图仅需 4 秒、每千张约 $0.034;视频模型 Omni Flash 同日首次开放给开发者。
一眼速览
  • 谷歌发布 Nano Banana 2 Lite(模型代号 gemini-3.1-flash-lite-image),是 Nano Banana 系列目前最快、最便宜的生图模型:4秒出一张图,每千张图0.034美元。
  • 谷歌首次向开发者开放视频模型 Gemini Omni Flash(gemini-omni-flash-preview),支持文本、图片、视频混合输入的视频生成与对话式编辑,定价每秒视频0.10美元,与 Veo 3.1 Fast 相同。
  • 两款模型可以串联:先用 Nano Banana 2 Lite 生图,再交给 Omni Flash 变成动态视频,靠 Interactions API 保留会话上下文,最多可连续叠加3轮编辑。
  • Nano Banana 2 Lite 已同步上线 AI Studio、Gemini API、Gemini Enterprise Agent Platform,以及 Search AI Mode、Gemini App、NotebookLM、Google Photos 等消费端产品。
  • Omni Flash 目前只支持生成10秒视频,且暂不支持上传音频参考和场景扩展,换镜头时角色一致性也还不稳定。
立场提示:本文来源为谷歌官方博客,属厂商自家发布内容。文中的延迟、价格、能力表述均为官方口径,跑分图为谷歌自评。下文按官方说法直述,读者可自行到 AI Studio 实测核对。
1同日两连发

谷歌这次同时放出两个新模型

谷歌于2026年6月30日宣布向开发者开放两款新模型:图像生成模型 Nano Banana 2 Lite,和视频生成/编辑模型 Gemini Omni Flash。

一个管出图,一个管出视频,而且官方直接把它们设计成可以接起来用:静态图生成后传给视频模型,就能动起来。
为什么值得看:Gemini Omni Flash 是谷歌视频模型第一次经 API 开放给开发者,每秒视频定价0.10美元,和 Veo 3.1 Fast 持平;Nano Banana 2 Lite 文生图只要4秒、每千张图0.034美元,是当前 Nano Banana 系列里最快、最便宜的版本,官方建议直接拿它替换初代 Nano Banana。
官方发布页头图演示片:两款生成媒体模型的效果展示。来源:谷歌官方博客
2官方基准

一张官方动图,看清「快」和「便宜」差多少

官方给出的这张基准动图,把横轴放价格、纵轴放延迟,Nano Banana 2 Lite 的位置越靠左下,就代表越快、越便宜。

图像生成与编辑:延迟与价格对比动图
官方基准动图:图像生成与编辑在「延迟」与「价格」两个维度上的位置对比。来源:谷歌官方博客
4秒
文生图耗时,官方称适合交互式原型和快速草图
$0.034
每千张图成本(官方 per 1K image 口径),约合人民币两毛四

官方补充:虽然主打速度,Nano Banana 2 Lite 在提示词遵循、角色一致性、图中文字清晰度这几项上仍保持可用水平,不是靠砍质量来换速度。

3家族分档

Nano Banana 现在分四档,该用哪个

加上这次的 Lite,Nano Banana 一共四档。它们不是简单的高中低配,而是按「速度、质量、可控性」的取舍分工,先看清各自定位再挑。

档位模型代号定位
Nano Banana 2 LiteGemini 3.1 Flash Lite Image主打速度。为接近实时、高吞吐的批量场景优化,延迟压到最低
Nano Banana 2Gemini 3.1 Flash Image通用主力。在更低延迟下给到高质量,性能和成本平衡最好
Nano Banana ProGemini 3 Pro Image专业复杂场景。控制力和推理最强,适合准确比速度更重要的活
Nano Banana(初代)Gemini 2.5 Flash Image官方标注的 legacy 老款,建议升级到 Lite 换质量、速度、成本三方面提升
Nano Banana 2 Lite、Nano Banana 2、Nano Banana Pro 对比表格
官方模型对比表:Nano Banana 2 Lite、Nano Banana 2、Nano Banana Pro 的能力分档。来源:谷歌官方博客
官方原话

Lite 不是阉割版,而是官方给初代 Nano Banana 用户的推荐替换项。原文写明「现在就能换过来,直接在关键性能维度上获益」,换句话说初代用户升级 Lite 属于官方建议的默认动作。

4核心能力

视频模型第一次能「对话着改」了

Omni Flash 是谷歌在 I/O 上亮过相的模型,这次第一次通过 API 交到开发者手里。它把 Gemini 的多模态理解和视频生成、编辑接在一起,能一边听自然语言指令一边改视频。官方点了四项能力,下面切开逐个看。

本次重点

过去要「生成视频 + 再修改」,往往得拼两套系统。Omni Flash 把生成和对话式编辑放进同一个模型:你用一句话下指令,它就在已生成的片段上接着改,不用重写完整提示词。

conversational video editing|对话式视频编辑

生成视频后不用重新写完整提示词,直接用一句自然语言指令去改已经生成的片段。

比如你只说一句「镜头拉远一点」,它就照着改,不用把整段要求从头讲一遍。
multimodal referencing|多模态参考

生成时可以同时把图片、文字、视频都喂给模型当参考素材,让角色长相、场景细节在整个过程里保持一致。

给它一张人物图加一段文字说明,它在生成的视频里尽量维持同一张脸、同一处场景。
real-world knowledge|真实世界知识

Omni 会调用 Gemini 掌握的历史、生物、叙事逻辑等知识,让画面内容合理、故事说得通。

生成一段有情节的视频时,它能靠这些常识把镜头组织得更连贯,而不是画面堆砌。
text and action synchronization|文字与动作同步

用简单的提示,就能把文字、图形直接对应到视频里的动作时间点。

你写明某个动作对应哪句文字,画面里的动作就跟着那句话的节奏走。
打个比方 · 对话式编辑

像和一个已经看过片子的剪辑师聊天:你说一句,他就照着改,不用每次把要求从头讲一遍。这就是「对话式编辑」和过去「每改一次都重写提示词」的区别。

视频编辑基准评测图
官方视频编辑基准评测图(自评数据)。来源:谷歌官方博客
5串起来用

两个模型怎么接起来用

官方说,真正好用的地方在于把两个模型串成一条链:先用 Nano Banana 2 Lite 快速出图,把这张图当参考传给 Omni Flash,让它动起来变成视频,再靠 Interactions API 记住上下文,接着对话式地连改。

Nano Banana 2 Lite4秒出图
作为参考图传给下一步
Omni Flash生成动态视频
Interactions API保留上下文,最多叠加3轮编辑

这里的关键是 Interactions API 的多轮会话上下文:模型会记住之前几轮生成的是哪一张图、哪一段视频,你可以像聊天一样一步步接着改,最多连续叠加3轮,不用每轮从头写提示词。

打个比方 · 多轮上下文

类似 Photoshop 的历史记录:你说「再给这张加个滤镜」,模型知道你说的是刚才那一张,不用你重新指认。三轮编辑,就是这条历史记录最多能往前接三步。

视频 静态图
一张静态图沿时间轴逐帧长出动态视频,对应「生图 → 变视频」这条链路

官方给了三个可直接玩的 demo

这三个 demo app 就是这条链路的具体落地,都能在 AI Studio 里直接改着用。

Anywhere
拍张自拍或传张照,先用 Lite 把你「传送」到几十个地标,点开某张图,再用 Omni Flash 把它变成一段该地点的动画。
Space Lift
室内设计 demo:传一张房间照,自动生成多种风格的装修概念,选中喜欢的一版,点视频按钮让 Omni 用运镜把这套设计动态呈现。
Omni product studio
把 Lite 生成的静态图转成电商展示视频:合并多模态输入,通过对图片的一次交互得到图生视频的结果。
6对开发者的意义

这对做产品的人意味着什么

把上面的能力落到实处,这次发布实际解锁了三类场景。

一,生图成本压到每千张约 $0.034(约合人民币两毛四)、4秒一张。批量出图、快速试错这类产品原型,可以用更低预算跑起来,试错的边际成本变得很低。

二,视频生成加对话式编辑第一次通过 API 直接开放。开发者不用再自己拼接「生成模型」和「编辑工具」两套系统,一个 API 就能又生成又改。

三,图生视频可以链式调用。先出图、再变视频、还能连改3轮,这催生了换装修效果、地标漫游、电商展示视频这类交互型应用,官方三个 demo 就是样板。

7当前边界

现在还做不到什么

Omni Flash 目前是公开预览版,官方自己列了几条限制,先知道边界再上手,别对能力预期过高。

  • 单次视频生成上限10秒,官方称更长时长即将支持。
  • 在 Gemini API 里,这个模型暂不支持上传音频参考,也不支持场景扩展。
  • 3秒以内的视频参考,API 的 schema 收得下,但模型目前处理不了。
  • 换镜头或平移运镜时,角色一致性还有局限,官方称在改进中。
顺带一提:水印与内容溯源
两款模型都基于谷歌的基础设施,输出会带 SynthID 水印,可以通过 Gemini App、Chrome 里的 Gemini 或 Search 来核验内容是否为 AI 生成。这属于官方的溯源机制,和上面的能力限制是两回事。
8价格账

新价格和同类比,差在哪

用具体数字收尾。Nano Banana 2 Lite 的落点是「系列里最快最便宜」,Omni Flash 的落点是「和 Veo 3.1 Fast 同价」,这两条是这次发布最硬的价格信号。

4秒
Nano Banana 2 Lite 文生图耗时
$0.034
Nano Banana 2 Lite 每千张图成本
$0.10/秒
Omni Flash 视频输出定价
10秒
Omni Flash 当前单次视频时长上限

视频每秒定价:Omni Flash 与 Veo 3.1 Fast 持平

Gemini Omni Flash$0.10/秒
Veo 3.1 Fast$0.10/秒

换句话说,谷歌把这个首次开放的视频模型,直接定在了和现有 Veo 3.1 Fast 相同的每秒价位上。生图侧,Nano Banana 2 Lite 则是官方明确点名、建议初代 Nano Banana 用户直接替换的最快最便宜档位。

It's our recommended replacement for developers currently using our first version of Nano Banana, you can swap it out now for immediate benefits across key performance dimensions. 谷歌官方博客,2026-06-30
来源:谷歌官方博客《Start building with Nano Banana 2 Lite and Gemini Omni Flash》,作者 Alisa Fortin,发布于2026年6月30日。本文为该篇官方发布内容的可视化中文解读,文中延迟、价格、能力表述及跑分图均为谷歌官方口径与自评数据。图片、视频素材版权归谷歌所有。