Google が Nano Banana 2 Lite と動画モデル Omni Flash を発表:画像生成 4 秒、シリーズ最速・最安
- Google が Nano Banana 2 Lite(モデルコード gemini-3.1-flash-lite-image)を発表。Nano Banana シリーズで現時点最速・最安の画像生成モデルで、1 枚 4 秒、1,000 枚あたり $0.034。
- Google が初めて動画モデル Gemini Omni Flash(gemini-omni-flash-preview)を開発者へ開放。テキスト・画像・動画の混在入力による動画生成と対話型編集に対応し、価格は動画 1 秒あたり $0.10 で、Veo 3.1 Fast と同じ。
- 2 つのモデルは連結できる。まず Nano Banana 2 Lite で画像を作り、それを Omni Flash に渡して動画化。Interactions API で会話の文脈を保持し、最大 3 回まで編集を重ねられる。
- Nano Banana 2 Lite は AI Studio、Gemini API、Gemini Enterprise Agent Platform に加え、Search AI Mode、Gemini App、NotebookLM、Google Photos などの消費者向けプロダクトにも同時提供。
- Omni Flash は現状 10 秒動画の生成のみ対応。音声リファレンスのアップロードやシーン拡張は未対応で、カット切り替え時のキャラクター一貫性もまだ不安定。
Google は今回 2 つの新モデルを同時に投入
Google は 2026 年 6 月 30 日、開発者へ 2 つの新モデルを開放すると発表しました。画像生成モデル Nano Banana 2 Lite と、動画生成/編集モデル Gemini Omni Flash です。
公式アニメ 1 枚で、「速さ」と「安さ」の差がわかる
公式が示したこのベンチマークアニメは、横軸に価格、縦軸に遅延を取り、Nano Banana 2 Lite の位置が左下に寄るほど速く・安いことを表します。
公式の補足:速度を売りにしつつも、Nano Banana 2 Lite はプロンプト追従、キャラクターの一貫性、画像内の文字の鮮明さといった項目で実用水準を維持しており、品質を削って速度を得ているわけではないとしています。
Nano Banana は今 4 段階、どれを使うべきか
今回の Lite を加えて、Nano Banana は全 4 段階。単なる上・中・下位モデルではなく、「速度・品質・制御性」のトレードオフで役割分担しています。各自の位置づけを押さえてから選びましょう。
| 段階 | モデルコード | 位置づけ |
|---|---|---|
| Nano Banana 2 Lite | Gemini 3.1 Flash Lite Image | 速度重視。ほぼリアルタイム・高スループットのバッチ用途に最適化し、遅延を最小まで圧縮 |
| Nano Banana 2 | Gemini 3.1 Flash Image | 汎用の主力。より低い遅延で高品質を提供し、性能とコストのバランスが最良 |
| Nano Banana Pro | Gemini 3 Pro Image | 専門的・複雑な用途。制御力と推論が最強で、速度より正確さが重要な作業向き |
| Nano Banana(初代) | Gemini 2.5 Flash Image | 公式が legacy と明記した旧版。Lite への移行で品質・速度・コストの 3 面が向上するため推奨 |
Lite は機能を削った廉価版ではなく、初代 Nano Banana ユーザーへ向けた公式推奨の乗り換え先です。原文には「今すぐ乗り換えられ、主要な性能指標で即座に恩恵を得られる」と明記。つまり初代ユーザーの Lite へのアップグレードは、公式が推奨するデフォルトの動きということです。
動画モデルが初めて「対話しながら直せる」ように
Omni Flash は Google が I/O で披露していたモデルで、今回初めて API を通じて開発者の手に渡ります。Gemini のマルチモーダル理解と動画生成・編集を接続し、自然言語の指示を聞きながら動画を直せる。公式が挙げた 4 つの能力を、以下で 1 つずつ見ていきます。
従来は「動画を生成 + 後から修正」に、2 つのシステムを継ぎ合わせる必要がありました。Omni Flash は生成と対話型編集を同じモデルに収めます。一言で指示を出せば、生成済みの断片にそのまま手を入れてくれる。プロンプト全体を書き直す必要はありません。
動画を生成した後、プロンプト全体を書き直さず、一言の自然言語指示で生成済みの断片をそのまま直せます。
生成時に画像・テキスト・動画を同時にリファレンス素材として渡せます。キャラクターの見た目やシーンのディテールを全工程で一貫させられる。
Omni は Gemini が備える歴史・生物・物語論理などの知識を呼び出し、画面内容を妥当に、物語を筋の通ったものにします。
簡単なプロンプトで、文字や図形を動画内の動作のタイミングへ直接対応づけられます。
すでに映像を見た編集者と話すようなもの。一言言えばその通りに直してくれて、毎回要求を最初から説明し直す必要はありません。これが「対話型編集」と、従来の「直すたびにプロンプトを書き直す」との違いです。
2 つのモデルをどうつなげるか
公式いわく、本当に便利なのは 2 つのモデルを 1 本のチェーンに連結する点です。まず Nano Banana 2 Lite で素早く画像を作り、その画像をリファレンスとして Omni Flash に渡して動かし、動画にする。さらに Interactions API で文脈を記憶させ、対話しながら続けて直していく。
ここで鍵になるのが Interactions API のマルチターン会話文脈です。モデルは直前の数ターンでどの画像・どの動画を生成したかを覚えており、チャットのように一歩ずつ続けて直せる。最大 3 回まで重ねられ、毎ターン最初からプロンプトを書く必要はありません。
Photoshop のヒストリーに近い。「この画像にもう 1 つフィルターを」と言えば、モデルはさっきのあの 1 枚を指していると分かる。改めて指し直す必要はありません。3 回の編集とは、このヒストリーを最大で 3 歩前までさかのぼれるということです。
公式がそのまま試せる 3 つの demo を用意
この 3 つの demo app はまさにこのチェーンの具体的な実装で、いずれも AI Studio 上で直接いじって使えます。
プロダクトを作る人にとって、これが何を意味するか
上記の能力を実務に落とすと、今回の発表は 3 種類の場面を実際にアンロックします。
1 つ、画像生成コストが 1,000 枚あたり約 $0.034、1 枚 4 秒まで圧縮。バッチ生成や素早い試行錯誤といったプロダクト試作を、より低い予算で回せる。試行錯誤の限界コストがぐっと下がります。
2 つ、動画生成と対話型編集が初めて API から直接開放。開発者はもう「生成モデル」と「編集ツール」の 2 つを自前で継ぎ合わせなくてよく、1 つの API で生成も修正もできます。
3 つ、画像から動画へのチェーン呼び出しが可能。まず画像、次に動画、さらに 3 回続けて修正。これが内装ビフォーアフター、ランドマーク散策、EC 展示動画といったインタラクティブなアプリを生み、公式の 3 つの demo がそのお手本です。
今はまだできないこと
Omni Flash は現状パブリックプレビュー版で、公式自身がいくつか制約を挙げています。境界を知ってから手をつけ、能力への期待を上げすぎないように。
- 1 回の動画生成の上限は 10 秒。より長い尺は近く対応予定と公式は説明。
- Gemini API では、このモデルは音声リファレンスのアップロードもシーン拡張も現状未対応。
- 3 秒以内の動画リファレンスは API の schema には収まるが、モデルは現状処理できない。
- カット切り替えやパン系のカメラワークで、キャラクターの一貫性にまだ限界あり。公式は改善中とのこと。
ついでに:透かしとコンテンツの来歴
新価格は同種と比べてどこが違うか
具体的な数字で締めます。Nano Banana 2 Lite の落としどころは「シリーズ最速・最安」、Omni Flash は「Veo 3.1 Fast と同価格」。この 2 点が今回の発表で最も硬い価格シグナルです。
動画の秒単価:Omni Flash は Veo 3.1 Fast と同水準
言い換えれば、Google はこの初開放の動画モデルを、既存の Veo 3.1 Fast と同じ秒単価にそのまま設定したということです。画像側では、Nano Banana 2 Lite が公式に名指しで、初代 Nano Banana ユーザーへ直接乗り換えを勧める最速・最安の段階になっています。
It's our recommended replacement for developers currently using our first version of Nano Banana, you can swap it out now for immediate benefits across key performance dimensions. Google 公式ブログ、2026-06-30