プロダクト発表 · 小互解説

Google が Nano Banana 2 Lite と動画モデル Omni Flash を発表:画像生成 4 秒、シリーズ最速・最安

画像生成はわずか 4 秒、1,000 枚あたり約 $0.034。動画モデル Omni Flash も同日に初めて開発者へ開放。
一目で速読
  • Google が Nano Banana 2 Lite(モデルコード gemini-3.1-flash-lite-image)を発表。Nano Banana シリーズで現時点最速・最安の画像生成モデルで、1 枚 4 秒、1,000 枚あたり $0.034。
  • Google が初めて動画モデル Gemini Omni Flash(gemini-omni-flash-preview)を開発者へ開放。テキスト・画像・動画の混在入力による動画生成と対話型編集に対応し、価格は動画 1 秒あたり $0.10 で、Veo 3.1 Fast と同じ。
  • 2 つのモデルは連結できる。まず Nano Banana 2 Lite で画像を作り、それを Omni Flash に渡して動画化。Interactions API で会話の文脈を保持し、最大 3 回まで編集を重ねられる。
  • Nano Banana 2 Lite は AI Studio、Gemini API、Gemini Enterprise Agent Platform に加え、Search AI Mode、Gemini App、NotebookLM、Google Photos などの消費者向けプロダクトにも同時提供。
  • Omni Flash は現状 10 秒動画の生成のみ対応。音声リファレンスのアップロードやシーン拡張は未対応で、カット切り替え時のキャラクター一貫性もまだ不安定。
スタンスの注記:本記事の出典は Google 公式ブログで、ベンダー自身の発表内容です。文中の遅延・価格・能力の記述はいずれも公式見解、ベンチマーク図は Google の自己評価です。以下は公式の説明をそのまま記述しており、読者は AI Studio で自ら実測・照合できます。
1同日に 2 連発

Google は今回 2 つの新モデルを同時に投入

Google は 2026 年 6 月 30 日、開発者へ 2 つの新モデルを開放すると発表しました。画像生成モデル Nano Banana 2 Lite と、動画生成/編集モデル Gemini Omni Flash です。

片方は画像、片方は動画を担当。しかも公式はこの 2 つを、そのまま接続して使えるよう設計しています。静止画を生成したら動画モデルへ渡すだけで、動き出す。
なぜ注目に値するか:Gemini Omni Flash は Google の動画モデルが初めて API 経由で開発者へ開放されたもので、価格は動画 1 秒あたり $0.10、Veo 3.1 Fast と同水準。Nano Banana 2 Lite はテキストから画像生成がわずか 4 秒、1,000 枚あたり $0.034 で、現行 Nano Banana シリーズで最速・最安。公式は初代 Nano Banana からの直接乗り換えを推奨しています。
公式発表ページのヘッダー動画:2 つの生成メディアモデルの効果デモ。出典:Google 公式ブログ
2公式ベンチマーク

公式アニメ 1 枚で、「速さ」と「安さ」の差がわかる

公式が示したこのベンチマークアニメは、横軸に価格、縦軸に遅延を取り、Nano Banana 2 Lite の位置が左下に寄るほど速く・安いことを表します。

画像生成・編集:遅延と価格の比較アニメ
公式ベンチマークアニメ:画像生成・編集の「遅延」と「価格」2 軸での位置比較。出典:Google 公式ブログ
4 秒
テキストから画像生成の所要時間。公式はインタラクティブな試作や素早いラフに適すると説明
$0.034
1,000 枚あたりのコスト(公式の per 1K image 基準)

公式の補足:速度を売りにしつつも、Nano Banana 2 Lite はプロンプト追従、キャラクターの一貫性、画像内の文字の鮮明さといった項目で実用水準を維持しており、品質を削って速度を得ているわけではないとしています。

公式デモ:同じ「動物を数える」タスクで、Nano Banana 2 Lite と前世代 Nano Banana 2 の生成速度と画質を比較。出典:Google 公式ブログ
3ファミリーの区分

Nano Banana は今 4 段階、どれを使うべきか

今回の Lite を加えて、Nano Banana は全 4 段階。単なる上・中・下位モデルではなく、「速度・品質・制御性」のトレードオフで役割分担しています。各自の位置づけを押さえてから選びましょう。

段階モデルコード位置づけ
Nano Banana 2 LiteGemini 3.1 Flash Lite Image速度重視。ほぼリアルタイム・高スループットのバッチ用途に最適化し、遅延を最小まで圧縮
Nano Banana 2Gemini 3.1 Flash Image汎用の主力。より低い遅延で高品質を提供し、性能とコストのバランスが最良
Nano Banana ProGemini 3 Pro Image専門的・複雑な用途。制御力と推論が最強で、速度より正確さが重要な作業向き
Nano Banana(初代)Gemini 2.5 Flash Image公式が legacy と明記した旧版。Lite への移行で品質・速度・コストの 3 面が向上するため推奨
Nano Banana 2 Lite、Nano Banana 2、Nano Banana Pro の比較表
公式モデル比較表:Nano Banana 2 Lite、Nano Banana 2、Nano Banana Pro の能力区分。出典:Google 公式ブログ
公式の原文

Lite は機能を削った廉価版ではなく、初代 Nano Banana ユーザーへ向けた公式推奨の乗り換え先です。原文には「今すぐ乗り換えられ、主要な性能指標で即座に恩恵を得られる」と明記。つまり初代ユーザーの Lite へのアップグレードは、公式が推奨するデフォルトの動きということです。

4コア能力

動画モデルが初めて「対話しながら直せる」ように

Omni Flash は Google が I/O で披露していたモデルで、今回初めて API を通じて開発者の手に渡ります。Gemini のマルチモーダル理解と動画生成・編集を接続し、自然言語の指示を聞きながら動画を直せる。公式が挙げた 4 つの能力を、以下で 1 つずつ見ていきます。

今回の要点

従来は「動画を生成 + 後から修正」に、2 つのシステムを継ぎ合わせる必要がありました。Omni Flash は生成と対話型編集を同じモデルに収めます。一言で指示を出せば、生成済みの断片にそのまま手を入れてくれる。プロンプト全体を書き直す必要はありません。

公式デモ:Gemini Omni Flash の実際の動作:自然言語の指示による対話型の動画編集・生成。出典:Google 公式ブログ
conversational video editing|対話型動画編集

動画を生成した後、プロンプト全体を書き直さず、一言の自然言語指示で生成済みの断片をそのまま直せます。

たとえば「もう少し引きの画に」と言うだけで、その通りに直してくれる。要求を最初から全部言い直す必要はありません。
multimodal referencing|マルチモーダル参照

生成時に画像・テキスト・動画を同時にリファレンス素材として渡せます。キャラクターの見た目やシーンのディテールを全工程で一貫させられる。

人物画像 1 枚とテキスト説明を渡せば、生成する動画の中でも同じ顔・同じシーンをできるだけ維持します。
real-world knowledge|実世界の知識

Omni は Gemini が備える歴史・生物・物語論理などの知識を呼び出し、画面内容を妥当に、物語を筋の通ったものにします。

筋のある動画を生成する際、こうした常識を頼りにカットをより一貫して組み立て、画面の寄せ集めにしない。
text and action synchronization|文字と動作の同期

簡単なプロンプトで、文字や図形を動画内の動作のタイミングへ直接対応づけられます。

ある動作がどの文言に対応するか書いておけば、画面内の動作がその文言のリズムに合わせて動きます。
たとえるなら · 対話型編集

すでに映像を見た編集者と話すようなもの。一言言えばその通りに直してくれて、毎回要求を最初から説明し直す必要はありません。これが「対話型編集」と、従来の「直すたびにプロンプトを書き直す」との違いです。

動画編集のベンチマーク評価図
公式の動画編集ベンチマーク評価図(自己評価データ)。出典:Google 公式ブログ
5連結して使う

2 つのモデルをどうつなげるか

公式いわく、本当に便利なのは 2 つのモデルを 1 本のチェーンに連結する点です。まず Nano Banana 2 Lite で素早く画像を作り、その画像をリファレンスとして Omni Flash に渡して動かし、動画にする。さらに Interactions API で文脈を記憶させ、対話しながら続けて直していく。

Nano Banana 2 Lite4 秒で画像
リファレンス画像に次の工程へ渡す
Omni Flash動画を生成
Interactions API文脈を保持、最大 3 回の編集を重ねる

ここで鍵になるのが Interactions API のマルチターン会話文脈です。モデルは直前の数ターンでどの画像・どの動画を生成したかを覚えており、チャットのように一歩ずつ続けて直せる。最大 3 回まで重ねられ、毎ターン最初からプロンプトを書く必要はありません。

たとえるなら · マルチターン文脈

Photoshop のヒストリーに近い。「この画像にもう 1 つフィルターを」と言えば、モデルはさっきのあの 1 枚を指していると分かる。改めて指し直す必要はありません。3 回の編集とは、このヒストリーを最大で 3 歩前までさかのぼれるということです。

動画 静止画
1 枚の静止画がタイムラインに沿ってフレームごとに動画へ育つ。「画像 → 動画化」のチェーンに対応

公式がそのまま試せる 3 つの demo を用意

この 3 つの demo app はまさにこのチェーンの具体的な実装で、いずれも AI Studio 上で直接いじって使えます。

Anywhere:自撮りや写真を渡すと、まず Lite で数十のランドマークに「テレポート」。選んだ画像を Omni Flash でその場所のアニメーションに変える。出典:Google 公式ブログ
Space Lift:インテリアデザインの demo。部屋の写真から複数スタイルの内装コンセプトを自動生成し、選んだ 1 案を Omni がカメラワークとともに動的に見せる。出典:Google 公式ブログ
Omni product studio:Lite が生成した静止画を EC 展示動画に変換。画像への 1 回の操作で画像から動画への結果を得る。出典:Google 公式ブログ
6開発者にとっての意味

プロダクトを作る人にとって、これが何を意味するか

上記の能力を実務に落とすと、今回の発表は 3 種類の場面を実際にアンロックします。

1 つ、画像生成コストが 1,000 枚あたり約 $0.034、1 枚 4 秒まで圧縮。バッチ生成や素早い試行錯誤といったプロダクト試作を、より低い予算で回せる。試行錯誤の限界コストがぐっと下がります。

2 つ、動画生成と対話型編集が初めて API から直接開放。開発者はもう「生成モデル」と「編集ツール」の 2 つを自前で継ぎ合わせなくてよく、1 つの API で生成も修正もできます。

3 つ、画像から動画へのチェーン呼び出しが可能。まず画像、次に動画、さらに 3 回続けて修正。これが内装ビフォーアフター、ランドマーク散策、EC 展示動画といったインタラクティブなアプリを生み、公式の 3 つの demo がそのお手本です。

7現状の限界

今はまだできないこと

Omni Flash は現状パブリックプレビュー版で、公式自身がいくつか制約を挙げています。境界を知ってから手をつけ、能力への期待を上げすぎないように。

  • 1 回の動画生成の上限は 10 秒。より長い尺は近く対応予定と公式は説明。
  • Gemini API では、このモデルは音声リファレンスのアップロードもシーン拡張も現状未対応。
  • 3 秒以内の動画リファレンスは API の schema には収まるが、モデルは現状処理できない。
  • カット切り替えやパン系のカメラワークで、キャラクターの一貫性にまだ限界あり。公式は改善中とのこと。
ついでに:透かしとコンテンツの来歴
2 つのモデルはどちらも Google のインフラをベースとし、出力には SynthID 透かしが付きます。Gemini App、Chrome 上の Gemini、Search を通じて、内容が AI 生成かどうかを検証できる。これは公式の来歴確認の仕組みで、上記の能力制約とは別の話です。
8価格の勘定

新価格は同種と比べてどこが違うか

具体的な数字で締めます。Nano Banana 2 Lite の落としどころは「シリーズ最速・最安」、Omni Flash は「Veo 3.1 Fast と同価格」。この 2 点が今回の発表で最も硬い価格シグナルです。

4 秒
Nano Banana 2 Lite のテキストから画像生成の所要時間
$0.034
Nano Banana 2 Lite の 1,000 枚あたりコスト
$0.10/秒
Omni Flash の動画出力価格
10 秒
Omni Flash の現状 1 回あたり動画尺の上限

動画の秒単価:Omni Flash は Veo 3.1 Fast と同水準

Gemini Omni Flash$0.10/秒
Veo 3.1 Fast$0.10/秒

言い換えれば、Google はこの初開放の動画モデルを、既存の Veo 3.1 Fast と同じ秒単価にそのまま設定したということです。画像側では、Nano Banana 2 Lite が公式に名指しで、初代 Nano Banana ユーザーへ直接乗り換えを勧める最速・最安の段階になっています。

It's our recommended replacement for developers currently using our first version of Nano Banana, you can swap it out now for immediate benefits across key performance dimensions. Google 公式ブログ、2026-06-30
出典:Google 公式ブログ『Start building with Nano Banana 2 Lite and Gemini Omni Flash』、著者 Alisa Fortin、2026 年 6 月 30 日公開。本記事はこの公式発表内容のビジュアル日本語解説であり、文中の遅延・価格・能力の記述およびベンチマーク図はいずれも Google 公式の見解と自己評価データです。画像・動画素材の著作権は Google に帰属します。