Ether.fi Card

Gemini Omni 中文教學 2026|Google AI 影片生成模型功能、使用步驟、與 Veo3 差異一次看懂

Gemini Omni

📌 重點整理

  • Gemini Omni 是 Google I/O 2026 發表的多模態影片生成模型,首發版本為 Gemini Omni Flash。
  • Gemini Omni 可以把圖片、影片、文字、聲音,甚至一張手繪草圖當成輸入,生成影片之後還能用自然語言一步步修改。
  • 台灣可以用:付費走 Gemini app 或 Google Flow(自 AI Plus 方案起,NT$260 / 月),免費路徑走 YouTube Shorts 與 YouTube Create。
  • 所有產出都會打上 SynthID 隱形浮水印與 C2PA 內容標記,方便辨識 AI 生成。
  • 目前以製作 10 秒短片為主,影片對影片編輯與多輪編輯已上線,虛擬化身、內建語音生成等新功能官方陸續開放。

Gemini Omni 是什麼,和過去的 AI 影片有什麼不同

Gemini Omni 是 Google 在 2026 年 I/O 大會推出的新一代生成模型,官方把首發版本命名為 Gemini Omni Flash。它最核心的賣點是「原生多模態」,也就是同一個模型可以同時吃進影片、圖片、文字、音訊與手繪草圖,再生成一段連貫的影片,而不是把好幾個工具串在一起硬接。

以下圖官方示範為例,第二個影片直接以全新的角度來呈現。

大cleanshot 2026 05 26 At 15.45.23@2x
圖:Google DeepMind 官方 Gemini Omni 示範

Google DeepMind 在介紹這個模型時用了一個很傳神的比喻,說它「就像 Nano Banana,但是給影片用的」。意思是過去大家在圖片編輯上習慣的那種「用講的就能改」,現在搬到了影片上。它和市面上那種把靜態照片加上一點運鏡、做成「會動的照片」最大的差別,在於 Gemini Omni 把 Gemini 本身對歷史、科學、文化的知識,跟對物理世界的理解結合在一起,讓生成的畫面更貼近真實邏輯。

想直接看實際效果,可以先看 Google 官方釋出的「Introducing Gemini Omni」示範影片:

如果你已經在用 Gemini 的對話模型,可以把 Omni 想成同一個家族裡專門負責影片的成員,運作邏輯和 Gemini 3 Pro 完整教學 介紹過的那套多模態理解一脈相承,只是輸出從文字換成了影片。


Gemini Omni 有哪些核心功能

Gemini Omni 的功能可以拆成三個層次來理解,分別是對話式剪輯、物理理解,以及多模態知識接地。

用對話一步步把影片改到滿意

這是 Omni 最有感的改變。過去用 AI 生影片,prompt 寫完按下生成,結果不滿意就得整段重來,運氣成分很重。Omni 改成多輪對話,每一次指令都建立在上一步的結果之上,官方的說法是「每一次編輯都會延續前一次,維持一致、連貫的場景」。換句話說,你可以先生出一段畫面,再說「把吉他換成黑色電吉他」「加上舞台燈光」,模型會在原本的影片上接著改,角色和場景的一致性會被保留下來。

對物理現象的直覺理解

Google 特別強調 Omni 內建了對「重力、動能、流體力學」的直覺理解,這讓畫面中的運動更接近真實世界。比方說水流、物體墜落、光影反射,這些過去 AI 影片最容易穿幫的地方,是這一代主打改善的重點。

Gemini Omni 官方示範:模擬流體與重力等物理現象
圖:Google DeepMind 官方 Gemini Omni 示範

多模態輸入與知識接地

Omni 接受的輸入相當多元,官方列出的包括影片、圖片、文字、音訊,以及手繪草圖。輸出以影片為主,並已內建語音生成;官方表示獨立的圖片與音訊輸出會在日後支援。根據官方說明,它支援的編輯任務大致涵蓋以下幾類:

編輯類型可以做什麼
風格轉換把實拍影片換成漫畫、動畫等不同美術風格
動作改變調整畫面中人物或物件的動作
角色與物件替換把畫面裡的某個物件或角色換成另一個
場景搬移把同一個主體放到不同的環境背景
動作轉移參考另一段影片的動作,套到目前的畫面上
草圖轉影片把一張手繪草圖變成動態影片
文字與畫面同步讓字幕或文字和畫面動作對上

Gemini Omni 怎麼用,台灣三種管道一次看

好消息是台灣的使用者可以正常使用 Gemini Omni。要注意的是,目前官方規定須年滿 18 歲才能使用影片功能。下面整理三種管道。

付費管道一:Gemini app(電腦版最完整)

電腦版的操作流程,依照官方說明大致如下:

  • 在開啟 gemini 並登入帳號。
  • 在文字輸入框下方點選「新增檔案」圖示,接著按「Videos」。
  • 想省事的話可以先挑一個官方提供的範本,不挑也沒關係。
  • 在輸入框描述你想要的影片內容。
  • 需要的話上傳素材,官方規定單次最多上傳 1 部影片加上 5 張圖片。
  • 按下「提交」開始生成,生成通常需要幾分鐘。
Gemini Omni 影片生成畫面,選範本或描述影片
步驟 3:挑官方範本,或在「Describe your video」直接描述想生成的影片

付費管道二:Google Flow(進階創作)

如果你要把多個片段組成完整故事,Google Flow 是更專業的影視級創作環境。Gemini Omni Flash 已整合進 Flow,提供給 Google AI 訂閱用戶,Flow 本身可以免費試用,進階用量會吃方案附帶的 Flow Credits。操作流程大致如下:

  1. labs.google/fx/tools/flow,用你的 Google 帳號登入。
  2. 開一個新專案,進入 Flow 的創作畫布。
  3. 用 Gemini Omni:把文字、圖片、影片等素材混合當輸入,描述你想要的畫面。
  4. 用自然語言做逐步、迭代式的編輯,也能用專業控制項微調個別素材,或一次把改動批次套用到整個專案。
  5. 需要時叫出 Flow Agent(AI 創作助理),請它規劃分鏡、給劇情建議、一次產生多個變體,或批次套用修改。
  6. 想配樂可用 Flow Music,逐段編輯歌曲、改寫或翻譯歌詞,再搭配 Omni 做成音樂影片。

簡單說,Gemini app 適合單一片段「邊聊邊改」,Google Flow 則是把 Omni 放進完整的影視製作流程,適合做敘事、多片段、團隊協作的人。想把研究、筆記到影片產出串成一條工作流,可以搭配 NotebookLM 完整教學 一起用。

Cleanshot 2026 05 26 At 14.45.08@2x

以下為作者簡單測試影片,將多個圖片與影片進行結合,並自動生成的故事。

免費管道:YouTube Shorts 與 YouTube Create

不想付費訂閱的話,Gemini Omni 也免費開放在 YouTube Shorts 的 Remix 與 YouTube Create App(須年滿 18 歲),是門檻最低的入口。以 Shorts Remix 為例,僅有符合改編資格的 Short,可以加入你自己的提示詞和圖片」


Gemini Omni vs Veo3,差在哪該用哪一個

很多看過站上 Gemini Veo3 實測教學 的讀者會問,那 Omni 和 Veo 系列到底差在哪。官方的定位很清楚:Veo 是「專用」的影片生成模型,Gemini Omni 則是「多模態通用」模型,兩者目的不同。

比較項目Gemini OmniVeo 系列
定位多模態通用模型,影片是其中一種輸出專用影片生成模型
主要操作方式自然語言多輪對話、逐步改片以 prompt 或 JSON 提示詞為主的生成流程
輸入彈性影片、圖片、文字、音訊、草圖以文字與圖片提示為主
生態整合深度整合進 Gemini app 與 Flow偏向獨立的影片生成

簡單說,如果你想要的是「邊聊邊改、反覆微調」的編輯體驗,Omni 的對話式流程會更順手;如果你已經熟悉用結構化提示詞一次把影片生成到位,Veo 系列的 JSON 提示詞工作流仍然有它的價值。兩者不是誰取代誰,而是針對不同的創作習慣。


訂閱方案與成本,怎麼選最划算

Gemini Omni 的完整體驗綁在 Google AI 訂閱方案上。根據 Google 官方訂閱頁面 截至 2026 年 5 月顯示的台灣資訊,方案大致如下,實際價格與額度仍以官方當期公佈為準。

方案月費(官方頁顯示)影片生成Google Flow Credits
FreeNT$0基本功能有限額度
Google AI PlusNT$260含影片生成200 點
Google AI ProNT$650含影片生成1,000 點
Google AI UltraNT$3,300 或 NT$6,500含影片生成10,000 或 25,000 點

從官方資料看,影片生成功能自 Google AI Plus 方案起就包含在內。要不要往上加到 Pro 或 Ultra,關鍵在你的使用強度。據社群與媒體的實測回報,高密度的多輪對話編輯非常吃額度,有 Pro 方案的使用者反映,常常只做兩次比較深入的影片生成,就用掉了當天大部分的高速運算配額。如果你是重度創作者,配額會是比月費更實際的考量。

訂閱這類 AI 服務,要綁信用卡扣款,刷哪一張比較省、能不能用加密卡來付,其實差很多。這部分我們在 AI 訂閱用什麼信用卡刷最省 這篇有完整比較,從台灣信用卡到加密卡的回饋與外幣手續費都整理過,訂閱前可以先看一下怎麼搭配最划算。


Gemini Omni 的 prompt 範例指令(官方示範)

官方 prompt 指南發表公告 直接給了一批可以照抄的示範指令。原則是「一次只說要改哪裡」,模型會在原片上接著改。以下照官方示範分類整理,每組都附官方示範畫面,用繁中或直接複製灰色英文原句都行:

逐步迭代修改

  1. 把蝴蝶換成蜜蜂
    Change the butterfly to a bee.
  2. 再把蜜蜂變成一小群螢火蟲
    Change the bee into a small swarm of fireflies.
逐步迭代修改場景
官方示範:在同一個黏土動畫場景上逐步迭代修改

指定運鏡

  1. 把鏡頭換成從小提琴手的肩膀後方拍
    Change the camera angle to be over the violinist’s shoulder.
  2. 特寫他的鞋子,快速上搖到中景再拉廣
    Change the camera angle, a close-up on his shoes, quickly tilting up to medium shot, then widening.
運鏡特寫鞋子
官方示範:運鏡指令,特寫鞋子再快速上搖拉廣

改變動作、與音樂同步

  1. 公寓的燈光跟著音樂節拍一盞盞亮起
    The lights of the apartments start turning on in sync with the music.
公寓燈光隨音樂亮起
官方示範:公寓燈光跟著音樂節拍一盞盞亮起

只換指定元素、其餘場景不變

  1. 把船改成白色摺紙做的
    Change the ships to be made from white origami paper.
  2. 把太空人換成海葵
    Change the astronaut to a sea anemone.
  3. 把小船換成魟魚
    Change the small ships to stingrays.
太空場景換成白色摺紙
官方示範:把太空場景的元素換成白色摺紙,其餘不變

參考原片、加特效

  1. 其他都不變,在滑板周圍加上動態動畫特效
    Edit this keeping everything the same. Add animated motion effects coming out of the skateboard.
滑板加動態動畫特效
官方示範:在滑板周圍加上動態動畫特效

模擬物理與世界知識

  1. 把雕像變成泡泡做的
    Make the sculpture out of bubbles.
  2. 一顆彈珠在連鎖反應軌道上快速滾動,一鏡到底順順拍
    A marble rolling fast on a chain reaction style track, continuous smooth shot.

用分鏡腳本生成整段

  1. 照這個故事生成,從左上開始依序,整段 10 秒,電影感
    Show me in this story. Follow the story exactly in order starting top left. Entire story in 10 seconds. Cinematic

套用新風格(動作保留)

  1. 把蛋白質摺疊做成黏土定格動畫解說,全部用黏土、無人手、定格、講求精準
    claymation explainer of protein folding, everything is made out of clay, no hands, stop motion, accurate
黏土動畫風格示範
官方示範:把影片套上黏土動畫等風格,動作邏輯會保留

實測上 Omni 在連續動作偶爾會「跳」、繁體中文語音也還不夠自然,建議以短片段、逐步修為主。想多練「用自然語言驅動生成」的手感,可參考站上的 Gemini Canvas 實作教學


常見問題

Gemini Omni 是免費的嗎

部分免費。完整的 Gemini app 與 Google Flow 體驗綁在 Google AI 付費方案上,從 AI Plus 起才包含影片生成。不過 Google 也在 YouTube Shorts 的 Remix 與 YouTube Create App 提供免費入口,想免費試玩可以從這裡開始,同樣須年滿 18 歲。

Gemini Omni 台灣可以用嗎

可以。唯一硬性條件是須年滿 18 歲。

Gemini Omni 可以生成多長的影片

依 Google 台灣官方頁面,Gemini Omni Flash 目前以製作 10 秒影片為主。需要更長的內容,可以在 Google Flow 把多個片段組合成完整故事。實際額度仍依你的方案配額為準,建議以短片段、多輪修正的方式使用。

Gemini Omni 和 Veo3 哪個比較好

看用途。Gemini Omni 是多模態通用模型,主打自然語言多輪對話式改片;Veo 系列是專用影片生成模型,偏向以提示詞一次生成。想要邊聊邊改的編輯體驗選 Omni,已經熟悉結構化提示詞流程的人,Veo 系列仍然好用,兩者定位不同。

Gemini Omni 生成的影片會有浮水印嗎

會。根據官方說明,Gemini Omni 產出的影片都會嵌入 SynthID 隱形浮水印,並附上 C2PA 內容標記,用來辨識內容由 AI 生成。這是一種內容來源透明化的機制,肉眼通常看不出來。

  • 260105 新首頁banner 02