Gemini Veo3 以電影級畫質、真實光影與物理特效,顛覆了我們對 AI 影片生成的想像,也因此迅速成為創作者與開發者最想搶先體驗的生成工具。

近期在網路上爆紅的 IKEA 爆裂開箱影片,以家具自動組裝的動畫效果、流暢的動態設計,加上電影級的畫面質感,引發廣泛關注。隨著話題延燒,越來越多類似風格的影片接連出現,而這些作品,都是透過 Google 最新推出的 AI 影像生成模型 Gemini Veo3 所製作。
Gemini Veo3 是什麼?
Veo3 是 Google DeepMind 開發的最新 AI 影片生成模型,於 2025 年 Google I/O 發布。它支援文字到影片(Text-to-Video)和圖片到影片(Image-to-Video)生成,並能自動生成與畫面同步的音效、對話和背景音樂。相較於前一代 Veo2,Veo3 在畫質、物理真實性和提示詞遵循性上有顯著提升,且所有生成影片均帶有可見水印和隱形 SynthID 水印,以確保內容可追溯性。
Google 最新推出 Veo3 Fast 版本,整合進 Gemini API,支援文字或圖片輸入,一鍵生成具備動畫與音效的高品質影片。再搭配結構化的 JSON 提示詞,不但能精準控制畫面細節,也能大幅提升影音創作效率。
延伸閱讀:《 Google I/O 2025 重點整理:Gemini 升級、Imagen 4、Veo 3 全面整合 AI 創作與工作流程 》
為什麼 Gemini Veo3 要使用 JSON 提示詞?
JSON(JavaScript Object Notation)是一種結構化數據格式,適合用於定義複雜的影片生成需求。與純文字提示詞相比,JSON 提示詞的優勢包括:
- 精確控制:JSON 允許指定場景、角色、動作、攝影機角度、音效和風格等細節,減少模型誤解。
- 模組化設計:便於拆分多場景提示詞,適合生成連貫的多鏡頭影片。
- 可重複性:結構化格式方便儲存、修改和重複使用提示詞,提高工作效率。
- 與 API 整合:JSON 格式與 Gemini API 無縫銜接,適合開發者將生成流程自動化。
JSON 提示詞要怎麼寫?
撰寫 Gemini Veo 3 的 JSON 提示詞時,需清楚描述場景細節,並遵循 Veo 3 的提示設計原則。你可以把它想像成一份給 AI 導演的「拍攝清單」(Shot List),涵蓋畫面風格、鏡頭運動、光線、場景轉換與關鍵元素等,越具體越能生成理想畫面。
如果只是追求快速生成或偏好直覺式表達,也可使用簡化的純文字提示,參考 JSON 基本架構來撰寫。即使省略部分細節(例如音效),也不用擔心,AI 會根據整體情境自動補足並生成合適的效果。
以下是基本架構參考:
欄位名稱 | 定義說明 |
1. description | 整體場景的自然語言敘述,描述「這是什麼場面、發生什麼事」,如一段鏡頭的旁白。 |
2. style | 畫面風格屬性,如 photorealistic、cyberpunk、cartoon、vaporwave、cinematic 等。 |
3. camera | 鏡頭的型態與視角,如 wide angle、first-person、orbit、symmetrical 等。 |
4. lighting | 光源與氣氛設計,描述光線方向、顏色、質感(如 neon, soft daylight, rim light)。 |
5. room | 場景空間的簡要說明,例如「Shiba-themed crypto cave」、「minimalist doge hacker den」等。 |
6. elements | 畫面中具體出現的物件、道具、角色等,盡量具體生動、包含材質與風格。 |
7. motion | 描述畫面中是否有動態元素,如粒子、漂浮、旋轉、爆開等。 |
8. audio | 背景音樂、環境音效、物件互動聲或角色對話的描述。 |
9. framing(攝影機設置) | 描述畫面比例(如 16:9)、攝影角度(如俯視、仰角)、是否為一鏡到底等設計。 |
10. ending | 畫面最後停留的狀態與主體,例如「Shiba logo glowing in center, surrounded by coins」。 |
11. text | 是否包含文字,如字幕、標語、浮現文字或提示詞。若沒有請寫 “none”。 |
12. keywords | 作為快速理解畫面主題的關鍵字,有助於 AI 辨識內容主軸(可視為 hash tag 組合)。 |
Gemini Veo3 影片生成操作教學

01. 使用 ChatGPT 來協助撰寫 JSON 提示詞
如果不知道如何撰寫 Gemini Veo 3 的 JSON 提示詞時,可以參考上述的提示詞架構,或透過 X(原 Twitter)上網友們分享的範例,套用你想要的主題與特效進行修改與延伸
以「台灣感性」為主題時,ChatGPT 提示詞可以這樣撰寫:
(貼上提示詞架構或 JSON 範例),根據以上架構 / 範例,更改為台灣場景:開場設定在空無一人的山河空地中,一個油桶爆裂出台北城市 101、台灣機車、7-Eleven、台灣經典紅綠燈等在地元素,營造出台灣獨有的城市氛圍
可以再根據 GPT 生成的提示詞再進行元素的微調。
不過實測多次後發現,Veo 3 目前對台灣文化、場景的理解相對有限。如果希望更準確呈現「台灣感」,建議在提示詞中具體描述標誌性地標(如 Taipei 101),以增加辨識度與生成準確性。
02:登入 google 帳號,進入 Gemini
03:在對話筐,點擊「影片」,貼上撰寫完成的 JSON 提示詞送出
04:等待 1-2 分鐘,影片生成就完成
Gemini Veo3 影片生成是免費的嗎?
Gemini Veo3 影片生成並非免費,需訂閱付費方案。入門的「Pro」方案每日約可生成 3 次(額度會動態調整)。若有更高的生成需求,目前需升級至「Ultra」高階方案,Google AI Ultra 的訂閱費用為每月 NT$8,150,前 3 個月優惠價為每月 NT$4,050,訂閱費用對一般用戶來說相對門檻較高。

Gemini Veo3 生成案例與提示詞參考
IKEA 開箱
IP 開箱
特斯拉開箱
LOGO 轉場
Apple Watch 廣告
啤酒廣告
延伸閱讀:【2025 教學】ChatGPT 生圖全攻略:完整提示詞應用技巧