【2025 最新】Gemini Veo3 實測教學:JSON 提示詞與影片生成步驟一次看懂

Gemini Veo3 以電影級畫質、真實光影與物理特效,顛覆了我們對 AI 影片生成的想像,也因此迅速成為創作者與開發者最想搶先體驗的生成工具。

250726 Veo3
Gemini Veo3 實測教學:JSON 提示詞與影片生成步驟一次看懂

近期在網路上爆紅的 IKEA 爆裂開箱影片,以家具自動組裝的動畫效果、流暢的動態設計,加上電影級的畫面質感,引發廣泛關注。隨著話題延燒,越來越多類似風格的影片接連出現,而這些作品,都是透過 Google 最新推出的 AI 影像生成模型 Gemini Veo3 所製作。

Gemini Veo3 是什麼?

Veo3 是 Google DeepMind 開發的最新 AI 影片生成模型,於 2025 年 Google I/O 發布。它支援文字到影片(Text-to-Video)和圖片到影片(Image-to-Video)生成,並能自動生成與畫面同步的音效、對話和背景音樂。相較於前一代 Veo2,Veo3 在畫質、物理真實性和提示詞遵循性上有顯著提升,且所有生成影片均帶有可見水印和隱形 SynthID 水印,以確保內容可追溯性。

Google 最新推出 Veo3 Fast 版本,整合進 Gemini API,支援文字或圖片輸入,一鍵生成具備動畫與音效的高品質影片。再搭配結構化的 JSON 提示詞,不但能精準控制畫面細節,也能大幅提升影音創作效率。

延伸閱讀:《 Google I/O 2025 重點整理:Gemini 升級、Imagen 4、Veo 3 全面整合 AI 創作與工作流程

為什麼 Gemini Veo3 要使用 JSON 提示詞?

JSON(JavaScript Object Notation)是一種結構化數據格式,適合用於定義複雜的影片生成需求。與純文字提示詞相比,JSON 提示詞的優勢包括:

  • 精確控制:JSON 允許指定場景、角色、動作、攝影機角度、音效和風格等細節,減少模型誤解。
  • 模組化設計:便於拆分多場景提示詞,適合生成連貫的多鏡頭影片。
  • 可重複性:結構化格式方便儲存、修改和重複使用提示詞,提高工作效率。
  • 與 API 整合:JSON 格式與 Gemini API 無縫銜接,適合開發者將生成流程自動化。

JSON 提示詞要怎麼寫?

撰寫 Gemini Veo 3 的 JSON 提示詞時,需清楚描述場景細節,並遵循 Veo 3 的提示設計原則。你可以把它想像成一份給 AI 導演的「拍攝清單」(Shot List),涵蓋畫面風格、鏡頭運動、光線、場景轉換與關鍵元素等,越具體越能生成理想畫面。

如果只是追求快速生成或偏好直覺式表達,也可使用簡化的純文字提示,參考 JSON 基本架構來撰寫。即使省略部分細節(例如音效),也不用擔心,AI 會根據整體情境自動補足並生成合適的效果。

以下是基本架構參考:

欄位名稱定義說明
1. description整體場景的自然語言敘述,描述「這是什麼場面、發生什麼事」,如一段鏡頭的旁白。
2. style畫面風格屬性,如 photorealistic、cyberpunk、cartoon、vaporwave、cinematic 等。
3. camera鏡頭的型態與視角,如 wide angle、first-person、orbit、symmetrical 等。
4. lighting光源與氣氛設計,描述光線方向、顏色、質感(如 neon, soft daylight, rim light)。
5. room場景空間的簡要說明,例如「Shiba-themed crypto cave」、「minimalist doge hacker den」等。
6. elements畫面中具體出現的物件、道具、角色等,盡量具體生動、包含材質與風格。
7. motion描述畫面中是否有動態元素,如粒子、漂浮、旋轉、爆開等。
8. audio背景音樂、環境音效、物件互動聲或角色對話的描述。
9. framing(攝影機設置)描述畫面比例(如 16:9)、攝影角度(如俯視、仰角)、是否為一鏡到底等設計。
10. ending畫面最後停留的狀態與主體,例如「Shiba logo glowing in center, surrounded by coins」。
11. text是否包含文字,如字幕、標語、浮現文字或提示詞。若沒有請寫 “none”。
12. keywords作為快速理解畫面主題的關鍵字,有助於 AI 辨識內容主軸(可視為 hash tag 組合)。

Gemini Veo3 影片生成操作教學

截圖 2025 07 26 17.23.21
Gemini Veo3 影片生成實測

01. 使用 ChatGPT 來協助撰寫 JSON 提示詞

如果不知道如何撰寫 Gemini Veo 3 的 JSON 提示詞時,可以參考上述的提示詞架構,或透過 X(原 Twitter)上網友們分享的範例,套用你想要的主題與特效進行修改與延伸

以「台灣感性」為主題時,ChatGPT 提示詞可以這樣撰寫:

(貼上提示詞架構或 JSON 範例),根據以上架構 / 範例,更改為台灣場景:開場設定在空無一人的山河空地中,一個油桶爆裂出台北城市 101、台灣機車、7-Eleven、台灣經典紅綠燈等在地元素,營造出台灣獨有的城市氛圍

可以再根據 GPT 生成的提示詞再進行元素的微調。

不過實測多次後發現,Veo 3 目前對台灣文化、場景的理解相對有限。如果希望更準確呈現「台灣感」,建議在提示詞中具體描述標誌性地標(如 Taipei 101),以增加辨識度與生成準確性。

02:登入 google 帳號,進入 Gemini

03:在對話筐,點擊「影片」,貼上撰寫完成的 JSON 提示詞送出

04:等待 1-2 分鐘,影片生成就完成

Gemini Veo3 影片生成是免費的嗎?

Gemini Veo3 影片生成並非免費,需訂閱付費方案。入門的「Pro」方案每日約可生成 3 次(額度會動態調整)。若有更高的生成需求,目前需升級至「Ultra」高階方案,Google AI Ultra 的訂閱費用為每月 NT$8,150,前 3 個月優惠價為每月 NT$4,050,訂閱費用對一般用戶來說相對門檻較高。

截圖 2025 07 26 17.25.12
Google – Gemini 官方訂閱費用

Gemini Veo3 生成案例與提示詞參考

IKEA 開箱

IP 開箱

特斯拉開箱

LOGO 轉場

Apple Watch 廣告

啤酒廣告

延伸閱讀:【2025 教學】ChatGPT 生圖全攻略:完整提示詞應用技巧

加密貨幣屬於高風險投資,本網站內容均不構成任何投資建議與責任。

掌握虛擬貨幣、區塊鏈大小事