Ether.fi Card

Codex /goal 是什麼?OpenAI 開發者分享 7 個高效使用 Goal Mode 的關鍵方法

OpenAI Codex 推出的 goal mode,也就是 /goal 模式,目的是讓 Codex 能夠朝一個明確、具體的成果持續執行任務。使用者設定目標後,Codex 會根據該目標反覆工作,直到判斷任務已經完成。

根據 OpenAI 開發者關係成員 Dominik Kundel 的說法,/goal 可以支援長時間任務執行。有使用者已讓 Codex 針對同一個目標連續工作超過 120 小時。這也代表,/goal 模式適合用於需要多輪迭代、持續測試與工程優化的任務,例如效能調校、架構重構、測試覆蓋率提升、UI 還原與部署流程優化。

原文作者:Dominik Kundel|編譯:Grenade

以下整理 Dominik Kundel 提出的 7 個使用重點。

1. 設定清楚、可驗證的完成標準

啟動 goal mode 時,輸入的提示詞會成為 Codex 的初始指令,也會成為判斷任務是否完成的退出標準。Codex 在每一輪工作後,都會根據這個目標檢查目前是否已經達成結果。

因此,目標提示詞不需要寫得冗長,重點在於明確定義「什麼狀態代表完成」。

較好的目標通常包含可衡量的數字,例如:

  • 「將 build 與 deployment 時間降低 30%。」
  • 「將這項功能從 TypeScript 遷移到 Rust,並達到 100% 測試一致性。」
  • 「優化應用程式架構,讓正式環境的 LCP 低於 2.5 秒。」

目標並非每次都必須包含數字,但明確數字通常有助於 Codex 判斷進度與完成狀態。

若使用者還不確定該如何定義目標,可以先與 Codex 進行一般討論,等方向清楚後,再讓 Codex 根據前面的對話內容建立 /goal。使用者也可以隨時調整目標:在 Codex 應用程式中點擊編輯,或在 CLI 中再次輸入 /goal

2. 盡可能提供執行方向

像「將 build 與 deployment 時間降低 30%」這類目標,可能讓 Codex 探索出意想不到的解法。但若使用者已經大致知道問題來源,應該直接提供方向。

例如可以告訴 Codex:

  • 可以從哪個模組開始檢查。
  • 可以使用哪些工具。
  • 哪些做法可接受。
  • 哪些限制必須遵守。
  • 哪些區域可能是效能瓶頸。

Dominik Kundel 提到,有同事曾告訴 Codex 可以透過 Chrome 進入 Google Colab,也說明在訓練模型時,可以讓 Codex 自行產生資料集。這類具體指示能讓 Codex 更快進入有效工作狀態。

另一種可行方法是,先讓 Codex 使用 plan mode 進行初步研究,建立一份計畫文件,再讓 /goal 模式引用這份計畫執行後續任務。

3. 讓進度能被衡量

當目標較大,或 Codex 可能透過多種路徑逐步接近結果時,就需要建立可衡量進度的工具或指標。

有些任務本身就容易量化,例如:

  • 降低 build 時間。
  • 提升測試覆蓋率。
  • 降低延遲。
  • 改善效能指標。
  • 提升測試通過率。

這類任務通常可以直接透過既有工具觀察進展。

Hj Esa8aakvf
螢幕截圖 Codex 生成,用於直觀地比較兩幀畫面

但部分任務需要額外建立評估方式。舉例來說,如果要讓 Codex 根據影片還原一個 UI 元件,Codex 可能需要建立截圖差異比對工具,用於判斷畫面是否越來越接近目標。Dominik Kundel 表示,他曾讓 Codex 自行建立這類工具,並持續迭代不同的視覺差異比對方法。

同時,也需要設計防呆檢查機制。否則 Codex 可能用錯誤方式達成表面目標。例如:

  • 為了像素級還原 UI,直接裁切參考圖片並嵌入頁面。
  • 為了讓測試通過率達到 100%,刪除或縮減測試範圍。

這些結果看似達標,實際上偏離真正的工程目標。

4. 建立接近真實情境的執行環境

若希望 Codex 真正取得有效成果,就需要讓它在足夠真實的環境中執行。

例如要優化部署時間或系統延遲,Codex 應能存取部署與測試環境,而且這些環境應盡量接近正式環境,包括:

  • 相同技術棧。
  • 相同設定。
  • 相近資料庫。
  • 相同或接近的建置流程。

可觀察的日誌與效能資料。

Dominik Kundel 提到,OpenAI 團隊曾讓 Codex 調試 developers.openai.com 的 build 與 deployment 時間。雖然 Codex 可以使用 preview deployment 與查看日誌,但預覽環境和正式環境存在差異,部分建置路徑在預覽環境中被關閉,因此最後仍需要將 Codex 的改動部署到更接近正式設定的環境,才能驗證實際效果。

同樣地,有些任務可能需要讓 Codex 使用 computer use 操作真實應用程式介面。有些 iOS 效能問題甚至需要實體裝置,才能得到較準確的測試結果。

5. 謹慎設定視覺目標

給 Codex 一個視覺目標,例如「根據這張圖片 100% 像素級還原 UI」,表面上很直覺,但在實務上容易造成問題。

若缺乏足夠限制與指引,Codex 可能會過度鑽研局部細節,反而忽略整體目標。例如參考圖片中有複雜圖形元素時,Codex 可能花大量時間嘗試精準重建素材,卻沒有正確處理整體 UI 架構。

此外,Codex 需要額外工具才能進行視覺比較,這會增加圖片輸入與 token 消耗,也未必能讓 Codex 判斷哪些改進最有價值。

因此,圖片較適合作為目標脈絡,而非唯一完成標準。較好的做法是搭配其他判斷依據,例如:

  • 功能是否完整。
  • 元件是否符合設計系統。
  • 互動行為是否正確。
  • 程式碼結構是否合理。
  • 畫面是否符合主要視覺方向。

6. 持續追蹤進展

當 Codex 可能連續工作數小時甚至數天,使用者很容易失去對任務進度的掌握。因此,Dominik Kundel 建議建立清楚的進度追蹤方式。

可行做法包括:

讓 Codex 在關鍵節點 commit,並推送到 draft PR。若網站專案有 preview deployment,這種方式尤其實用。

讓 Codex 更新一份可供團隊或管理層查看的交付文件。這份文件可以是 HTML 頁面、Markdown 文件、進度圖表,或部署到內部環境的進度頁面。

也可以在目標中要求 Codex 主動發布進度更新。例如在取得重要進展時,將更新發送到 Slack 頻道或其他紀錄位置。

若使用 CLI,也可以使用 /side 開啟側邊對話,快速詢問目前進度。這個側邊對話會從目前 thread 分支出來,因此具備截至當下的上下文。

7. 清理成果並進行最終審查

當 Codex 判斷目標完成後,仍應進行最終確認。

Dominik Kundel 建議,尤其是優化類任務,可以要求 Codex 回顧整個過程,說明:

  • 嘗試過哪些方法。
  • 哪些方法有效。
  • 哪些方法無效。
  • 目前成果如何達成目標。
  • 是否有殘留的暫時性改動。
  • 是否有需要清理的程式碼。

由於 Codex 會為了完成目標持續嘗試不同方法,過程中可能留下無效、重複或實驗性的程式碼。這些內容需要在最終交付前整理乾淨。

使用者也可以先透過 /review 進行本地程式碼審查,再要求 Codex 針對整體成果進行更深入的自我檢查。

結論:/goal 適合處理長時間、可衡量的工程任務

Codex /goal 模式的核心價值,在於讓 AI agent 能夠朝明確工程成果持續推進。它適合用於效能優化、部署流程改善、架構重構、測試補強、UI 還原與長時間除錯等任務。

不過,要讓 /goal 發揮效果,使用者需要提供清楚的目標、可衡量的完成標準、接近真實情境的執行環境,以及可追蹤的進度管理方式。對工程團隊而言,這代表 AI coding agent 的使用方式正從單次指令執行,逐步走向長週期、目標導向的協作模式。

OpenAI Codex 中文完整教學,費用如何計算?與 Claude Code 差在哪?


FAQ

1. Codex /goal 是什麼?

Codex /goal 是 goal mode 的指令形式,使用者可以設定一個明確目標,讓 Codex 持續工作並嘗試完成該目標。

2. /goal 適合哪些任務?

適合可衡量、需要多輪迭代的工程任務,例如降低 build 時間、優化部署流程、提升測試覆蓋率、調整效能指標、重構功能或還原 UI。

3. 使用 /goal 時,提示詞應該怎麼寫?

提示詞應明確說明完成標準,最好包含可驗證的數字或條件,例如「降低 30% build 時間」、「達到 100% 測試一致性」、「LCP 低於 2.5 秒」。

4. 為什麼需要提供真實環境?

因為許多工程問題只會在接近正式環境的條件下出現。若測試環境與正式環境差異太大,Codex 可能無法準確判斷問題來源或驗證結果。

5. /goal 完成後還需要人工審查嗎?

需要。Codex 在達成目標過程中可能嘗試多種方法,最後成果中可能保留無效或實驗性改動,因此仍應進行程式碼審查與成果清理。


延伸閱讀:

  • 260105 新首頁banner 02