← → 翻页 · B 静态 · ESC 索引
AI Agent Workshop · 2026
Vol.01
Codex · Antigravity · Harness

從 Chat 到
Agentic Workflow

當 AI 不只回答問題,而是開始規劃、調用工具、產出成果並自主驗證,我們需要新的使用方法。

Codex / Antigravity 應用簡報·Duncan
AI Agent 的新工作方式
01 / 28
Overview
02 / 28
Today’s Route

這份簡報想分享的四件事

01 · Shift
從對話到工作流
先看 Chat 模式與 Agent 模式的差異:AI 不只是回答,而是開始承接流程。
02 · Workflow
建立使用觀點
用 Plan、Act、Produce、Verify 理解交辦與驗收,也補齊溝通與對齊的觀念。
03 · Harness
讓 Agent 不失控
把 Prompt、Context、Harness 分清楚,理解為什麼能力越強,越需要環境設計。
04 · Tools + Demo
工具與實機作業
最後介紹 Codex 與 Antigravity 的角色,並用實機展示規劃、執行與驗證。
先看架構,再進入細節
02 / 28
Opening Question
03 / 28
The Shift

AI 除了可以對話之外,
到底還能做些什麼?

也許真正的差異,是 AI 能不能把一段工作可靠地完成。

從問答走向工作系統
Act I
Act I · Mental Model
04 / 28
Before / After

Chat 模式 vs Agent 模式

LLM Chat
我問問題,AI 回答。
早期工作模式重視提示詞工程:指定角色、限定專業領域,讓 AI 在一問一答中給出更好的回答。
AI Agent
我交辦任務,AI 執行流程。
現在的 AI Agent 能規劃、讀檔、操作工具、寫入檔案、串接介面,也能導入 Skill / Plugin;關鍵是如何用它放大我們的能力。
不是介面差異,是責任邊界的差異
Chat → Agent
Act I · Workflow
05 / 28
Agentic Workflow

四個關鍵動作

從交辦到驗收
01
Plan
拆解任務、辨識風險、先列計畫。
02
Act
在授權範圍內調用工具與環境。
03
Produce
產出文件、資料、程式、網站或郵件。
04
Verify
測試、檢查、修正,回報可驗收結果。

沒有經過這些流程的自動化,就算能完成工作,也不一定能達到真正的目標。跟 AI 協作與跟人溝通沒兩樣,溝通能力仍是關鍵。

規劃、工具、產出、驗證
Workflow
Workflow Case
06 / 28
Office Work as Workflow

一個研討會的實作案例

因為它不僅僅只有開發,還有各種文件處理,包含資料確認、簡報、信件往來、網站製作與各項追蹤。

Context
Project + AGENTS.md
把活動背景、規則、檔案放進同一個工作範圍。
Repeat
Skills
把重複 SOP 包成可呼叫的能力,避免每次重講。
Tools
Plugins
連接 Gmail、PPT、PDF、Netlify、文件與表格。
Verify
Computer Use
像真人一樣操作網站表單,確認流程真的可用。
從研討會任務變成可執行流程
Case Study
Act I · Reframe
07 / 28
Reframe

AI Agent 不是更長的對話

它是一個更完整、更可追蹤的交辦作業鏈:背景放進專案,重複流程變成 Skill,工具透過 Plugin 擴充,結果由測試與審閱驗收。

從如何問,移到如何設計工作環境
07 / 28
Act II · Harness
08 / 28
Act II

讓 Agent
不要失控

讓 AI 自動作業,我們面對的就不只是答案或成果對不對,而是沒「對齊」可能造成可怕的後果。

Harness Engineering
Act II
Concept · Three Layers
09 / 28
Prompt · Context · Harness

三個元素,三種不同的問題

Prompt Engineering
怎麼說
除了原先的提示工程,更重要的是規劃概念與對齊。
Context Engineering
給它看什麼
給予正確的資料,提供完整的背景與緣由。
Harness Engineering
建什麼系統
讓模型能在真實環境裡安全、可控、可驗證地行動。
Prompt 沒有消失,它被納入更大的系統
09 / 28
Metaphor · Harness
10 / 28
Harness
不是把馬換掉, 而是讓馬能被穩定駕馭。

模型提供能力;Harness 決定方向、速度、邊界,以及出問題時怎麼拉回來。

模型越強,越需要精準的控制系統
10 / 28
Framework · Guides x Sensors
11 / 28
Feedforward + Feedback

Guides x Sensors

Guide · Computational
先給確定規則
Type system、LSP、架構規則、結構限制。
Guide · Inferential
先給判斷方向
AGENTS.md、規劃、Skills、範例與工作準則。
Sensor · Computational
事後機械檢查
Lint、Test、CI、coverage、格式檢查。
Sensor · Inferential
事後語義審查
AI Code Review、Architecture Review、LLM-as-judge。
完整論述讓它知道方向,回饋修正讓它知道哪裡需導正
11 / 28
Failure Modes
12 / 28
Why Agents Drift

Agent 常見失控模式

01 · One-shotting
想一次做完,做到一半 context 爆掉,留下半成品。
02 · Premature Victory
看到部分進度就宣布完成,剩下功能沒有實作。
03 · No E2E Test
單元檢查或 curl 過了,不代表使用者流程真的可用。
04 · Environment Friction
每次啟動都花 token 找路,環境資訊沒有持久化。
這些常常不只是因為模型笨,而是環境沒有設計好
12 / 28
Method · Execution Discipline
13 / 28
Research · Plan · Implement · Verify

理解 → 規劃 → 執行 → 驗證

實際使用 Codex / Antigravity 時的基本節奏
01
理解
先讀資料、辨識目標、確認限制。
02
規劃
列步驟、列風險、必要時停下來確認。
03
執行
限定範圍動手,保留進度與決策線索。
04
驗證
用測試、截圖、檢查、review 收尾。
規劃與執行分離,是現場 demo 的評估標準
13 / 28
Harness · Five Dimensions
14 / 28
Checklist for Teams

五個 Harness 維度

Resource
資源管理
token、成本、熔斷機制。
State
狀態持久化
memory、進度檔、git log。
Context
資訊流控制
壓縮、分層、按需載入。
Safety
安全邊界
權限、approval、sandbox。
Orchestration
任務編排
multi-agent、reviewer、分工。
導入 AI Agent 時,可以用這五項做成熟度檢查
14 / 28
Industry Pattern
15 / 28
OpenAI · Anthropic · Google

不同產品,看到同一個方向的發展路線

OpenAI
Repo 是事實源
文件、架構、execution plan、linter、observability 都放進 Agent 能讀的環境。
Anthropic
長任務要接力
initializer、progress file、增量 coding agent,讓下一輪能恢復狀態。
GOOGLE
Agent 已經是系統主體
隔離 devbox、MCP 工具、內部系統上下文,支撐大規模 PR 流程。
共同點不是只換模型,而是重新設計環境
15 / 28
Counter-intuition
16 / 28
Paradox
模型越強, Harness 越重要。

能力更強,代表能做更多事;能做更多事,代表副作用的風險更大。

技術護城河不只在模型,而在環境
16 / 28
Act III · Tools
17 / 28
Act III

工具不是答案

工具只是新工作方式的入口。需先有觀點與理解,再看 Codex 與 Antigravity,才能真正的應用,同時這也將帶來產業劇變。

從概念回到操作
Act III
Tool Positioning
18 / 28
Which Agent for Which Job

不是哪個工具最強,而是不同的工具有不同角色

Planner
Antigravity
規劃感強,適合複雜任務先拆解、先確認、再分段執行。
Engineering Workbench
Codex
進 repo、CLI、IDE、GitHub、背景任務、review、sandbox。
Automation Factory
OpenClaw
自架 workflow、Telegram/LINE、Skill、多主機與本地模型。
Second Opinion
Claude 系工具
長文整理、方案對照、Code Review 與另一種判斷視角。
混合式 AI 團隊,工具的迭代變化太快
18 / 28
Codex · Workbench
19 / 28
Codex

工程化的 AI Agent 工作台

Codex 的重點不是多一個聊天視窗,而是直接進入真實工作環境。

Project
工作資料夾
讓 Agent 讀寫本地檔案,保存上下文與成果。
AGENTS.md
專案守則
把背景、規則、偏好、驗收條件寫成可讀文件。
Skills
可重複 SOP
需要時才載入,避免污染主要上下文。
Plugins
外部能力
Gmail、Netlify、簡報、文件、表格與更多服務。
Projects / AGENTS.md / Skills / Plugins
19 / 28
Antigravity · Planning
20 / 28
Antigravity

它像習慣先畫白板的人

看起來比較慢,但在複雜任務中,先規劃、先確認,反而能降低偏航與 token 浪費。

拆解
接到需求後先拆問題、列 task list。
Plan
確認
遇到不確定、成本、權限、價值判斷時停下來。
Align
執行
適合下載資料、讀論文、摘要、翻譯、文件建立與跨工具操作。
Act
規劃感是複雜任務的安全感
20 / 28
Hybrid AI Team
21 / 28
Operating Model

混合式 AI 團隊

Planning
Antigravity
高價值規劃、複雜判斷、先拆任務。
Engineering
Codex
repo、CI、CLI、review、程式與工作流。
Automation
OpenClaw
自動化、排程、Telegram、Skill。
Review
Claude
長文脈絡、第二意見、另一種解法。
Workers
Local Models
清洗、分類、翻譯、embedding、搬運。
我們的位置從逐字作業,移到定義方向與校正判斷
21 / 28
Codex · First Setup
22 / 28
Demo Prep

Codex 入門:Project / AGENTS.md / 權限

現場展示前置流程
01
建資料夾
把任務素材集中放置。
02
寫守則
建立 AGENTS.md。
03
選模型
依任務調整速度與推理強度。
04
設權限
確認、自動審核或完整存取。
05
先讀資料
要求它先理解,不急著改。
權限要配合任務風險,不是永遠開最大
22 / 28
Codex · Capabilities
23 / 28
From Tool to Workflow

Skills / Plugins / Automations

Skills
把 SOP 變成能力
專案層級或全域層級,需要時載入,節省上下文。
Plugins
接上真實工具
Gmail、Netlify、簡報、文件、表格與瀏覽器操作。
Automations
變成持續流程
定期檢查、更新、整理、提醒,讓任務自己回來。
這三個能力把 Codex 從 Chat 推向工作系統
23 / 28
Live Demo A · Codex
24 / 28
Live Demo

Codex 工作流

目標是讓成果可以被看到:先規劃,再動手,最後驗證。

Suggested Script
1. 開專案資料夾
2. 放入文件或表格
3. 要求先閱讀、先提出計畫
4. 確認後執行
5. 要求它驗證輸出並回報
不要直接叫它「幫我做完某件事」。先讓它說清楚要怎麼做。AI 夠不夠聰明也跟使用者有關。
Codex Demo Cue Card
24 / 28
Live Demo B · Antigravity
25 / 28
Live Demo

Antigravity 規劃與執行

展示它如何拆任務、問問題、設確認點,再進入執行。

Suggested Script
1. 給一個多步驟任務
2. 觀察它如何拆解
3. 保留確認節點
4. 分段執行
5. 對比 Codex 的工作台手感
這裡不要炫速度,要讓大家看見控管感。
Antigravity Demo Cue Card
25 / 28
Takeaway · Checklist
26 / 28
Use Tomorrow

一份 Agent 工作流檢查清單

01
目標是否清楚?輸出格式是否明確?
02
資料與上下文是否放在正確位置?
03
是否先要求計畫,而不是立刻執行?
04
工具權限是否符合任務風險?
05
是否有驗收條件與驗證方式?
06
重複流程是否應該變成 Skill?
07
長期任務是否需要 Automation?
08
結果是否需要第二個 Agent 或人類 review?
讓同仁帶走可立即套用的方法
26 / 28
Closing
27 / 28
Final Thought
我們不是只是在使用 AI, 而是在管理一種新的工作型態。

AI Agent 的難點不是讓它更主動,而是當它越來越主動時,我們能讓它與目標、方法、邊界和價值判斷對齊。

Codex / Antigravity / Harness Engineering
27 / 28
Live Session
28 / 28
END

實機作業

接下來進入 Codex 與 Antigravity 的現場操作。

Codex / Antigravity Demo
END