AI Agent Workshop · 2026

Vol.01

Codex · Antigravity · Harness

從 Chat 到
Agentic Workflow

當 AI 不只回答問題，而是開始規劃、調用工具、產出成果並自主驗證，我們需要新的使用方法。

Codex / Antigravity 應用簡報·Duncan

AI Agent 的新工作方式

01 / 28

Overview

02 / 28

Today’s Route

這份簡報想分享的四件事

01 · Shift

從對話到工作流

先看 Chat 模式與 Agent 模式的差異：AI 不只是回答，而是開始承接流程。

02 · Workflow

建立使用觀點

用 Plan、Act、Produce、Verify 理解交辦與驗收，也補齊溝通與對齊的觀念。

03 · Harness

讓 Agent 不失控

把 Prompt、Context、Harness 分清楚，理解為什麼能力越強，越需要環境設計。

04 · Tools + Demo

工具與實機作業

最後介紹 Codex 與 Antigravity 的角色，並用實機展示規劃、執行與驗證。

先看架構，再進入細節

02 / 28

Opening Question

03 / 28

The Shift

AI 除了可以對話之外，
到底還能做些什麼？

也許真正的差異，是 AI 能不能把一段工作可靠地完成。

從問答走向工作系統

Act I

Act I · Mental Model

04 / 28

Before / After

Chat 模式 vs Agent 模式

LLM Chat

我問問題，AI 回答。

早期工作模式重視提示詞工程：指定角色、限定專業領域，讓 AI 在一問一答中給出更好的回答。

AI Agent

我交辦任務，AI 執行流程。

現在的 AI Agent 能規劃、讀檔、操作工具、寫入檔案、串接介面，也能導入 Skill / Plugin；關鍵是如何用它放大我們的能力。

不是介面差異，是責任邊界的差異

Chat → Agent

Act I · Workflow

05 / 28

Agentic Workflow

四個關鍵動作

從交辦到驗收

01

Plan

拆解任務、辨識風險、先列計畫。

02

Act

在授權範圍內調用工具與環境。

03

Produce

產出文件、資料、程式、網站或郵件。

04

Verify

測試、檢查、修正，回報可驗收結果。

沒有經過這些流程的自動化，就算能完成工作，也不一定能達到真正的目標。跟 AI 協作與跟人溝通沒兩樣，溝通能力仍是關鍵。

規劃、工具、產出、驗證

Workflow

Workflow Case

06 / 28

Office Work as Workflow

一個研討會的實作案例

因為它不僅僅只有開發，還有各種文件處理，包含資料確認、簡報、信件往來、網站製作與各項追蹤。

Context

Project + AGENTS.md

把活動背景、規則、檔案放進同一個工作範圍。

Repeat

Skills

把重複 SOP 包成可呼叫的能力，避免每次重講。

Tools

Plugins

連接 Gmail、PPT、PDF、Netlify、文件與表格。

Verify

Computer Use

像真人一樣操作網站表單，確認流程真的可用。

從研討會任務變成可執行流程

Case Study

Act I · Reframe

07 / 28

Reframe

AI Agent 不是更長的對話

它是一個更完整、更可追蹤的交辦作業鏈：背景放進專案，重複流程變成 Skill，工具透過 Plugin 擴充，結果由測試與審閱驗收。

從如何問，移到如何設計工作環境

07 / 28

Act II · Harness

08 / 28

Act II

讓 Agent
不要失控

讓 AI 自動作業，我們面對的就不只是答案或成果對不對，而是沒「對齊」可能造成可怕的後果。

Harness Engineering

Act II

Concept · Three Layers

09 / 28

Prompt · Context · Harness

三個元素，三種不同的問題

Prompt Engineering

怎麼說

除了原先的提示工程，更重要的是規劃概念與對齊。

Context Engineering

給它看什麼

給予正確的資料，提供完整的背景與緣由。

Harness Engineering

建什麼系統

讓模型能在真實環境裡安全、可控、可驗證地行動。

Prompt 沒有消失，它被納入更大的系統

09 / 28

Metaphor · Harness

10 / 28

Harness

不是把馬換掉，而是讓馬能被穩定駕馭。

模型提供能力；Harness 決定方向、速度、邊界，以及出問題時怎麼拉回來。

模型越強，越需要精準的控制系統

10 / 28

Framework · Guides x Sensors

11 / 28

Feedforward + Feedback

Guides x Sensors

Guide · Computational

先給確定規則

Type system、LSP、架構規則、結構限制。

Guide · Inferential

先給判斷方向

AGENTS.md、規劃、Skills、範例與工作準則。

Sensor · Computational

事後機械檢查

Lint、Test、CI、coverage、格式檢查。

Sensor · Inferential

事後語義審查

AI Code Review、Architecture Review、LLM-as-judge。

完整論述讓它知道方向，回饋修正讓它知道哪裡需導正

11 / 28

Failure Modes

12 / 28

Why Agents Drift

Agent 常見失控模式

01 · One-shotting

想一次做完，做到一半 context 爆掉，留下半成品。

02 · Premature Victory

看到部分進度就宣布完成，剩下功能沒有實作。

03 · No E2E Test

單元檢查或 curl 過了，不代表使用者流程真的可用。

04 · Environment Friction

每次啟動都花 token 找路，環境資訊沒有持久化。

這些常常不只是因為模型笨，而是環境沒有設計好

12 / 28

Method · Execution Discipline

13 / 28

Research · Plan · Implement · Verify

理解 → 規劃 → 執行 → 驗證

實際使用 Codex / Antigravity 時的基本節奏

01

理解

先讀資料、辨識目標、確認限制。

02

規劃

列步驟、列風險、必要時停下來確認。

03

執行

限定範圍動手，保留進度與決策線索。

04

驗證

用測試、截圖、檢查、review 收尾。

規劃與執行分離，是現場 demo 的評估標準

13 / 28

Harness · Five Dimensions

14 / 28

Checklist for Teams

五個 Harness 維度

Resource

資源管理

token、成本、熔斷機制。

State

狀態持久化

memory、進度檔、git log。

Context

資訊流控制

壓縮、分層、按需載入。

Safety

安全邊界

權限、approval、sandbox。

Orchestration

任務編排

multi-agent、reviewer、分工。

導入 AI Agent 時，可以用這五項做成熟度檢查

14 / 28

Industry Pattern

15 / 28

OpenAI · Anthropic · Google

不同產品，看到同一個方向的發展路線

OpenAI

Repo 是事實源

文件、架構、execution plan、linter、observability 都放進 Agent 能讀的環境。

Anthropic

長任務要接力

initializer、progress file、增量 coding agent，讓下一輪能恢復狀態。

GOOGLE

Agent 已經是系統主體

隔離 devbox、MCP 工具、內部系統上下文，支撐大規模 PR 流程。

共同點不是只換模型，而是重新設計環境

15 / 28

Counter-intuition

16 / 28

Paradox

模型越強， Harness 越重要。

能力更強，代表能做更多事；能做更多事，代表副作用的風險更大。

技術護城河不只在模型，而在環境

16 / 28

Act III · Tools

17 / 28

Act III

工具不是答案

工具只是新工作方式的入口。需先有觀點與理解，再看 Codex 與 Antigravity，才能真正的應用，同時這也將帶來產業劇變。

從概念回到操作

Act III

Tool Positioning

18 / 28

Which Agent for Which Job

不是哪個工具最強，而是不同的工具有不同角色

Planner

Antigravity

規劃感強，適合複雜任務先拆解、先確認、再分段執行。

Engineering Workbench

Codex

進 repo、CLI、IDE、GitHub、背景任務、review、sandbox。

Automation Factory

OpenClaw

自架 workflow、Telegram/LINE、Skill、多主機與本地模型。

Second Opinion

Claude 系工具

長文整理、方案對照、Code Review 與另一種判斷視角。

混合式 AI 團隊，工具的迭代變化太快

18 / 28

Codex · Workbench

19 / 28

Codex

工程化的 AI Agent 工作台

Codex 的重點不是多一個聊天視窗，而是直接進入真實工作環境。

Project

工作資料夾

讓 Agent 讀寫本地檔案，保存上下文與成果。

AGENTS.md

專案守則

把背景、規則、偏好、驗收條件寫成可讀文件。

Skills

可重複 SOP

需要時才載入，避免污染主要上下文。

Plugins

外部能力

Gmail、Netlify、簡報、文件、表格與更多服務。

Projects / AGENTS.md / Skills / Plugins

19 / 28

Antigravity · Planning

20 / 28

Antigravity

它像習慣先畫白板的人

看起來比較慢，但在複雜任務中，先規劃、先確認，反而能降低偏航與 token 浪費。

拆解

接到需求後先拆問題、列 task list。

Plan

確認

遇到不確定、成本、權限、價值判斷時停下來。

Align

執行

適合下載資料、讀論文、摘要、翻譯、文件建立與跨工具操作。

Act

規劃感是複雜任務的安全感

20 / 28

Hybrid AI Team

21 / 28

Operating Model

混合式 AI 團隊

Planning

Antigravity

高價值規劃、複雜判斷、先拆任務。

Engineering

Codex

repo、CI、CLI、review、程式與工作流。

Automation

OpenClaw

自動化、排程、Telegram、Skill。

Review

Claude

長文脈絡、第二意見、另一種解法。

Workers

Local Models

清洗、分類、翻譯、embedding、搬運。

我們的位置從逐字作業，移到定義方向與校正判斷

21 / 28

Codex · First Setup

22 / 28

Demo Prep

Codex 入門：Project / AGENTS.md / 權限

現場展示前置流程

01

建資料夾

把任務素材集中放置。

02

寫守則

建立 AGENTS.md。

03

選模型

依任務調整速度與推理強度。

04

設權限

確認、自動審核或完整存取。

05

先讀資料

要求它先理解，不急著改。

權限要配合任務風險，不是永遠開最大

22 / 28

Codex · Capabilities

23 / 28

From Tool to Workflow

Skills / Plugins / Automations

Skills

把 SOP 變成能力

專案層級或全域層級，需要時載入，節省上下文。

Plugins

接上真實工具

Gmail、Netlify、簡報、文件、表格與瀏覽器操作。

Automations

變成持續流程

定期檢查、更新、整理、提醒，讓任務自己回來。

這三個能力把 Codex 從 Chat 推向工作系統

23 / 28

Live Demo A · Codex

24 / 28

Live Demo

Codex 工作流

目標是讓成果可以被看到：先規劃，再動手，最後驗證。

Suggested Script

1. 開專案資料夾
2. 放入文件或表格
3. 要求先閱讀、先提出計畫
4. 確認後執行
5. 要求它驗證輸出並回報

不要直接叫它「幫我做完某件事」。先讓它說清楚要怎麼做。AI 夠不夠聰明也跟使用者有關。

Codex Demo Cue Card

24 / 28

Live Demo B · Antigravity

25 / 28

Live Demo

Antigravity 規劃與執行

展示它如何拆任務、問問題、設確認點，再進入執行。

Suggested Script

1. 給一個多步驟任務
2. 觀察它如何拆解
3. 保留確認節點
4. 分段執行
5. 對比 Codex 的工作台手感

這裡不要炫速度，要讓大家看見控管感。

Antigravity Demo Cue Card

25 / 28

Takeaway · Checklist

26 / 28

Use Tomorrow

一份 Agent 工作流檢查清單

01

目標是否清楚？輸出格式是否明確？

02

資料與上下文是否放在正確位置？

03

是否先要求計畫，而不是立刻執行？

04

工具權限是否符合任務風險？

05

是否有驗收條件與驗證方式？

06

重複流程是否應該變成 Skill？

07

長期任務是否需要 Automation？

08

結果是否需要第二個 Agent 或人類 review？

讓同仁帶走可立即套用的方法

26 / 28

Closing

27 / 28

Final Thought

我們不是只是在使用 AI，而是在管理一種新的工作型態。

AI Agent 的難點不是讓它更主動，而是當它越來越主動時，我們能讓它與目標、方法、邊界和價值判斷對齊。

Codex / Antigravity / Harness Engineering

27 / 28

Live Session

28 / 28

END

實機作業

接下來進入 Codex 與 Antigravity 的現場操作。

Codex / Antigravity Demo

END

從 Chat 到Agentic Workflow

這份簡報想分享的四件事

AI 除了可以對話之外，到底還能做些什麼？

Chat 模式 vs Agent 模式

四個關鍵動作

一個研討會的實作案例

AI Agent 不是更長的對話

讓 Agent不要失控

三個元素，三種不同的問題

Guides x Sensors

Agent 常見失控模式

理解 → 規劃 → 執行 → 驗證

五個 Harness 維度

不同產品，看到同一個方向的發展路線

工具不是答案

不是哪個工具最強，而是不同的工具有不同角色

工程化的 AI Agent 工作台

它像習慣先畫白板的人

混合式 AI 團隊

Codex 入門：Project / AGENTS.md / 權限

Skills / Plugins / Automations

Codex 工作流

Antigravity 規劃與執行

一份 Agent 工作流檢查清單

實機作業

從 Chat 到
Agentic Workflow

AI 除了可以對話之外，
到底還能做些什麼？

讓 Agent
不要失控