從聊天到工作流
近半年,我花了不少時間,在不同的 AI Agent 工具裡反覆折騰。

一開始的念頭很單純,一方面是工作上的需求,另一方面我想知道,Agentic AI 這些被稱為下一代工作革命的東西,到底是真正能幫研發團隊分攤工作,還是另一波被媒體包裝得很漂亮的新玩具。

三年半以前,我主要透過 LLM 的 Chat,或是 GitHub Copilot 來協助開發。當時主要的 IDE是 VSCode,工作方式也很直覺:我問問題,AI 回答;我寫程式,用 tab 補全;遇到 bug,我將錯誤訊息輸入,由 AI 推測原因。那時候的 AI像顧問,或是一個很懂語法的自動完成器。它可以提高速度,但真正決定工作如何展開的人還是我自己。

後來開始使用 Cursor、Windsurf,情況就有些變化了。AI 不再只是回答問題,而是開始處理整個專案脈絡。它會讀檔案、理解 repo、跨檔案修改,也可以承接較完整的功能開發。這時明顯感覺到,提示工程正在變成另一種東西。過去我們在意的是 prompt 寫得好不好,現在更重要的是任務是否被拆解清楚、上下文是否乾淨、驗收條件是否明確。

而從 Antigravity 推出之後,我就改用 Antigravity 來開發。同時我也混用了 Codex、Claude Code、Claude Cowork 等 coding agent。到這個階段,我已經很難只用「哪個工具比較強」來形容它們。它們比較像不同性格、不同工作習慣的工程師。問題不只是能力,而是我們要把什麼工作交給誰,以及怎麼讓它照著我們的期待前進。

Antigravity 的規劃感
Antigravity 很像一位習慣先把白板規劃好的人。接到工作需求之後,它通常不會立刻動手,而是先拆解問題、安排步驟、建立 task list,然後才往下執行。很多時候,它會停下來,需要我確認下一步。剛開始我覺得這樣有點慢,因為使用工具時,總會希望它愈快愈好,最好一句話,就能讓 AI 將整件事完成。

但真正把複雜任務交給它之後,這種需要我確認的節奏反而重要。當任務不只是問答,而是包含下載資料、閱讀論文、整理摘要、翻譯、建立文件,甚至跨 browser 與 terminal 操作時,AI 若沒有節制地一路往前衝,其實很容易偏離原本的目標,重點是 token 的消耗都要錢。

最早我曾讓它處理十五篇專業論文的工作流程。從下載、抽取內容、摘要、翻譯,到最後輸出整理過的文件,那種感覺很奇妙。它不只是執行而已,它會規劃,而這個能力很重要。真正的大型任務,會失敗往往不是模型看不懂,而是作業流程在某個地方開始偏掉,接著 token、上下文、檔案與工具呼叫混在一起變得難以控管。

對齊不只是一個好 prompt
我現在喜歡用「對齊」來說明我使用 AI 開發的方式。這裡說的對齊,不只是把 prompt 寫得漂亮,而是讓 AI 知道任務的方向、邊界、格式、停止條件,以及什麼事情需要跟我確認。

以前談提示工程時,很多重點放在角色設定、語氣、範例與輸出格式。這些當然還是有用,但 Agent 能做的事情變多之後,溝通方式也必須跟著改變。我會更明確地告訴它:先讀資料,不急著改;先提出計畫,不急著執行;遇到成本、權限、不可逆操作、或需要價值判斷的地方,要停下來;輸出之後,要用我指定的角度檢查,而不是只給一份看似完整的結果。而這些過程,我會混著雲地模型來使用,部分工作我先進行處理,才讓它接手後續作業。

這也是我現在使用 AI 的核心變化。它不再只是回答者,而是可以執行複雜任務的協作者。既然它會執行,就必須有工作準則;既然它會消耗 token,就須要有成本意識;既然它會接觸檔案與工具,就必須有邊界。不然它雖然會工作,但也同樣會製造難以收拾的災難。

=> 深入閱讀...

2026-05-18  -  duncan Email  -  84  -  資訊工程 - 讀者回應