從聊天到工作流
近半年,我花了不少時間,在不同的 AI Agent 工具裡反覆折騰。
一開始的念頭很單純,一方面是工作上的需求,另一方面我想知道,Agentic AI 這些被稱為下一代工作革命的東西,到底是真正能幫研發團隊分攤工作,還是另一波被媒體包裝得很漂亮的新玩具。
三年半以前,我主要透過 LLM 的 Chat,或是 GitHub Copilot 來協助開發。當時主要的 IDE是 VSCode,工作方式也很直覺:我問問題,AI 回答;我寫程式,用 tab 補全;遇到 bug,我將錯誤訊息輸入,由 AI 推測原因。那時候的 AI像顧問,或是一個很懂語法的自動完成器。它可以提高速度,但真正決定工作如何展開的人還是我自己。
後來開始使用 Cursor、Windsurf,情況就有些變化了。AI 不再只是回答問題,而是開始處理整個專案脈絡。它會讀檔案、理解 repo、跨檔案修改,也可以承接較完整的功能開發。這時明顯感覺到,提示工程正在變成另一種東西。過去我們在意的是 prompt 寫得好不好,現在更重要的是任務是否被拆解清楚、上下文是否乾淨、驗收條件是否明確。
而從 Antigravity 推出之後,我就改用 Antigravity 來開發。同時我也混用了 Codex、Claude Code、Claude Cowork 等 coding agent。到這個階段,我已經很難只用「哪個工具比較強」來形容它們。它們比較像不同性格、不同工作習慣的工程師。問題不只是能力,而是我們要把什麼工作交給誰,以及怎麼讓它照著我們的期待前進。
Antigravity 的規劃感
Antigravity 很像一位習慣先把白板規劃好的人。接到工作需求之後,它通常不會立刻動手,而是先拆解問題、安排步驟、建立 task list,然後才往下執行。很多時候,它會停下來,需要我確認下一步。剛開始我覺得這樣有點慢,因為使用工具時,總會希望它愈快愈好,最好一句話,就能讓 AI 將整件事完成。
但真正把複雜任務交給它之後,這種需要我確認的節奏反而重要。當任務不只是問答,而是包含下載資料、閱讀論文、整理摘要、翻譯、建立文件,甚至跨 browser 與 terminal 操作時,AI 若沒有節制地一路往前衝,其實很容易偏離原本的目標,重點是 token 的消耗都要錢。
最早我曾讓它處理十五篇專業論文的工作流程。從下載、抽取內容、摘要、翻譯,到最後輸出整理過的文件,那種感覺很奇妙。它不只是執行而已,它會規劃,而這個能力很重要。真正的大型任務,會失敗往往不是模型看不懂,而是作業流程在某個地方開始偏掉,接著 token、上下文、檔案與工具呼叫混在一起變得難以控管。
對齊不只是一個好 prompt
我現在喜歡用「對齊」來說明我使用 AI 開發的方式。這裡說的對齊,不只是把 prompt 寫得漂亮,而是讓 AI 知道任務的方向、邊界、格式、停止條件,以及什麼事情需要跟我確認。
以前談提示工程時,很多重點放在角色設定、語氣、範例與輸出格式。這些當然還是有用,但 Agent 能做的事情變多之後,溝通方式也必須跟著改變。我會更明確地告訴它:先讀資料,不急著改;先提出計畫,不急著執行;遇到成本、權限、不可逆操作、或需要價值判斷的地方,要停下來;輸出之後,要用我指定的角度檢查,而不是只給一份看似完整的結果。而這些過程,我會混著雲地模型來使用,部分工作我先進行處理,才讓它接手後續作業。
這也是我現在使用 AI 的核心變化。它不再只是回答者,而是可以執行複雜任務的協作者。既然它會執行,就必須有工作準則;既然它會消耗 token,就須要有成本意識;既然它會接觸檔案與工具,就必須有邊界。不然它雖然會工作,但也同樣會製造難以收拾的災難。
TOMORROW X TOGETHER WORLD TOUR <ACT:TOMORROW> IN TAIPEI
這是我第三次參加 TXT 的演唱會,女兒開始追自己的星星時我為了陪她跟著入坑,幫忙搶票,很認真的聽每一首歌曲,然後跟看著 Youtube 上的 MV 做功課。
然後我就真的入坑了~ 我一直都記得在南港展覽館,聽到 LOVESONG 響起的那一刻,有時候遇到工作上的低潮期,我都會聽這首歌,回想那一晚帶給我的悸動 ”I know I love you”,我希望我記得我所熱愛的,跟我生活的初衷。
老大喜歡姜太顯,老二喜歡休寧凱,而我則是喜歡崔秀彬跟崔然竣。小孩說我是音迷,我其實不是很懂這些新潮的術語,但我試著去了解小孩的世界,同時也藉由這個過程在治癒我自己。我們都需要信仰~
我看著小孩迷她們心中的偶像,然後從這個過程去感受青春的生活,有哭、有笑,有歡樂、有期待,也有走不出來的迷惘。但這就是人生啊!
這一次的舞台演出感覺更成熟了,TXT 出道也邁入了第七年,能跟著一個團體一起成長,看著粉絲不斷增加,真的也是一種很特別的感受。 2026 年的演唱會,感謝 TXT 帶給我跟小孩一個青春期的聯繫,也感謝所有 MOA 一起共情,共享一個美好的世界。
이건 제가 TXT 콘서트에 세 번째로 다녀온 이야기예요.
딸이 자기만의 ‘별’을 좋아하기 시작했을 때, 저는 곁에서 함께해 주고 싶어서 자연스럽게 같이 입덕하게 됐어요. 티켓 예매를 도와주고, 모든 곡을 정말 진지하게 들었고, 유튜브에 올라온 뮤직비디오도 하나하나 찾아보며 공부하듯 봤죠.
그러다 보니 어느새, 제가 진짜로 빠져 있더라고요.
난강 전람관에서 ‘0X1=LOVESONG (I Know I Love You)’이 흘러나오던 그 순간을 저는 아직도 잊지 못해요.
가끔 일 때문에 힘든 시기를 지날 때면, 저는 이 노래를 다시 들어요. 그날 밤 느꼈던 두근거림과
“I know I love you”라는 가사를 떠올리면서요.
내가 무엇을 사랑하고 있는지, 그리고 어떤 마음으로 살아가고 싶은지를 다시 기억하고 싶어서요.
큰딸은 강태현을 가장 좋아하고, 둘째 딸은 휴닝카이를 좋아해요.
그리고 저는 수빈이랑 연준이의 팬이에요.
물론 우리 가족 모두 범규도 정말 많이 사랑해요.
아이들은 저를 ‘음미’라고 부르는데, 솔직히 이런 신조어들을 다 잘 아는 건 아니에요. 그래도 아이들의 세계를 이해해 보려고 노력하고 있고, 그 과정이 오히려 저 자신을 치유해 주기도 해요.
우리 모두에게는 믿고 의지할 무언가가 필요하니까요.
아이들이 마음속의 아이돌에 빠져 있는 모습을 보면서, 저는 그 과정을 통해 청춘이라는 시간을 느껴요.
울고, 웃고, 기뻐하고, 기대하다가, 때로는 쉽게 벗어나지 못하는 혼란을 겪기도 하죠.
하지만 그게 바로 인생인 것 같아요.
이번 무대는 확실히 더 성숙해졌다는 느낌이었어요.
TXT도 데뷔 7년 차에 접어들었고, 한 팀과 함께 성장하면서 팬이 점점 늘어나는 모습을 지켜본다는 건 정말 특별한 경험이에요.
2026년 콘서트를 통해,
TXT가 저와 아이에게 청춘이라는 시간을 이어 줄 수 있는 연결고리가 되어줘서 고마웠고,
같은 감정을 나누며 함께 공감해 준 모든 MOA에게도 감사해요.
정말 아름다운 세계를 함께 나눌 수 있었어요.
近日工作有感,我們單位迎來第一次擴編。當一個團隊開始成長,真正發生改變的,往往不只是工作量,而是每個人對自己位置的理解。原本只需要把事情完成,慢慢變成被期待承擔更多的工作與責任。這樣的轉換不一定會被明確說出口,可能只是會議變多了,溝通增加了,做決定時開始擔心是否什麼沒考慮到......。時間一久,壓力便開始累積,並在不同的人身上造成負面影響。有的人感到疲憊,有的人變得焦躁,也有人開始對方向跟產出感到不安。站在管理的位置來看,這些反應都很真實,也很合理,只是當它們同時出現,摩擦便難以避免。
在這樣的過程中,我很清楚管理職並不是一種升遷,而是一種責任結構的轉換。技術角色關心的是把事情做好,管理角色面對的,則是必須為整體結果負責,包含那些沒有親手完成,卻仍然需要承擔後果的部分。當有人誠實地說出目前的工作量已經接近極限,那並不是推託,而是一個站在執行者位置的自然反應。但管理角色所面對的現實,往往不是事情會不會太多,而是在事情一定很多的前提下,哪些需要被重新安排,哪些甚至必須暫時放下。這樣的轉換,對長期以專業自我要求為核心的人來說,本來就不輕鬆。
特別是越在意品質的人,或自我要求高的人,往往在這個階段越容易受挫。不是因為不夠成熟,而是因為心中對什麼才算把事情做好,有一套清晰的標準。但現實環境裡,時間有限、資源不足、需求也未必完整,許多決定只能在不理想的條件下做出。如果只用妥協或迎合來理解這些選擇,很容易讓人開始懷疑自己。管理者真正面對的,其實是另一個更困難的課題,在有限條件下,哪些不完美是目前可以承擔的,哪些則是不能妥協的底線。這不是放棄理想,而是理解環境運作的現實。
隨著團隊人數增加,溝通鏈變長,壓力也不會平均落在每個人身上。它會讓每個人原本的個性更容易暴露。習慣自己把事情扛完的人,更容易感到疲憊與不公平;對品質高度敏感的人,則更容易對現況感到失落與無力。如果這些反應沒有被好好理解,就很容易被誤解成抗拒或情緒化。但站在管理的位置看,真正需要被調整的,往往不是情緒本身,而是同仁對角色的理解是否已經跟上團隊正在發生的變化。
在本次公開演講結束後,主辦單位安排了一場延伸的技術座談,作為對演講內容的進一步討論與交流。與會者包含學術研究者、醫療臨床人員、醫院資訊與 AI 團隊,以及實際參與系統開發的工程人員,討論重心聚焦於大型語言模型與多模態系統在醫療場域中的實際應用問題。這場座談以開放問答的形式進行,圍繞著模型角色定位、系統設計邊界、資料與評估方式等議題,延伸出多項具體而實務導向的技術討論,成為本次演講之外,另一段重要的交流內容。
一、LLM 在醫療系統中的角色定位與責任邊界
在這場延伸對談中,最早被反覆提出的問題,圍繞在大型語言模型是否適合直接參與醫療決策,以及一旦系統產生錯誤時,責任應如何界定。這類提問來自不同角色的共同焦慮,無論是臨床端、資訊單位或系統開發者,都意識到醫療場域與一般應用最大的差異,在於錯誤本身即可能帶來實質風險,而非僅是體驗不佳。當語言模型具備高度擬真的表達能力時,更容易讓使用者誤以為其具備判斷與決策資格,這也使角色定位成為設計初期無法迴避的問題。
對此陳縕儂教授提出她的看法:「LLM 在醫療系統中應被視為輔助工具,而非決策主體」。模型可以協助整理資訊、補充背景知識,甚至引導使用者思考,但不應被賦予做出診斷或臨床判斷的責任。這樣的定位並非限制技術能力,而是回到系統設計的初衷,確保最終判斷仍掌握在人類專業者手中。
在實作層面,關鍵不在於模型「怎麼說」,而在於系統是否能清楚界定「什麼情況下可以回應、什麼情況下必須拒答或轉介人工」。這種界線若僅仰賴提示詞或語氣調整,往往難以在複雜情境中維持一致性。相較之下,透過架構層面的設計,例如在生成前加入風險判斷、將高風險問題導向固定流程,才能建立較為穩定的防線。對於醫療這類高風險場域,結構性的限制遠比事後修正輸出內容來得可靠,這不僅是技術選擇,更是責任意識的體現。
陳縕儂教授為國立臺灣大學資訊工程學系教授,長期投入自然語言處理與對話系統研究,研究主軸涵蓋語言理解、口語對話系統、機器智慧與深度學習應用。她曾於美國卡內基美隆大學取得博士學位,並於微軟研究院從事研究工作,近年持續關注語言模型在實際應用場域中的可靠性與可控性問題。此次研討會即以「搜尋、驗證與決策」為主軸,聚焦大型語言模型在專業領域對話與決策任務中所面臨的結構性限制。
一、大型語言模型的訓練架構與限制
演講一開始,陳教授回顧 GPT 類大型語言模型的基本訓練方式。此類模型以序列預測為核心,透過大量語料學習詞與詞之間的條件機率關係,建立語言生成能力。這種訓練方式能有效掌握語言表面結構與常見語境,但本質上仍是機率模型,並未具備對事實正確性的內在驗證機制。
接著說明大型語言模型常見的三個訓練階段,包括以海量資料建立基礎能力的預訓練、透過人工標註資料學習任務指令的指令微調,以及利用人類回饋進行行為對齊的強化學習。這些訓練流程能改善模型回應的可用性,但並未根本解決模型對知識正確性的掌握問題。
在此架構下,長尾知識成為關鍵限制。高頻出現的通用知識較容易被模型記憶與重現,而專業、低頻或語意相近但差異細微的知識,則容易在生成過程中被錯誤拼接,形成幻覺。陳教授指出,這類結構性問題在醫療等高風險場域中特別需要被正視。
:: 下一頁 >>







