入職短短五個月,我們打造的第一款「生成式AI照護機器人」,已於昨日正式對外發表。從一開始的單打獨鬥,到現在團隊擴展為七人,公司規模也隨之成長至十四人,這段旅程充滿挑戰,更充滿成就感。

L1020636

實際的開發時間不到三個月,這在一般情況下可能需要一整年的時間才能完成。然而在緊湊的時程與高壓的挑戰下,我們堅守原訂計畫,成功如期推出了第一個產品版本,這無疑是一場與時間競賽的成果。

L1020647

回顧起初,產品功能尚未成形,需求輪廓也模糊不清,而我在團隊仍未建立時,便需獨自處理有開發跟規劃的工作。那段日子裡,跨部門的會議規模龐大、意見紛陳,但也正是這樣的磨合與碰撞,促使我下定決心聚焦產品核心,迅速確立方向並找到合適的協作夥伴。每一週都有新挑戰,節奏緊湊得彷彿一齣連續劇。

這段期間,我全力投入開發,曾一度因過度操勞而健康亮起紅燈(因壓力性潰瘍差點被收治住院,說是用生命在做產品也不為過)。當時在研發端只有我一人,負責所有與大型語言模型(LLM)與檢索增強生成(RAG)相關的技術,所幸後來團隊陸續加入,我們也一同完成了三項LLM專利,與三項AI任務調度的專利申請。

516314277_10161418757796481_7571339033693332666_n

=> 深入閱讀...

2025-09-27  -  duncan Email  -  109  -  小公司當伯特 - 讀者回應

農曆年前網路上的攝影朋友舉辦了一場台中舊市區的團體街拍,由於時間是農曆假期的第一個週六,當時我還在考慮中,沒想到晚上要報名時就滿額六十名了。所以我就一直想辦一個自己人的團拍。

問了一些對攝影有興趣的同事後,我就安排了一個底片攝影的街拍計劃,選在了四月的一個週六進行。活動分為上下午兩個時段,有些同事下午有事無法參與,但至少可以進行上午的街拍。

這一天安排的路線是第二市場、柳川水岸、台中文學館、綠川水岸、台中火車站、綠空廊道、國家漫畫博物館。

午餐在南園酒家享受了精釀啤酒跟餐點,下午茶時段則是在春水堂創始店小小休憩了一個半小時。
活動從上午八點四十五分開始,一直到下午五點才結束。總共步行超過七點二公里,同事說這不是街拍,是被騙來健行的⋯⋯

街拍有趣的地方在於大家走過一樣的地方,但每一個人觀察的角度都不相同。我們可以藉由彼此的作品去察覺不同的視角,這一點是團體街拍的魅力之一。

原先我還想一併進行攝影的紀錄,但背了很重的包包走了一整天,要拍照還要錄影真的很困難。期待大家收到底片的掃描檔案後,都能發現自己拍出一些有趣的照片。

辛苦了一起走了一整天的同事,我擔心一卷底片拍不完,所以安排了上下午兩場,比較好的活動時間還是三個小時內比較恰當,其他時間負責吃吃喝喝聊聊天就好。希望大家今晚都有個好眠,半夜腿不會痠痛跟抽筋。我想下次再辦街拍的話,應該是找不到成員參加了,所以改約爬山好了。

2025-04-15  -  duncan Email  -  339  -  影像日記, 小公司當伯特, 當式攝影 - 讀者回應

午餐的約會。

大家藉著中午休息的空檔,分享了最近在研究 AI 應用的心得。我們暢談了在地端封閉式的使用模式,以及各大語言模型(LLM)可以應用在工作和生活的不同場景。

DSCF4724

隨著投入研究的時間越來越多,我們發現琳瑯滿目的工具並不是最重要的。關鍵在於如何運用這些工具,解決實際的問題和需求。

DSCF4723

有時感到獨自摸索很孤單,缺乏不同觀點的交流實在可惜。因此,我們希望未來能夠有更多這個領域的意見交換,這對於職涯發展和個人競爭力的提升,相信會有正面的影響。

=> 深入閱讀...

2025-03-07  -  duncan Email  -  471  -  小公司當伯特 - 讀者回應

近日 OpenAI 推出了 Deep Research,雖然暫時只提供給每月支付兩百美金的 Pro 用戶,但很多人試用後都稱讚這個 Agent AI 真的很好厲害(Deep Research 是什麼?實測介紹 ChatGPT 深度研究新功能),而除了 OpenAI 推出這個服務之外,Hugging Face 也重現了一個基礎版的類似智慧代理架構,(Hugging Face挑戰OpenAI Deep Research,24小時打造開源智慧代理系統),有興趣的人可以點擊這裡測試使用

這個自動代理 AI 的運作原理,主要運作是分為幾個步驟:首先會將使用者輸入問題進行類型跟關鍵字拆解,然後進行相關資料查詢。接者則是透過網路搜尋的結果進行不同來源的比對,這其實也是部分資料提示工程師提升 LLMs 精準度的作業方式之一。然後會將這些資料進行過濾篩選跟提取,最後產出結構化的報告。因此它結合了自動代理(AI Agent)、多步推理 (Chain of Thought, CoT),以及檢索增強生成 (Retrieval-Augmented Generation, RAG)三種核心技術。

而在 OpenAI Deep Research 服務推出之前,Google 的 NotebookLM 也提供了類似的應用場景。NotebookLM 也包含了資訊整合跟分析,但需要使用者自行提供資訊的來源。同時它也有自動化研究流程,系統會預設一些提示詞,導引使用者減少人工介入並提升使用效能。我認為 NotebookLM 適合彙整已有明確資料來源的項目,而 Deep Research 則適合探訪一個我們未知的主題,如我下圖所顯示的。

FireShot Capture 086 - 建造 --- Gradio - m-ric-open-deep-research.hf.space

我的使用範例是要求:「以鑽石與氮化硼切削工具的市場專家,幫我搜尋網際網路上面近三年的市場調查分析,如果以全球市場來看,有哪些區域的廠商對這樣的產品有需求。同時以台灣的製造商,哪些區域適合我們去拓展市場。請給我市場分析的來源跟數據相關資料,並提出為何適合台灣製造商開拓的原因。」這個議題我不知道要到哪裡蒐集有用的資料,所以透過網路代理工具可以大幅減少我的時間。而我之所以進行這些資料的查詢,是因為幫朋友給予一些製造業產品外銷的建議,由於 AI 工具的輔助,以往我要花上三到五天才能蒐集完資料並產出一份產業建議報告,在這些工具的輔助下,我只用了四個小時就處理完畢。

回到 NotebookLM,前陣子在 Threads 上看到有人大力推薦,應該要透過它的一個「語音摘要」功能,然後將自己的履歷丟進去,看看語音摘要會生成什麼樣的介紹。而相信透過這個介紹,大家都會得到心靈方面的撫慰。我也開始努力在找下一份工作,所以也就找時間測試了一下。這個雙人語音對話的功能,我在上一篇《DeepSeek:AI模型效能與成本革命》有介紹過,當時是利用語音摘要,以 Podcast 的型態來介紹 DeepSeek。

Duncan Chen · Chen Hsuan Wei's(Duncan) Resume R&D And AI Innovation

=> 深入閱讀...

2025-02-22  -  duncan Email  -  423  -  資訊工程, 小公司當伯特 - 讀者回應

新的一年我參與的讀書會首個討論議題是「組織改造跟文化核心如何提升作業績效」。這個議題銜接去年底的「年終績效考核」討論,其中不少人都提到《影視颶風》作為例子。因此我想分享自己對工作流程、組織以及文化如何提升團隊作業績效的看法。

◎系統與功能的迷思
我前公司的老闆大約每三個月就會提出系統與功能方面的需求,認為工作全面資訊化、系統化後,就能避免人員出錯,並以最有效的方式作業。這個想法本質上是對的 - 有了自動化和資訊系統的輔助,確實能讓人員將心力投注在更有價值的工作上。關於這點,我們可以從《影視颶風》的影片「影視颶風的100個員工,上班都在做點啥?飛書辦公體驗分享」中得到很好的印證。

◎《影視颶風》的演進歷程
從影片中可以看到《影視颶風》不同職位工作者的工作模式與環境。但這樣的工作流程並非一蹴可幾,而是在八年間經歷了多次改變與調整,中間也曾面臨過工作流程與管理的困境。感謝 Tim 在 Youtube 頻道上的分享,不論是 QA 問答或《影視颶風》內部的工作內容分享,都讓我們看到這間公司不斷求變的態度,完全符合他們「無限進步」的 Slogan。

話說第一個採訪的剪輯工程師姚志浩,提到他想購買的整套圖馬司特方向盤,這讓我想起我們午休時間,一群工程師在開歐洲卡車模擬遊戲的場景,所有的工程師想法都是差不多的。

IMG_1722

IMG_1745

=> 深入閱讀...

2025-01-14  -  duncan Email  -  625  -  小公司當伯特 - 讀者回應

:: 下一頁 >>