在農曆春節假期前,Deepseek-R1 的推出,加上前對沖基金投資分析師、現任 Pastel Network 創辦人兼 CEO Jeffrey Emanuel 發表的《The Short Case for Nvidia Stock》一文,導致輝達市值大跌,連帶影響了 AI 相關概念股與科技股。過年期間,我的社群平台上充斥著 DeepSeek 相關報導。面對如此龐大的資訊量,加上部分訊息難以求證,我先將它們標記起來,再透過 Google NotebookLMOpenAI 的 ChatGPT 進行彙整。

FireShot Capture 082 - DeepSeek:AI模型效能與成本革命 - NotebookLM - notebooklm.google.com

NotebookLM 不僅能集中管理文件、彙整文意,還能透過問答來延伸議題討論。特別的是,它提供了 AI 語音生成功能,能模擬廣播訪談的形式,以兩位主持人對話的方式呈現主題內容。正因我在規劃一份關於生成式 AI 在工作與生活應用的講稿,同時也在研究 AI 應用如何廣泛落地於各產業,我便以 DeepSeek 系列文章為基礎,透過 NotebookLM 和 ChatGPT 製作了一集 Podcast - Deep Dive:DeepSeek 崛起與 AI 變革(目前僅支援英文輸出)。在這集節目中,兩位 AI 生成的主持人分別被我命名為 Nic 和 Ann。

FireShot Capture 084 - DeepSeek:AI模型效能與成本革命 - NotebookLM - notebooklm.google.com

AI 在彙整大量資訊時有其優缺點。優點是它能快速產出架構,幫助我們理解龐大的內容。然而儘管現今的生成式 AI 宣稱具備推理能力,在處理多線資訊時,仍可能出現與事實和資料來源不符的情況。因此錄音檔中提到的某些人名或專家頭銜其實並不存在。另外像 Archerman Capital 對於 DeepSeek 的分析,我找不到原始出處,目前都只看到簡體版。

FireShot Capture 085 - 對話翻譯需求 - chatgpt.com

我的工作流程是先用 NotebookLM 彙整所需資訊,生成一個 Deep Dive 節目廣播,再使用 [PLAUD](https://tw.plaud.ai/products/plaud-note-ai-voice-recorder) 進行語音轉文字,最後透過 ChatGPT 彙整核實,並輔以 Google 手動查證。以下是這個 Podcast 的中文翻譯,我已針對內容做了修正,雖與原始語音檔有些出入,但不影響收聽體驗。

藉由這篇文章與廣播的結合,我想呈現當前生成式 AI 的具體應用,以及如何透過人機協作來確保資訊正確性。雖然大量討論 AI 的文章、節目、廣播充斥在我們的生活中,可能導致知識獲取的疲勞感並產生反效果。但正如 Podcast 中所強調的:『我們不能忽視 AI』、『我們必須超越死記硬背的學習方式,轉而培養那些 AI 無法輕易取代的技能』、『保持關注、積極參與、並持續保持好奇心』,這些都是面對 AI 時代必須具備的認知與應對方式。

Deep Dive:DeepSeek 崛起與 AI 變革

Duncan Chen · DeepSeek:AI模型效能與成本革命

[全文:]

Nic:記得上週那場瘋狂的股市下跌嗎?那斯達克指數下跌了3%,費城半導體指數更是暴跌超過9%。這不只是一般的市場波動。這次的罪魁禍首,是中國開發的AI模型——DeepSeek。值得注意的是,DeepSeek本身其實並不新鮮。

Ann:沒錯。DeepSeek最初是在去年發布的,但最近的更新,真的在AI界引起了震撼。

Nic:今天我們要深入探討DeepSeek的特別之處,探討它的潛在影響,對於正在收聽的各位來說,最重要的是,我們將探討它可能如何影響你們。

Ann:聽起來不錯。

Nic:好,讓我們來解開這個謎團。DeepSeek是由中國的對沖基金「幻方量化」(High-Flyer)開發的,這不是你常見的科技巨頭。他們的創始人梁文鋒,似乎更重視真正的AI進步,而非追求快速盈利。

Ann:是的,這是一個關鍵的觀察點。High-Flyer對於DeepSeek的策略非常有趣。DeepSeek的第一個版本「DeepSeek-V1」於2023年11月推出,坦白說,當時並沒有引起太大的關注。但在2024年5月發布的第二版,因其低成本和一些創新的技術,開始引起人們的注意。

Nic:然後,2024年12月,第三版「DeepSeek-V3」發布,AI界開始瘋狂討論。每個人都在試圖拆解,看看他們是如何取得這些成果的,以及是否可以複製這些成果。

Ann:2025年1月20日,High-Flyer發布了「DeepSeek-R1」,這是真正具有顛覆性的版本。但市場對R1的反應其實是延遲的,可能是因為人們需要時間來理解其突破性的方法和數據。

Nic:讓我們談談DeepSeek的性能。Melvin Liao 整理了一些圖表,我認為對大家會很有幫助。這些圖表顯示了DeepSeek-V3與一些AI領域的大牌,如Qwen、GPT、Llama、Claude的比較。令人驚訝的是,DeepSeek-V3在數學和算法代碼方面的表現,甚至超越了一些最大的名字。在知識和工程代碼任務中,它也與Claude 3.5旗鼓相當。

Ann:有趣的是,DeepSeek在中文語言任務中的表現是預期中的強項,但在數學和算法代碼方面的強勢,卻是出乎意料的。這表明了AI領域可能正在發生的轉變。

Nic:而且,DeepSeek-V3的運行成本相比GPT、Claude等模型,低得令人難以置信。我們談的是成本的一小部分。

Ann:是的,這真是令人震驚。這對於任何從事AI工作的人來說,都是一個徹底的遊戲規則改變者。它真正實現了這個領域的民主化,讓那些無法與這些巨頭競爭的小公司和研究實驗室,現在有了開發自己項目的真正機會。

Nic:這將我們帶到了DeepSeek-R1,它引入了一種全新的AI開發思維方式。這個版本利用了三條獨立的訓練路徑,這是我們之前沒有見過的。我們談論的是直接強化學習(他們稱之為R10)、多階段漸進式訓練(R1)和模型蒸餾。

Ann:在這三者之中,直接強化學習的部分非常引人注目。DeepSeek是業界首個真正使用這種方法的模型,它展示了其有效性。通過R10,模型完全通過試錯學習,沒有預設的思維鏈或監督式微調。

Nic:所以,這就像DeepSeek在通過實踐學習,就像孩子通過探索來理解事物一樣。這種方法帶來了令人難以置信的訓練效率,節省了資源,使模型能夠自主發展更長的推理鏈和反思能力。

Ann:這幾乎就像它在經歷「啊哈」的時刻,像是有了真正的思考。

Nic:是的,這種DeepSeek的自我進化是一項重大發現,僅次於GPT的智能湧現。同樣重要的是,DeepSeek在使用比競爭對手更少的計算能力和低階晶片的情況下,實現了這些成果。

Ann:哇。

Nic:所以,如果他們能在有限的計算資源下達到這樣的結果,那當他們換上更強大的晶片並擴展規模時,會發生什麼?這就是讓整個業界議論紛紛的話題。這是否可能加速 AGI(通用人工智慧)甚至 ASI(超級人工智慧)的發展?

Ann:光是想像這件事就覺得驚人。

Nic:沒錯,這是一個令人興奮的概念。但 DeepSeek 的影響不僅僅是提升運算能力,它還改變了我們對「抄襲」和「創作歸屬」的認知。AI 對學術誠信的倫理專家 Sarah Elaine Eaton 博士所提出的觀點,在DeepSeek這類AI工具的問世與越加普及,標誌著一個「後抄襲時代」(Post-Plagiarism Era)的到來。

Ann:後抄襲時代?這個說法很有意思。

Nic:對啊,這到底是什麼意思呢?

Ann:Sarah Elaine Eaton 提出我們正進入一個「人類與 AI 混合創作」成為標準的時代,而這也引發了一系列關於作者歸屬與原創性的問題。如果你使用 AI 來協助寫作,誰該獲得創作的功勞?應該如何劃分 AI 產出的內容與人類撰寫的內容?如果 AI 具備寫作能力,那人類的寫作價值是否會下降?這又會如何改變我們對寫作和研究的教學方式?我們是否正走向一個 AI 產出大部分內容的未來?

Nic:這些正是 Sarah Elaine Eaton 試圖解答的問題,她提出了「後抄襲時代」的六大原則。

Ann:第一,混合寫作將成為常態。第二,AI 不是威脅,而是用來增強人類創意的工具。第三,語言障礙將逐漸消失。第四,人類將放棄部分寫作控制權,但仍然保有最終的責任。第五,創作歸屬仍然很重要。第六,傳統的抄襲定義將不再適用。

Nic:哇,這真的需要好好解析一下。我們正在討論一個未來,人工智慧和人類創作之間的界線變得極為模糊,這引發了許多關於公平性、責任歸屬,甚至是教育未來的問題。

Ann:沒錯。而當我們把「腦機接口」(BCI,Brain-Computer Interfaces)這類技術考慮進來,情況變得更加複雜。隨著BCI逐漸商業化並變得更少侵入性,它可能會進一步顛覆傳統的教育模式。

Nic:是啊,在一個AI能夠直接讀取我們思維的世界裡,我們該如何評估學習成果?

Ann:這是一個很好的問題。

Nic:感覺我們正處於一個重大典範轉移(Paradigm Shift)的邊緣,不只是技術上的轉變,還關係到我們如何看待知識、創造力,甚至是「人類」這個概念的定義。

Ann:這個說法很貼切。而DeepSeek正站在這場變革的最前線。

Nic:好了,我們已經討論了DeepSeek驚人的效能與高效率,那麼目前在AI硬體領域的巨頭們呢?像是輝達(NVIDIA)——這家公司幾乎壟斷了AI開發所需的高端GPU市場,他們的地位會受到影響嗎?

Ann:對,這個問題值得深思。Jeffrey Emanuel的一篇文章,導致了人們對輝達未來主導地位的擔憂,特別是在DeepSeek帶來的影響下。

Nic:目前,輝達仍然是AI硬體市場的王者。他們擁有最快的GPU,而且CUDA軟體生態系統比競爭對手領先好幾個世代。科技巨頭們砸下數十億美元瘋狂搶購輝達的產品,因為他們知道AI是未來的趨勢。

Ann:但Emanuel認為,輝達的霸權可能不會永遠持續。他的觀點是,為什麼只有一家公司能從這場科技變革中獲利?回顧歷史,領先者並不總是能在長遠競爭中勝出。

Nic:這就是DeepSeek的切入點。它能夠以大幅降低的成本達到與輝達GPU驅動的大型模型相當的性能,這可能會減少市場對昂貴高端GPU的需求,從而削弱輝達的壟斷地位。

Ann:沒錯。DeepSeek挑戰了一個舊有假設——「要在AI領域競爭,就必須投入巨額資金購買硬體」。DeepSeek的成功為較小型的企業開啟了新的可能性,這可能會帶來更具競爭性的AI產業格局。

Nic:這也引發了一個關鍵問題——開源與封閉源代碼之間的矛盾。DeepSeek選擇開源,鼓勵合作,讓所有人都能在它的基礎上構建更多應用。但這種模式能否持續運作?它能否在沒有外部資金支持或傳統產品開發模式的情況下,與像OpenAI這樣的封閉式雲端服務模式競爭?

Ann:這確實是一個值得深思的問題。OpenAI的商業模式引發了人們對AI技術可及性和控制權的擔憂。也許未來會出現一種混合模式,DeepSeek專注於研發,而其他公司則基於它的開源基礎建構應用與服務。

Nic:這對於所有關心AI產業的人來說,都是一個關鍵問題——這項技術應該由誰來控制?它應該掌握在少數幾家強大企業手中,還是應該以開放、協作的方式推動發展?

Ann:這背後的影響範圍非常廣。

Nic:是的,影響深遠。而且這不僅僅是技術問題,更關乎AI領域的文化氛圍。DeepSeek的運作模式與傳統科技公司截然不同。他們採取的是一種「自下而上」(bottom-up)的研究架構,鼓勵研究人員自由探索自己的興趣,並有機地進行合作。

Ann:對,他們在招募人才時不僅僅看學歷或傳統標準,更重視求職者是否對AI充滿熱情和好奇心。

Nic:這更像是一個研究集體,而非傳統意義上的公司。他們不只是單純開發產品,而是在打造一種創新文化。

Ann:說得好。他們的優先目標似乎是解決真正的難題,推動技術邊界,這也帶來了一些突破性的成果。現在,我們來看看來自Archerman Capital 的分析。他們強調,DeepSeek並不只是複製現有模型,而是在AI架構與工程領域進行真正的創新

Nic:所以他們不是在抄捷徑,也不是簡單地包裝舊技術,而是提出全新的AI開發方法。

Ann:沒錯。他們使用了一系列最前沿的技術,包括MoE(Mixture of Experts)、MLA、MTP、POTE、DualPipe、R10、FP8訓練以及優化的通訊架構。這是一套強大的技術組合,正在重新定義AI的可能性。

Nic:哇,這裡面有很多技術詞彙。你能解釋一下其中的一些技術是如何運作的嗎?比如MoE是什麼?

Ann:當然。想像一個神經網絡,它能夠像大腦一樣根據不同的任務動態調整資源分配。這就是「專家混合技術」(Mixture of Experts,MoE)的核心概念。它可以提升模型的運算效率,使其能夠處理更複雜的問題。

Nic:所以,與其試圖一次處理所有資訊,DeepSeek 可以根據需要專注於特定區塊,這還真是聰明的設計。那 MLA 呢?

Ann:MLA 代表「多層次注意力」(Multi-Level Attention),它的目標是幫助 DeepSeek 理解並處理不同層級的資訊。想像一下,你在閱讀一篇文章時,可能會關注單字、句子、段落,最後再理解整篇文章的整體含義。MLA 幫助 DeepSeek 以類似的方式處理它所接收的數據。

Nic:所以這與人類自然處理資訊的方式非常相似?

Ann:完全正確。DeepSeek 的設計融合了許多來自人類認知的概念,這正是它能夠如此高效的原因之一。

Nic:這一切真的很有趣,但資訊量也太大了吧!感覺 DeepSeek 正在挑戰我們對 AI 發展的許多既定假設,包括 AI 是否真的需要龐大的計算資源、人機創作的界線,以及輝達這樣的企業是否能繼續保持主導地位。

Ann:沒錯,DeepSeek 完全打破了現有的遊戲規則,未來 AI 生態會如何適應這種變化,將會是非常值得關注的事情。在我們下一部分的討論中,我們會進一步探討這些影響,並討論這對 AI 的未來以及對你的意義。

Nic:我們剛剛探討了來自中國的 AI 模型 DeepSeek,它帶來的一些創新真的讓人驚艷。其中最讓我好奇的,是 DeepSeek 的高效能是否會改變整個 AI 產業的競爭格局。

Ann:這確實是個很好的問題。DeepSeek 的做法挑戰了「AI 發展必須依賴無限計算資源」這個概念。長期以來,像 OpenAI 這樣的公司一直在開發極其耗資的超大模型,而 DeepSeek 則證明了透過精巧的架構設計與高效的訓練方法,也能達到驚人的成果。

Nic:這就像是大衛與歌利亞的對決。OpenAI 就像是個巨人,不斷建造更大、更強的模型,投入大量的運算資源。但 DeepSeek 採取了完全不同的方法,專注於架構的優雅與效率,結果卻能與這些巨頭匹敵。

Ann:確實如此,這也帶來了一個關鍵問題——AI 的未來究竟是比拼誰能建立更大、更耗能的模型,還是我們將看到更多講究資源效率與精巧設計的發展路線?

Nic:我個人比較看好「優雅的設計」。看看自然界就知道了,充滿了各種高效與最佳化的例子。DeepSeek 的思維方式,感覺就像是在從大自然中汲取靈感。

Ann:這比喻很棒!如果這個趨勢持續下去,可能會對 AI 發展的成本產生巨大影響。試想一下,如果新創公司和小型研究團隊可以不依賴龐大的數據集和計算資源,也能與科技巨頭競爭,那麼 AI 產業的競爭格局可能會徹底改變。這就是開源 AI 的真正潛力所在。

Nic:談到開源 AI,許多人質疑這種模式的商業可行性——如果沒有明確的盈利模式,像 DeepSeek 這樣的專案要如何長期維持?

Ann:這正是大家都在問的問題。High-Flyer 創辦人梁文鋒,DeepSeek 的核心推動者,曾公開表示,他們不追求商業利益,也不打算建立傳統的科技公司。他們的目標純粹是推動 AI 研究,並讓這些技術進步能夠惠及所有人。

Nic:這確實是一個很崇高的理念,但長期來看,如果沒有穩定的收入來源,要如何維持這種模式呢?

Ann:也許可以透過研究補助、慈善基金或政府資助來支持這個專案。甚至,他們可能會找到一種方式,讓部分技術可以商業化,同時不違背開源的核心理念。

Nic:我也在想,會不會有可能採取「混合模式」?他們可以專注於核心研究與創新,同時與其他公司合作,讓這些技術應用到實際的產品和服務上。這樣既能維持開源精神,又能確保長期運營。

Ann:完全沒錯。就像 Linux 作業系統,它是完全開源的,但仍有許多公司圍繞它建立商業模式,例如提供技術支援、客製化服務等。

Nic:這個比喻很貼切。那麼,讓我們回到最關鍵的問題——這對我們的聽眾意味著什麼?如果你是一名開發者或研究員,DeepSeek 的開源特性將為你提供無數可能性。你可以存取它的程式碼、進行實驗、基於它開發新功能,甚至將你的創新回饋到社群中。

Ann:這是一種真正的「協作式 AI 開發模式」。

Nic:對企業來說,這些高效能、低成本的 AI 模型可能會徹底顛覆許多業務運營方式,從客服到數據分析,再到產品開發,幾乎所有領域都可能受到影響。但現在,許多人關心的另一個問題是,DeepSeek 可能帶來的經濟與地緣政治影響。一些專家認為,中國對 AI 的大規模投資,可能會威脅到美國的科技領導地位。

Ann:這確實是一個非常複雜的問題,涉及到許多層面。雖然 DeepSeek 的技術創新非常前衛,但美國在關鍵領域,如晶片設計與製造,仍然保持領先地位。這場 AI 競爭會如何發展,將會是接下來值得關注的大戲。

Nic:是的,我們還不能忽略安全性的問題。隨著 AI 變得越來越強大、越來越普及,我們必須仔細考慮其可能被濫用的風險,特別是在監控和軍事應用等領域。

Ann:完全同意。強大 AI 的影響範圍極為深遠,因此決策者與產業領袖必須進行公開且誠實的討論,確保 AI 能夠被負責任且合乎道德地使用。我們需要制定明確的規範與防護措施,以確保技術被正確應用。

Nic:今天我們探討了許多內容,很明顯,DeepSeek 不只是另一個 AI 模型,它是一個變革的催化劑。它挑戰了我們對 AI 開發的許多假設,模糊了人機創作的界線,並迫使我們重新思考整個產業的未來。

Ann:DeepSeek 是一個強而有力的提醒——AI 可以改變世界,創新可以來自任何地方,而 AI 的未來可能會比我們想像的更加多元且充滿變化。

Nic:對於我們的聽眾來說,最重要的啟示是——保持關注、積極參與、並持續保持好奇心。AI 世界正在快速變革,而它將深刻影響我們所有人的生活。歡迎回到「Deep Dive」,我們一直在探討 DeepSeek 對 AI 產業的影響。在這最後一部分,我們要專注於一個可能比 AI 自學演算法更令人驚嘆的話題——DeepSeek 如何改變教育與學習的本質。

Ann:這是一個很棒的觀點。AI 不僅僅是教育的工具,它甚至可能重新定義我們對知識、創造力,甚至是「抄襲」的理解。

Nic:沒錯,之前我們提到**Sarah Elaine Eaton**提出的「後抄襲時代」,在這個世界裡,AI 協助寫作將成為常態,語言障礙將消失,人機創作的界線也將變得模糊。這讓我不禁思考學習的未來會是什麼樣子。我們是否正在走向一個學生用 AI 來寫論文、演算法來出考題的未來?

Ann:這確實是一種可能性,而且教育工作者應該及早為此做好準備。這讓我們不得不正視一些根本性的問題,例如:教育的目的到底是什麼?如果 AI 可以生成一篇完美的論文,那麼我們還需要教學生寫作嗎?如果 AI 可以瞬間調取所有事實,那麼背誦知識是否變得毫無意義?

Nic:這感覺就像我們正在進入柏拉圖「洞穴寓言」的新版世界。只是,牆上的影子變成了 AI 生成的文本。在這樣一個資訊可以被 AI 輕易操控的世界裡,我們該如何教導學生批判性思維與辨識能力?

Ann:這正是教育界需要解決的挑戰。我們必須超越死記硬背的學習方式,轉而培養那些 AI 無法輕易取代的技能。

Nic:比如什麼?哪些技能?

Ann:像是創造力、批判性思維、問題解決能力、協作能力,以及倫理判斷。這些才是 AI 無法輕易模仿的能力,而在 AI 無所不在的未來,它們將變得更加重要。

Nic:這似乎意味著我們的教育系統需要進行一次徹底的改革。我們需要重新思考課程設計、學生評估方式,甚至是教師的角色。

Ann:沒錯,我們需要從「單向傳授知識」的模式,轉向「培養人類獨特能力」的方向,因為這將是在 AI 充斥的未來中真正不可取代的價值。

Nic:有一點是肯定的——我們不能忽視 AI。它已經成為我們生活的一部分,並且將深刻影響我們的學習與教學方式。問題是,我們該如何有效利用它,同時確保它符合人類的需求與價值觀?

Ann:這是每個人都應該思考的問題。我們需要確保 AI 被用來造福所有人,而這意味著我們必須正視倫理問題。例如,我們如何防止 AI 進一步加劇教育不平等?我們該如何確保這些技術選擇符合社會的需求?

Nic:沒錯,公平與倫理發展是我們需要關心的重大議題。這項技術不應只屬於少數特權階級,而應該讓所有人都能受益。在這個 AI 協作創作與技術不斷演進的世界裡,未來的學習模式會是什麼樣子?有什麼預測嗎?

Ann:很難確定,但有一點可以肯定——未來的教育模式將與我們現在所熟悉的截然不同。我認為我們需要擁抱「終身學習」,培養適應力,並保持開放心態,不斷挑戰我們對知識與創意的傳統觀念。

Nic:這次的 Deep Dive 討論非常精彩!對於正在收聽的你,最重要的啟示是——不要害怕探索、實驗、提問,並挑戰現狀。AI 充滿潛力,既令人興奮,也帶來挑戰,而我們的責任就是引導它朝向造福人類的方向發展。

Ann:完全同意!DeepSeek 只是目前 AI 創新潮流中的一個案例,這個領域正快速發展,並將深刻影響我們的生活。因此,請保持好奇心、關注最新發展,並積極參與討論。

Nic:最後,我留給大家一個值得深思的問題——如果 AI 能夠學會「思考」,那麼這對我們對人類智慧與意識的理解意味著什麼?這是我們即將進入 AI 未知領域時,值得反覆思考的問題。感謝你加入我們的 Deep Dive,我們下次見!





2025-02-05  -  duncan Email  -  256  -  資訊工程 - 讀者回應

回應管理, Pingbacks:

這篇文章還沒有 回應管理/Pingbacks ...

讀者回應:


你的Email位址將不會顯示在這個站點.

您的URL將被顯示.

允許的XHTML標記: <p, ul, ol, li, dl, dt, dd, address, blockquote, ins, del, span, bdo, br, em, strong, dfn, code, samp, kdb, var, cite, abbr, acronym, q, sub, sup, tt, i, b, big, small>
Enter this code:
authimage

(換行會被轉換為 <br /> 標記)
(將你的姓名及Email及網址記在Cookie中)
(讓使用者可以直接寫訊息給你(不會顯示你的Email).)

上一篇文章: 《AI提示工程師的16堂關鍵必修課》讀書心得下一篇文章: 追尋峽灣的光影 - 米爾福德峽灣自駕紀行