李飛飛的 World Labs 在前幾天推出了首款商業化產品Marble,這是一個多模態的 3D 模型,也是生成式 AI 的重大發展。大家對 AI 的想像,近兩年幾乎都被 LLM 帶著走。不管是生成文字、整理資料、重構知識、寫程式、當客服、當助理,大家一開始用的時候都會覺得不可思議,後來也逐漸習慣了這一切。然而多數人還是把 AI 視為一個語言工具,覺得它聰明,是因為它懂得「用文字回答我們」,而不是因為它真的懂這個世界。

空間智慧2.ai

但現在開始發生的,是比 LLM 影響更大的事情,這是多數人還沒感受到、甚至還來不及理解的變化,那就是空間智慧的出現。我的意思不是把相機、深度感測器放進產品,而是 AI 能開始真正理解三度空間的結構、物體的關係、場景的語意,能推測人與物體之間的行為,不再只活在文字或影像的平面上,而是能在一個完整立體的世界裡思考和行動。

很多人會以為空間智慧就是把特斯拉 FSD 變得更厲害,或是把 NVIDIA Omniverse 做得更精準,但實際上它們的定位與空間智慧是完全不同的。特斯拉的自動駕駛算是空間技術的代表,可是它的世界很狹窄,它只需要理解道路、車流、行人的動向。它處理得再好,也依然是在道路這個單一場域裡求生存。Omniverse 雖然強大,但它本質上是一個「模擬平台」,是給開發者訓練模型、測試機器人、建立數位分身用的,它不會自己理解一個場景的日常邏輯,也不會像人一樣對這個世界形成完整的認知。

空間智慧不是提升某一個垂直領域,而是讓 AI 具備真正的「世界理解力」。它不但能重建環境,也能推理行為,能預測動態,能在虛擬的世界生成物理一致的空間,甚至能把真實世界的結構抽取起來,用於模擬、推演,最後再回到現實場域裡幫助我們決策。這是一種新的 AI 型態,也是一種新的存在方式。

[全文:]

這樣的能力,會讓現在的硬體產品產生非常大的變化。像最近很夯的 AI 眼鏡,或是已經上市一段時間的 Apple Vision Pro,看起來都很酷,但他們都還停留在「把資訊疊在現實世界」的階段。空間智慧真正成熟後,這些產品不會只是眼鏡或頭戴裝置,而會變成能理解你身處環境的夥伴。你走進家裡,它會知道你的動線,也知道什麼地方危險。你在街上走,它能預測前方的人流變化,也能提醒你注意某個穿越馬路的人。你進入陌生的國家,它能把整個城市的空間語意完整呈現,像是你的第六感。在 Vision Pro 裡面,這些能力會更立體,因為 AI 能同時理解你所在的真實環境,並且用世界模型即時生成一個融合的空間,讓你不但看得到畫面,還能在真實與虛擬之間自由切換,彷彿你整個人站在兩個世界的交界。

空間智慧

空間智慧對機器人的影響會更大。現在的人形機器人很受歡迎,因為人們習慣把「會動的機器」想像成「要長得像人」。但如果 AI 真正具備空間智慧,能理解周遭環境、能推理物體的行為、能預測人的意圖,那麼任何機械都可以成為廣義的機器人。車子可以變成能理解交通意圖的行動智慧體。家電可以變成能感知周圍環境的生活代理人。工廠裡的機械手臂不需要重新撰寫程式,只要讓它看一眼就能知道工作區正在發生什麼事。醫院裡的設備可以自動分析人流動向,決定何時運作、何時讓開。這些機具不再只是工具,而是能與你共享空間、共享行為、共享理解的智能夥伴。

這整個發展的終局,其實已經超越現在 Meta 所提的「元宇宙」。元宇宙把人丟進虛擬世界。而空間智慧帶來的,是虛擬世界與真實世界的同步,是像阿凡達那樣的空間融合,用真實身體去感受虛擬空間的刺激,用虛擬世界去回饋真實世界的感官(現有的 4D 電影就是類似概念)。當 AI 能生成一個具備完整物理規則、能被你「走進去」的世界,再配上全身觸覺、力回饋、空間音場、温度模擬,你就能在真實的身體裡體驗一個被創造的宇宙。這不是遊戲,也不是 VR,而是另一種生活與工作方式的開始。

最後這項技術會把很多產業重新洗牌。遊戲和影視會從觀看變成參與,建築與室內設計會從圖面變成立體的生活模擬,醫療與長照會從檢查變成預測,交通運輸會從駕駛變成協作,工廠會從自動化變成自治化(不再等待指令,而是能理解並行動),教育會從講述變成沉浸式學習,零售會從逛街變成空間體驗。這些變化不是把現有的產品「升級」,而是讓整個社會的運作邏輯重新調整一次,像是從文字社會跨進影像社會、再從影像社會跨進空間社會。說到這裡,這很像是 2009年上映的電影《獵殺代理人》(Surrogates)所描述的場景。

或許現在大部分人還沒辦法理解空間智慧的衝擊,但就像十年前沒有人能想像 LLM 會變成今天這樣,空間智慧也會在不久的將來讓世界的運作方式產生質變。我覺得我們正在經歷一件非常大的變革,只是它還沒被大眾完全意識到而已。





2025-12-11  -  duncan Email  -  250  -  資訊工程 - 讀者回應

回應管理, Pingbacks:

這篇文章還沒有 回應管理/Pingbacks ...

讀者回應:


你的Email位址將不會顯示在這個站點.

您的URL將被顯示.

允許的XHTML標記: <p, ul, ol, li, dl, dt, dd, address, blockquote, ins, del, span, bdo, br, em, strong, dfn, code, samp, kdb, var, cite, abbr, acronym, q, sub, sup, tt, i, b, big, small>
Enter this code:
authimage

(換行會被轉換為 <br /> 標記)
(將你的姓名及Email及網址記在Cookie中)
(讓使用者可以直接寫訊息給你(不會顯示你的Email).)

上一篇文章: AI 橫空出世後,產業面臨的震盪與我們必須面對的轉折下一篇文章: 當團隊從管理走向經營