嗯...最近一直在想一件事。AI 這世界,感覺好像快要分裂了。一邊是美國隊,以 Nvidia 為首;另一邊是中國隊,有華為跟百度這些。我們這些在中間的開發者、創業者,甚至只是一般用戶,好像不知不覺就得選邊站。這感覺...蠻糟的。
幾個月前,這還只是一個猜想,現在越來越像現實了。Nvidia 的那個所謂的「矽谷馬歇爾計畫」,不再只是個比喻,是真的在發生。
先說結論:三個世界,三條路
簡單講,AI 的基礎建設正在分裂成三塊。一是美國企業巨頭的「雲端帝國」,二是中國的「主權科技」,第三條路... 是一條由社群、開源和去中心化技術拼湊起來的「人民的路」。我們現在就站在這個岔路口上。
Nvidia 的陽謀:CUDA 生態系綁架
Nvidia 今年早些時候市值不是蒸發了幾千億美金嗎?我以為他們會收斂一點,結果沒有,他們反而加倍下注。
你知道嗎,透過像 Nvidia Inception 這樣的計畫,還有跟 Google Cloud 合作,他們瘋狂地給那些新創公司,特別是 Y Combinator 出來的,超便宜甚至免費的 GPU 算力。聽起來很棒,對吧?但天下沒有白吃的午餐。
那個魔鬼細節就是,這一切,通通都得跑在 CUDA 上面。
這已經不只是商業策略了,老實說,這根本就是「生態系綁架」。它就有點像你買了 iPhone,然後你的手錶、耳機、電腦最好都用 Apple 的,不然就會這裡卡那裡不順。Nvidia 現在就在用 CUDA 幹一模一樣的事。一旦你所有的工具、程式碼、人才都習慣了 CUDA,你就再也離不開它了。這招,IBM 玩過,微軟也玩過。
中國的奇襲:DeepSeek 的省錢智慧
但另一邊,中國也沒閒著。有一家叫 DeepSeek 的公司,真的跌破很多人眼鏡。
他們證明了,要做出頂尖的 AI 模型,不一定需要最貴、最頂級的硬體。他們用的是美國出口管制下還能買到的 A800 GPU,花了大概...嗯...不到六百萬美金吧,就訓練出跟 GPT-4 差不多等級的模型。這在以前根本不敢想。
一開始大家還很懷疑,但後來越來越多的證據、甚至開源社群的複製實驗都證實了這件事。他們的 App 在中國的下載量甚至一度超過 ChatGPT。這背後其實是一種哲學:把「限制」當作創新的催化劑。很像 80 年代日本的工業奇蹟,不是嗎?
科技冷戰:兩大「技術堆疊」的對決
所以現在,全球的 AI 基礎設施,很明顯地分成了兩個互不相容的「超級技術堆疊」(Super-stacks)。
- 西方的 CUDA 堆疊:就是 Nvidia 的那一套,CUDA、cuDNN、TensorRT。速度極快,但天生封閉。你只能在它的地盤上玩。
- 東方的深圳堆疊:以華為的昇騰(Ascend)晶片、百度的飛槳(PaddlePaddle)平台為核心,搭配一堆針對自家硬體優化的編譯器。
這感覺就像回到當年的「瀏覽器大戰」,網頁在 IE 能跑,到 Netscape 就破圖。現在是 AI 模型在 CUDA 上優化得好好的,要搬到昇騰上面?祝你好運,大概率會壞掉,得花一堆工夫重寫。這種轉換的痛苦,只會越來越嚴重。
說到這個,我們在台灣,好像就剛好卡在這場風暴的中心。晶片是我們做的,但軟體生態系卻是美國或中國在定義。這種感覺其實蠻複雜的。台灣官方像國科會(NSTC)也在推自己的大型語言模型 [TAIDE],有點像規模小一點的「主權堆疊」思路,但要跟這兩大巨頭抗衡,老實說,路還很長。
| 企業雲端堆疊 (美國隊) | 主權堆疊 (中國隊) | 人民堆疊 (地球村) | |
|---|---|---|---|
| 由誰控制? | 就那幾家科技巨頭,像 Nvidia、Google、Microsoft。 | 國家力量主導,硬體到軟體都是自己人。 | 沒有單一控制者,由全球的開發者社群、DAO 組織共同擁有。 |
| 感覺像什麼? | 住在豪華飯店裡。很方便,但你不能決定飯店的規則,而且房租很貴。 | 一個有圍牆的巨大花園。裡面應有盡有,但你出不去,外面的人也進不來。 | 像一個熱鬧的戶外市集。有點亂,但充滿活力,你可以自己擺攤,甚至一起制定市集規則。 |
| 開發者體驗 | 工具超好用,API 文件完整,但你被鎖死了。想換一家?很難。 | 生態自成一格,跟外面世界不太一樣。功能強大,但有點孤立。 | 自由度最高,但也最需要自己動手。工具可能沒那麼成熟,得自己拼拼湊湊。 |
| 最大的坑? | 生態系綁架。你的資料、你的模型、你的成功,最終都鞏固了他們的帝國。 | 政治風險和隔離。你的技術可能沒辦法在全球市場上自由流通。 | 慢...而且混亂。社群協作的效率有時候真的比不上一個中央集權的公司。 |
第三條路:「人民堆疊」的崛起
sem
就在這兩大巨頭互撞的時候,第三條路正在悄悄成形。它的精神,更像是早期網際網路、開源運動那種理想主義。我喜歡叫它「人民堆疊」(The People's Stack)。
它不是一家公司,而是一個架構,建立在三個看不見的巨人肩膀上:用 Linux 作為開放的基礎設施,用 Web3 技術來做去中心化的協調和所有權分配,再用社群主導的開源 AI 模型當作大腦。
這聽起來很抽象,但它是由一些很具體的東西組成的:
- 擺脫 CUDA 的算力:像 UXL Foundation 這樣的組織,就在推動 Intel 的 oneAPI,目標是讓 GPU 計算不再被 Nvidia 一家綁架。
- 去中心化的 AI 訓練:有個叫 Bittensor 的網路,它讓世界各地的人貢獻自己的算力來一起訓練模型,然後用加密貨幣作為獎勵。很酷吧。
- 開放權重的模型:像 LLaMA、Mistral、Yi 這些模型,它們的「權重」(就像模型的大腦)是開放的,任何人都可以下載、修改、使用,而不是只能透過 API 去呼叫。
- 保護隱私的計算:有一種叫「零知識機器學習」(ZKML)的技術,可以在不洩漏你原始資料的情況下,去驗證 AI 的計算結果。這對隱私超級重要。
- 社群自治:透過 DAO(去中心化自治組織)的形式,由社群成員共同投票決定要資助哪個模型的開發、要用哪些資料集。
有趣的是,不管是 CUDA 帝國,還是深圳堆疊,甚至是 Bittensor,你知道它們底層幾乎都跑在什麼作業系統上嗎?Linux。這個安靜的巨人,才是這一切的真正基石。
在這條路上,我們可以蓋些什麼?
所以,如果我們不選邊站,而是走這第三條路,到底能做出什麼不一樣的東西?這是我自己覺得最興奮的部分。這不是空想,很多東西已經有人在做了。
另一種瀏覽器(People's Clients)
想像一下,你的瀏覽器內建一個本地跑的 LLaMA 模型,它可以幫你總結網頁、管理分頁,但完全不需要把你的瀏覽紀錄傳到雲端。你的搜尋引擎是 P2P 的,搜尋結果的排序由社群決定,而不是廣告費。這有可能嗎?當然。用 WebAssembly、IPFS 這些技術,結合本地 AI 模型,就能做到。
去中心化的社交平台
不用再忍受演算法餵給你的烏煙瘴氣。你的動態牆可以由 Farcaster 或 Nostr 這樣的去中心化協定驅動,再用你自己的本地 AI 模型去過濾你真正想看的內容。沒有中間商賺差價,也沒有演算法為了流量而挑撥離間。
真正屬於我們的文化藝術
現在的 AI 畫圖,風格很容易被那幾家大公司的模型所定義。但如果我們可以用 DAO 來集資,訓練專屬於特定文化的生成模型呢?比如一個專門生成台灣廟宇慶典風格、或是原住民圖騰風格的 AI?藝術的解釋權,應該回到創作者和文化本身手上。
這只是幾個例子。還有離線也能運作的 AI 助手、保護吹哨人的匿名工具、由社群共同治理的 AI 倫理規範... 可能性是無限的。
所以,我們到底要什麼?
寫到這裡,感覺思緒有點亂... 但核心問題其實很清楚。
在我們衝向 AI 未來的路上,我們得問自己一個問題:「我們想要的,是服務於人的工具,還是服務於工具的人?」
企業的雲端帝國很方便,但我們會變成數據的奴隸。主權的科技長城很強大,但我們會失去與世界連結的自由。「人民堆疊」這條路,走起來可能很慢、很顛簸、甚至有點混亂,但它至少給了我們一個選擇——一個建立我們真正擁有、真正能反映我們價值觀的 AI 未來的選擇。
這不只是技術之爭,我覺得,這是價值觀之爭。下一個時代的勝負,不會只看誰的 GPU 多,而是看誰能建立起更強大、更有韌性的人類網路和機器網路。我希望,那個網路是為我們服務的。
那你呢?看完這三條路,你覺得哪一條更吸引你?或者你看到了第四條路?在下面留言聊聊吧。
