Jensen Huang: NVIDIA - The $4 Trillion Company & the AI Revolution | Lex Fridman Podcast #494

2026年4月11日 · 約 5 分鐘閱讀 · 02:25:58 · en
影片封面
YouTube · 02:25:58

對談由 Lex Fridman 主持,邀請到 NVIDIA(輝達)執行長 Jensen Huang(黃仁勳) 分享這家公司如何在人類文明史上成為推動 AI 革命的引擎。對談探討了 NVIDIA 從晶片設計轉向機櫃規模乃至數據中心規模設計的過程,並深入剖析了領導力、工程哲學以及人工智慧的未來 [00:00]

NVIDIA 的成功現在建立在 極致協同設計 (Extreme Co-design) 的基礎之上。Huang 指出,之所以需要這種方法,是因為目前的計算問題已經龐大到無法裝進單一電腦或由單一 GPU 加速 [01:11]。為了解決這種規模的問題,必須對演算法進行重構,將管線、數據與模型進行 分片 (Sharding)。在這種分散式運算的規模下,阿姆達爾定律 (Amdahl's Law) 成為核心挑戰:如果計算僅占問題的 50%,即便將計算速度提升無限倍,整體工作負載的速度也僅能提升兩倍。因此,NVIDIA 必須將技術觸角延伸至網路、交換機、CPU、記憶體,甚至是電源冷卻與數據中心基礎設施 [02:00]。這種設計難度極高,因為在 丹納德縮放定律 (Dennard Scaling) 放緩、摩爾定律 (Moore's Law) 減速的背景下,若不進行全疊層優化,運算規模只能線性成長,無法達成飛躍 [03:13]

在組織管理上,Huang 的直屬部下超過 60 人,且幾乎全是工程背景的專家。他從不進行一對一面談,而是採取全體參與的問題解決模式 [05:43]。當面對如冷卻或電源分配等特定組件的問題時,所有領域的專家都會在場聆聽並貢獻意見,這種透明的溝通方式確保了系統整體的協調性。Huang 認為,公司的組織架構應該反映其產出的產品,而非盲目模仿傳統的企業層級 [05:02]

回顧 NVIDIA 的歷史,這家公司最初是定位為特定領域的加速器公司。Huang 解釋,極度專業化雖能帶來優化優勢,但也限制了市場規模與研發能力 [07:32]。為了擴張,NVIDIA 必須在「運算公司」的通用性與「加速器」的專業性之間尋找狹窄的平衡點。關鍵的第一步是發明了可程式化的像素著色器,隨後又在著色器中加入 IEEE 相容單精度浮點數 (IEEE-compatible FP32)。這一決定讓數據流處理器開發者發現 GPU 可用於通用計算 [09:25]

緊接著,NVIDIA 做出了最具風險的戰略決策:將 CUDA 架構下放到 GeForce 消費級顯示卡中。當時這個決定讓公司的利潤大幅縮減,且不被當時的遊戲玩家理解,公司的市值甚至一度跌至 15 億美元 [10:52]。Huang 堅持這項投資的原因在於,他深知「安裝量」才是一個運算架構能否生存的關鍵。他舉例指出,儘管 x86 架構在美學上不如許多 RISC(精簡指令集電腦)架構優雅,但憑藉龐大的安裝量,它成為了定義時代的架構。透過讓每一位研究人員與學生都能在自己的 PC 上使用運算能力,NVIDIA 建立了無法動搖的開發者生態系統 [12:04]

Huang 描述自己的決策過程是基於「推理系統」來顯現未來。他不會突如其來地宣佈重大轉變,而是花費數年時間逐步塑造員工的信念體系。他透過每日的交流,確保當決定收購 Mellanox 或全力投入深度學習的那一天到來時,對全體員工而言,這個決策已是理所當然的下一步 [17:21]。他甚至開玩笑說,當他最終宣布決策時,員工的反應往往是:「Jensen,你怎麼拖了這麼久?」 [20:30]。NVIDIA 的角色並非單純銷售電腦或雲端服務,而是一個垂直設計、水平整合的運算平台,這種特質讓它必須先說服整個產業鏈相信未來,產品才能成功 [21:53]

談到 AI 的未來,Huang 提出了四種 縮放定律 (Scaling Laws)。第一是 預訓練 (Pre-training):雖然有人擔心數據即將枯竭,但 Huang 認為未來將轉向 合成數據 (Synthetic Data)。由於人類產生的數據本質上也是經過加工的,AI 能夠根據地面事實生成大量高品質數據,這使得訓練不再受限於數據,而是受限於算力 [23:12]。第二是 後訓練 (Post-training) 的持續優化。第三則是 推理時間縮放 (Test-time Scaling):Huang 強調「思考」遠比「閱讀」困難,推理過程涉及計劃、搜尋與問題分解,這是極度消耗算力的過程 [26:14]。最後是 代理程式縮放 (Agentic Scaling):這涉及 AI 自動產生子代理程式來組成大型團隊協作,這將是下一個成長點 [27:36]

為了因應這些變化,NVIDIA 必須具備預測未來二至三年的眼光。例如,當 混合專家模型 (Mixture of Experts, MoE) 出現時,NVIDIA 隨即推出了 NVLink 72,讓高達數兆參數的模型能像在單一 GPU 上運行一樣 [29:55]。Huang 將 AI 比喻為「數位勞工」,指出它們會像人類一樣使用工具,如 OpenClaw 這類代理程式系統,將改變人類與電腦互動的方式 [34:35]

在基礎設施方面,電力是顯而易見的瓶頸。Huang 推動極致協同設計以提升每瓦代幣產出速度,儘管單機價格上升,但生成單一 代幣 (Token) 的成本每年都在下降 [37:53]。他提出一個創新的電力解決方案:電網 99% 的時間都在為了應付極端情況而保留閒置電力。數據中心應與電網達成協議,在社會用電高峰期自動降級運作或轉移負載,僅利用這些閒置電力運算,從而減少浪費 [47:38]

Huang 高度評價了 Elon Musk(馬斯克)及其 xAI 團隊在四個月內建成 Colossus 超級電腦的壯舉。他認為 Musk 是極致的系統思考者,能夠質疑每一項既定流程,將效率推向極限。這種個人深度參與並帶著迫切感行動的領導風格,促使所有供應商都將其視為最高優先 [53:15]。這與 Huang 提倡的「光速思維」相呼應:不應只追求持續改進,而應從物理極限出發思考某項任務最快能達成什麼程度,再回推解決方案 [56:55]

關於全球科技格局,Huang 指出中國在技術領域極具競爭力。這源於其優秀的理工教育、激烈的內部競爭,以及一種以家庭和朋友為核心的社會文化,這使得知識在同儕與不同公司間流傳極快。這種文化天然契合開源社群,加速了創新過程 [01:02:05]。NVIDIA 本身也致力於開源,如發佈 Nemotron-3 模型與權重。Huang 解釋,這不僅是為了讓 AI 擴散到各行各業,也是協同設計策略的一環:透過理解各種模型架構(如 SSM 或 Transformer)的演進,NVIDIA 才能設計出對應的硬體 [01:05:52]

在供應鏈上,NVIDIA 與 TSMC(台積電) 的關係極其深厚。Huang 認為 TSMC 最珍貴的資產並非電晶體技術,而是其編織全球數百家公司動態需求的能力。雙方合作三十年,處理過數千億美元的業務,卻從未簽署過正式合約,這種基於人際關係的「信任」是不可取代的 [01:10:29]。Huang 也證實了在 2013 年曾受邀擔任 TSMC 執行長的傳聞,雖然深感榮幸,但他當時已看見 NVIDIA 未來的使命而婉拒 [01:13:18]

Huang 認為 NVIDIA 未來的成長是必然的。運算模式已從「檔案檢索」轉向「實時生成」,電腦不再只是倉庫,而是生產代幣的「工廠」 [01:24:45]。隨著代幣展現出不同層級的價值(如 iPhone 代幣),智慧將成為一種商品。他預測 NVIDIA 未來的營收有可能達到 3 兆美元,因為人類對生產力提升的需求是無上限的 [01:30:10]

針對工作被取代的焦慮,Huang 以放射科醫師為例。儘管電腦視覺在多年前就已超越人類,但放射科醫師的人數不減反增。原因在於工作「任務」被自動化後,醫師能診斷更多病人,創造更多價值。他認為未來每一位木匠、電工或護理師都應該成為 AI 的專家,利用 AI 提升自己的專業門檻 [01:58:40]。程式開發的定義也將擴張,從目前的 3000 萬人增加到 10 億人,因為未來的程式編寫本質上就是「規格定義」 [02:01:52]

在個人層面上,Huang 分享了他應對壓力的方法:將複雜問題分解,並將負擔與團隊分享。他提倡「有系統地遺忘」,不讓過去的失敗或尷尬絆住腳步 [01:34:39]。他自嘲自己的第一份工作是洗廁所,這種背景讓他保持謙卑。他對死亡感到恐懼,因為他熱愛現在的工作與家庭,但他不相信傳統的繼任計劃;相反地,他選擇在每一場會議中毫無保留地分享自己的洞察與思維過程,藉此賦能給身邊的 60 位專家,希望自己能工作到生命最後一刻 [02:18:31]

Huang 最後表達了對人性的信心。他認為「智慧」即將成為廉價商品,而真正該被推崇的是「人性」——包含同情心、慷慨與堅韌的性格。他對未來充滿浪漫的期待,認為我們正處於一個能夠解決疾病、減少污染、甚至利用 AI 探索物理奧秘的時代。他開玩笑說,未來他會把自己的意識上傳到網路,並以光速發射出去,去追趕在宇宙探索中的機器人 [02:23:17]。對談在 Huang 對長格式深度對談價值的肯定中圓滿結束 [02:25:27]

· · ·