Jensen Huang: NVIDIA - The $4 Trillion Company & the AI Revolution

對談由 Lex Fridman 主持，邀請到 NVIDIA（輝達）執行長 Jensen Huang（黃仁勳） 分享這家公司如何在人類文明史上成為推動 AI 革命的引擎。對談探討了 NVIDIA 從晶片設計轉向機櫃規模乃至數據中心規模設計的過程，並深入剖析了領導力、工程哲學以及人工智慧的未來 [00:00]。

NVIDIA 的成功現在建立在 極致協同設計 (Extreme Co-design) 的基礎之上。Huang 指出，之所以需要這種方法，是因為目前的計算問題已經龐大到無法裝進單一電腦或由單一 GPU 加速 [01:11]。為了解決這種規模的問題，必須對演算法進行重構，將管線、數據與模型進行 分片 (Sharding)。在這種分散式運算的規模下，阿姆達爾定律 (Amdahl's Law) 成為核心挑戰：如果計算僅占問題的 50%，即便將計算速度提升無限倍，整體工作負載的速度也僅能提升兩倍。因此，NVIDIA 必須將技術觸角延伸至網路、交換機、CPU、記憶體，甚至是電源冷卻與數據中心基礎設施 [02:00]。這種設計難度極高，因為在 丹納德縮放定律 (Dennard Scaling) 放緩、摩爾定律 (Moore's Law) 減速的背景下，若不進行全疊層優化，運算規模只能線性成長，無法達成飛躍 [03:13]。

在組織管理上，Huang 的直屬部下超過 60 人，且幾乎全是工程背景的專家。他從不進行一對一面談，而是採取全體參與的問題解決模式 [05:43]。當面對如冷卻或電源分配等特定組件的問題時，所有領域的專家都會在場聆聽並貢獻意見，這種透明的溝通方式確保了系統整體的協調性。Huang 認為，公司的組織架構應該反映其產出的產品，而非盲目模仿傳統的企業層級 [05:02]。

回顧 NVIDIA 的歷史，這家公司最初是定位為特定領域的加速器公司。Huang 解釋，極度專業化雖能帶來優化優勢，但也限制了市場規模與研發能力 [07:32]。為了擴張，NVIDIA 必須在「運算公司」的通用性與「加速器」的專業性之間尋找狹窄的平衡點。關鍵的第一步是發明了可程式化的像素著色器，隨後又在著色器中加入 IEEE 相容單精度浮點數 (IEEE-compatible FP32)。這一決定讓數據流處理器開發者發現 GPU 可用於通用計算 [09:25]。

緊接著，NVIDIA 做出了最具風險的戰略決策：將 CUDA 架構下放到 GeForce 消費級顯示卡中。當時這個決定讓公司的利潤大幅縮減，且不被當時的遊戲玩家理解，公司的市值甚至一度跌至 15 億美元 [10:52]。Huang 堅持這項投資的原因在於，他深知「安裝量」才是一個運算架構能否生存的關鍵。他舉例指出，儘管 x86 架構在美學上不如許多 RISC（精簡指令集電腦）架構優雅，但憑藉龐大的安裝量，它成為了定義時代的架構。透過讓每一位研究人員與學生都能在自己的 PC 上使用運算能力，NVIDIA 建立了無法動搖的開發者生態系統 [12:04]。

Huang 描述自己的決策過程是基於「推理系統」來顯現未來。他不會突如其來地宣佈重大轉變，而是花費數年時間逐步塑造員工的信念體系。他透過每日的交流，確保當決定收購 Mellanox 或全力投入深度學習的那一天到來時，對全體員工而言，這個決策已是理所當然的下一步 [17:21]。他甚至開玩笑說，當他最終宣布決策時，員工的反應往往是：「Jensen，你怎麼拖了這麼久？」 [20:30]。NVIDIA 的角色並非單純銷售電腦或雲端服務，而是一個垂直設計、水平整合的運算平台，這種特質讓它必須先說服整個產業鏈相信未來，產品才能成功 [21:53]。

談到 AI 的未來，Huang 提出了四種 縮放定律 (Scaling Laws)。第一是 預訓練 (Pre-training)：雖然有人擔心數據即將枯竭，但 Huang 認為未來將轉向 合成數據 (Synthetic Data)。由於人類產生的數據本質上也是經過加工的，AI 能夠根據地面事實生成大量高品質數據，這使得訓練不再受限於數據，而是受限於算力 [23:12]。第二是 後訓練 (Post-training) 的持續優化。第三則是 推理時間縮放 (Test-time Scaling)：Huang 強調「思考」遠比「閱讀」困難，推理過程涉及計劃、搜尋與問題分解，這是極度消耗算力的過程 [26:14]。最後是 代理程式縮放 (Agentic Scaling)：這涉及 AI 自動產生子代理程式來組成大型團隊協作，這將是下一個成長點 [27:36]。

為了因應這些變化，NVIDIA 必須具備預測未來二至三年的眼光。例如，當 混合專家模型 (Mixture of Experts, MoE) 出現時，NVIDIA 隨即推出了 NVLink 72，讓高達數兆參數的模型能像在單一 GPU 上運行一樣 [29:55]。Huang 將 AI 比喻為「數位勞工」，指出它們會像人類一樣使用工具，如 OpenClaw 這類代理程式系統，將改變人類與電腦互動的方式 [34:35]。

在基礎設施方面，電力是顯而易見的瓶頸。Huang 推動極致協同設計以提升每瓦代幣產出速度，儘管單機價格上升，但生成單一 代幣 (Token) 的成本每年都在下降 [37:53]。他提出一個創新的電力解決方案：電網 99% 的時間都在為了應付極端情況而保留閒置電力。數據中心應與電網達成協議，在社會用電高峰期自動降級運作或轉移負載，僅利用這些閒置電力運算，從而減少浪費 [47:38]。

Huang 高度評價了 Elon Musk（馬斯克）及其 xAI 團隊在四個月內建成 Colossus 超級電腦的壯舉。他認為 Musk 是極致的系統思考者，能夠質疑每一項既定流程，將效率推向極限。這種個人深度參與並帶著迫切感行動的領導風格，促使所有供應商都將其視為最高優先 [53:15]。這與 Huang 提倡的「光速思維」相呼應：不應只追求持續改進，而應從物理極限出發思考某項任務最快能達成什麼程度，再回推解決方案 [56:55]。

關於全球科技格局，Huang 指出中國在技術領域極具競爭力。這源於其優秀的理工教育、激烈的內部競爭，以及一種以家庭和朋友為核心的社會文化，這使得知識在同儕與不同公司間流傳極快。這種文化天然契合開源社群，加速了創新過程 [01:02:05]。NVIDIA 本身也致力於開源，如發佈 Nemotron-3 模型與權重。Huang 解釋，這不僅是為了讓 AI 擴散到各行各業，也是協同設計策略的一環：透過理解各種模型架構（如 SSM 或 Transformer）的演進，NVIDIA 才能設計出對應的硬體 [01:05:52]。

在供應鏈上，NVIDIA 與 TSMC（台積電） 的關係極其深厚。Huang 認為 TSMC 最珍貴的資產並非電晶體技術，而是其編織全球數百家公司動態需求的能力。雙方合作三十年，處理過數千億美元的業務，卻從未簽署過正式合約，這種基於人際關係的「信任」是不可取代的 [01:10:29]。Huang 也證實了在 2013 年曾受邀擔任 TSMC 執行長的傳聞，雖然深感榮幸，但他當時已看見 NVIDIA 未來的使命而婉拒 [01:13:18]。

Huang 認為 NVIDIA 未來的成長是必然的。運算模式已從「檔案檢索」轉向「實時生成」，電腦不再只是倉庫，而是生產代幣的「工廠」 [01:24:45]。隨著代幣展現出不同層級的價值（如 iPhone 代幣），智慧將成為一種商品。他預測 NVIDIA 未來的營收有可能達到 3 兆美元，因為人類對生產力提升的需求是無上限的 [01:30:10]。

針對工作被取代的焦慮，Huang 以放射科醫師為例。儘管電腦視覺在多年前就已超越人類，但放射科醫師的人數不減反增。原因在於工作「任務」被自動化後，醫師能診斷更多病人，創造更多價值。他認為未來每一位木匠、電工或護理師都應該成為 AI 的專家，利用 AI 提升自己的專業門檻 [01:58:40]。程式開發的定義也將擴張，從目前的 3000 萬人增加到 10 億人，因為未來的程式編寫本質上就是「規格定義」 [02:01:52]。

在個人層面上，Huang 分享了他應對壓力的方法：將複雜問題分解，並將負擔與團隊分享。他提倡「有系統地遺忘」，不讓過去的失敗或尷尬絆住腳步 [01:34:39]。他自嘲自己的第一份工作是洗廁所，這種背景讓他保持謙卑。他對死亡感到恐懼，因為他熱愛現在的工作與家庭，但他不相信傳統的繼任計劃；相反地，他選擇在每一場會議中毫無保留地分享自己的洞察與思維過程，藉此賦能給身邊的 60 位專家，希望自己能工作到生命最後一刻 [02:18:31]。

Huang 最後表達了對人性的信心。他認為「智慧」即將成為廉價商品，而真正該被推崇的是「人性」——包含同情心、慷慨與堅韌的性格。他對未來充滿浪漫的期待，認為我們正處於一個能夠解決疾病、減少污染、甚至利用 AI 探索物理奧秘的時代。他開玩笑說，未來他會把自己的意識上傳到網路，並以光速發射出去，去追趕在宇宙探索中的機器人 [02:23:17]。對談在 Huang 對長格式深度對談價值的肯定中圓滿結束 [02:25:27]。

Jensen Huang: NVIDIA - The $4 Trillion Company & the AI Revolution | Lex Fridman Podcast #494