![]()
2026年6月1日,英偉達(NVIDIA)與臺積電(TSMC)在GTC Taipei大會上聯合宣布,臺積電正在將英偉達的加速計算和人工智能技術全面引入晶圓廠,從計算光刻、晶體管仿真到缺陷檢測和工廠運營優化,系統性地提升先進半導體制造的效率與良率。這一合作標志著全球最頂尖的芯片設計公司與最領先的半導體制造廠商,在AI時代形成了一種全新的深度協同模式。
黃仁勛指出:“英偉達與臺積電攜手合作近三十載,不斷突破計算技術的極限。臺積電將英偉達人工智能與加速計算技術落地到晶圓廠生產環節,依托仿真、優化及人工智能技術攻克全球頂尖的設計與制造難題,為新一代芯片提速、增效、提良。”
臺積電董事長兼首席執行官魏哲家也表示:“臺積電與英偉達建立了長期穩固的合作關系,雙方始終深耕前沿技術,為下一代計算產業發展筑牢根基。在晶圓廠運營優化、光刻、制程控制與檢測等環節應用英偉達加速計算和人工智能技術,將進一步鞏固我們的技術領先優勢與頂尖制造能力。”
一、CUDA-X庫全面賦能
隨著芯片向更先進的制程節點演進,將其從設計階段推向規模化量產,已成為全球最復雜的計算挑戰之一。而先進的半導體設計與制造需要龐大的計算負載和高度協調的晶圓廠運營能力,涵蓋芯片設計轉移、晶體管建模、工藝控制和晶圓生產力。
![]()
臺積電作為全球晶圓制造龍頭,目前正在利用英偉達的CUDA-X庫和AI模型,在多個關鍵領域加速其工作負載:
1. 計算光刻:cuLitho提升20-50%成本效益
眾所周知,光刻是芯片制造過程中最復雜、最昂貴、最關鍵的環節。數據顯示,光刻環節所需的成本占據整個硅片加工成本的約1/3甚至更多。而計算光刻則是模擬了光通過光學元件并與光刻膠相互作用時的行為,應用逆物理算法來預測掩膜板上的圖案,以便在晶圓上生成最終圖案。
![]()
在2023年3月的英偉達GTC大會上,黃仁勛就宣布推出了面向芯片制造行業的突破性技術——NVIDIA cuLitho計算光刻庫。
黃仁勛當時就解釋稱,“計算光刻則是芯片設計和制造領域中最大的計算工作負載,每年消耗數百億CPU小時。大型數據中心24x7全天候運行,以便創建用于光刻系統的掩膜板。這些數據中心是芯片制造商每年投資近2000億美元的資本支出的一部分。”cuLitho能夠將計算光刻的速度提高到原來的40倍。舉例來說,英偉達H100 GPU的制造需要89塊掩膜板,在CPU上運行時,處理單個掩膜板需要兩周時間,而在GPU上運行cuLitho只需8小時。
臺積電正在使用英偉達的cuLitho計算光刻庫,相比傳統基于CPU的方案,該技術在不增加擁有成本的前提下,將成本效益或生產周期優化了20%至50%。據行業分析,這一改進可能幫助臺積電在光刻環節節省大量時間和資本支出。
2. 晶體管仿真:cuEST實現50倍加速
隨著芯片制程逼近原子尺度,半導體設計已不再只是畫電路圖,而需要在原子層面上回答基礎物理問題:電子如何鍵合?如何遷移?它們在僅有數個原子厚度的薄膜中如何相互作用?一個先進芯片包含超過500億個晶體管,每一個晶體管的性能都取決于這些量子力學層面的精確控制。
傳統上,業界依賴CPU集群運行密度泛函理論(DFT)仿真來評估候選材料(如柵極介電質、互連金屬等),通常需要數小時甚至數天才能完成一批次計算。這種方式導致材料篩選成為芯片研發的瓶頸環節。
cuEST是英偉達專為GPU加速設計的量子化學庫,它優化了基于高斯基組的DFT計算中的核心矩陣運算,包括重疊積分、動能、核吸引、庫侖以及交換關聯等。cuEST支持從標準廣義梯度近似(GGA)到雜化泛函等多種近似方法,使工程師能夠在計算成本與精度之間靈活權衡。
同時,cuEST的API設計遵循“顯式構建”原則——用戶需要明確定義每個基函數的角動量、指數和收縮系數,系統會“照單全收”地構建內部數據結構。這種設計雖然增加了使用復雜度,但賦予了研究人員對計算過程的完全控制權,確保了工業級仿真的可重復性和精度。
據英偉達介紹,臺積電在半導體材料設計領域,已經開始使用英偉達cuEST電子結構仿真庫,實現了化學仿真速度平均50倍的提升。這一突破大幅縮短了新材料的研發周期。此外,應用材料、三星、新思科技也已經采用了該技術。
3. 先進制程控制:cuML減少工藝變異
當前,一顆先進制程芯片需要經歷數千道生產工序,涉及數十萬項制程參數的精確控制。臺積電已經借助英偉達cuML機器學習庫,在GPU上加速大規模數據分析,將這些制程參數精準輸入機器學習模型,實現工藝變異的顯著降低。這對于3nm及以下制程尤為重要——在這些節點上,微小的工藝波動都可能導致顯著的性能差異或良率損失。
具體來說,從晶圓制造到封裝測試,半導體生產的每個階段都會產生TB級數據。這些數據來自多個源頭:晶圓級量測數據;電路探針測試的芯片級數據、封裝單元的功能測試數據等。
傳統CPU數據處理工作流程面對如此規模的數據往往不堪重負。英偉達cuML的核心價值在于:將這些數據處理和模型訓練從CPU遷移到GPU,實現5到30倍的加速。
此外,半導體制造中面臨一個特殊的數據科學難題:極端的類別不平衡。在某些芯片系列中,超過99%的單元通過測試,只有一小部分單元失敗。這導致標準機器學習算法會偏向“多數類”——模型學會預測“全部合格”,準確率仍可達99%,但對真正有價值的“缺陷預測”毫無用處。
而英偉達cuML提供了一套完整的GPU加速機器學習工作流:
1)數據重采樣技術。SMOTE(合成少數類過采樣技術):生成合成的缺陷樣本,平衡數據集。cuML的NearestNeighbors實現比傳統scikit-learn快2到8倍;分層下采樣:使用cuDF的groupby操作在GPU上快速完成
2)適合不平衡數據的評估指標。傳統ROC曲線會因不平衡數據產生誤導。cuML支持精確率-召回率曲線(Precision-Recall Curve)和加權精度等更適合制造場景的指標;加權精度公式:acc = (缺陷準確率 + 合格準確率) / 2,給予兩個類別同等權重。
3)模型可解釋性。cuML支持特征重要性分析和GPU加速的SHAP值計算。這使工藝工程師能夠理解模型為何做出某個預測,識別高影響力參數,甚至消除冗余的測試步驟,直接節省成本。
總結來說,通過cuML驅動的先進制程控制,臺積電能夠:實時梳理數十萬項制程參數之間的復雜關聯;精準預測工藝波動趨勢,在問題發生前進行調整;系統性地降低工藝變異,提升良率一致性。
4. 晶圓廠運營優化:GPU驅動排程計算
臺積電的先進半導體晶圓廠是全球最復雜的制造設施之一,需要實現生產設備、物料、機械臂、工作人員及廠區配套系統的精密協同,這當中就會涉及到晶圓廠的排程優化問題,這是一個典型的大規模組合優化問題:
數百臺昂貴設備,每臺設備有不同的工藝能力;
數千批晶圓同時處于生產流程的不同階段;
復雜的工藝約束:設備兼容性、批量大小、重入流程(同一設備多次使用);
動態擾動:設備故障、緊急訂單、工藝變更。
傳統基于CPU的排程系統受限于計算能力,往往只能采用啟發式規則進行近似優化,無法在大規模搜索空間中找到全局最優解。目前,臺積電正利用CUDA架構進行GPU加速排程運算,搭配H200 GPU,臺積電實現了:
1)并行搜索:GPU的數千個核心可同時評估大量排程方案,在相同時間內探索遠超CPU的搜索空間;
2)復雜約束建模:H200的大容量高速內存(141GB HBM3e)使系統能夠加載完整的生產狀態和約束條件,進行更高精度的優化。
3)實時響應:當發生設備故障等擾動時,GPU加速的排程系統可在數分鐘內生成重新優化方案,而傳統系統可能需要數小時。
總結來說,利用CUDA架構進行GPU加速排程運算,搭配英偉達H200 GPU,臺積電顯著提升了晶圓廠的生產效率。通過優化管理復雜生產約束,臺積電能夠精簡生產流程,在不增加產線的情況下,最大化廠區產能,提升運營效率。
二、AI視覺檢測:Metropolis平臺賦能納米級缺陷檢測
隨著芯片工藝愈發精密,即便是微小瑕疵也會影響產品品質與良率。過去,芯片制造商主要依賴卷積神經網絡(CNN)來自動執行缺陷分類。然而,隨著制造業規模擴大和產品多樣化,基于CNN的方法正逐漸逼近其能力極限,因為其需要大量標注數據集,頻繁重新訓練,仍難以應對新型缺陷實現有效泛化。
目前臺積電正在采用英偉達Metropolis平臺的視覺語言模型 (VLM)、視覺基礎模型 (VFM) 以及英偉達TAO 微調工具包,實現缺陷分類的現代化,并具有少量樣本學習、能夠生成具備可解釋性的結果、自動數據標記、時間序列和批次級別分析等優勢。
![]()
△不同圖像類型的示例,可用于通過視覺語言模型 (VLM) 和視覺基礎模型 (VFM) 增強的自動缺陷分類 (ADC) 系統。圖中包含晶圓缺陷圖,以及在光學、電子束和光學顯微鏡 (OM) 圖像中發現的多種裸片級缺陷。
![]()
△左側展示了 Cosmos Reason VLM 如何自動將其分類為中心環晶圓缺陷,并歸因于化學污染。右側展示了自動標注方法如何加速訓練過程,同時簡化缺陷分析并減少人工視覺檢查的工作量。
據介紹,這套基于視覺人工智能的方案,使臺積電實現了納米級缺陷檢測能力的提升。更重要的是,當生產環境、檢測設備及缺陷類型發生變化時,該方案能顯著減少數據標注與模型重新訓練的工作量,大幅提升了質檢的適應性和效率。
英偉達也指出,一家領先的半導體制造商在一項研究中采用英偉達 TAO 工具套件,利用芯片生產過程中多層收集的無標記圖像,將自監督學習(SSL)應用于 NV-DINOv2。相比未使用 SSL 訓練的模型,引入 SSL 后性能實現持續提升,準確率最高提升達 8.9%,工作效率隨之提高達 9.9%。
三、數字孿生:探索“FabTwin”虛擬晶圓廠
正如前面所提及的,高端半導體晶圓廠是目前結構最為復雜的工業設施之一,需要實現生產設備、物料、機械臂、工作人員及廠區配套系統的精密協同。除了導入英偉達GPU驅動排程計算之外,臺積電還在探索運用英偉達Omniverse庫搭建晶圓廠數字孿生“FabTwin”——一個虛擬晶圓廠環境,用于評估生產設備布局及相關仿真工作流。
在實體落地前通過數字化方式測試各類設計方案,臺積電能夠更靈活地對比復雜布局,提前排查潛在運行瓶頸。這種“先虛擬、后實體”的模式大幅提升了規劃效率,在投入實體建設與資金前加快關鍵決策落地。
小結:
此次臺積電全面導入英偉達加速計算和AI技術,標志著英偉達與臺積電的關系進入了一個全新階段。行業分析指出,這種合作已形成“三層鎖定”:客戶集中(英偉達已成為臺積電最大客戶)、產能鎖定(英偉達預定了大部分先進制程及CoWoS先進封裝產能)以及工具整合(cuLitho等制造工具深度嵌入臺積電流程)。這意味著英偉達不僅作為客戶購買臺積電的產能,更是在與臺積電共同設計制造流程本身。
值得一提的是,當前正值臺積電全球產能高速擴張期,這也帶來了巨大的資本支出。臺積電2026年資本支出將推高至520億至560億美元區間,涉及在美光亞利桑那州、日本和德國同步建廠擴產,而這些海外晶圓廠建設和運營成本預計將遠高于中國臺灣同等設施。而AI優化制造帶來的效率提升,有望幫助臺積電部分抵消這些成本壓力。
正如英偉達官方新聞稿所述,臺積電利用英偉達AI和加速計算技術,正“應對全球最具挑戰性的設計與制造難題”。隨著AI從云端下沉到物理世界,這場始于芯片設計、延伸至制造流程的深度協同,正在為下一代計算奠定堅實的基礎。
編輯:芯智訊-浪客劍
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.