在游戲畫面追求極致清晰、AI大模型高效運行的今天,“超分”(Super Resolution)和“超采”(Super Sampling)已成為提升視覺體驗和計算效率的關(guān)鍵技術(shù)。NVIDIA的DLSS 4.5和AMD的FSR 'Redstone''等前沿方案,正將AI深度融入圖形渲染和推理計算中。然而,這些技術(shù)的核心——計算精度卻常常被忽略,它直接影響圖像質(zhì)量、性能表現(xiàn)以及AI模型的實際效果。
![]()
超分與超采:從低分辨率到高品質(zhì)畫面的魔法
超分辨率(Super Resolution,簡稱超分)是指通過算法將低分辨率圖像智能提升到更高分辨率的過程,而超采樣(Super Sampling)則是在渲染時以更高采樣率生成圖像,再通過技術(shù)優(yōu)化輸出。傳統(tǒng)方法依賴手工規(guī)則,容易出現(xiàn)模糊、鋸齒或閃爍等問題。
![]()
AI的加入徹底改變了游戲規(guī)則。NVIDIA DLSS 4.5采用第二代Transformer AI模型,利用游戲引擎的運動數(shù)據(jù)、像素采樣和海量高保真數(shù)據(jù)集進(jìn)行訓(xùn)練。它不僅能從低分辨率幀中重建細(xì)節(jié),還在線性空間中直接處理光照,避免了傳統(tǒng)TAA(時間抗鋸齒)在對數(shù)空間中導(dǎo)致的高光壓制和細(xì)節(jié)丟失問題。結(jié)果是邊緣更銳利、運動更清晰、光照更真實。
![]()
AMD的FSR 'Redstone''同樣轉(zhuǎn)向機器學(xué)習(xí)驅(qū)動。它在RDNA 4架構(gòu)上優(yōu)化,通過神經(jīng)網(wǎng)絡(luò)從低分辨率幀重建高品質(zhì)畫面,并在4.1版本中提升了銳度和穩(wěn)定性,尤其現(xiàn)在還下放支持老款RDNA3顯卡通過INT8計算適配。這兩者都體現(xiàn)了“用AI智能填補采樣不足”的理念,讓玩家在高幀率下也能享受接近原生分辨率的畫質(zhì)。
![]()
AI推理中的計算精度:精度 vs 效率的平衡藝術(shù)
AI推理計算的精度,本質(zhì)上是數(shù)據(jù)表示的“位寬”問題。傳統(tǒng)訓(xùn)練常用FP32(32位浮點),精度高但計算和內(nèi)存開銷巨大。在實時性要求極高的圖形超分和大型語言模型推理中,這顯然不可行。
![]()
于是,低精度格式登場:FP16、BF16、FP8乃至INT8。這些格式通過減少每個數(shù)值的比特數(shù),大幅降低內(nèi)存占用和計算量,同時借助硬件加速(如Tensor Core)實現(xiàn)更高吞吐量。例如,INT8可將內(nèi)存需求減半,計算速度提升數(shù)倍,特別適合已訓(xùn)練好的模型推理階段。
![]()
在DLSS 4.5和FSR 'Redstone'中,AI模型的推理大量采用混合精度策略:關(guān)鍵計算可能保留較高精度以保證圖像穩(wěn)定性,而大量矩陣運算則使用FP8或INT8加速。DLSS 4.5的第二代Transformer模型計算量是前代的5倍,但通過高效量化,依然能在消費級GPU上實時運行。FSR 'Redstone'也強調(diào)低精度數(shù)值格式,讓AI上采樣在各種硬件上更具普適性。
![]()
對于AI大模型來說,量化技術(shù)(Quantization)是關(guān)鍵。Post-Training Quantization(PTQ)可在訓(xùn)練后直接轉(zhuǎn)換模型權(quán)重,Quantization-Aware Training(QAT)則在訓(xùn)練時模擬低精度效果。FP8相比INT8在處理激活值異常時更有優(yōu)勢,而INT8在圖形和簡單推理任務(wù)中成熟可靠。適當(dāng)?shù)牧炕軐⒋竽P汀笆萆怼保屖謾C或邊緣設(shè)備也能運行復(fù)雜AI,而精度損失通過校準(zhǔn)和混合精度控制在可接受范圍內(nèi)。
![]()
精度選擇如何影響實際體驗
當(dāng)然了,計算精度不是越高越好,也不是越低越省。過高精度會浪費算力,導(dǎo)致幀率下降;過低則可能引入噪點、鬼影或細(xì)節(jié)丟失。在超分任務(wù)中,AI模型需要精確捕捉運動向量和光照梯度,DLSS 4.5通過更強的Transformer和線性空間推理,顯著提升了高對比場景的表現(xiàn)。FSR 'Redstone'則在穩(wěn)定性上迭代優(yōu)化,讓低內(nèi)部分辨率下的畫面更自然。
![]()
在大模型推理中,類似權(quán)衡同樣存在。量化后的模型在生成文本、圖像或代碼時,需確保“幻覺”不增加、連貫性不下降。硬件如NVIDIA的Tensor Core和AMD的AI加速單元,正是為這些低精度計算量身定制,讓精度與性能實現(xiàn)最佳平衡。
![]()
超分與超采技術(shù)的演進(jìn),背后是AI推理計算精度不斷優(yōu)化的成果。從DLSS 4.5的第二代Transformer到FSR 'Redstone'的ML驅(qū)動,再到大模型的FP8/INT8量化,我們看到一個清晰趨勢:通過智能的精度管理,AI不僅提升了視覺沉浸感,還讓高性能計算變得更普惠和高效。未來,隨著硬件和算法的進(jìn)一步融合,這一領(lǐng)域?qū)砀囿@喜。無論是游戲玩家還是AI開發(fā)者,理解計算精度的奧秘,都能幫助我們更好地?fù)肀Ъ夹g(shù)浪潮。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.