一、前言:首款100%全自研的國產(chǎn)顯卡
20年來,NVIDIA和AMD主導(dǎo)了桌面顯卡的發(fā)展,但在更早之前的2D時(shí)代,S3 Graphics顯卡領(lǐng)域的絕對霸主。
這家成立于1989年的公司在1994年推出了Trio 系列顯卡,占領(lǐng)了當(dāng)年全球顯卡市場70%以上的份額,全球累計(jì)銷量超1億顆,是歷史上銷量最高的顯卡系列。
在從2D向3D轉(zhuǎn)型的過程中,S3相繼推出了Savage3D和Savage 4,特別是后者當(dāng)時(shí)被認(rèn)為是NVIDIA GeForce顯卡最有力的競爭對手。
只是這兩款顯卡雖然技術(shù)超前,但驅(qū)動(dòng)驅(qū)動(dòng)穩(wěn)定性和兼容性卻長期落后于競爭對手,而S3作為一家獨(dú)立公司的歷史也就止步于此了。
S3的曾經(jīng)的輝煌則不能不提一個(gè)人,礪算科技創(chuàng)始人兼CEO宣以方。
![]()
作為S3 Graphics 創(chuàng)始團(tuán)隊(duì)成員(第6號員工),宣以方在1992年加入S3,并主導(dǎo)了Trio 和Savage系列顯卡的研發(fā),在S3被威盛、HTC和兆芯相繼收購之后,繼續(xù)擔(dān)任GPU團(tuán)隊(duì)的研發(fā)副總裁,累計(jì)主導(dǎo)15代以上GPU量產(chǎn)。
2021年,宣以方從S3離職并創(chuàng)立礪算科技,經(jīng)過5年的打磨終于推出了國內(nèi)首款6nm圖形GPU—LX 7G100。
LX 7G100和其他國產(chǎn)顯卡最本質(zhì)的區(qū)別就是它的TrueGPU天圖架構(gòu),從指令集、計(jì)算核心到軟件棧完全自主設(shè)計(jì),沒有依賴Imagination/ARM等任何第三方IP授權(quán)。
![]()
TrueGPU架構(gòu)融合了高性能圖形渲染與人工智能推理能力,核心技術(shù)亮點(diǎn)包括:
智能亂序渲染引擎:打破傳統(tǒng)三角形渲染的順序限制,在無依賴場景下提升 50% 渲染效率;
FP32/INT32 雙指令發(fā)射:硬件級并行執(zhí)行,提升通用計(jì)算與圖形處理效率;
矩陣內(nèi)存布局優(yōu)化:將數(shù)據(jù)以方塊形式存儲,顯存利用率提升 40%;;
自研 Tensor Engine 張量引擎:支持 FP16、FP32、INT8 多精度運(yùn)算,兼顧游戲與 AI 算力需求;
NRSS 神經(jīng)網(wǎng)絡(luò)超分辨率:通過 AI 技術(shù)在提升幀率的同時(shí)維持畫面質(zhì)量。
礪算 LX 7G100基于7G106核心,采用臺積電6nm制程工藝,擁有192個(gè)紋理單元、96個(gè)ROP、192Bit顯存位寬,顯存容量12GB,整卡平均功耗200W,平均峰值功耗350W(隨應(yīng)用不同)。
尤為值得一提的是,礪算是全球第四家、中國第一家拿到微軟WHQL驅(qū)動(dòng)認(rèn)證的GPU廠商,這意味著它在兼容性、穩(wěn)定性方面得到了權(quán)威認(rèn)可。
MD:Page title=圖賞:限量版第925塊創(chuàng)始人顯卡
二、圖賞:限量版第925塊創(chuàng)始人顯卡
![]()
包裝盒。
![]()
礪算LX 7G100是目前市面上少見的采用全金屬外殼框架的顯卡,不僅僅只是背面,連正面的外殼和中框都是純鋁材質(zhì),整卡非常堅(jiān)固。
外殼為一體化銀灰色金屬噴砂材質(zhì),啞光質(zhì)感細(xì)膩且不易沾指紋,整體線條平直硬朗,無多余棱角或夸張?jiān)煨停L(fēng)格克制高級。
顯卡采用的三風(fēng)扇設(shè)計(jì),但只有右邊的黑色軸流風(fēng)扇顯露在外面,另外2個(gè)風(fēng)扇隱藏在金屬框架里面。
![]()
背面右側(cè)有圓孔開孔,可以讓熱風(fēng)直接吹透顯卡,提升散熱效率。
![]()
面板左側(cè)印有NO.925/999,表明了這塊顯卡的身份,這是限量發(fā)行999塊中的第925塊。
![]()
頂部視角圖,中間白色方形外殼上印有礪算科技的橙色圖形 Logo。
![]()
12V-2x6供電接口,比起雙8Pin能節(jié)省不少空間。
![]()
底部視角圖,金屬前蓋和背板采用了螺絲緊密連接在一起。
![]()
4個(gè)DP1.4a接口,沒有HDMI。
![]()
這塊新卡的拆解與其他顯卡不同,不是先拆背板,而是先拆金屬前蓋。
拆下前蓋后可以看到里面的3個(gè)風(fēng)扇。
![]()
![]()
三段式散熱器,5條8mm熱管穿插其中。
![]()
拆下來的金屬背板。
![]()
PCB板正面,布局十分工整,一共10+2+1相供電設(shè)計(jì)。中間是礪算7G106核心,臺積電6nm FinFET(N6)制程工藝。
![]()
正反面各6顆,共12顆SK海力士GDDR6顯存,單顆容量1GB,總?cè)萘?2GB。
三、3Dmark測試:與RTX 3060相差10%
![]()
在3DMark Fire Strike測試中,LX 7G100的GPU分?jǐn)?shù)為9118,GPU-Z完全無法讀到顯卡信息。
![]()
![]()
3DMark Time SPY測試中,LX 7G100的GPU分?jǐn)?shù)為7301,
![]()
四、3A游戲性能測試:
1、刺客信條:英靈殿
![]()
![]()
2、地平線:零之曙光(可否拿掉?)
![]()
![]()
3、孤島驚魂5 (可否拿掉?)
![]()
![]()
4、孤島驚魂6
![]()
![]()
5、古墓麗影:暗影
![]()
![]()
6、黑神話:悟空
![]()
![]()
7、霍格沃茨之遺
![]()
![]()
8、龍騰世紀(jì):影障守護(hù)者
![]()
《龍騰世紀(jì):影障守護(hù)者》的游戲畫面會有貼圖錯(cuò)誤,待后續(xù)驅(qū)動(dòng)修正。
![]()
9、賽博朋克2077
![]()
![]()
10、巫師3(能否拿掉?)
![]()
![]()
11、無主之地3
![]()
![]()
12、心靈殺手2
![]()
![]()
13、星空
![]()
![]()
14、戰(zhàn)爭機(jī)器5
![]()
![]()
測試數(shù)據(jù)匯總?cè)缦拢?/p>
![]()
一共測試了18款游戲,這些游戲都是我們此前常用在新卡首發(fā)測試中常用的項(xiàng)目。
LX 7G100在《怪物獵人:荒野》、《極限競速:地平線5》、《星球大戰(zhàn):亡命之徒》中會出現(xiàn)報(bào)錯(cuò)或者中途退出的情況。
《心靈殺手》、《星空》這2款游戲幀率異常之低,應(yīng)該是驅(qū)動(dòng)還未優(yōu)化。
《巫師3》、《孤島驚魂5》這2款DX11游戲,LX 7G100的幀率只有RTX 3060的1/3左右。
其他DX12游戲,LX 7G100的幀率基本上都在RTX 3060的50%以上,部分優(yōu)化好的游戲比如《黑神話:悟空》、《霍格沃茨之遺》,幀率可以達(dá)到RTX 3060的60%以上。
五、常規(guī)游戲測試:主流游戲超過60幀不是太難
1、英雄聯(lián)盟
![]()
1080P分辨率極高畫質(zhì)。
![]()
出生地的幀率可以超過500FPS。
![]()
對線的時(shí)候則是300FPS左右。
![]()
2、坦克世界
![]()
1080P極高畫質(zhì)下,LX 7G100的分?jǐn)?shù)13551,幀率則是85FPS。
![]()
RTX 3060的幀率則是228FPS,幾乎三倍于LX 7G100。
![]()
3、Dota 2
![]()
《Dota 2》的幀率穩(wěn)定在80FPS左右。
![]()
RTX 3060的幀率在160~200FPS之間跳動(dòng)。
![]()
4、孤島驚魂6
![]()
設(shè)置為"高畫質(zhì)"之后,LX 7G100的幀率就來到了64FPS。
![]()
RTX 3060在高畫質(zhì)下的幀率是112FPS。
![]()
5、街頭霸王6
![]()
《街頭霸王6》鎖定了60FPS,2款顯卡幀率都無法突破60FPS。
在這個(gè)游戲中,LX 7G100的GPU使用率只有51%,如果解鎖幀率限制,應(yīng)該能超過100FPS。
![]()
6、艾爾登法環(huán)
![]()
1080P最高畫質(zhì)。
![]()
這款游戲也限制了幀率,LX 7G100穩(wěn)定60FPS,此時(shí)GPU利用率只有64%。如果解鎖幀率限制,應(yīng)該能超過80FPS。
![]()
7、三角洲行動(dòng)
![]()
極致畫質(zhì),F(xiàn)SR3性能優(yōu)先模式。
![]()
LX 7G100的幀率是68FPS。
![]()
8、黑神話:悟空
![]()
前面的測試使用的是影視級畫質(zhì),并且沒有開超分辨率。現(xiàn)在我將畫質(zhì)設(shè)置為高,分辨率比例調(diào)為62,再打開幀生成,幀率來到了60FPS。
![]()
同樣的設(shè)置下,RTX 3060幀率是137FPS。
![]()
9、生化危機(jī)9:安魂曲
![]()
![]()
RTX 3060幀率是130FPS。
![]()
10、霍格沃茨之遺
![]()
超高畫質(zhì),F(xiàn)SR3平衡。
![]()
LX 7G100的幀率是89FPS。
![]()
RTX 3060則是157FPS。
![]()
11、賽博朋克2077
![]()
在超級畫質(zhì)的基礎(chǔ)上,開啟FSR3幀生成。
![]()
LX 7G100的幀率就來到了73FPS。
![]()
RTX 3060的幀率是129FPS。
![]()
測試數(shù)據(jù)匯總?cè)缦拢?/p>
![]()
LX 7G100對于DX11游戲的優(yōu)化不是太好,當(dāng)然《英雄聯(lián)盟》例外。
在大多數(shù)DX11游戲中,LX 7G100的幀率只有RTX 3060的1/3左右甚至更低。
但是在DX12游戲中,LX 7G100的幀率可以到RTX 3060的50%以上。
另外,此前有部分在最高畫質(zhì)下只有40FPS的游戲,在開啟FSR3或者幀生成之后,幀率都輕松突破了60FPS。
六、超頻測試:一鍵超頻 性能提升11%
LX 7G100擁有不俗的超頻能力,我們可以直接在官方工具"Lisuan eXtreme Software"中進(jìn)行超頻設(shè)置。
![]()
進(jìn)入軟件后,打開超頻模式就完成了超頻,非常簡單。
下面我們看看超頻后性能提升了多少!
1、3DMark Fire Strike Extreme
![]()
超頻后的圖形分?jǐn)?shù)來到了9813分,比起默頻的9118提升了8%。
2、坦克世界
![]()
![]()
3、孤島驚魂6
![]()
![]()
4、黑神話:悟空
![]()
![]()
5、生化危機(jī)9:安魂曲
![]()
![]()
6、霍格沃茨之遺
![]()
![]()
7、賽博朋克2077
![]()
![]()
測試數(shù)據(jù)匯總?cè)缦拢?/p>
![]()
超頻后,6款游戲平均下來提升幅度有11%,與RTX 3060的性能差距進(jìn)一步縮小。
七、解碼能力與功耗測試:4K解碼毫無壓力 待機(jī)功耗稍高
1、解碼測試
![]()
3840*2160分辨率,AV1硬件解碼,幀率30FPS,碼率30538Kbps,播放22945幀,掉了3幀,CPU占用率5%,GPU視頻解碼器占用率17%。
![]()
3840*2160分辨率,H265硬件解碼,幀率30FPS,碼率11512Kbp32130幀,掉了1幀,CPU占用率2%,GPU視頻解碼器占用率17%。
![]()
3840*2160分辨率,AVC(H264)硬件解碼,視頻幀率29.4FPS,碼率17428Kbps,播放12467幀,總計(jì)掉了0幀,CPU視頻解碼器占用率1%,GPU占用率10%。
下面試試8K解碼!
![]()
不論是H264、H265還是AV1,在啟用硬件解碼后,LX 7G100都會出現(xiàn)掉幀的情況,但GPU視頻解碼器的利用率并沒有超過50%。
2、烤機(jī)測試
現(xiàn)在主流的監(jiān)控軟件都無法識別礪算LX 7G100顯卡,我們使用功耗測試儀來測量它的烤機(jī)與待機(jī)功耗。
![]()
我們這個(gè)平臺,在使用核顯時(shí),待機(jī)功耗120W左右。插上LX 7G100之后,待機(jī)功耗來到了174W,換算下來,它的待機(jī)功耗在50W左右。
![]()
烤機(jī)時(shí),整機(jī)功耗392W,相比之下,RTX 3060的烤機(jī)功耗是303W。
![]()
LX 7100的整機(jī)待機(jī)功耗174W,顯卡功耗估算是50W左右。
烤機(jī)時(shí),LX 7100整機(jī)功耗392W,顯卡功耗估算220~230W之間,比RTX 3060高了50~60W。
八、小結(jié):算得上成功的開局
對于目前所展示出來的性能,可能與大多數(shù)同學(xué)的心理預(yù)期相差很遠(yuǎn),但在我們看來,LX 7G100能順利玩3A游戲就已經(jīng)算得上成功。只要能成功邁出第一步,此后將會有廣闊的發(fā)展和進(jìn)步空間。
以下是本次測試小結(jié):
1、游戲表現(xiàn)
總共測試了18款主流3A大作,有3款游戲會出現(xiàn)報(bào)錯(cuò)或者中途退出的情況,分別是《怪物獵人:荒野》、《極限競速:地平線5》、《星球大戰(zhàn):亡命之徒》。另有兩款游戲幀率波動(dòng)異常,判定為驅(qū)動(dòng)適配不完善導(dǎo)致。
DX11 環(huán)境下,該卡幀率僅為RTX 3060三分之一左右的水平。
正常運(yùn)行的DX12游戲,LX 7G100的幀率在RTX 3060的50~60%之間。部分優(yōu)化好的游戲比如《黑神話:悟空》、《霍格沃茨之遺》,性能占比可突破 60%。
2、功耗控制
作為礪算旗下第一款消費(fèi)級顯卡,LX 7G100的功耗仍有較大的優(yōu)化空間。實(shí)測它的待機(jī)功耗在50W左右,烤機(jī)功耗則是220~230W。
縱觀行業(yè)發(fā)展,早期AMD、NVIDIA顯卡同樣存在待機(jī)功耗偏高問題,AMD顯卡是在RDNA架構(gòu)上才實(shí)現(xiàn)將待機(jī)功耗壓到了個(gè)位數(shù)。
3、視頻編解碼性能
礪算7G100擁有非常完整的編解碼能力,可以支持H.264/H.265/AV1硬件編解碼。
實(shí)測4K分辨率下硬件解碼B站高碼率視頻時(shí),幾乎可以實(shí)現(xiàn)0掉幀,并且完全不占用CPU。
但在解碼8K視頻時(shí),會出現(xiàn)一定程度的掉幀情況,需要驅(qū)動(dòng)后續(xù)優(yōu)化。
![]()
下面說說這款顯卡值得肯定的地方。
1、純自研圖形架構(gòu)
和其他采用依賴Imagination/ARM等第三方IP的國產(chǎn)GPU不同,礪算7G100采用了全自研 TrueGPU 天圖架構(gòu)(無任何外部 IP 授權(quán)),從指令集、計(jì)算核心到軟件棧完全自主設(shè)計(jì),但這也意味著需要優(yōu)化的地方會有很多。
該有的技術(shù),比如FP32/INT32雙發(fā)射設(shè)計(jì)、NRSS 神經(jīng)網(wǎng)絡(luò)超分辨率、智能亂序渲染引擎,這些技術(shù)都有。特別是Tensor Engine張量引擎,支持FP16、FP32、INT8多精度運(yùn)算,對標(biāo)NVIDIA Tensor,在保證了游戲性能的同時(shí),還能兼顧AI計(jì)算需求。
2、到底能不能流暢玩3A和電競游戲
答案是能!
LX 7G100在《英雄聯(lián)盟》可以穩(wěn)定300FPS以上的幀率,《Dota 2》、《Counter-Strike 2》、《艾爾登法環(huán)》在最高畫質(zhì)下也能超過60FPS。
就算是最新的硬件殺手游戲,比如《黑神話:悟空》、《生化危機(jī)9:安魂曲》,只需要稍微降低畫質(zhì),或者開啟超分辨率,就能輕松達(dá)到60FPS。
此外,我們還進(jìn)行了超頻測試,在官方工具"Lisuan eXtreme Software"中進(jìn)行一鍵超頻之后,LX 7G100在6款3A游戲中平均提升幅度可以達(dá)到11%,此時(shí)與RTX 3060的性能差距進(jìn)一步縮小。
就像前面說的那樣,對于LX 7G100而言,能正常玩3A游戲,能通過微軟WHQL認(rèn)證,就已經(jīng)非常成功的開局了。
至于游戲優(yōu)化,NVIDIA、AMD也是歷經(jīng)幾十年技術(shù)沉淀與海量驅(qū)動(dòng)打磨,才形成如今成熟的游戲適配體系。
LX 7G100在發(fā)售時(shí)就已完成對絕大多數(shù)主流游戲的基礎(chǔ)優(yōu)化,如果他們的驅(qū)動(dòng)團(tuán)隊(duì)能像現(xiàn)在這樣,能對每一款最新發(fā)售的3A大作及時(shí)進(jìn)行驅(qū)動(dòng)優(yōu)化,多年之后,它的驅(qū)動(dòng)也會如A/N一樣完善。
本次首發(fā)使用的驅(qū)動(dòng)是第一版WHQL認(rèn)證驅(qū)動(dòng),為保證穩(wěn)定性在性能方面有所犧牲,可以稱之為"殘血版"。
就我們評測完成時(shí),礪算已經(jīng)完成了第二版WHQL認(rèn)證驅(qū)動(dòng),游戲性能將有顯著的提升,后續(xù)有時(shí)間我們也會對這款新驅(qū)動(dòng)進(jìn)行詳細(xì)評測,敬請期待!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.