雨宫琴音电影|杏吧直播app官方下载|蕾丝小内内被撕开强入|影音先锋资源|国产 高速 亚洲 欧美 在线|今夜无人入睡免费完整版|97精品视频播放

當前位置:第一POS網 > 刷卡機知識點 >

刷卡機刷卡顯示超出時間范圍

瀏覽:86 發布日期:2023-04-18 00:00:00 投稿人:佚名投稿

網上關于刷卡機刷卡顯示超出時間范圍,昂達 RTX 4080 魔劍顯卡評測的刷卡知識比較多,也有關于刷卡機刷卡顯示超出時間范圍的問題,今天第一pos網(m.fzog.com.cn)為大家整理刷卡常見知識,未來的我們終成一代卡神。

本文目錄一覽:

1、刷卡機刷卡顯示超出時間范圍

刷卡機刷卡顯示超出時間范圍

引言&外觀賞析

引言

說起RTX 40系顯卡,大家映入眼簾的應該是它強大的性能和出色的能耗比,當時一經推出,就成了眾多發燒友的追捧對象,不少AIC廠商都在推出了當家花旦,讓游戲玩家一飽眼福,嘗鮮RTX 40系顯卡的魅力。昂達作為NVIDIA在國內的主要合作伙伴,也于近日推出了新品GeForce RTX 4080魔劍16GB顯卡。

全新的魔劍系列顯卡定位為昂達的高端旗艦,而這次推出的GeForce RTX 4080魔劍16G更是該系列首款顯卡產品。熟悉昂達的小伙伴應該知道,以前昂達做的都是中低端顯卡,最高也只是到RTX 3060 Ti、RTX 2060 SUPER,這次直接拉滿,直沖RTX 4080,想必你也和我一樣,十分好奇這張顯卡的表現,讓我們一起見證這張新顯卡能否利刃出鞘!

下文“昂達 GeForce RTX 4080 魔劍 16GB”簡稱為“昂達RTX 4080 魔劍”

規格對比

在開始之前,先了解一下本次的主角RTX 4080,其采用的是AD103-300 核心,TSMC 4N工藝制造,芯片面積為379平方毫米,晶體管密度達到了459億,晶體管數量相比較于上一代產品提升明顯,近乎翻倍,而這一代的核心還進一步提升了頻率,因此能帶來更好的性能表現。

其他參數方面,RTX 4080 RTX 4080標配9728個CUDA,128個第三代RT Cores,512個第四代Tensor Cores,并且用上了16GB的GDDR6X顯存,大顯存配合性能上的提升更可以為游戲以及創作者帶來更好的使用體驗。

而目前RTX 4080顯卡配備的AD103-300核心并不是完整的AD103核心,完整的AD103核心應該包括7個GPC(圖形處理集群)、40個TPC(紋理處理集群)、80個SM(流式多處理器)以及一個帶有8個32Bit顯存控制器的256Bit顯存帶寬。因此筆者猜測,RTX 4080或許不是AD103核心下的終極產物,后續應該還會推出完整AD103核心的RTX 4080 Ti。

再看看下方的RTX 4080的核心結構圖,和完整版本的AD103核心對比起來就很容易看出差別,RTX 4080核心代號為AD103-300,其擁有4個完整規格的GPC(圖形處理集群,每個內建6個TPC),與3個非完整的GPC(兩個內建5個TPC,一個內建4個TPC),共組成38個TPC,SM單元則剩下76個,顯存位寬還是完整的256Bit。

但是RTX 4080上的AD103-300核心在編解碼器上砍了一刀,不得不說老黃的刀法精準,編解碼器數量直接砍半,與RTX 4090同等規格,僅保留了兩個NVENC編碼器和一個NVDEC解碼器,因此完整版的AD103核心應該會有更快的視頻編解碼速度,不過之前測試過RTX 4090,編解碼速度相比上一代有著近乎翻倍的提升,想必RTX 4080也有不錯的表現。

外觀賞析

正面包裝盒最吸睛的莫過于中間巨大的“眼睛”,熟悉NVIDIA的玩家一眼就能認出那是經典的眼睛Logo,這也代表了昂達不斷探索新技術、接近和創新的精神。包裝盒的右下角寫著“GeForce RTX”字樣。

包裝盒的背面就顯得簡約了許多,大多數標識都是昂達RTX 4080魔劍顯卡全新升級的技術及品牌理念等。

昂達RTX 4080魔劍表面方方正正,但不失質感,黑色的外觀配合斜切線條低調而不失優雅,超大風扇的表面還置入了光線鐳射條,在不同角度與光線下能顯示不同顯示效果,觀感極佳。

正面是三把巨型的散熱風扇,昂達將其命名為“冰點”滾珠風扇,可見其對散熱效能的信心。三把風扇中左右兩個為10cm,中間的為9cm,每把風扇上配以9片交錯的流線型扇葉,可帶來更多的進風量。

翻到顯卡背面,可以看到昂達RTX 4080魔劍還配備了一體式陽極鋁金屬強化背板,可以有效保護PCB。

在顯卡背部還有大面積的鏤空風道,這樣設計不僅顏值更美觀,還可以令鰭片上的熱量被快速帶走,有效地增強散熱效率。

顯卡的頂部是一小塊屏幕,當顯卡接通電源后,屏幕會顯示“ONDA”的呼吸燈,大幅增加了這張顯卡的時尚個性。

屏幕之外就是一整排的出風口,橫跨整個顯卡頂部和底部,配合正面的三把散熱風扇,加速熱量排出。

供電接口還是我們熟悉的老朋友——12VHPWR供電接口,用來帶這張320W TGP的昂達RTX 4080魔劍可以說是綽綽有余了。

底部為顯卡金手指,接口為標準的PCIe 4.0 x16,在使用前一定要在主板打開Resizable BAR功能,這張顯卡的性能才能完全釋放。

比起其他RTX 4080顯卡,昂達RTX 4080 魔劍更為“輕薄”,是一張三槽顯卡,配備了3個DP1.4接口和1個HDMI2.1接口,支持最高8K輸出顯示。

顯卡拆解

顯卡拆解

每張顯卡到了我手里,必不可少的就是拆解,這張昂達RTX 4080魔劍的拆解還是相當容易的,只需要卸下金屬背板上的螺絲即可完全分離PCB與散熱器。

PCB是類公版的方案,從PCB正面可以清楚的看到昂達RTX 4080魔劍為越肩設計,比一般的顯卡都要再高一些,不過PCB上的接口、供電、核心、顯存,以及輔助供電位置都相當的合理且規正。

翻到背面,相比正面就要簡潔不少了,顯卡上的一些控制芯片被安置在此。在核心的背面還有兩顆兩個POSCAP(導電聚合物鉭電容),有它們坐鎮,顯卡整體的電氣性能會更強。

PCB上的主角那肯定是AD103-301-A1核心,由TSMC 4N定制工藝打造,換裝了全新的Ada Lovelace架構,9728個CUDA核心加持,同時兼具超高的能耗比,這也讓它能夠在昂達RTX 4080魔劍上大放異彩。

核心旁則是8顆GDDR6X顯存,來自美光,型號為2PU47 D8BZF,作為GDDR6的升級版,顯存位寬為256Bit,速度達到了22.4Gbps,并且單顆容量達到了2GB,8顆組成16GB的大顯存為昂達RTX 4080魔劍提供澎湃性能。

供電規模也是這款顯卡最值得關注的點,昂達RTX 4080魔劍的供電模組被安排在PCB的兩側,采用13相核心供電+3相顯存供電。

每相供電都采用獨立的DrMos芯片,封裝型號為BLN3,實際應為AOS的AOZ5311NQI-03,持續輸出電流為55A。

核心供電DrMos芯片

顯存供電DrMos芯片

供電控制芯片則安排在了PCB背面,分別是uP9512R、uP9529Q和uS5650Q,其中uP9512R和uP9529Q共同管理核心供電,可以做精細化的供電管理,而uS5650Q則是主要負責顯存供電部分。

uP9512R芯片

uP9529Q芯片

uS5650Q芯片

昂達RTX 4080魔劍用的是最新的12VHPWR供電接口,單口最大功率600W,僅需一根12VHPWR的電源線就可以完成對于顯卡的供電,安裝方便。

拆解繼續!我們來看看昂達RTX 4080魔劍的散熱系統,這個散熱系統由主動散熱的散熱風扇、散熱器以及金屬背板三部分組成。

先看看這個碩大的散熱器,整個散熱器采用熱管直觸設計,這樣有利于加速解熱,整體的散熱效能更強。

供電MOS、顯存、核心芯片緊密接觸均熱板,并且還為接觸的地方加裝了高系數的導熱墊輔助散熱,全方位優化熱量傳遞效率,散熱能力更勝一籌。

散熱器用的是兩段式的散熱模塊,兩邊均升級了特大面積的散熱鰭片。散熱鰭片的底下,6根高性能熱管穿梭而過,超高效的散熱效能助力顯卡超性能發揮。

有如此規格的一體成型鰭片模組設計,再配合金屬背板上的鏤空窗口以及優秀的風道設計,昂達RTX 4080魔劍想熱都難。

主動散熱部分是三把“冰點”滾珠風扇,每把風扇上有9片流線型扇葉,這樣設計的目的是增加進風量,讓顯卡即使高負載運轉時也能快速散熱,穩定滿血釋放。

三把風扇均采用智能控制,當顯卡在低功耗運行時,風扇能夠智能停止轉動,保證良好的低噪音效果與更穩定的性能。

測試平臺&理論/游戲性能測試

測試平臺介紹

先介紹一下本次的測試平臺,昂達RTX 4080 魔劍作為次旗艦定位的顯卡,想要與之映襯的硬件自然不能差,因此我們用上了評測室最強配置,CPU用的是Intel i9-13900K,主板為ROG MAXIMUS Z790 HERO,內存插滿,直接上金士頓的64GB DDR5-6000,這樣的配置才能讓展現這張顯卡的性能。

單有強悍的硬件可不夠,顯示設備也得跟上,所以我們為這張昂達RTX 4080 魔劍配備了4K顯示器的天花板——愛攻&保時捷聯名設計的AGON PD32M,4K@144Hz高刷,還有miniLED背光加持,從里到外都散發著一種高級感,只有這樣的顯示器才能配得上這張旗艦顯卡。

開始測試前,先通過GPU-Z了解一下測試的昂達RTX 4080 魔劍,從圖中可以看出這款顯卡的基準頻率為2205MHz,Boost頻率可以達到2505MHz,與公版RTX 4080保持一致。

而在溫控和功耗策略方面,這款顯卡的TGP設定為320W與公版保持一致,允許的最高功耗限制為330W。在溫度墻上,這款顯卡也頗為激進,最高可以去到88℃,顯然這是為超頻所準備的。

理論性能測試

啰嗦了那么多,測試正式開始,首先是理論性能測試,為了更好的展現昂達RTX 4080魔劍的性能,我們也加上了前代卡皇RTX 3090 Ti進行對比。

在全世界最好玩的游戲《3DMark》中,這張顯卡的表現可以用驚喜來形容。單是對比上代的RTX 3080 Ti,昂達RTX 4080魔劍的領先幅度能夠達到33%,如果是跟前卡皇RTX 3090 Ti,它也絲毫不虛,性能領先依舊有20%以上。

要說這里面提升幅度最大的要屬Fire Strike項目,昂達RTX 4080魔劍得分59244,只差一點就能突破6W分大關,這個成績是RTX 3080 Ti的1.2倍,可見新架構和新工藝帶來的性能提升有多明顯。

如果看老黃引以為傲的光追項目,性能差距還會更加明顯,作為老黃家的看家本領,這代顯卡在光追和DLSS上也是提升明顯,單是在Port Royal測試中昂達RTX 4080魔劍的得分就高達17711,而作為前代卡皇的RTX 3090 Ti僅有1W4左右,單是光追的提升就有30%以上,更別說DLSS加持后對游戲性能的提升了。

看完了常規的理論測試,再看看GPGPU的算力測試,在這個項目中,昂達RTX 4080魔劍的的領先幅度進一步提升,無論是跟RTX 3080 Ti比還是跟RTX 3090 Ti比,它的性能都高出40%左右,真的不負旗艦之名。

游戲性能測試

像我們這種臭打游戲的最關注的肯定是昂達RTX 4080魔劍的游戲性能,因此我們也在不同分辨率下選取了多款主流熱門的3A游戲進行實測。

1080P分辨率真的毫無壓力,不會真有人用RTX 4080配1080P的屏幕吧?!實測中可以看到昂達RTX 4080 魔劍的整體性能領先上代RTX 3080 Ti足足有27%以上,不少游戲都是200+ FPS,這個表現已經不能用流暢來形容了,要用絲滑。

2K分辨率下,昂達RTX 4080魔劍與RTX 3080 Ti的差距進一步拉大,此時的RTX 3080 Ti很多游戲都是100多FPS,但昂達RTX 4080魔劍憑借高顯存、新架構的優勢,絕大多數游戲還能保證接近甚至超越200 FPS的水準,像跑分界的活化石《古墓麗影:暗影》,這個優化極好的游戲在這款顯卡的加持下,幾乎快要突破300 FPS!

4K分辨率下,昂達RTX 4080魔劍的游戲性能領先RTX 3080 Ti達到了40%,不少游戲已經是可玩跟流暢玩的區別了。要說這里面最明顯的當屬顯卡殺手之稱的《賽博朋克2077》和《地鐵:離去 增強》,RTX 3080 Ti在這兩個游戲里都是勉強60 FPS的水平,但昂達RTX 4080魔劍在僅開啟DLSS 2的情況下已經能夠做到90 FPS了,更別說它還有隱藏的DLSS 3這個黑科技。

看過RTX 4090的都知道,8K游戲已經成為可能,那作為次旗艦的昂達RTX 4080魔劍又如何呢?經過我們實測,可以看到部分游戲依舊可以跑到60 FPS以上,像優化好的《極限競速:地平線5》可以去到70 FPS,《古墓麗影:暗影》甚至可以有103 FPS的優秀成績,可見8K還是可以期待一下的。

總的來說,得益于架構革新和緩存加大,這代RTX 4080顯卡在開啟最高畫質和DLSS的情況下,市面上的3A大作已經能夠暢玩了,對于游戲玩家來說,昂達RTX 4080魔劍不僅是一塊趁手的游戲工具,更是一款性價比的高端顯卡,2K@165Hz、4K@144Hz的電競體驗統統不在話下。

DLSS 3性能測試

DLSS 3性能測試

要說RTX 40系顯卡最大的升級點是什么?那莫過于DLSS 3這個黑科技了,DLSS作為RTX 20系推出的黑科技,其目的就是為了讓顯卡能夠在不影響畫質的前提下提高游戲性能,讓玩家能夠體驗更真實的游戲畫質。現在老黃在RTX 40系顯卡上帶來了全新的版本——DLSS 3,相比前作,新增幀生成和NVIDIA Reflex技術,能夠實現游戲性能的翻倍提升。

3DMark DLSS 3理論性能測試

先給DLSS 3來一個理論性能測試,我們使用3DMark中的DLSS專項測試進行,實測下來可以看到昂達RTX 4080魔劍在開啟DLSS 2時已經能夠暢玩4K了,如果開啟DLSS 3后,性能能夠進一步提升,并且開關DLSS 3前后性能差距能夠達到3倍以上,同時我們也試了一下8K分辨率,開啟DLSS 2時,45 FPS還是不能達到流暢游玩,但當你打開DLSS 3后,游戲幀數可以去到70 FPS左右,已經可以期待8K流暢游戲了。

光明記憶:無限》游戲實測

關測理論數據可沒有意思,我們也選用了目前支持DLSS 3技術的游戲進行實測,這里我們以《光明記憶:無限》為例,這款游戲現在已經支持DLSS 3了,并且在游戲中還能通過開啟DLSS 3的插幀功能來實現DLSS 2與DLSS 3的對比,接下來就讓我們看看昂達RTX 4080 魔劍到底能有怎樣的表現。

實測在不開啟DLSS的情況下,昂達RTX 4080 魔劍在4K分辨率下仍是可以流暢運行《光明記憶:無限》的;開啟DLSS 2后,游戲幀數就達到了137 FPS,1%幀數也達到了115 FPS,這完全就是翻倍的游戲流暢度提升;至于開啟DLSS 3之后,游戲幀數更是達到了160 FPS,配上4K@144Hz的AGON PD32M顯示器,別提有多爽了,真的是絲滑電競。

這里我們也截取了一下游戲在4K分辨率下開啟DLSS 3后的游戲效果,可以看到畫質依舊清晰,幾乎與原生4K無異!

Unreal Engine 5 Enemies DEMO性能測試

最后我們還測試了開發游戲所需用到的Unreal Engine 5引擎,UE5作為全新的游戲開發引擎,對顯卡的壓力自是不小,在Enemies DEMO中,昂達RTX 4080 魔劍開啟DLSS 3后猶如有高人相助,4K分辨率下可達77 AVG/66 1% FPS/ 55 ms的水平,而關閉DLSS 3僅有22 AVG/17 1% FPS/ 195 ms,前后足足相差3倍之多,可見老黃的黑科技真的沒有騙人。

并且開啟DLSS 3后,游戲流暢度提升的同時,畫質也不受影響。我們可以從視頻中可以看出,即使開啟DLSS 3后,從肉眼看來,開關前后的畫質幾乎沒有區別,并且因為DLSS是利用AI進行渲染,在部分細節上,DLSS模式下的畫質甚至比原生畫質還要清晰。

2K分辨率DLSS性能測試

我們不僅測了《光明記憶:無限》,還測了更多的游戲在開關DLSS 3下的區別,從測試數據中可以看到在2K畫質下,開啟DLSS 2后昂達RTX 4080魔劍已經超越前代RTX 3080 Ti不少了,一旦開啟DLSS 3,它將大幅領先前作,不少游戲在DLSS 3的加持下已經能夠滿足240Hz的高刷游戲需求了。

4K分辨率DLSS性能測試

上面我們實測在DLSS 2下,昂達RTX 4080魔劍征戰4K分辨率沒有絲毫問題,現在有了DLSS 3,成績更是亮眼,在開啟DLSS 3后,游戲幀數相比DLSS 2高出20-30幀,而相比RTX 3080 Ti來說,那就是性能的翻倍!像《賽博朋客2077》開啟DLSS 3后,前后游戲差距足足有30幀,即便是4K,超級光追的模式下,現在昂達RTX 4080魔劍也能有114 FPS了,如果降低一些特效,4K@144Hz暢玩夜之城將成為現實。

8K分辨率DLSS性能測試

8K分辨率其實我們也進行了測試,不過昂達RTX 4080 魔劍的16GB顯存在這里就顯得有些不足了,部分游戲都遇到了顯存瓶頸,不過還是有部分游戲能夠穩定在60 FPS運行的,像是《瘟疫傳說:安魂曲》《毀滅全人類2》這類新游戲,在開啟DLSS 3后還是不錯的,滿足流暢游玩問題不大。其他游戲則需要等游戲廠商優化,屆時配上8K的顯示器甚至是電視,全新的游戲體驗一定能夠驚艷眾人。

創作性能測試

創作性能測試

測完了游戲,4K甚至8K的游戲體驗給我們留下了深刻印象,不過昂達RTX 4080魔劍可不止在游戲上有所成就,在生產力上也頗有建樹。這里我們也測試了包括PCMark 10與PugetBench在內的多個項目。能夠比較全面的反應這款顯卡在綜合體驗和視頻內容生產力方面的實力。

實測結果如下,在PCMark10的測試中,昂達RTX 4080魔劍在數位內容創作和游戲項目上有不小的提升,這也與上面的游戲性能測試相符。而在創作生產力工具上,性能也比前代領先12%左右,相比RTX 4090更是只有1%的性能差距,可以說創作生產力用戶選昂達RTX 4080魔劍更具性價比一些。

值得一提的是昂達RTX 4080 魔劍支持最新的AV1編解碼功能,因此這次在達芬奇軟件中相比前代RTX 3080 Ti有比較大的性能提升,如果后續軟件經過不斷優化和顯卡驅動的更新,筆者想象以昂達RTX 4080魔劍獨有的AV1優勢,在視頻方面會更進一步,與前代的差距會越來越明顯,因此如果你是一名視頻創作者,我也更推薦你使用最新的昂達RTX 4080魔劍。

再看看專業生產力的表現,如果說視頻內容生產力的提升只是小步快跑,那在建模、渲染、工業設計等軟件上昂達RTX 4080魔劍就可以說是質的飛躍了,單是在Blender渲染軟件中,相比前代RTX 3080 Ti就有50%以上的提升,面對RTX 3090 Ti也絲毫不虛,性能差距依舊有45%以上。

另外在SPECviewperf 2020集成的8款工業軟件測試中,昂達RTX 4080魔劍的表現依舊喜人,整體性能領先RTX 3080 Ti有40%左右,這也意味著渲染同一素材時,使用昂達RTX 4080魔劍可以縮短近三分之一以上的時間。

雙NVENC編碼器專項測試

要說RTX 40系還有什么黑科技?那當屬RTX 40系顯卡上升級的雙NVENC編碼器,它支持時下熱門的AV1編碼,而AV1作為下一代主流的視頻編碼技術有著自己獨特的優勢,其具有更快的編碼速度和更高質量的流媒體傳輸性能,像達芬奇、萬興喵影、剪映等常用的剪輯軟件已經支持AV1編碼,B站等主流的視頻網站也加入了AV1解碼,未來AV1將會成為一個新趨勢。

為了驗證雙NVENC編碼器對視頻創作的提升究竟有多大,我們使用NVIDIA提供的8K片源與工程文件分別測試AV1格式和H.265格式下的編碼時間。實測昂達RTX 4080 魔劍的編解碼實力與旗艦級的RTX 4090相當,同一段素材下,AV1編碼相比H.265編碼快不少;即使同樣使用H.265編碼,有雙編碼器的加持下,昂達RTX 4080 魔劍的效率比前代快62%以上。

AV1編碼可不僅僅是快,它還有更多你意想不到的點,例如,它在占用空間上也頗有優勢,從下圖可以看到無論是4K還是8K分辨率,采用AV1編碼后,視頻文件大小平均能夠降低25%以上。

你以為這就結束了嗎,AV1編碼導出快、占用小,畫質也不輸H.265,這里我們截取了幾個畫面進行對比,從肉眼來看,其實畫質幾乎完全一樣,這樣也意味著AV1可以用更小的空間占用量實現與H.265同等規格的畫質表現。

功耗&超頻&評測總結

功耗與發熱

這張昂達RTX 4080魔劍的散熱規格大家也都看到了,可以用極致豪華來形容,用它來壓制AD103核心筆者都覺得大材小用了,這個規格別說RTX 4080,就算是RTX 4090也一樣夠用,因此筆者也相當好奇這款顯卡的散熱效能。

在Furmark甜甜圈單烤15分鐘測試中,昂達RTX 4080魔劍的占用率達到了99%,但此時的顯存溫度僅有50℃,GPU核心溫度也是70℃左右,足以證明這代顯卡在架構設計及散熱器的雙重優勢下,功耗與發熱表現近乎逆天,比大多數CPU的溫度還要低。

值得一提的是無論是待機還是滿載的情況下,這款顯卡的風扇轉速都相當低,放在機箱內幾乎感覺不到風扇噪音,并且待機時的溫度甚至只有30℃出頭,可以說老黃的RTX 4080真的把溫度跟能耗比提升到了新臺階。

超頻體驗

在GPU-Z中我們知道昂達RTX 4080魔劍可以將溫度跟功耗墻都進行解鎖,給超頻留下了不小的空間,筆者也用小飛機進行超頻測試,看看這款顯卡的潛力究竟在哪里!

首先看看這款顯卡在默頻下,Time Spy得分27858,這個成績已經相當出色了,在它之上也只有RTX 4090了,可見它的游戲性能不是一般的強。

緊接著我們在小飛機中解鎖電壓、功耗以及溫度后,超頻GPU核心,GPU核心保守點,先加190MHz,穩定過測,此時Time Spy得分28820,此時顯卡核心頻率穩定在3000MHz。

繼續加碼,這次同時超頻GPU核心及顯存,GPU核心頻率加220MHz,顯存頻率也拉升500MHz,這次Time Spy得分已經來到了29158,相比剛才又增加了近400分。

最后我們將頻率定格在GPU核心+250MHz,顯存+500MHz的水平,此時的Time Spy測試得分29265,相比默認頻率下的27858分,提升了5%以上,這樣的表現還是相當可觀的。不過這應該不是昂達RTX 4080魔劍的極限,如果有更好的散熱條件,它應該還能繼續沖擊更高的頻率。

評測總結

測試了這么多張RTX 40系顯卡以后,可以說全新的RTX 40系顯卡還是無時不刻帶給我新的驚喜,Ada lovece架構大大提升了執行效率和光追性能,TSMC 4N工藝和豪華散熱器讓這代顯卡的能耗比驚人,當然最值得夸贊的還是老黃的獨家黑科技DLSS 3,僅靠這個就讓顯卡的游戲性能翻倍,而在專業性能上新顯卡也有質的飛躍。總體來說,RTX 40系顯卡內外皆驚喜。

我們再聊聊這次送測的昂達GeForce RTX 4080 魔劍 16GB顯卡,外觀上雖不及其他家的顯卡那樣亮眼,但黑色的外殼加上兩根漸變色帶,遠望有種絕地黑武士的既視感,整體給人一種低調又不失優雅的感覺,頂部的“ONDA”呼吸燈恰到好處,給這張顯卡增添了一抹點睛之筆。

當然,性能方面才是它的殺手锏,得益于新架構和大顯存的加持,這張顯卡在我們的游戲測試中可謂所向披靡,幾乎是上代顯卡無法企及的高度。散熱方面也相當不錯,超強的散熱系統與動力十足的風扇相配合,展現了無以倫比的功耗與溫度表現,甚至在超頻測試中,還能盡情釋放,實現核心與顯存的雙雙超頻,性能提升也十分可觀。

最后再聊聊這款顯卡的售價,RTX 4080公版上市時首發價9499元,雖然它的性能強勁,但高昂的售價依舊讓不少玩家望而卻步,緊接著發售的不少AIC顯卡也在9499元之上。不過昂達GeForce RTX 4080 魔劍 16GB顯卡可謂是獨樹一幟,一經上市就是8999元的超值售價,如果你最近剛好想入手一款旗艦性能的高端顯卡,那筆者推薦你關注一下昂達GeForce RTX 4080 魔劍 16GB,低調冷艷的外觀,極致震撼的性能是你不容錯過的理由。

技術講解:Ada Lovelace架構

Ada Lovelace架構講解

Turing、Ampere上兩代架構核心均以人物來命名,前者是計算機科學之父——艾倫·麥席森·圖靈;后者則是“電學中的牛頓”——安德烈·瑪麗·安培,電流的國際單位安培就是以其姓氏命名。那Ada Lovelace定非凡人,度娘一下果然,這是 人稱“數字女王”的阿達·洛芙萊斯,編寫了歷史上首款電腦程序,是被世界公認的第一位計算機程序員,果真是一代比一代還要更牛。PS:她的父親是《唐璜》的作者,詩人拜倫喔。

從Turing架構開始,NVIDIA首次在顯卡中加入了加速光線追蹤的RT Core單元,以及面向AI推理的Tensor Core單元,這革命性的創新使實時光線追蹤成為可能。而Ampere架構則是全面的架構改進,在加入新一代的二代RT Core和三代Tensor Core基礎上,還有著更先進的SM單元設計,這樣顯卡工作效率那是翻倍的提升。而來到Ada Lovelace架構,同時是以效率提升為大前提,自然是引入了最新的第三代 RT Cores與第四代 Tensor Cores單元,同時加入眾多新穎的黑科技,從執行效率來說Ada Lovelace架構是上代Ampere架構的2倍以上,甚至光線追蹤能力更是達到了恐怖的4倍性能。

全新的SM流式多處理器

Ada Lovelace架構中最大的亮點之一:全新的SM流式多處理器,每個SM包含了128個CUDA核心、1個第三代的RT Cores,4個第四代 Tensor Cores(張量核心)、4個Texture Units(紋理單元)、256 KB Register File(寄存器堆),以及128 KB L1 數據緩存/共享內存子系統,于是這一個全新的SM單元有著超過上一代2倍之的性能表現。

過去的Turing架構INT32 計算單元與FP32數量是一致的,而兩者相加才組成了64個CUDA核心。但是Ampere架構開始,左側的計算單元實現了FP32+INT32的計算單元并發執行,也就是說CUDA核心數量翻倍到了128個。

再來看看Ada Lovelace架構的SM,FP32/INT32的計算單元組合,同樣實現了每個SM內含128個CUDA的設計,看似提升不大,但是當你了解到GeForce RTX 4080擁有76個SM,9728個CUDA核心,那你也就應該明白達82.6 TFLOPS的著色器能力是如何實現的了,比上一代的RTX 3090 Ti顯卡的40 TFLOPS,還真是提升了兩倍有多。

另外緩存方面Ada Lovelace架構也進行了大規格的提升,首先每個SM單元中單獨配上了128 KB的緩存,這樣RTX 4080顯卡中就實現了97MB L1/共享內存。其次核心的二級緩存進行進行了重新的設計,并且完整AD103核心與RTX 4080都是64MB二級緩存,相比RTX 3080 Ti可以說是質的飛躍。

技術講解:第三代RT Cores與第四代Tensor Cores

以為剛才的CUDA數量與超大L2緩存就已經很猛了,實現上Ada Lovelace架構最大的提升還是在第三代 RT Cores與第四代 Tensor Cores身上。

第三代 RT Cores

RT Cores用于光線追蹤加速,第三代 RT Cores 的有效光線追蹤計算能力達到 191 TFLOPS,是上一代產品 2.8 倍。

在Ampere架構中,第二代RT Cores支持邊界交叉測試(Box Intersection testing)和三角形交叉測試(Triangle Intersection testing),用于加速BVH遍歷和執行射線三角交叉測試計算,雖然光線追蹤處理能力已經比初代的Turing架構核心更高效,但是隨著環境和物體的幾何復雜性持續增加,傳統的處理方式很難再以更高效率、正確反應出的現實世界中的光線,尤其是光的運動準確性。

所以在第三代 RT Cores增加了兩個重要硬件單元:Opacity Micromap Engine與Displaced Micro-Meshes Engine引擎。Opacity Micromap Engine,主要是用于alpha通道的加速,可以將 alpha 測試幾何體的光線追蹤速度提高2倍。

在傳統光柵渲染中,開發人員使用一些 Alpha 通道的素材來實現更高效的畫面渲染,例如 Alpha 通道的葉子或火焰等復雜形狀的物體。但在光線追蹤時代,這傳統的做法會為光線追蹤帶為不少無效的計算,例如運動性的光線多次通過一塊葉子,光線每擊中一次葉子,都會調用一次著色器來確定如何處理相交,這時就會做成嚴重的執行成本與時間等待成本。

而Opacity Micromap Engine用于直接解析具有非不透明度光線交集的不透明度狀態三角形。根據Alpha 通道的不透明,透明與未知等三個不同的塊狀態進行處理:透明則直接忽略繼續找下一個,不透明塊則記錄并告之命中,而未知的則交給著色器來確定如何處理,這樣GPU很大部分都不需要進行著色器的調試處理,能夠實現更為高效的性能。

Displaced Micro-Meshes Engine

如果說Opacity Micromap Engine加速的是面處理,那么Displaced Micro-Meshes Engine就是幾何曲面細節的加速器。如上圖所示,在Ada Lovelace架構中,通過1個基底三角形+位移地圖,就可以創建出一個高度詳細的幾何網格,所需要資源占用比二代RT Cores更低,效率也更高。

通過NVIDIA給出的創建14:1珊瑚蟹例子來說事,這里我們需要需要1.7萬個微網格、160萬個微三角形,在Ada Lovelace架構中BVH創建速度可加快7.6倍,存儲空間縮小8.1倍。Displaced Micro-Meshes Engine起到了關鍵性的作用,其將一個幾何物體根據不同細節分成密度不一的微網絡處理,紅色密度超高,細節處理越為復雜 。相應的低密度微網絡區域則可以釋放更多的資源與存儲空間,這樣Displaced Micro-Meshes Engine就可以幫助BVH加速過程,減少構建時間和存儲成本。

同時Ada Lovelace架構SM中新增了著色器執行重排序(Shader Execution Reordering,SER),這是由于光線追蹤不再只有強光或者陰影渲染處理,未來將會更多的是在光線的運動性,這樣光線就會變得越來越復雜,想要第三代 RT Cores與第四代 Tensor Cores有著更高的執行效率,那就得為他們來安排一位管家。而著色器執行重排序(SER)就是為了能夠即時重新安排著色器負載來提高執行效率,為光線追蹤提供2倍的加速,也能更好地利用 GPU 資源。不過目前仍未有實例,想實現這個功能,還得游戲與開發工具的支持才行。

第四代 Tensor Cores

Tensor Cores是專門為執行張量/矩陣運算而設計的專用執行單元,這些運算是深度學習中使用的核心計算功能。第四代 Tensor Cores 新增 FP8 引擎,具有高達 1.32 petaflops 的張量處理性能,超過上一代 的 5 倍。

技術講解:DLSS 3

技術講解:DLSS 3

或者說第四代 Tensor Cores太硬核你不會知道是啥?提升意義在哪?但是Tensor Cores最經典的應用DLSS你肯定會知道,這一次Ada Lovelace架構支持NVIDIA最新的DLSS3技術。

之前我們也聊過DLSS技術,其設計之初是為了彌補光線追蹤技術后的性能損失,具體的表現為開啟光線追蹤技術后游戲幀數大幅度的下降,甚至很難保證游戲流暢的運行。于是DLSS使用低分辨率內容作為輸入并運用AI技術輸出高分辨率幀,從而提升光線追蹤的性能。

在DLSS3中包含了三項技術:DLSS 幀生成、DLSS 超分辨率(也稱為 DLSS 2)和 NVIDIA Reflex。你可以理解為DLSS3是在DLSS2的基礎上,新增了DLSS 幀生成技術;而后兩技術中,DLSS 超分辨率只需要GeForce RTX顯卡都能使用上,NVIDIA Reflex則是GeForce 900 系列以后的顯卡都用使用上。

想實現DLSS 幀生成可不簡單,這需要配合上Ada Lovelace架構的GeForce RTX 40系列顯卡才行。DLSS 幀生成技術原理是:利用 AI 技術生成更多幀,以此提升性能。DLSS 會借助 GeForce RTX 40 系列 GPU 所搭載的全新光流加速器分析連續幀和運動數據,進而創建其他高質量幀,同時不會影響圖像質量和響應速度。

從Ampere架構開始,NVIDIA顯卡就已經支持了光流加速器,而Ada Lovelace架構的光流加速器升級到了第二代,其提供了高達300 TeraOPS (TOPS) ,比安培架構的初代光流加速器(Optical Flow Acceleration,OFA)快 2 倍以上。為了實現DLSS幀生成,OFA扮演了重要的角色,其配合上新的運行矢量分析算法在DLSS 3技術框架內實現精確和高性能的幀生成能力。

另外,由于DLSS 幀生成是在GPU上作為后處理執行的,那么即使在游戲受到CPU性能限制的時候,我們同樣能夠從中獲得更好的游戲性能提升。尤其是那種物理計算密集型的游戲或大型場景游戲,DLSS2均可以讓GeForce RTX 40系列顯卡以高達兩倍于CPU可計算的性能來渲染游戲。

最后由于DLSS 3是建立在DLSS 2基礎之上的,游戲開發者可以在已支持DLSS 2或NVIDIA Streamline的現有游戲中快速集成該功能,所以DLSS 3已在游戲生態得到廣泛應用,目前已有超過35款游戲和應用即將支持該技術。

閱讀小亮點:NVIDIA Reflex

NVIDIA Reflex也是DLSS3其中的一環,它可以使GPU和CPU同步,確保最佳響應速度和低系統延遲。

想要實現端對端的最低延遲,你需要確保游戲、顯示器以及鼠標三者都同時支持并開啟了Reflex 技術。

當GeForce RTX 40 系列顯卡和 NVIDIA Reflex搭配上后,直接達到1440p分辨率360 FPS的體驗,這著實是性能有點強勁了。

在GTC2022大會時已經透露將會還有4 款 1440p 分辨率的新型 G-SYNC 電競顯示器將要發布,包括采用mini-LED技術的AOC AG274QGM – AGON PRO Mini LED、MSI MEG 271Q Mini LED 和 ViewSonic XG272G-2K Mini LED三款顯示器刷新率均為300Hz,而最猛的是ASUS ROG Swift 360 Hz PG27AQN ,刷新率直接來到了360Hz。

但唯一一個問題就在于,部分顯示器廠商認為此類產品受眾人群較少,會降低此類顯示器的產能,甚至產品就已經被內部PASS掉,所以1440p 360Hz是很美好,但現實也是相當的骨感。

技術講解:雙NVIDIA編碼器

技術講解:雙NVIDIA編碼器(NVENC)

GeForce RTX 40 系列顯卡還有一個全新的升級,那就是雙編碼器NVENC。第八代的NVENC雙編碼器不僅支持H.264與H.265,還支持開放式視頻編碼格式 AV1。

而由于AV1是一種免版稅的視頻編碼格式,上游軟件廠商與下游戲的配套端都在大力推廣此編碼格式,我們也會看到越來越多的硬件與軟件支持AV1格式,包括剪映專業版、DaVinci Resolve、以及 Adobe Premiere Pro 較為流行的 Voukoder 插件均支持,且均可通過編碼預設使用雙編碼器,這樣我們等待視頻導出的時間縮短將近一半。

不單是視頻制作軟件,AV1格式也將會是主播、游戲直播UP主們的新寵兒,在保證畫面最高質量的情況下,AV1 編碼器可將效率提高 40%,同時顯卡的占用也更低。包括OBS Studio一一代軟件中也會增加AV1格式的支持。另外我們還能通過 GeForce Experience 和 OBS Studio 錄制高達 8K60 的內容,這樣我們做游戲錄制也會變得更為輕松。

包括我們之后測試時使用的游戲內錄視頻都是支持AV1格式,同時雙編碼器NVENC在資源占用和適配上做得越來越好。

以上就是關于刷卡機刷卡顯示超出時間范圍,昂達 RTX 4080 魔劍顯卡評測的知識,后面我們會繼續為大家整理關于刷卡機刷卡顯示超出時間范圍的知識,希望能夠幫助到大家!

轉載請帶上網址:http://m.fzog.com.cn/shuaka/61460.html

版權聲明:本文內容由互聯網用戶自發貢獻,該文觀點僅代表作者本人。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。如發現本站有涉嫌抄襲侵權/違法違規的內容, 請發送郵件至 babsan@163.com 舉報,一經查實,本站將立刻刪除。
聯系我們
訂購聯系:小莉
微信聯系方式
地址:深圳市寶安區固戍聯誠發產業園木星大廈

公司地址:深圳市寶安區固戍聯誠發產業園木星大廈

舉報投訴 免責申明 版權申明 廣告服務 投稿須知 技術支持:第一POS網 Copyright@2008-2030 深圳市慧聯實業有限公司 備案號:粵ICP備18141915號