在CES 2025展会上,NVIDIA正式发布了新一代的RTX 50系列显卡,采用全新的Blackwell架构,不仅大幅度升级了GPU核心性能,同时还带来了最新的DLSS4技术,让游戏玩家和内容创作者们获得更好的性能体验。
这次首发的RTX 50系列显卡为旗舰型号RTX 5090显卡,但为了应对美国芯片禁令对中国AI产业的技术封锁,NVIDIA专为中国游戏玩家们设计了RTX 5090 D显卡,和上一代的RTX 4090 D简单粗暴的砍硬件规格不同的是,这次的RTX 5090 D显卡在芯片规格方面和旗舰显卡RTX 5090完全一致,只是限制了Tensor AI算力,从RTX 5090的3352TOPS降低到了2375TOPS,降幅约29%,以满足美国的AI芯片禁令的出口管制要求。
完整Blackwell架构核心
根据NVIDIA的官方给的资料,完整的Blackwell架构核心拥有12个GPC,内含8组TPC,每组TPC包含2个SM簇,共计96组TPC和192个SM簇,搭配16个32bit的内存控制器,显存带宽达到了512bit,PCIe通道也升级为了PCIe5.0,以满足旗舰显卡日益庞大的数据吞吐量。
RTX 5090和RTX 5090 D采用的GB202核心
RTX 5090和RTX 5090 D采用的是削减过后的GB202核心,在完整的GB核心基础上砍掉了11组TPC,保留了85组TPC共计170个SM簇。
这里存在分歧:一般逻辑,想砍掉11组TPC只要砍掉1个完整的GPC,再在第二个GPC中砍掉3组TPC即可,但在NVIDIA给出资料中却出现了一张有2个GPC各砍掉一组TPC的GB202架构图,所以就有了另一种刀法的可能性:12个GPC中有11个GPC各砍掉一组TPC,只保留一个完整的GPC。
Blackwell架构SM簇示意图
Ada LoveLace架构SM簇示意图
和上一代的Ada LoveLace架构相比,Blackwell架构重新设计了SM簇,取消的独立的FP32计算单元,全部改为FP32/INT32混合单元,总数依然是128个,但在每个计算周期内,单核只能以FP32或者INT32进行计算,这就让FP32和INT32计算量在周期内提高了一倍。
每个SM簇配置了4个第五代Tensor核心,RTX 5090 D和RTX 5090相比最大的差别就在于NVIDIA限制了RTX 5090 D的Tensor核心AI算力,从RTX 5090的3352TOPS降低到了2375TOPS,降幅约为29%。目前NVIDIA显卡的帧生成技术主要依赖Tensor核心进行计算,不过根据NVIDIA的说法,虽然削弱了RTX 5090 D的Tensor核心的AI算力,但对游戏玩家没有影响。
每个SM簇还配置了1个第四代RT核心,改进了光线追踪算法,和第三代RT核心相比实现了光线追踪算力翻倍的效果。
综合计算,RTX 5090 D共拥有21760个CUDA计算单元、680个五代Tensor、170个四代RT核心。如果以CUDA数量来计算传统性能,RTX 5090 D应该要比上一代旗舰显卡RTX 4090强33%左右,鉴于显存规格的升级,在4K分辨率和光追游戏方面领先幅度应该更大。
随RTX 50系显卡一起到来的还有更强的DLSS4技术。借助Blackwell架构和第五代Tensor核心,让额外生成多帧成为现实,可以在完成一个传统渲染帧的同时额外生成3帧,让玩家获得更高的游戏帧数表现。
为了解决FG帧生成功能带来的输入延迟问题,NVIDIA还跟进更新了NVIDIA Reflex2技术,可以降低75%的PC延迟,让玩家操作更流畅精准。
接下来我们将以NVIDIA全球核心AIC合作伙伴索泰推出的全新SOLID系列RTX 5090 D显卡——索泰RTX 5090 D SOLID OC显卡来为广大玩家们展示一下,这款专为中国游戏玩家推出的“旗舰级”游戏显卡究竟表现如何,能给玩家们带来怎样的游戏体验。
1 2 3 4 5 6 7 8 9 10
11
下一页
友情提示:支持键盘左右键“← →”翻页
暂无评论内容