NVIDIA RTX 3080 Ti显卡怎么样 NVIDIA RTX 3080 Ti显卡全面
受到芯片短缺以及矿潮影响,近一年的DIY市场尤其混乱,其中又以显卡最为畸形,原本5499元首发的GeForce RTX 3080已经被炒到了15000左右,价格翻了3倍。而不久前NVIDIA在官方博客中宣布,后续推出的RTX 30系显卡,除了RTX 3090外将全部从芯片层面限制挖矿,包括之前已经推出的RTX 3060/3060 Ti/3070/3080,以及后续将要推出的显卡,今天大家期待已久的GeForce RTX 3080 Ti终于来了。
此次我们根据9个方面来全面分析一下NVIDIA的显卡能力,赶紧看看吧
GeForce RTX 3080 Ti
GeForce RTX 3080 Ti细节特写
关于此次发布的GeForce RTX 3080 Ti显卡,想必大家主要关心的有这几点,是价格和性能,是供货量,能不能买到。由于此次的显卡全部限制了哈希率,也就是以太坊挖矿,所以会减少矿工的涌入。在6月1日台北电脑展发布会上,已经公布了售价为8999元,但国内目前买不到,所以只能期待一波非公版的显卡了,不同厂商会根据公版定价酌情加价,但首发价格一定是比较低的,大家不妨去抢一波。
01 GA102核心的第三张卡
下面我们先来看看在架构上有哪些改动,官方白皮书上对比的对象为GeForce RTX 2080 Ti,相较于上一代的NVIDIA Turg架构,NVIDIA Ampere架构下的GeForce RTX 3080 Ti每个时钟执行2次着色器运算,而Turg为1次,RTX 3080 Ti的着色器性能达到34 TFLOPS单精度性能,而Turg为14 TFLOPS。
第一代NVIDIA RTX架构 Turg下的RTX 2080 Ti
第二代NVIDIA RTX架构 Ampere下的RTX 3080 Ti
NVIDIA Ampere架构翻倍了光线与三角形的相交吞吐量,RT Core达到67 RT TFLOPS,而Turg为43 RT TFLOPS。而且第二代光线追踪最重要的不仅仅是性能提升,还增加了对游戏中运动模糊部分场景的光线追踪计算加速。
第三代Tensor Core可自动识别并消除不太重要的DNN权重,处理稀疏网络的速率是Turg的两倍,算力高达273 Tensor TFLOPS,而Turg为114 Tensor TFLOPS。
GeForce RTX 3080 Ti仍然采用了GA102核心,与GeForce RTX 3080/3090相同,下面我们来看一看RTX 3080 Ti在GA102中做了哪些改动。
完整的GA102核心
完整的GA102 GPU包含7个GPC(图形处理集群)42个TPC(纹理处理集群)以及84个SM(流处理器)组成,而RTX 3080 Ti的CUDA数量是10240个,所以可以推断RTX 3080 Ti屏蔽了两组TPC,所以只有80个SM单元,而完整GA102核心的CUDA数量应该是10752个。
为了查询方便,笔者将这几款显卡的核心参数列出,可以看到RTX 3080 Ti与RTX 3090的核心参数非常接近。相差的两个SM单元,也就是1组TPC,256个CUDA,其实在实际应用中来讲差距并不是很大,最重要的是RTX 3090相比RTX 3080 Ti多了12GB的显存;而相比RTX 3080来说提升就非常大了。
可能有用户会问,既然和RTX 3090的差距如此小,那这张卡的定位是什么?笔者个人感觉RTX 3080 Ti更多的还是为游戏玩家而准备,24GB的显存其实大部分游戏是用不到的,8K除外。
渲染8K素材占用了17GB显存
但在专业渲染软件中,渲染8K或4K素材的显存占用率非常高,能达到17GB甚至更高,这对于只有12GB显存的RTX 3080 Ti就完全不够了,爆显存的危害想必大家也知道,可以导致游戏或软件崩溃,从而进程丢失。
02 NVIDIA Ampere架构GA102解析
GeForce RTX 3080 Ti采用了GA102核心,拥有280亿(28000 million)个晶体管,628平方毫米的面积,基于三星的8nm NVIDIA定制工艺,来自Micron的GDDR6X显存。
本次NVIDIA Ampere的SM在Turg基础上增加了一倍的FP32运算单元,这使得每个SM的FP32运算单元数量提高了一倍,吞吐量也就变为了一倍。
而通常我们计算显卡的CUDA数量,并不是把SM中的所有单元加起来计数,而是只统计FP32单元的数量,所以这样一来,SM中的【FP32 : INT32】 从 1:1 变为 2:1。
GeForce RTX 3080 Ti共有10240个CUDA,其实它有5120个INT32单元,但由于内部的FP32数量翻了一倍,所以最终实现了10240的CUDA数量。
而这样粗暴的提升CUDA数量对于游戏其实有着非常大的帮助,通常在游戏中浮点运算相比整数计算要常用的多,图形、算法以及各种计算操作中着色器工作负载通常需要混合使用FP32算数指令,而FP32的加速也有助于光线追踪降噪着色器。
在去年与GeForce RTX 30系显卡一同发布的还有一项新技术——RTX IO。目前很多游戏动辄几十G甚至百G的安装空间,对于存储空间的负担暂且不提,但存放在硬盘中的数据,如果显卡想要读取到,需要先由CPU从硬盘中读取压缩过的数据,经过解压缩再发送到显存中。
虽然随着NVMe SSD的推出,读取速度相较机械硬盘能够快20倍,但受制于传统I/O限制,NVMe高达7GB/秒的高速读写对于CPU是极大的负担。
传统的数据交换
在这个过程中,会占用多个CPU核心,压力急剧增大,占用较多的内存,而此时其实GPU是处于闲置状态的。RTX IO的作用就是越过CPU解压再传输数据这一步,直接从PCIE总线读取硬盘上经过压缩的数据,并且完成无损GPU解压,降低CPU占用,变向提升了性能。
RTX IO可以极大解放CPU负担
这项技术作为系统底层的运行方式改变,还需要借助微软发布的DirectStorage来实现,对于目前容量的游戏来说,RTX IO的改善效果有限,但假以时日等游戏容量上百G成为常态的时候,这项技术将会发挥巨大的功效。
搭配新增的HDMI 2.1接口,可以支持单线8K的视频输出,而上一代HDMI 2.0仅支持4K 98Hz的视频输出,如果想要连接8K电视,则需要更多的线缆支持。
03 GeForce RTX 3080 Ti外观
还是来看一下外观,在外包装上相比之前的公版没有变化,不过GeForce RTX 3080 Ti这款显卡本身相比GeForce RTX 3080在细节上还是有不少变化的。
GeForce RTX 3080 Ti
GeForce RTX 3080 Ti配件盒展示
外包装依旧是礼盒形式的,收藏感满满,在拿出显卡后下方是转接线和说明书的配件盒,因为此次公版仍采用单12p的供电插槽,所以需要转换成双8p的接口才能使用。
GeForce RTX 3080 Ti 正面
拿出显卡后我们先来看一下正面(由于公版轴流式设计,两侧均有风扇,我们以插入机箱后的方向来区分反正面),相比GeForce RTX 3080的设计整体基本无改动,不过边框部分的内角从哑光改为了镜面,这种略带跳跃的视觉效果相比之前的设计更好看。
GeForce RTX 3080 Ti 内角的金属光泽
GeForce RTX 3080 Ti上机后灯光效果
在这次GeForce RTX 3080 Ti中出了显卡侧面的GeForce RTX的logo灯,在正面还增加了一个“X”的灯光效果,不过由于是显卡自内而外发出的灯效,所以并不明显,需要在较暗的环境下才能看出。
GeForce RTX 3080 Ti背面
GeForce RTX 3080 Ti边框部位NVIDIA logo
显卡背面部分(虽然这看起来更像正面),基本没有改动,边框配色为淡淡的玫瑰金,包括极细微的NVIDIA logo。
GeForce RTX 3080 Ti 单12p供电接口
在GeForce RTX 3080 Ti显卡的侧面,可以看到单12p的供电接口,从整体来看它比较靠近中间部位,但我们都知道公版卡采用了高度紧凑的PCB板,长度也小于一般尺寸,所以其实供电接口已经位于板子的尾部,没有往右挪的空间了。根据NVIDIA官方说明,GeForce RTX 3080 Ti的单卡功耗为350W,下面我们也会详细测试。
GeForce RTX 3080 Ti视频接口
GeForce RTX 3080 Ti的挡板部位颜色也和GeForce RTX 3080不同,后者采用了与散热鳍片相同的黑色,而在新版的GeForce RTX 3080 Ti中也改为了正常的金属色,未作特殊处理。接口方面的配置依旧为DP 1.43+HDMI 2.11的4接口设计,由于新的HDMI 2.1协议,最高已可支持单线8K的视频输出。
散热系统示意
如果是第一次了解公版显卡的朋友们,这里再给大家说一下挡板部位这个奇怪的“栅栏”的用处,由于公版卡采用了双轴流式设计,正面及背面均有散热风扇,正面风扇为主动吸入冷空气为GPU降温,挡板部位则是排出热空气的“出风口”,而背面的风扇则是向上排出显卡内热空气的作用。
04 3DMARK 理论性能测试
介绍一下测试平台,为了保证此次评测能够发挥GeForce RTX 3080 Ti显卡的最佳性能,主板和CPU采用了目前桌面旗舰级配置,具体如下。
在测试成绩上,基准测试采用3DMARK,游戏性能测试使用游戏自带Benchmark,为了减小误差,每项测试成绩均测试3遍取平均值。
GPU-Z参数
看一下GPU-Z的参数,GeForce RTX 3080 Ti采用GA102核心,三星8nm工艺,芯片面积628平方毫米,拥有10240个CUDA,1665MHz频率。采用12GB GDDR6X显存,位宽为384bit,显存带宽达到了912.4 GB/s,光栅单元和纹理单元为112和320。
下面先进行的是用来衡量显卡DX11理论性能的3DMARK FS套装FS,FSE,FSU三者分别对应显卡在1080P、2K、4K的理论性能,取显卡分数实际测试结果如下
3D MARK FS套装测试
在针对显卡DX11性能的3DMARK FS套装测试中,我们选择了上代和本代的4张显卡进行分值对比,以便能更好的反应GeForce RTX 3080 Ti的性能水平。
可以看到GeForce RTX 3080 Ti的性能基本与GeForce RTX 3090相同,差距微乎其微。对比GeForce RTX 3080则提高了不少,整体差距在11%左右。而对比上一代旗舰GeForce RTX 2080 Ti整体提升约为40%。
3D MARK TS套装测试
而在针对DX12环境下的Time Spy和Time Spy Extreme测试中,GeForce RTX 3080 Ti的分数与GeForce RTX 3090的分数差距则要大一些,达到4%左右。而对比GeForce RTX 3080的分数要高出7%左右;对比上一代GeForce RTX 2080 Ti的分数要高出43%左右。
3D MARK 光追测试
PortRoyal是3DMARK中专门针对光追性能的测试项,在这组测试中GeForce RTX 3080 Ti的表现依旧紧咬GeForce RTX 3090,分数差距不超过1%;对比GeForce RTX 3080的分数提升约为11%;对比上一代GeForce RTX 2080 Ti的分数提升则非常大,约为60%。
05 游戏性能测试
在游戏性能测试中,我们选择了《德军总部新血脉》、《孤岛惊魂5》、《刺客信条英灵殿》、《无主之地》,国产游戏《边境》、《光明记忆无限》的benchmark跑分软件。
在游戏测试中,由于显卡驱动的版本更新和游戏更新非常影响游戏帧数,所有benchmark跑分成绩均以本次成绩为准。
《刺客信条英灵殿》游戏测试
在游戏实测中我们更印证了前面的说法,GeForce RTX 3080 Ti和GeForce RTX 3090的大部分分数相同,仅有1-2帧的差距。而GeForce RTX 3080的分数差距在1080P和2K分辨率下也并不大,主要是4K分辨率会有10%左右的差距。
《德军总部新血脉》游戏测试
《德军总部新血脉》并且由于自带两个benchmark,所以我们的数据取跑分均值,这款游戏几乎每更新一次驱动或者游戏版本升级都会导致分数的巨大差异,在本次重新测试中,GeForce RTX 3080 Ti与GeForce RTX 3090的差距依旧微乎其微,而相比GeForce RTX 3080的提升约为4%左右。
《孤岛惊魂5》游戏测试
《孤岛惊魂5》同样算是优化比较到位的3A大作,GeForce RTX 3080 Ti均能达到100帧以上的流畅运行标准,其中4K分辨率下的成绩要领先GeForce RTX 3080 15%左右。
《无主之地3》游戏测试
《无主之地3》是一款采用了卡通渲染风格的游戏,它对于性能要求的下限很低而上限又很高,在1080P分辨率下GeForce RTX 3080 Ti能够跑到147帧,而在4K分辨率下打了对折仅有70帧。
《光明记忆无限》游戏测试
《光明记忆无限》是由飞燕群岛工作室开发的《光明记忆》新系列,目前还没有游戏提供试玩,不过benchmark的跑分软件官方已经提供,玩家可以在steam上自行下载。我们在测试的时候由于无法关闭光追选项,故所有测试成绩均为“RTX 最高/DLSS 质量”模式下进行。在这款游戏的benchmark中出现了惊人的分数一致情况,虽然多测试几遍肯定会有所不同,但在整体趋同的情况下意义不大。
1
网络推广
- 5g网络有多快:5g网络网速有多快
- dota2无法连接至steam网络 为什么无法连接dota2网络
- 无线网络信号接收器 无线网络信号接收器怎么用
- 网络延时是什么意思 网络延时是什么原因
- 无线网络不可用:无线网络不可用是什么原因
- 网络广告销售技巧 网络广告销售技巧有哪些
- 智能手机网络设置 智能手机网络设置在哪里
- 为什么找不到无线网络 为什么找不到无线网络信
- 网络这么赚钱:网络怎么能赚到钱
- 为什么无线网络连接不上 为什么无线网连不起来
- 网络上的人际交往 网络上人际交往的优势
- 支付宝网络系统异常 支付宝显示网络异常什么时
- 营销软件:营销软件有哪些
- 无法访问您要使用的功能所在的网络位置
- 网络安全基本知识 网络安全基本知识有哪些
- 什么网络电话最好用 什么网络电话最好用最便宜