一、前言2019年7月7日,AMD推出了自己新GPU架构,RDNA(按AMD自己的分代是自GCN后7年,GFX6——>GFX10),是A饭们翘首以待7年以来一个全新的架构。
NAVI1.jpg (208.7 KB, 下载次数: 0)
同时推出的RX5700系列显卡,性能上确实也很强,卡在了TU104和TU106之间。那么既然新架构有了,性能还很强,有好事者就想要对比对比这新架构究竟有几斤几两,这也是本次测试的起因。二、核心浅析和变量控制寻找一组合适的对照,成为了进行对比测试的关键。本次测试选用的是RX5700原厂公版和RX480原厂公版(刷为RX580)。RX580使用的Polaris20核心基于GCN4架构,该架构发布于2016年6月29日,而RX5700使用的Navi10核心基于RDNA1.0架构,该架构发布于2019年7月7日。两者的核心面积,算力规模,市场定位均十分类似,适合拿来对比。
蜂蜜浏览器_0.jpg (193.85 KB, 下载次数: 0)
1、概述(1)架构图Navi10是AMD在7nm制程节点打造的第一个主流级别核心。拥有2SE*20CU*64SP=2560SP,256bit GDDR6,64ROP。本次测试的RX5700阉割掉一组DCU,共计36CU*64SP=2304SP。
NAVI2.jpg (244.95 KB, 下载次数: 0)
而之前的Polaris10是AMD在14nm制程节点打造的第一款也是唯一一款主流级别核心。拥有4SE*9CU*64SP=2304SP,256bit GDDR5,32ROP。
POLARIS1.jpg (281.11 KB, 下载次数: 0)
两者定位类似,核心面积类似,功耗级别类似,可以说NAVI10是AMD甜点战略的最新继承。(2)改进浅析别看架构图差别那么大,实际上是因为画法不同,NAVI的画法更接近与单元实际布置位置,基本的逻辑顺序没有大的变化,主要还是每个单元本身发生了极大的变化。(A)先是补课,VEGA(GFX9)上面没有启用的NGG,本次NAVI(GFX10)正式启用了,几何性能(曲面细分)会有一个翻倍的飞跃
PRIM UNITS.jpg (204.01 KB, 下载次数: 0)
阿三的黑点之一,因为硬件单元的问题,VEGA的NGG无法使用
VEGA.jpg (109.68 KB, 下载次数: 0)
(B)完全不同的CU,实现了指令级并行,本次最大改进首先是SIMD宽度翻倍
SIMD.jpg (148.31 KB, 下载次数: 0)
发射端直接翻倍配套的Scheduler直接2X
DCU.jpg (152.89 KB, 下载次数: 0)
解码单元也直接2X
CU.jpg (177.92 KB, 下载次数: 0)
SIMD流水线化因为SIMD流水线化,在WAVE64的情况下下,甚至可以做到4X提升
arch8.jpg (193.63 KB, 下载次数: 0)
(C)增加了L1,各级缓存延迟同步降低
arch14.jpg (168.46 KB, 下载次数: 0)
(D)更强的色彩压缩,没有提具体提升比率
色彩压缩.jpg (148.62 KB, 下载次数: 0)
2、变量控制因为两款核心的规模类似,所以本次测试的原则是尽量同频。(1)核心频率,580保持1340MHz,5700用wattman调到1380MHz(此时实际运行频率是1346MHz)。
580GPU-Z.JPG (116.18 KB, 下载次数: 0)
5700GPU-Z.JPG (113.34 KB, 下载次数: 0)
(2)显存频率,580保持8000MHz,5700通过SPPT降到10000MHz,变量不算完全控制住,带宽相差64GB/s。测试前,我尝试过直接将RX5700的显存频率降到500MHz(等效8000MHz),以匹配580的显存带宽。无奈降到500后显卡驱动不起来,一点一点加频率到625MHz(等效10000MHz)的时候才可以进行测试。之前也找过overclock的hellm大佬,请教如何把显存搞到500MHz,他发了个SPPT给我,结果不起作用,所以我还是只有自己搞了。后面我会给出显存带宽的影响来修正测试数据。(3)ROP,Navi10对比Polaris10的ROP翻倍,这点变量无法控制。但是这里我要说,同一款核心如果阉割出不同的ROP规格,那适合用来做对比ROP的影响(例如660Ti和670);如果本身不是同一款核心,单独说ROP有多大影响是没有意义的(例如580和1060)。因为ROP本身不是主要瓶颈,设计多少ROP完全看这个核心本身的需求,参考我之前的帖子(【黄氏刀法】震惊!NVIDIA主流显卡竟然采用“饥饿ROP”设计)。三、测试平台1、RX5700开箱盒子和5700XT的不一样,不是上下打开的,是一个侧面打开的纸盒
蜂蜜浏览器_1.jpg (154.04 KB, 下载次数: 0)
吹风搞下来封条后,打开盒子
蜂蜜浏览器_2.jpg (153.85 KB, 下载次数: 0)
盒子打开后有个隔间,显卡就直接放在里面,没有静电袋什么的
6.jpg (134.19 KB, 下载次数: 0)
显卡背面
7.jpg (233.24 KB, 下载次数: 0)
贴纸不在背面,在显卡下部,遥想影驰780Ti贴纸短路的事情,这点好评
9.jpg (181.5 KB, 下载次数: 0)
显卡尾部和5700XT不一样,是封闭的
10.jpg (150.42 KB, 下载次数: 0)
8+6供电接口,实际功耗不大,后面有说
8.jpg (200.74 KB, 下载次数: 0)
IO接口依然是3DP+1HDMI,没有加上USBC
蜂蜜浏览器_11.jpg (347.93 KB, 下载次数: 0)
2、测试平台AMD Ryzen ThreadRipper 1900XASUS ROG ZENITH EXTREMEGALAX GAMER DDR4 3200C14*4Intel Optane 900P 280GASUS ROG THOR 850WSTREACOM BC1
蜂蜜浏览器_IMG_20190721_165253.jpg (249.44 KB, 下载次数: 0)
四、公对公默认测试1、基准测试(1)测试数据GPURX 580RX 5700SP23042304ROP3264MC256bit256bitL22M4M驱动19.7.219.7.2最大核心频率1340MHz1625(1690)MHzAIDA64 理论显存带宽256.0GB/s448.0GB/sAIDA64 理论像素填充率42880109056AIDA64 理论纹理填充率192960245376AIDA64 FP3261467785AIDA64 FP64384.1483.7AIDA64 INT3212291559AIDA64 memory copy186202386298FSE627410929TS415678093DMark Vantage Color Fillrate26.8880.853DMark Vantage Texture Fillrate152.43199.71
评论
卡是好卡 但是农企的思路 有时候真理解不了 不给背板 不給灯 老黄现成的套路不学
评论
期待大Navi,我现在买了5700XT纪念版只是收藏,日常还是用的Radeon VII
评论
我想要RX5600
评论
什么时候给中端卡给背板给灯了?
评论
柯基天下第一呢
评论
NAVI2.0先上PS5吧?
评论
帮妳顶顶
评论
顶一个柯基
评论
柯基总是对的
QQ图片20190728205033.png (47.12 KB, 下载次数: 0)
评论
移动客户前来观摩六副总亲自写文章
评论
!.jpg (8.28 KB, 下载次数: 0)
来都来了,不黑一把5700吗?
评论
做到最便宜打价格战啊,这思路有问题?
评论
老黄1060 2060 没灯?
评论
背板和灯 需要多少钱
评论
问一个问题,以前对比N卡和A卡的时候,用N卡时CPU占用率会更高,这回AMD新构架有没有同样的情况呢?
评论
那么问题来了 假设现在8se成新的瓶颈 大naive无法配置更多的前端 单纯堆sp会是个神马表现呢
0023.png (5.5 KB, 下载次数: 0)
评论
b站有视频评测,AMD占用依然更低。我没有专门测这个。
评论
N卡CPU占用高是因为nv的驱动用了更多线程去做优化,和卡本身是没关系的,所以换了navi以后amd的驱动架构不改,cpu占用还是会比nv低
评论
谢谢
评论
了解了。
评论
这卡 居然是 台湾制造 才看到
评论
学习技术贴,另外,Amd Yes
评论
Navi10の未解之谜:
1.Raja、老王各自出了多少力
170305obpnrddl77xgxzln.jpg (209.96 KB, 下载次数: 0)
这张PPT上列举了radeon GPU架构变更的几个关键节点。
1-2,硬件T&L类似GF256,以及图形管线;
2-3,统一渲染架构;
3-4,GCN
4-5,RDNA
未提到Vega。是变化不够大,还是vega并非老王操刀,所以不值得在这里提到?
2.现在的Navi是否就是15年路线图上的Navi?
nextgen memory是否就是指GDDR6,“scalability”到底是啥
Roadmap-640x360.jpg (81.59 KB, 下载次数: 0)
3.与流处理器相仿的polaris10(2560 vs 2304)相比,晶体管增加在了什么地方(5.7b vs 10.3b)
4.RDNA1是全系列,后续有更大核心,还是就出到navi10。更大核心直接RDNA2+光追
评论
最大提升是解决了前端的效率问题,之前4X16变成了2X32
评论
我想知道RX5700玩家园2还会不会闪退,之前A卡14.8RC3驱动开始,全都打不开家园2了
评论
那RDNA跑3dmark那个drawcall测试的dx11成绩还是要比黄卡差一大截?!
评论
CPU-Z DX11 Driver Command Lists
AMD的驱动不支持的
评论
5700xt 没灯?
评论
那只能指望明年游戏厂商都切换到DX12或者vulkan了
20190729_001930-1612x907.jpg (163.01 KB, 下载次数: 0)
等EK水頭等的菊花都謝了
LG 27GL850-B也是。。。。
大概要請孫子燒給我了
评论
阿三滚蛋的太晚了,给苏妈合大胃王点赞
评论
好文必须要顶!
评论
这里面没有三哥的贡献吗?我寻思着研发过程中他还在位啊
评论
gcn出来以后他就在吃老本了
评论
不得不说。chh那个技术范的回归让我高兴。感觉阿三走的时候,那个架构作废了,rnda应该是全新设计的,期待大核心。
评论
咋对一个2500的中端卡要求那么高
评论
我觉得非公5700XT 应该会很牛逼。。。。
评论
谁让我是个傻逼农企显卡的粉丝呢
评论
看这结果,完全就是rop数量增加带来的性能差距啊,楼主认为rop对性能影响不大的结论从何而来?
评论
在不构成瓶颈的情况下,rop数量对性能影响微乎其微。
290x 64rop 2816sp,rx480 32rop 2304sp,前者被后者痛打
评论
看完这贴,越更佩服老黄了,用着12nm,那么点晶体管数量,和可控的功耗,居然打的amd的7nm 新架构不能还手。
评论
Polaris10前端单周期4多边形,32像素,后端配32ROP足够,多的无用
Navi10前端单周期8多边形(NGG,PPT明确写了的),64像素(至少,没有明确数据),后端理所当然配64ROP
从前后端匹配这个角度来说,这两个核心不需要更多的ROP,ROP不构成瓶颈
至于出现ROP瓶颈的卡,660Ti这种最明显,前后端不匹配
评论
我把rop理解为整个前端部分了。所以整个前端部分都包括什么?
评论
我指的是流处理器的后续工段整个部分。既然rop是最终环节,在流处理器和rop中间的工段叫做什么?
评论
rop和流处理器之间没东西。
流处理器其实是在各个阶段都存在的
只是pixel shader在一般渲染流程作为output merge之前的最后一步
评论
唯一的疑问,规模相当,晶体管几乎翻倍,感觉Navi 10可能藏了什么...
但可以预料,这次绝对不是类似Vega的电热丝。
评论
Vega上的NGG反正在Navi上已经确实的启用了
评论
感觉蓝宝石的非公5700没XT会非常口啪
难不成我又要上演一出5个月换显卡的尴尬
苏妈行行好限制一下第三方的TDP吧
评论
就想问一句 这5700XT怎么跑的4.0 X399+1900X还能跑PCIE4?
评论
不能的,GPU-Z乱填的
评论
前几天心动57xt,觉得2700左右的卡能pk2070确实不错。。
是等双11买一块,还是等明年大核心出来再试试?
评论
一直没关心显卡,没想到这货还挺猛的……不过我先要把我290x用挂再说。
评论
售价摆在那里 7nm成本肯定比老黄高
评论
就是更灵活了
评论
我记得是因为N卡的架构是驱动调度的部分比较多(软调度) 缺点是需要同步
AMD是调度器大部分在硬件里完成 但是缺点是不够灵活
评论
双十一买个非公卡,然后等待明年7NM2家的高端卡大战
评论
hmm。。看过之后更期待58xt,59xt咯哇~5950xt 电路 电子 维修 我现在把定影部分拆出来了。想换下滚,因为卡纸。但是我发现灯管挡住了。拆不了。不会拆。论坛里的高手拆解过吗? 评论 认真看,认真瞧。果然有收 电路 电子 维修 求创维42c08RD电路图 评论 电视的图纸很少见 评论 电视的图纸很少见 评论 创维的图纸你要说 版号,不然无能为力 评论 板号5800-p42ALM-0050 168P-P42CLM-01
·日本中文新闻 唐田绘里香为新剧《极恶女王》剃光头 展现演员决心
·日本中文新闻 真子小室夫妇新居引发隐私担忧
·日本中文新闻 前AKB48成员柏木由纪与搞笑艺人交往曝光
·日本学校 {日本国际学校}梅田インターナショナルスクール
·日本学校 LINE:sm287 陳雨菲、20歳、台湾からの留学生、東京に来たばかり
·日本留学生活 出售平成22年走行48000km 代步小车
·日本华人网络交流 円相場 一時1ドル=140円台まで上昇?
·日本华人网络交流 问日本华人一个问题
·日本旅游代购 富山接机
·生活百科 英国转澳大利亚转换插头
·汽车 【求助】修车遇到困难怎么办?