日本电子维修技术 显卡rdna2背后的故事




闲来无事,来聊聊rdna2背后的故事
1.rdna2初期开发计划是在大胃王回amd后主导开发,历时三年,目标是全平台从mobile,console到高性能图形计算卡都能使用
2.rdna2征召了cpu的rd资源,在每个电压/频率点参考了cpu的高频设计做了充足优化,因此我们才能看到rdna2在不改变工艺的情况下频率相比rdna1提高了百分之25甚至更多。这在三哥主政rtg时期各自为战是看不到的。
3.rdna2的infinity cache是在做了大量的case study和仿真模拟后才决定的,所以为什么console部分没有使用到类似技术,时间点上两者开发可能并不同调
4.infinity cache参考了zen架构的设计,运用了server级别的高密度库达成,相比传统设计的l3cache密度提高了三倍,以此来控制die size面积优化成本
5.光追单元集成在cu内,一是便于扩展(未来的mcm),二是光追单元的频率也能随核心整体频率提高而提高。有趣的是mark cerny在给ps5做预研的时候也是类似的设计思路 mark cerny认为较小规模但是高频率的gpu core效率更好 当然ps5是受限于成本 navi21相比起来限制就少了很多
这个我个人理解是rdna2的目标是实现feature,未来的rdna3 rdna4随着cu的增加性能自然也会有线性的提升。AMD这边的思路认为ray tracing还是软硬结合的一个功能,没有像老黄那样那么坚决的走rt core,当然也是为了die size做出的取舍,毕竟老黄已经动不动就整个7 800平方毫米的硅片怪物。。。
6.hbm游戏卡就别想了,未来是gd6+infinity cache的天下

=====================================================================================
总的来说,我个人认为rdna2是真正结合cpu和gpu架构的产物。算是amd在lisa,纸大师,rick bergman,大胃王四位技术高管在amd收购ati 15年后真正携手开始重视在gpu领域上发力的成果,相比起之前三哥自己搞自己的独立王国和一些不着边际的设计思路,rdna2的开发目标明确简单而且非常高效,而且也充分说明领导者的重要性以及amd和ati深厚的技术储备。
因此我断言rdna3肯定会打破amd自己设下的performance/watt目标,并且在raytracing上面应该也会有长足的进步




评论
等一个7900xt
结论就是等等党又赢了

评论

我相信RDNA3的navi31比navi21强1.5倍(2.5倍性能),而且农企完全可以在一个CU里再加1-3个光追的模块吧,完全可以做到,到时候光追的性能大幅度提高也正常,不过游戏光追化之后,RDNA2估计无法战未来了

评论

强2.5倍就是3.5倍咯,不过也合理

评论

可见的未来还是光栅化为主的,本世代console才刚刚上市,起码也得5年时间才有下一代,而且这破新冠搞得全世界到处都爆炸我估计这世代的寿命起码7年。。。。
像地铁那样全盘做光追导致老卡玩不了只有老黄塞足了钱游戏公司才敢搞

评论
阿三瞎搞,罄竹难书

评论
RDNA2的RT加速器没输吧,算上主频甚至是胜了。他光追慢难道不是因为单精度算力被安培的双倍FP32单元按死了么...其实rdna2最大的问题还是没在光栅性能上把纯为了光追性能优化设计的安培给按住如果双方一加一减之下rdna2的光栅能赢3090 10%以上那他现在的评价就会完全不一样了。

评论

这个就是设计思路的区别了,nv有本钱可以在整个核心架构上为了raytracing堆某个单元,但是die size爆炸直接600+,就只能回头去用三棒的8nm(10nm改良版产物),但是效果当然是不错的,老黄确实不缺钱,但是给臭打游戏的那么好工艺好像也浪费了

amd则是在die size限制下跳舞,虽然跟着cpu能拿到很好的工艺但也不能超预算,所以现在的rdna2已经是rtg能拿出来的最优解了

评论
这代6900XT我已经很满足了

之前3080 COD17 2K分辨率核弹镇同样设置

之前3080FPS最高不过170最低110-120

换了6900XT后最高FPS200多点最低FPS160

但是光追和DLSS就是硬伤了没办法

评论

dlss我实际体验过真不行,动起来糊的一p
看看amd的fsr什么效果吧
个人觉得这些后处理技术都是奇技淫巧,短时间内为了解决算力不足而想出来的凑合解决方法,就像aa还是ssaa和msaa效果最好一样
要是gpu的mcm能成熟到zen这边chiplet的程度,那么最后还是堆核心解决问题,等rdna3出来吧

评论
就是这A卡驱动让人很烦躁 不够智能化

换了6900XT 用POTPLAYER放4K片源直接能给我GPU频率2.5G跑满

最后摸索出来办法再全局设置里限制FPS199  可以把POTPLAYER 得影片FPS限制144

至于为什么要开到199 才能跑144限制完全不懂  但是游戏里的确限制是199

A卡很多问题只能自己摸索 之前3080用起来真是省心太多 驱动一装显卡设置一改 基本都不用在去看驱动面板

评论
游戏卡追的比较近了,专业卡呢

评论

专业卡慢慢来咯,反正大胃王和rick在,rtg就有戏

评论

改了,表述错误

评论
RDNA3是不是可以把千层饼技术也用上  RDNA2的大缓存应该是为千层饼打基础

评论

千层饼是啥,3d堆叠?

评论

没必要把期待放低,反正不止2.5

评论

都这么自信的吗,3代直接干6块核心不成?

评论

zoo说是大杀器的东西  应该是  

评论

保守估计吧,反正mcm的话,核心总面积可不止700了吧,到时候和nvidia正面堆面积了,mcm变相让农企可以做超大核心了

评论
哦嚯  舅妈故事会  顶一个

评论
插帧还会搞吗

评论

等ibm 2nm 再买

评论
征召了这么多资源RD的结果就是产能优先甚至还不如市场份额开始下跌的desktop cpu

评论

这么多R&D资源大部分都是为了完成游戏主机的contract。。Xbox Series跟PS5加起来大概已经卖了千万级别了吧。桌面卡一年都卖不了这么多。

评论
三哥raja说:吃我 Intel xe 一棒

评论

其实tsmc产能是够的 问题是基板不够
所以封测产能优先server和console了 server今年涨了很多 这是amd最看中的市场

评论
期待老黄的核弹啊,争取这五年内,显卡性能翻8倍!苏妈,老黄加油!

评论
我对舅妈的可信度从不质疑,但 第四点“相比传统设计的l3cache密度提高了三倍”是纯粹的瞎扯。
别怪我较这个真哈。

图片1.jpg (481.68 KB, 下载次数: 0)

2021-5-15 22:00 上传


就算Navi 21只有500 mm2 那个cache也不会小于77mm2。
实际情况大概在1.6M per mm2左右
也就是说,传统设计密度 L3 cache大概是0.5x per mm2.
那么对比同级别制程下Zen3/TGL的L3

QQ图片20210515220510.png (511.24 KB, 下载次数: 0)

2021-5-15 22:05 上传


Zen3即便是算了互联的总线部分拖累,32M L3也就33.63 mm2 实际也有0.95 M per mm2,扣掉之后怎么也有差不多1.2 M per mm2.

QQ图片20210515220647.png (674.13 KB, 下载次数: 0)

2021-5-15 22:07 上传


膏子的L3跟ringbus总线划分的更清楚
3M l3也就 2mm2左右,甚至有1.5 M per mm2
至于ARM产品走高密度库的L3更是占比绝大多数。
其他的几点我都相信舅妈,就这一条建议改一下咯~



评论

老黄:我基板管够,有史以来最畅销的游戏卡,数据中心炼丹卡翻倍infinite cache还是要大些才行,现在128M在4k时已经全面落后90,68xt和69如果能上256的话应该对80 90在高分情况下就不会劣了

评论
还我补帧

评论
那么xsx2和ps5p是什么时候。4倍性能提升?

评论

其实地铁那种也远算不上全盘光追   只是相对占比高

评论
作为a粉,之前还因为把6900xt卖掉(原价)有些遗憾,但是转念一想ps5也是用的amd家的东西rdna2这一代也算支持了

评论

根据新闻,去年全球pc出货2.75亿
老黄大概占pc gpu市场的15%上下,苏妈独显跟老黄的比例大概2:8到3:7,一年千万还是能卖到的

评论
游戏卡放弃HBM是必然的
目前所有的用HBM的游戏卡都是失败产品

评论
移动卡还没看到

评论

这个2.75亿包含了核显吧……

评论

看重server是必然的,PC市场能赚几个钱,DIY玩家在整个行业中更是小众。肯定优先高利润高发展性的行业。

评论

光栅的游戏,现在大家都能跑得动,6900就算比3090强10%,也不影响体验,但是3090的DLSS和光追搭配,是把不能玩变成能玩,例如2077 灵媒之类的开4K光追,想流畅只能DLSS,按摩店完全没办法,只能关光追,还有8K游戏也类似,而且我个人没觉得DLSS2.0开平衡以上模糊,不细看完全看不出,当然例如死亡搁浅漂浮石块的小BUG还是有的。

评论

后面老黄占15%上下也是包含核显的,amd独显算老黄的1/3吧,2.75亿*5%

评论

这个是大胃王自己开briefing的时候说的 又不是我自己胡编的

评论

其实还是比较少 要知道 皓龙当年拿下了40%多 还不是被Intel缓过神来  

评论

这个确实非常关注,所以480卖掉后,还留了一张460,如果新卡也能开启补帧,老卡完全可以拜拜了

评论
总体来讲大卫王回归了以后RDNA就是做的有模有样
憨憨阿三就是要权不做事。 XE搞了3年多了,搞了个锤子出来。raja换个地方做VEGA而已。

评论

vega背后还有很多故事
rtg血泪史

评论

这也是为啥AMD能做到科技史上的奇迹。阿三真的拉跨

评论
三倍是说的对比L2,当然IC的速度比起L2也只有四分之一啊

评论

在游戏上失败,在挖矿上爬起来。还是赢两次。。

评论
为啥navi到现在还是不能炼丹有人能解释下么

评论

2000w电源哪家强

评论


navi可能还等着用mi200超算的国家实验室帮忙写驱动呢,等金坷垃的tenstorrent加速卡可能都比amd靠谱。。。

评论

插帧已经被放弃了不用再惦记新卡会有

评论

算shader的驱动稍微改改就就行,中高级API rocm都有,其实navi是完全具备炼丹能力的。

原因应该不是技术上的。

评论

翻翻这个github串https://github.com/RadeonOpenCompute/ROCm/issues/887。一个月前的说法是2-4个月会更新rocm。国家实验室那台机器应该得支持的,所以deadline应该是机器上线之前。。。

评论

2019年到现在其实应该早就做好了(只是可能没有做好debug和优化),一直没放出来。里面提到kernel function编程支持说明navi做dl没什么问题,只是自己手撸核函数比较麻烦,另外说一句核函数编程和shader编程比较类似。

我个人并不指望能够一开始就放出一个非常完美的rocm高级API支持,毕竟big navi后增加了ic,是有一定的优化难度的。当时发布rocm第一版的时候也不完美,但整个rocm同样包含了低级核函数实现到高级的api接口的全部内容,接口全部是照抄cuda。

评论

短时间内估计不会有咯 现在都缺成这样 等4年以后吧

评论

普通卡直接跑不了 这种事情除了老黄可劲塞钱给乌克兰穷比公司能做 别的公司基本不会接的

评论
GCN 系列和 NVIDIA 现在使用 HBM, GDDR6X 的 GPU,走的是 IMR (Immediate Mode Rendering) 的渲染路线。

AMD 则使用 Infinity Cache + GDDR6,这种优化数据处理平衡计算、访存负载的方式,在未来势必重构 PC 与主机端的渲染流水线。如果我们进一步考虑 AMD 在 RDNA2 发布会上推出的 Smart Access Memory 技术,大概可以想象到 Infinity Cache 与 Smart Access Memory 未来会进一步整合。

进一步去看,如果以 PICE 5.0 (甚至是 CXL 2.0) 作为基础,新一代的 Infinity Cache 与 Smart Access Memory (Cache) 或许可以让 AMD 平台的渲染方式由 IMR 转向能效表现更为优秀的 TBDR。

HBM / GDDR6X 与 Infinity Cache + GDDR6 会在未来持续交锋,我个人更看好 Infinity Cache + GDDR6,毕竟在设计上更加取巧、也更便宜实用。(个 P ,HBM 才是高性能计算的未来.jpg)
希望 RDNA3 如同「加强版的 HD 5870」,横扫顶级 GPU 战场,逼着新一代的 TITAN 上 HBM 显存。否则,未来想玩到的 HBM 游戏卡估计也就指望 The King 了。


评论
说穿了没啥稀奇的,要能耗比高就是少塞电晶体数量多的可编程单元,多塞不可编程单元
难点在於ATI从来设计过这类玩意,等於从新开始,RDNA算是与fusion时代AMD/ATI彻底告别

评论

Infinite Cache 首先要做的事与游戏厂商密切合作,优化渲染流程。

评论

4k的落後的原因是shader性能不足,分辨率越高shader占比越大,光加IF缓存没用
黄老板这样搞当然也不是为了4K碾压对手,而是炼丹性能
以前A卡挖矿强的时代也是分辨率越高越能战


评论
手上留著2012年的7770,4K SDR能正常插幀,2017年的1050TI支持8K60解碼
副卡搭配好解決RDNA/RDNA2架構的不足完事

评论
现在A卡最大的劣势反而是编码器 解码器了。。

评论

是的,我也在等A卡赶上蓝厂的时候

其实我很想买张蓝卡,做解码用

评论

其他还有什么问题吗?

据说显存待机的时候也不降低频率?

评论

恩  就跟那些专业软件一样  公司收钱 然后检查只要不是专业显卡  就直接帧数砍一半或者1/10一样

评论
大量的6700xt在哪里?

评论

这个东西已经没必要做到显卡上了。苹果这个东西就是跟核显脱钩的

评论
我不A黑,我是A饭,但是A家只认JD吗?这背后又有啥故事?什么时候能买到平价卡?非得抢购吗?不能预约登记购买?挖矿有几个用6000系列的?这么下去把人都逼成A黑了,就不能在天猫放货?

评论

天猫出过货,就是那个挂着AMD旗舰店的渠道;而且天猫的店价格是直接对接海鲜市场的,难得有低价也是出多少基本转进小黄鱼,和狗东也没差了

评论

但是AMD CPU上也没有。。所以有点不好用

评论
五舅妈不要瞎下预言,被打脸不好看

评论

必须塞在显示输出端呀
相比解码前的视频码率,解码后的视讯带宽需求是非常大的。

评论

PCIe带宽足够大,你看论坛里好多人专门买个Polaris补帧,那个就是要在不同显卡之间copy解码后的视频裸流,还是补过帧的。同理如果是软解也要从主内存copy到显卡输出。

评论
“mark cerny在给ps5做预研的时候也是类似的设计思路”他在预研时期就已经这样设想了?GPU部分这么大的rop也想上2.23Ghz也真够冒险的(虽然现在事后诸葛看起来是压住了

评论
牙膏厂被三哥祸祸的哭都哭不出来了。。。。 电路 电子 维修 求创维42c08RD电路图 评论 电视的图纸很少见 评论 电视的图纸很少见 评论 创维的图纸你要说 版号,不然无能为力 评论 板号5800-p42ALM-0050 168P-P42CLM-01 电路 电子 维修 我现在把定影部分拆出来了。想换下滚,因为卡纸。但是我发现灯管挡住了。拆不了。不会拆。论坛里的高手拆解过吗? 评论 认真看,认真瞧。果然有收
 ·日本中文新闻 唐田绘里香为新剧《极恶女王》剃光头 展现演员决心
·日本中文新闻 真子小室夫妇新居引发隐私担忧
·日本中文新闻 前AKB48成员柏木由纪与搞笑艺人交往曝光
·日本学校 {日本国际学校}梅田インターナショナルスクール
·日本学校 LINE:sm287 陳雨菲、20歳、台湾からの留学生、東京に来たばかり
·日本留学生活 出售平成22年走行48000km 代步小车
·日本华人网络交流 円相場 一時1ドル=140円台まで上昇?
·日本华人网络交流 问日本华人一个问题
·日本旅游代购 富山接机
 ·生活百科 英国转澳大利亚转换插头
·汽车 【求助】修车遇到困难怎么办?

维修经验

CPUcpu-z 1.77版低调发布

日本维修技术更新: New benchmark “submit and compare” feature New clocks dialog reporting all system’s clock speeds in real-time Preliminary support for Intel Kaby Lake AMD Bristol Ridge processors 主要是增加了支持I、A两个新架构的 ...

维修经验

CPU这几天经常开机黑屏,热重启后又正常

日本维修技术这几天经常开机黑屏,热重启后又正常,今天热重启也不管用了。折腾半天总算点亮,显示超频失败,以前出这个画面我是不理它的,直接重启就能正常进系统了,今天不敢托大,因为 ...

维修经验

CPU超频求助!关于华擎H170和6700K

日本维修技术问题见楼主的show贴 https://www.chiphell.com/thread-1634895-1-1.html 这次华擎的H170 Hyper最大的特色应该是自带时钟发生器可以自由超外频 可是楼主好久没有折腾超频了。。。 两图中除了CPU外频 以 ...

维修经验

CPU液态金属会侵蚀cpu核心吗?

日本维修技术前阵子看到有人说,液态金属时间长了会侵蚀cpu铜盖,那么问题来了,这货会不会侵蚀核心呢? 评论 这玩意儿好像只对铝起反应 评论 不是说,cpu的盖子是铜的吗。。。 评论 不会,核 ...

维修经验

CPUm6i究竟支不支持e3 1231v3

日本维修技术官网上看支持列表没写有e3 1231v3,装机帖又有人晒,百度也没个明确答案,那究竟能不能点亮?有在用的chher说一下么 评论 升级最新bios肯定可以支持 评论 我的p67evo官网上也没说支持12 ...

维修经验

CPU华擎 HYPER 妖板 正确玩法

日本维修技术600元的 B150,10相供电,释放洪荒之力 注意必须官网 Beta 区的 BIOS 有 AVX 的 CPU 可能会掉缓存 启动时按 X 键激活 SKY OC,重启后进入 BIOS 160924164727.jpg (95.63 KB, 下载次数: 1) 2016-9-24 17:47 上传 ...

维修经验

CPUE5 2686 V3和i7 6800K如何选择

日本维修技术默认用,不超频,两者功耗是一模一样的 E5 2686 V3:2.0主频,3.5睿频, 18核心36线程 ,45M L3 咸鱼大约2500~3000元 i7 6800K : 3.5主频,3.8睿频 ,6核心12线程 ,盒装3000元 评论 性能应该是26 ...

维修经验

CPUHD530硬解4K能力还是有点弱呀!

日本维修技术播放器用PotPlay 64bit,各种优化后,跑4K @120Hz视频只能到70帧左右的速度,勉强能用! 显示器用的4K的优派VP2780 未标题-1.jpg (211.97 KB, 下载次数: 0) 2016-9-26 21:29 上传 评论 这个估计你没优化 ...

维修经验

CPU6900k 1.25V到4.2体质怎么样

日本维修技术如图,体质怎么样,ring是35,没敢试了,都说ring高了毁硬件 评论 不错的U,但不算雕,上4.4就大雕了,这电压上4.5的目前没见有人发图 评论 谢谢前辈告知 评论 我这个用1.2V超的4.2,R ...

维修经验

CPUI3 6100 华擎B150M pro4超4.5g测试。

日本维修技术看看论坛没多少i3 6100的帖子,就转下自己发的show贴里面的数据,给大家参考下。家里还有当年的神U i3 540 oc 4.5G在给老妈用。 不知道数据上正常吗?有6100的朋友可以告诉下,另外是不有 ...

维修经验

CPU7系u会兼容100系主板吗?

日本维修技术RT,听说要推200系板,100系还能用吗以后。。 评论 兼容的 评论 感谢!以后换u就行了,目前消息200系板会有新的特性吗? 评论 24条PCI-E 3.0通道、支持Intel Optane混合存储技术、十个USB 3 ...

维修经验

CPU有心入5820k了,求教下温度问题

日本维修技术一直徘徊在6700k和5820k之间,6700k现在这德行直接把我推向了5820k啊,从2600k升级上来,三大件都要换,现在唯一疑惑的是IB-E ex这种顶级风冷能不能压住4.5g的5820呢?毕竟刚刚买一个多月。 ...

维修经验

CPU6600&6600K才100的差价

日本维修技术太少了吧。。。 6600.JPG (106.91 KB, 下载次数: 0) 2016-10-1 10:30 上传 评论 毕竟只是i5而已…… 评论 上z170 6600也能超,等于没区别,差价能有100已经不错了 评论 然后又见不超频人士推荐超频 ...