日本电子维修技术 显卡<後藤弘茂>那么RDNA和Navi到底是什么?



内容不少,4千字,图就不贴了,在原帖里。https://pc.watch.impress.co.jp/docs/column/kaigai/1187758.html
搭载押注未来10年的游戏向架构RDNA,AMD发表了7年以来的全新GPU核心Navi
这是2012年以来,AMD的时隔7年的GPU微架构更新 AMD的7nm制程GPU架构Navi是AMD的GPU从2012年以来,时隔7年的较大架构变化。 Navi的全新微架构名称为RDNA。和以往AMD的GPU架构GCN相比在微架构层面上将有所不同。通过架构的升级,IPC性能得到了1.25倍提升,每瓦性能获得了1.5倍的大幅度增长。AMD在发布会中说明,RDNA架构是为今后10年的游戏所设计的游戏专用图形架构。 在台北电玩展的主题演讲中,苏妈亲自揭开了RDNA的神秘面纱。 苏妈说:“我们为Navi准备了全新的RadeonDNA架构,该架构将有别于GCN架构。之所以叫做DNA,是因为AMD从事GPU领域的架构设计有很长的历史。其中孕育出来的GCN就是非常优秀的架构。今后GCN架构也将为了大量的高负荷应用程序而继续存在。 同时,Navi将专注于游戏领域。游戏所追求的高性能、高响应速度、高频率、低能耗都是Navi所关注的,同时这也是第一块配备了PCIE 4.0的游戏向GPU。 我们在设计ZEN架构的时候就决心从零开始设计它。原因是我们坚信着眼于未来的全新设计是不可或缺的。RDNA也是基于从零开始的理念设计的。RDNA将会成为支撑未来10年游戏的架构游戏引擎。AMD采取长期坚守一种基盘微架构的策略 AMD在GPU方面一直有着一旦采用了某种微架构,就将在较长的时间内持续使用的倾向。而NVIDIA则是每次更新GPU都会在相当程度上修改微架构,这种策略与AMD截然相反。因此在开发这个可以新三年旧三年缝缝补补又三年的基盘构架RDNA的时候,AMD花上呢很长的时间,认真稳当的设计,期待它能成为可以满足长期斗争的根基。 AMD在2012年发布南方群岛系列HD7000的时候刷新过一次GPU微架构,即沿用至今的GCN。在这之前,从2007年的R600系列的HD2000开始,采用的是基于统一渲染架构的VLIW处理器构架。除了在中间的修订版本中将VLIW的指令槽(instruction slot)由5削减为4以外,VLIW风格的构架基本没大改,持续用了5年。在切换到GCN后,更是变本加厉的从2012年用到7年后的今天。 从工艺制程的视角来看,VLIW架构是80mm用到40mm,CGN是从28nm用到14nm。随着工艺制程的精细化提升,可以集成越来越多的晶体管时,构架也会发生大的变化。于是这次乘着更新7nm工艺的东风,AMD终于下定决心导入RDNA构架。如果遵循以往的模式,这朵RDNA架构今后也会用到5到7年,直到20年中叶,都可能要做为AMD GPU构架基盘而存在。 RDNA微架构的特点 那么Navi和RDNA构架到底是什么样的呢?AMD在台北电玩展中明确的微架构特点有三点。 第一点,AMD全新设计了处理器核心,即CU。AMD坚持了7年的GCN CU设计,在Navi上终于做出了变化。 苏妈说:“在CU设计上我们更加重视效率,提升了每个时钟周期所能执行的命令数。“GCN的一个CU中包含4个SIMD模块,每个SIMD模块均封装了16路的向量单元,该设计将一个包含64线程的batch wavefront(类似NVIDIA的warp,线程的编组)以4并行度 x 16发射的形式进行并行执行。所以可以认为这种并发结构将会发生改变。 GCN本来是为了通用计算而诞生的,设计时充分满足了通用计算的各种功能需求,然而这对于图像应用而言就会稍显overkill。例如,从计算单元与寄存器的比率来看,寄存器的数量从一开始就显得非常的多。如果架构稍微偏向图像应用一点,那么就有可能设计出一个更有效率的构架。 第二点,在Navi上,缓存体系也将改变。据说在RDNA构架中通过设计了全新的缓存体系,降低呢延迟、提高了带宽、提升了响应速度。GPU设计传统上比起缓存大小而言更重视寄存器的数量,一般的做法是通过不断切换线程来掩盖内存访问延迟的问题。例如GCN的CU构成中,对比起高达256KB的寄存器,却只集成了16KB的L1数据缓存与64KB的便笺存储器(SPM)。这样看来在传统GPU缓存体系上,历史遗留问题拖后腿的地方不少,可以改良的空间巨大。 第三点,通过将图形处理流水线Streamlined化,可提升图形性能。为什么要削减图形处理流水线的复杂程度呢,这也跟GPU的历史遗留问题有关。 GPU架构设计从古代继承而来的图像处理专用流水线已经逐渐变得复杂。而在DirectX 12和Vulkan这些所谓新时代API中,已经在API层面完成了Streamlined化。所以在图像处理管线上也必须进行重新设计,跟随时代的进步。如果还是采用比较复杂的流水线设计,那么就可能潜藏着容易影响频率提升的Critical Path的可能性就比较高。重点优化这里的话就容易提升GPU频率。 AMD最先发布的Navi家族产品是Radeon RX 5700。在台北电玩展的发布会中也公开了实物。发布会中也重点强调了其匹敌RTX2070的性能。为什么不和RTX 2080比较可能是因为价格区间是和2070对位的原因。AMD在宣传中说性能比RTX2070高出10%。 目前还不明确的光线追踪支持 Navi在feature层面最大的疑问就是是否有实装类似图灵构架中的那种硬件光线追踪器。 根据SIE发表的信息,下一代PS搭载的Navi GPU中是有光线追踪功能的。但是这个PS5的光追功能是Navi提供的统一功能还是SIE专用的目前还有疑问。 不过按照以往经验,PS/PS4的确会有一些领先的扩张功能,但这些功能基本上都是来自AMD面向PC构架开发的功能,只是抢在PC之前先用上了而已。因此很难想象光追功能是SIE独自开发扩展的。那么光追硬件设计来源于RDNA构架就是自然而然的想法了。 但是目前预定7月发售的Radeon RX5000系GPU是否搭载了光追硬件却是个未知数,我觉得大概没有。这里有几个理由。第一,AMD在介绍Navi的时候完全没有提到光追的要素。然后是目前最初版本Navi的die相对较小,猜测对比起目前的Vega 7nm产品而言在晶体管数量上并没有显著的提升。 AMD的14nm GPU Vega64相对于7nm制程而言是落后的。Vega10的die尺寸为486mm2,而7nm的Vega20为331mm2。在计算单元上,内部构成上虽然有差别,但数量几乎没有变化,所以最终晶体管数量只是增加了一点点。 7nm制程工艺下需要抑制die尺寸的增长么? 本次公开的Navi架构比起Vega20而言可以说核心又缩小了。大约目测算了下大概260-280mm2的程度,在基本都是300mm2以上的GPU阵营里只能算是弟中弟。 所以可以推测出Navi比起Vega而言微架构效率更高,标准设计库(standard cell library)也经过微调,同时内存访问接口部分面积也缩小了。不过就算算上这些东西,初版Navi会装备会大量蚕食晶体管数量的光追单元也是一个小概率事件。 顺便说下和RX 5700对位的RTX 2070的核心尺寸为445mm2。RX5700的Navi核心仅为TU106的60%大小。不过单位核心面积的成本12nm和7nm是不一样的,不能这么单纯比较面积。 所以对于AMD而言,至少在当前这个时间点上还是必须抑制7nm核心面积的尺寸。究其原因可能还是因为曝光过程过于复杂,现在的浸液版7nm制程工艺(7nm duv)的晶圆还是太贵了。 还有另一个原因,因为随着工程的环节增加,提升良率的曲线也会趋于平稳(也就是良率越来越难以提升)。所以就现状而言,使用7nm制作大核心在制造上还是挺难的。这种Duv的特殊情况也成为了Navi这代扩展构架功能的一个限制条件(光追单元没法装上)。 试想一下,如果Navi也有光线追踪单元的话,那么就等于NVIDIA和AMD两大GPU厂都支持了光线追踪,再算上PS5的支持,这将加速光线追踪的铺开和发展进程。但是如果NVIDIA和AMD在光追单元实装的方法上有较大区别的话,将会增大软件厂商的负担。 光追的流程包含光线发射的Traversal过程和判定光线与物体接触的Intersection Test过程,这两个基本部分大概是相同的实现方式。 但是在Traversal中,在几何数据的管理上两者有不同的地方。这是因为NVIDIA和AMD在数据生成的方式上有不同之处。NVIDIA采用的是BVH结构,这是一种将3D空间中的对象以树形结构管理的方式,AMD是否也这样做是存疑的。然后是下一代XBOX估计也是用AMD方案,但是否支持光追却也是存疑的。 AMD的CPU也将非为计算向和图形向两个体系 随着RDNA的登场,AMD的GPU将由GCN完全变更为RDNA么,GCN会进入历史的垃圾堆么?然而并不是,也不能。至于为什么,那是因为AMD仍然需要为通用计算优化的GPU类型。AMD使用7nm工艺,首先完成了Vega架构的升级,仅隔数月就发布了Navi架构,这是有原因的。虽然这次发表的7nm Vega是面向图形市场的产品,但最先采用7nm Vega技术的却是计算向的Radeon Instinct(雷7也被认为是RI MI50的阉割版本)。相对的Navi则是7nm图形向产品线的开始。至此,Vega和Navi的定义开始不同。 这样看来,AMD的GPU也逐渐分化为了两个系统。包括Vega等使用GCN核心的计算向产品和Navi等使用RDNA核心面向图像的产品。针对不同的产品类型进行针对性的特别优化。之前采用GCN攻占两方市场似乎并未成功,今后图像市场将会交给RDNA来战斗。这方面简直和NVIDIA的策略一毛一样,NVIDIA这边是GPU计算方面使用Volta,而图像方面则交给Turing架构。 同时,AMD在7nm GPU产品中针对内存的支持也分化为两个系统,也是因为GPU构架的方向性有所不同。面向计算的Vega20使用高成本高带宽的HBM2,而图形向的Navi则采用低成本的GDDR6内存。战术简直就是NVIDIA的翻版,Volta用HBM2,而图灵则用GDDR5/6。 今后Radeon Instinct是否也是走GCN核心的路线发展? AMD似乎认为即使导入了RDNA后,GCN构架的GPU路线图仍然有发展的必要性。主要是因为Radeon Instinct似乎还是有市场的。虽然如今在服务器和超算领域的GPU上被NVIDIA一时压倒。但是就在上个月,画风突变,美国计划中最强的超算中心橡树岭实验室公布的下一代超算Frontier中,采用了基于AMD CPU与GPU的架构。即EPYC和RI的组合体。 如果观察美国超算的动向可知Frontier采用AMD方案所带来的冲击。下图是AMD的对手NVIDIA主办的GTC中发表的美国超算路线图,那个时候Frontier的规格还没公布,所以写着TBD。 2018年的超算中,ORNL和LLNL两者都采用了IBM Power CPU和volta的组合架构。其中准Exa规格的LBNLNERSC超算中心的Perlmutter中,采取了CPU为AMD,GPU为NVIDIA的组合。但是在进入真Exa世代后的领军超算Frontier中却采用了AMD纯血方案。 情况的巨变也打开了Radeon Instinct的市场。当然最顶端的超算对更广阔市场的直接影响是有限的,但多多少少也会有所冲击。既然RDNA已经负责了打好图像性能的江山,那么GCN系的GPU大概也会成为未来计算向GPU的构架而继续发展下去。 顺便说下在基于duv的7nm Vega和Navi之后的制程技术,因为情况有点复杂所以难以推测。TSMC的制程中,目前的ArF准分子照射浸液的7nm 7FF之后还有EUV曝光版的7FF+。但是据说7FF+中能够使用EUV的仅限via工序这一步,这样来说在布线方面与7FF比起来会更加细小,与7FF之间缺少了设计上的兼容性(同样芯片同样制程,DUV和EUV需要两套芯片设计验证) 所以TSMC紧急发表了命名为6nm的工艺制程技术。该技术可以在line和space的部分也采用EUV工艺了,因此在布线上也和7FF技术是设计兼容的。所以如今的芯片厂商或许会犹豫,是使用性能更好的7FF+呢,还是等待性能不仅好而且在设计上兼容性更好的6nm来降低成本呢,还是继续赌一把等5nm我全都要呢。


评论
意思就是我买不起,你买的起

评论
定价貌似499刀

评论
GCN还要在延续吗?

评论
就是为每代游戏机推出一种架构.....反正主机天然优化不怕过时。

评论

GCN成了计算卡了,游戏交给dna

评论
其实就是有钱了终于可以多线操作了。。

评论

以后买得起RDNA,买不起GCN了。

评论
能耗比是不是没有什么提升

评论

能耗比提升1.5

评论

这表述应该是提升50%,是原来的1.5倍吧  然后这里面制程带来的能耗比提升占了多少

评论
GCN说了,让你们天天瞧不起我,不跟你们玩儿了,以后好好学习,天天向上。

评论

这个价还是有点高了,499刀刀国内就得4000的价格了,比2070要高一些

评论
RDAN为游戏专用架构
期待下


评论
老黄那边好像近几年一直是双线操作……

评论

14nm做农企版980
7nm做农企版1080

显然这个1.5纯粹是制程提升

评论

看你们天天聊显卡,我就一个问题,没钱买哪个

评论
感觉就是制程带来的提升

评论

没钱当然先赚钱呀这方面丝露花雨很有经验,她都买5张图灵卡了

评论

赚钱没有路子啊,现在穷的有腿没裤子

评论

别灰心  很多人都是连胖次都脱掉开始赚钱的

评论
楼主这是自己翻的吗, 其实用感觉只用euv做via还是很合理的。具体数字不能说但是via尺寸快顶俩反相器大小了,我做的还是某厂fdsoi,22nm往下可想而知。听别人说再往下的某厂工艺pmos栅极还有电流,算是匪夷所思了。

评论
镭妻是7nm的GCN吧,等RDNA出了对比一下就知道多少是架构提升,多少是制程红利。

评论
不知道太极殿的5ff是不是兼容7ff+的设计规则

不兼容的话估计更多产品会弃用7ff+,要么用兼容7ff的6ff要么上更好的5ff

评论

不如说GCN本身就是计算卡,AMD当时没钱,没法搞两套设计,所以让GCN强行兼职了7年游戏卡,结果也可想而知,那些偏向计算卡的设计全部变成了电阻丝。

评论

感觉还是贫穷的气息。要是有钱就在发新一个新计算构架了。

评论
还不买暴苏妈的蕾妻!最后一代图形GCN!

评论
RDNA似乎在指令集方面继续沿用GCN来着

评论

但是IPC提高了,那就还行

评论

VEGA56刷WX8200岂不是头顶青天

太开心了树导
这么好的文章被个RBQ的粗鲁评论给毁了

评论

听说明年的navi20才是全改。现在的navi是 gcn大改。

评论

指令集改了的话ROCm等等会蛋疼

评论

我觉得现在是类似x1800的状态吧,各种参数来看似乎就是x800超频,直到x1900横空出世。

评论
存一块vega7做纪念吧。。

评论

vega56刷了vega fe。。。

QQ截图20190608164047.jpg (112.99 KB, 下载次数: 0)

2019-6-8 16:41 上传


电路 电子 维修 求创维42c08RD电路图 评论 电视的图纸很少见 评论 电视的图纸很少见 评论 创维的图纸你要说 版号,不然无能为力 评论 板号5800-p42ALM-0050 168P-P42CLM-01 电路 电子 维修 我现在把定影部分拆出来了。想换下滚,因为卡纸。但是我发现灯管挡住了。拆不了。不会拆。论坛里的高手拆解过吗? 评论 认真看,认真瞧。果然有收
 ·日本中文新闻 唐田绘里香为新剧《极恶女王》剃光头 展现演员决心
·日本中文新闻 真子小室夫妇新居引发隐私担忧
·日本中文新闻 前AKB48成员柏木由纪与搞笑艺人交往曝光
·日本学校 {日本国际学校}梅田インターナショナルスクール
·日本学校 LINE:sm287 陳雨菲、20歳、台湾からの留学生、東京に来たばかり
·日本留学生活 出售平成22年走行48000km 代步小车
·日本华人网络交流 円相場 一時1ドル=140円台まで上昇?
·日本华人网络交流 问日本华人一个问题
·日本旅游代购 富山接机
 ·生活百科 英国转澳大利亚转换插头
·汽车 【求助】修车遇到困难怎么办?

维修经验

CPUcpu-z 1.77版低调发布

日本维修技术更新: New benchmark “submit and compare” feature New clocks dialog reporting all system’s clock speeds in real-time Preliminary support for Intel Kaby Lake AMD Bristol Ridge processors 主要是增加了支持I、A两个新架构的 ...

维修经验

CPU这几天经常开机黑屏,热重启后又正常

日本维修技术这几天经常开机黑屏,热重启后又正常,今天热重启也不管用了。折腾半天总算点亮,显示超频失败,以前出这个画面我是不理它的,直接重启就能正常进系统了,今天不敢托大,因为 ...

维修经验

CPU超频求助!关于华擎H170和6700K

日本维修技术问题见楼主的show贴 https://www.chiphell.com/thread-1634895-1-1.html 这次华擎的H170 Hyper最大的特色应该是自带时钟发生器可以自由超外频 可是楼主好久没有折腾超频了。。。 两图中除了CPU外频 以 ...

维修经验

CPU液态金属会侵蚀cpu核心吗?

日本维修技术前阵子看到有人说,液态金属时间长了会侵蚀cpu铜盖,那么问题来了,这货会不会侵蚀核心呢? 评论 这玩意儿好像只对铝起反应 评论 不是说,cpu的盖子是铜的吗。。。 评论 不会,核 ...

维修经验

CPUm6i究竟支不支持e3 1231v3

日本维修技术官网上看支持列表没写有e3 1231v3,装机帖又有人晒,百度也没个明确答案,那究竟能不能点亮?有在用的chher说一下么 评论 升级最新bios肯定可以支持 评论 我的p67evo官网上也没说支持12 ...

维修经验

CPU华擎 HYPER 妖板 正确玩法

日本维修技术600元的 B150,10相供电,释放洪荒之力 注意必须官网 Beta 区的 BIOS 有 AVX 的 CPU 可能会掉缓存 启动时按 X 键激活 SKY OC,重启后进入 BIOS 160924164727.jpg (95.63 KB, 下载次数: 1) 2016-9-24 17:47 上传 ...

维修经验

CPUE5 2686 V3和i7 6800K如何选择

日本维修技术默认用,不超频,两者功耗是一模一样的 E5 2686 V3:2.0主频,3.5睿频, 18核心36线程 ,45M L3 咸鱼大约2500~3000元 i7 6800K : 3.5主频,3.8睿频 ,6核心12线程 ,盒装3000元 评论 性能应该是26 ...

维修经验

CPUHD530硬解4K能力还是有点弱呀!

日本维修技术播放器用PotPlay 64bit,各种优化后,跑4K @120Hz视频只能到70帧左右的速度,勉强能用! 显示器用的4K的优派VP2780 未标题-1.jpg (211.97 KB, 下载次数: 0) 2016-9-26 21:29 上传 评论 这个估计你没优化 ...

维修经验

CPU6900k 1.25V到4.2体质怎么样

日本维修技术如图,体质怎么样,ring是35,没敢试了,都说ring高了毁硬件 评论 不错的U,但不算雕,上4.4就大雕了,这电压上4.5的目前没见有人发图 评论 谢谢前辈告知 评论 我这个用1.2V超的4.2,R ...

维修经验

CPUI3 6100 华擎B150M pro4超4.5g测试。

日本维修技术看看论坛没多少i3 6100的帖子,就转下自己发的show贴里面的数据,给大家参考下。家里还有当年的神U i3 540 oc 4.5G在给老妈用。 不知道数据上正常吗?有6100的朋友可以告诉下,另外是不有 ...

维修经验

CPU7系u会兼容100系主板吗?

日本维修技术RT,听说要推200系板,100系还能用吗以后。。 评论 兼容的 评论 感谢!以后换u就行了,目前消息200系板会有新的特性吗? 评论 24条PCI-E 3.0通道、支持Intel Optane混合存储技术、十个USB 3 ...

维修经验

CPU有心入5820k了,求教下温度问题

日本维修技术一直徘徊在6700k和5820k之间,6700k现在这德行直接把我推向了5820k啊,从2600k升级上来,三大件都要换,现在唯一疑惑的是IB-E ex这种顶级风冷能不能压住4.5g的5820呢?毕竟刚刚买一个多月。 ...

维修经验

CPU6600&6600K才100的差价

日本维修技术太少了吧。。。 6600.JPG (106.91 KB, 下载次数: 0) 2016-10-1 10:30 上传 评论 毕竟只是i5而已…… 评论 上z170 6600也能超,等于没区别,差价能有100已经不错了 评论 然后又见不超频人士推荐超频 ...