日本电子维修技术 显卡<後藤 弘茂>AMD Vega64 发布,夏日大反击
AMD正式发表下一代GPU Radeon RX Vega64http://pc.watch.impress.co.jp/docs/column/kaigai/1073276.html
11点的文章,抓到了。粗翻,轻喷。
AMD在夏日开始大反击
AMD的反击终于开始了。8月份,AMD将向市场投入新的GPU Radeon RX Vega64(Vega10)和16核心CPU(Ryzen Threadripper)。
对于今年新的AMD产品来说,最重要的一点就是无论是CPU还是GPU都在构架上有了巨大的变化。在通过Zen架构刷新了CPU的微架构之后,这次轮到Vega了。对于AMD来说,这是5年来首次大规模的革新GPU的微架构。全新微架构的VegaVega10的具现化产品为RadeonRX Vega64Radeon RX Vega64的性能指标
以GPU产品的视角来看,Radeon RX Vega64是AMD两年来的首个旗舰型号。AMD去年并没有发表hi-end型号的GPU,所以高端型号的GPU跳过了Polaris一代直接过渡到Vega。Vega将发布一系列的家族型号,而本次率先发布是最上位的Vega10.
Vega10架构最大的特点是并未追随NVIDIA使用巨大die的道路,而是在这一代控制了die的大小。Die size为486mm2,只有NVIDIA GV100的815mm2的60%的程度。也只有2015年AMD的旗舰Fury X 596mm2的82%的程度。晶体管数量达到12.5B个,这也比NVIDIA要少不少。堆叠显存HBM2也只有两层,比起NVIDIA的4层也少一些。
在微构架方面,nvidia在本世代大规模的转向深度学习,选择了将深度学习向的GPU和图形图像向的GPU完全分开的道路。然而AMD却在添加了面向深度学习机能的同时,却控制了晶体管数量。结果就是Vega10在坐拥高性能图形性能的同时,制造成本却很低,价格也便宜,是非常平衡的一款GPU。
核心数量一致,性能却有47%的提升
Vega10的CU数量是64个,单精度运算单元(AMD称为Stream Processor)数量是4096个。数量上与Fury X是一致的。但FP32的性能对比Fury X的8.6T,Vega64有12.66T,有了近47%的性能提升。
性能大幅度提升的主要原因还是频率的提升。Fury X只有1050mhz,而Vega64的基础频率就有1247mhz,boost频率达到1546mhz。简单的频率提高就能带来不错的性能提升。
Vega构架相对于以往的GCN构架而言,在渲染流水线上并没有什么变化。向量单元在计算管线上仍然是4个时钟周期。而是在critical path上进行了非常彻底的优化。逻辑电路根据path不同所产生的延迟而不同。而延迟较长的path群被称为critical path。同类型的处理器频率的提升,就是受限于最长的path。所以只要优化critical path,缩短它们的延迟,就可能提升处理器频率。Vega10通过对critical path的调优,可能在14nm LPP的工艺下,达到1.7GHz的频率。
AMD通过电路设计达到高频率
来自zen组的馈赠,使用了cpu风格的定制电路SRAM寄存器
之所以没有改动流水线,是因为如果贸然加深流水线,那么数值运算的延迟会增加,那么为了满足流水线的需求,可能需要更多的线程参与其中。为了维护众多线程的并行性能,又进一步需要更多的类似于寄存器之类的资源,最终拖垮总体性能。所以只采用了优化critical path的方法,在构架的原理上没有修改。
GPU核心上的微构架更新
Vega在CU层面上还是进行了微构架的大规模刷新。新设计的名字叫NCU(Next-Generation Compute Unit)。NCU的最大特点就是被称为Rapid Packed Math (RPM)的Packed(一个SIMD为一个pack)在运算格式上支持了FP16运算。
开始支持ed FP16
源生指令集上也做了扩展
AMD的GPU具备对FP32运算的最佳化管线。而在Vega中,32bit的管线可以同时放置2组16bit的SIMD格式的数据,同时进行运算,从而获得两倍的FP32性能。
FP16在手机游戏中被广泛应用以外,在机器学习领域也正在大展身手。机器学习的训练层面,也在积极的使用FP16。Vega支持包含FMA以内的所有FP16运算。
packed 8位整数运算也是支持的
Vega构架同时也支持packed 8为整数运算,但只支持SAD这么一个指令(Sum of Absolute Difference差的绝对值之和)。这是面向视频和图像处理的指令,机器学习就用不了。除此以外,还有几何流水线的更新,新的缓存设计,FreeSync的扩展等诸多构架上的更新。以后再说。
名称Radeon Pro SSGRadeon Pro WX9100Radeon RX Vega64 Liquid Cooled EditionRadeon RX Vega64代号Vega10Vega10Vega10Vega10基础频率
1,406MHz1,247MHz核心频率(最高)1,500MHz?1,500MHz?1,677MHz1,546MHz构架GCN 5.0GCN 5.0GCN 5.0GCN 5.0运算单元数量 FP324,0964,0964,0964,096CU数64646464FP32 MAD/CU64646464运算单元数量 FP168,1928,1928,1928,192运算单元数量 INT816,38416,38416,38416,384FP32 GFLOPS10,21510,21511,51810,215FP32 GFLOPS (boost clock)12,28812,28813,73812,665FP16 GFLOPS20,43120,43123,03620,431FP16 GFLOPS (boost)24,57624,57627,47625,330Texture Units256256256256Texture Fill Rate319.2GT/s319.2GT/s359.9GT/s319.2GT/sROP Units64646464Pixel Fillrate79.81Gpixels/s79.81Gpixels/s89.98Gpixels/s79.81Gpixels/sL2 cache4,096KB4,096KB4,096KB4,096KB内存种类HBM2HBM2HBM2HBM2内存传输率1,892Mtps?1,892Mtps?1,892Mtps?1,892Mtps?位宽2,048bit2,048bit2,048bit2,048bit带宽(GB/Sec)484GB/s484GB/s484GB/s484GB/s内存大小16GB16GB8GB8GBDRAMdie8Gb8Gb8Gb8GbDRAM個数16 個16 個8 個8 個SSG(NAND Storage)2TB
制程14nm14nm14nm14nm制程特征14LPP14LPP14LPP14LPP晶体管数12,500M12,500M12,500M12,500Mdie size486平方mm486平方mm486平方mm486平方mmTDP Max300W250W345W295W
评论
```` 这个套装可以加入麦当劳豪华午餐么······
评论
Vega成本很低吗?
评论
最低配能打赢1070,就考虑搞个玩完,不过温度又是个大问题···
评论
明明是肯德基豪华午餐,麦当劳的叫天天超值套餐
评论
比Fiji低
评论
1546/1050,正好是147%
评论
逼格版Vega64只有买套装才买得到。。。求合买。
评论
只要le不要套装不行?我有显示器还要花这冤枉钱干蛋…
评论
A卡战未来啊,人工智能学习也被加入,这个是优化了挖矿吗?以往都是挖矿程序调用一部分流处理器去挖矿,现在在人工智能干预下,所有的流处理器都被拉去挖矿。
评论
人家就是这样算的……自然正好……
评论
有VEGA NANO 赢了
评论
那是米国才有的优惠,国内没有。还有,说不定出来会有一个惊喜价格,参考瑞龙,但是千万不要抢首发。
评论
PPT没用的
直接来个FSE FSU成绩就行
评论
目测这些套餐都不会在国内上市 至少不会送两款游戏 不知道fendi限量版会以什么形式进行销售~~
评论
AMD是打算一块芯片通吃所有领域?
评论
不愧是三倍营销费用 但是显卡还是垃圾啊
评论
惊喜个球 贵的飞起
评论
树卡没有16G显存版。。。。。。。
评论
那就算了,没有理由为高价垃圾买单。老实用我的1066。
评论
规格向gp102看齐,性能向gp104看齐
评论
amd现在要的是利润,不是销量。。。
所以vega这个东西真的挺两难的
评论
我靠,居然比fiji还低,那看来vega即使赔钱,也不会亏太多了
评论
这么说CPU部门一直都是隔岸观火的了?说好的APU没下文了?
评论
稍微卖卖满足下粉丝情怀就退市不就行了。。。
不然搞了好几年最后太监了,也太伤人了。
评论
RYZEN备货充足,但是水冷不是说是限量版嘛,就怕开头不抢,后续抢不到。。。
评论
你确定旷工不会扫货??
评论
能用显卡挖的矿最近价格已经腰斩一半还多了,只有比特币坚挺,但是那是有矿机存在的,现在每天一块1066每天挖到的矿的价值只有4元左右,一块1066显卡就算1500,回本也要一年,你确定这个时候还有矿工敢进入。尤其是高价显卡。
评论
我是看狗东 现在 580 1060 1070 价格都没有回到前期的价格啊 挖矿行情不是很关注 关注的是挖矿把显卡价格挖上去了
评论
明天8月1日,你再看看,不知道狗东的价格周期是多久,也许到8月份就会回归,但是不会到挖矿前的价格,这个一方面是因为挖矿的存在,另外一个方面也是因为内存芯片涨价导致的。
多谢老铁解惑
评论
好专业的文章
支持一下!!
评论
头像好评
评论
The new GPU king!!!
Under $500
评论
也就是说终于不是GCN了吗
评论
关键的问题是,是否能买到或者说以正常的价格买到
评论
辛苦楼主转过来!喜欢看这类文章,学习! 电路 电子 维修 求创维42c08RD电路图 评论 电视的图纸很少见 评论 电视的图纸很少见 评论 创维的图纸你要说 版号,不然无能为力 评论 板号5800-p42ALM-0050 168P-P42CLM-01 电路 电子 维修 我现在把定影部分拆出来了。想换下滚,因为卡纸。但是我发现灯管挡住了。拆不了。不会拆。论坛里的高手拆解过吗? 评论 认真看,认真瞧。果然有收
·日本中文新闻 唐田绘里香为新剧《极恶女王》剃光头 展现演员决心
·日本中文新闻 真子小室夫妇新居引发隐私担忧
·日本中文新闻 前AKB48成员柏木由纪与搞笑艺人交往曝光
·日本学校 {日本国际学校}梅田インターナショナルスクール
·日本学校 LINE:sm287 陳雨菲、20歳、台湾からの留学生、東京に来たばかり
·日本留学生活 出售平成22年走行48000km 代步小车
·日本华人网络交流 円相場 一時1ドル=140円台まで上昇?
·日本华人网络交流 问日本华人一个问题
·日本旅游代购 富山接机
·生活百科 英国转澳大利亚转换插头
·汽车 【求助】修车遇到困难怎么办?