AMD2K.jpg (170.25 KB, 下载次数: 0)
AMD4K.jpg (172.89 KB, 下载次数: 0)
有点13年下半年R9 290X/290战胜GTX780/GTX Titan,逼得NVIDIA推出完整版GK110的GTX780TI/GTX Titan Black的味道了。
按照目前的情况看NV的应对策略是取消华而不实的RTX3080 20GB/RTX3070 TI(GA104)/RTX3070 16GB,
把RTX3090小割一刀,显存取消双贴推RTX3080TI,RTX3080再阉一刀推RTX3070TI(GA102一个GPU三个子型号,上次是GF100/GT200/G92/G80年代的事情)
然而这似乎还不够,一定幅度的降价肯定是免不了的了。
理想情况下NV可能得把RTX3090升级成完整版GA102,RTX3080TI维持RTX3090当前的规模,RTX3070换成完整版GA104,除此之外还要放开TGP限制。
中期解决方案是换成TSMC N7,当年G92/GT200曾经换过制程并引入第二家代工厂(UMC),但是需要花费接近一年的时间
评论
不会,等着买老黄卡的人多的是,不可能降价。
评论
可能的办法是同样紧急开sam,反正是个软件特性,然后出3080ti,塞钱强化光追……大概这么几招
另外,真换n7应该不用这么久,本身就有适配n7的方案,sb老黄嫌贵……
评论
一切都要等卡出来后才能下定论。但老黄现在牌还有一大把。
3090已经82sm了,升级84完整版性能提升不大 ,对良率要求却高了很多,有84sm的直接拿来做quadro不香么。所以这个应该不会。
首先是feature上的问题,当然我认为N、A(包括主机)两家这代在feature是类似的,N反倒落后一个英菲尼迪缓存,其他都只是强度的差距,而非你有我无。
那么N可以打的牌:光追,dlss,这两个指标现在已经不仅仅停留在媒体的春秋笔法上了,有实打实的惠及玩家。特别是下代主机普及后,这些特性都是有点追求游戏的标准配置了。
A这边也有可能牛逼吹过了,
当所有这些牌打完了,N可能才会考虑花钱更新产品线。
不出意外的话,A卡出来后会有铺天盖地的“评测”开着各种光追dlss和A卡对线。
评论
皮衣黄生态优势某种程度上来说确实比当时intel对amd还要好点,指望他这么良心怕是不容易
希望酥麻保持这个势头吧
评论
N卡拥有几乎翻倍于竞争对手的单精度浮点能力,图像性能却和对方有来有回,还被对方占据了高地。
问题是N卡以前是以浮点转换能力强于A卡为傲的,现在一下高反差反转,你做的不是计算卡啊。。
但这里是否还有优化的空间呢,也是个可以期待的问题。
从历史规律总结来看,显卡就是谁越专一谁就要占优一些。以前是GCN三心二意,现在是ampere三心二意(ga102之所以要三心二意,我的猜测是ga100彻底变成强化tensorcore运行矩阵指令的gpu了,但在科学计算领域,还有大量算法仍然使用向量指令,这样老黄就出一个ga102,强化翻倍fp32,专攻向量指令,两手抓两手都要硬,当然游戏玩家买单,美滋滋),苦果子大家都要吃,谁也跑不了。
评论
----不出意外的话,A卡出来后会有铺天盖地的“评测”开着各种光追dlss和A卡对线----
这结果是肯定的,所以该买N卡的去买,A卡留给我,和我等。。不要抢
评论
我还以为第三方评测出来,原来还是AMD的PPT重制
评论
真要原架构花一年时间从三星迁移到台漏电 navi31都出来了
评论
换代工厂还要重新流片、验证,要花不少钱呢。不如学学牙膏厂,投30亿广告费,抓着光追和大力水手死吹。
评论
换制程没那么容易,DRC什么的都要重做。几百亿晶体管,光是验证就要跑很久。验证、debug完了只是能用。
如果要提升性能,还要针对不同的晶体管特性重新仿真各个模块的电压-频率关系,甚至可能要微调晶体管尺寸,这个工程量实在巨大,难以想象。
Zen和Zen+没做那么多工作,才能加快迭代节奏,代价就是没法整体取得12nm的提升。
评论
华人就是善于学习别人的优点并搞出自己的独门配方,这届大NAVI就相当于是吸收了图灵所有独门技术后再加上自家缓存新技术后的大成之作。当然我猜到了下一代老黄也会反过来吸收大NAVI上面的每个优势技术来勃起一波......顺带一说the king这种就是典型的三哥属于又菜又拉不下面子向对手学习的万年菜逼。
评论
扯淡,G92什么时候换过UMC
评论
上一次UMC代工GPU还是9550呢,因为台积电产不过来
评论
选择先进工艺还是成熟工艺是一个策略问题,不同的选择意味着不同的频率、密度、良率、成本
7nm之前选择先进工艺基一直是最优选,只要别在良率太低的时候急着上大芯片当小白鼠就行,
原因也简单,7nm之前每一整代工艺进步都能带来可观的频率和密度提升,平摊后的成本增长却不是很显著,甚至由于密度提升面积缩小还能降一点成本
GPU的性能基本可以等效于 频率*规模*效率(架构效率)
每一代工艺通过后续改进良率和频率都会获得提升,通过深入挖掘密度也会略有上涨(甚至单独作为“半代节点”,比如12nm/8nm)
当时GPU上先进工艺也很激进,基本是抢着用,吃了几次良率的亏之后A/N都开始先用小芯片试水(GT215/RV740)
7nm开始情况发生了显著的变化,一方面先进工艺的频率提升收益显著减小,另一方面成本明显增加。
表格里面记录了A/N两家各代旗舰GPU的工艺/频率变化情况
GPU
G80
G92
GT200A2
GT200B3
GF100
GF110
工艺nm
90
65
65
55(65+)
40
40
主频MHZ
612
650
602
648
700
772
增长
N/A
6%
-7%
8%
8%
10%
GPU
GK110A1
GK110B1
GM200
GP102
TU102
GA102
工艺nm
28
28
28
16
12(16+)
8(10+)
主频MHZ
993
1058
1075
1531
1770
1700
增长
29%
7%
2%
42%
16%
-4%
GPU
R600
RV670
RV770
Cypress
Cayman
Tahiti
工艺nm
80(90+)
55(65+)
55(65+)
40
40
28
主频MHZ
743
777
750
850
880
925
增长
N/A
5%
-3%
13%
4%
5%
GPU
Hawaii
Fiji
Vega10
Vega20
NAVI21
工艺nm
28
28
14
7
7
主频MHZ
1000
1050
1546
1750
2250
增长
8%
5%
47%
13%
29%
评论
001.jpg (146.92 KB, 下载次数: 0)
7nm也不是万能的吧。
根据农企的数据,在注重性能的时候,7nm相比GF的14nm 只不过做到了25%的频率提升,甚至在radeon VII上还没提升这么多频率,有一部分性能提升是带宽补足到1TB/s得来的。
从GF坑爹14nm到TSMC 7nm尚且如此,那从三星8nm到TSMC 7nm又能提升多少呢?三星8nm再不济也是10nm的改进版。
这次RDNA2在工艺没变的情况下,号称同功耗提升了30%频率。
其实要是按照一些人之前抹黑的说法,80CU跑5700xt的频率起码得450W甚至500W。现在居然300W就跑2250MHz,而且还有一定的灰烬潜力,说明频率提升还不止这个数。
这也说明改进工艺能提升一部分频率,然而自己的布线、优化提升更为重要。
002.png (102.62 KB, 下载次数: 0)
很遗憾的是这种招式在帕斯卡那代用过一次了。这就好比斗地主,NV的这张布线优化的王炸 几年前已经用出去了,现在还有类似的炸弹?我对此持怀疑态度。
评论
频率除了跟制程关系大,跟架构关系也很大,rdna2比rdna提升了30%频率,制程没变,发布会明确说了研发团队专门做了提升频率的架构优化,包括gcn和开普勒同为台积电28nm工艺时,开普勒架构频率也是明显高于gcn,老黄的麦克斯韦和开普勒同为28nm,频率提升也很大,老黄也专门说过优化了架构,使其能够跑在更高的频率
评论
Infinity Cache对N来说倒是不难实现,本身是个类似于全片L2的东西,GA100上有现成的40MB L2,GA102只有可怜的6MB而且最奇葩的是L1比L2大……
重新改一下内存控制器,把L2放大再研究一下怎么配合大容量L2效率更高
光追和DLSS倒是逐步实用了,至少比上一代强
GA100本身的SM设计更像Turing,INT32和FP32的数据路径还是分开的,真正强大的是第三代的Tensor Core,GA10X上面的TC直接性能腰斩,和Turing上比几乎没提升,仅仅是多了TF32、BF16的支持(这两有啥用?我用FP16好像一直很顺利)
更可恶的是老黄把GA10X上多出来的那一倍FP32做了手脚,不支持FP16(连直接丢精度都不支持),劣化炼丹性能(除非只用FP32).
老黄在发布会说图形处理主要用FP32,但是似乎多出来的这一倍FP32利用率存在严重问题,还不如增加GPC数量的提升更大,再联想到3080那个恶心的10GB显存……老黄是不是在防炼丹上太认真了
评论
这有点像DOTA2 更新核心装备一样。
nvidia 16年依靠优化布线,把GPU的核心频率推向了不可思议的程度。这就好比幻影刺客这种英雄出到了BKB这种质变装,一度团战取得巨大优势,但是没把对面打GG。
现在AMD那边的后期英雄,苟延残喘打了几年钱,也出到了BKB,频率不但跟上来还反超了对手,团战隐隐然有翻盘迹象。
现在nvidia还能再出一次BKB吗?要知道几年前就已经提前透支了这个优势
评论
UMC代工过:
G96-300
G92/G92a/G92b
评论
英菲尼迪缓存牛逼在不需要游戏开发商做什么适配,一切都是驱动里面调调就完事儿了
评论
Pascal的效率相对Maxwell没多大提升啊,架构提升大的是Maxwell那一代
16/14nm这个节点本身给力,AMD的频率和密度也提升了一大截
评论
评论
适当降价就行了,本来这类高端卡也卖不了几张,关键还是3000以下这个价位
评论
确实,三星的10nm和8nm是成熟的工艺,骁龙835用的10nm被成为一代神u,骁龙730 8nm也没翻车,虽然显卡跟移动芯片对工艺要求有区别,骁龙835和730至少说明了三星的工艺是成熟的,锅不能三星一个人背
评论
这个是硬件的,发布会说了,不用游戏特别优化
评论
你再看看我说的什么意思。
评论
好,丝印上面怎么区分呢?
评论
要改缓存体系就是要该构架了,这基本不可能,最少最少,也要用一年。生命周期腰斩后出40系显卡。
老黄防的是工业界生产的时候用游戏卡炼丹,而学术界用游戏卡是完全ok的,我猜测这也是它在安培游戏卡上翻倍fp32的原因。据我所知很多3090也是高校实验室定走了,很多面向研究机构的方案商也出了基于3090的计算平台。
学术界用卡和工业界还是有点不同,学术界做一些新网络构型不一定能够用tensor core高效的加速,这时候fp32性能还是蛮重要的。当然工业界的学术部门也是一样,不过它们有a100用。
评论
说的不是英菲尼的缓存么,这个官方并没有给出不同游戏效率对比,他是一种提高显存和芯片数据带宽的,给出游戏开关下数据对比的是sam技术,如果我理解错了,当我没说吧
那是我理解错了。。。
评论
我猜可以类似农企当年3dnow!上的PREFETCHW来调用?
评论
3A套装的sam技术确实容易跟英菲尼迪缓存技术弄混。。。
评论
我原帖是想说sam来的,不过确实把它们搞混了。
评论
这是我最近跑的测试,半精度有时候速度还会慢一些。
单精度
mnasnet0_5mnasnet0_75mnasnet1_0mnasnet1_3resnet18resnet34resnet50resnet101resnet15230.9500730.9507834.9447735.9423227.9550638.9366160.9023693.72544124.9730.9500729.9518133.9446136.9415329.9515738.9356657.907178.10259109.347130.9510231.9466633.9455641.9328227.9548238.9370959.9033878.1002124.973130.9505530.9498333.9455638.9373327.9552938.9373359.9038687.70657124.965930.9505530.9503133.945838.9368526.9534640.9324259.9043494.61856124.967829.9522929.9520533.945844.9290327.9545839.9386959.9038689.00428118.151429.9525330.9503133.945836.1008627.9555353.9135958.9067986.38978124.971229.9496730.9505533.9467535.9423227.9555347.9254759.9048176.11299124.968530.9507830.9498334.943135.9356427.9548239.9377360.9016493.72902109.346430.9503129.9515732.9480237.9326327.9462340.9343260.9028378.10092109.350429.9525330.9500732.9468335.9420827.9548240.934856.9086193.73021124.968329.9522931.9502433.9455634.944327.9552939.9358354.9118584.70941124.966635.9427931.9485733.9455634.944328.9514138.9375754.9120978.1002114.17732.9463530.9503133.9453234.9438230.9505538.9370954.9135293.72592109.345731.9490431.9485732.947334.9438229.9494338.9280355.9096378.10664109.34531.9497630.9500731.9485734.9283229.9522938.9330454.9120993.72902124.963833.9465130.9507831.9423734.9440630.9500739.9353555.9103578.11022124.970231.9485730.9500731.9490434.9440627.9555339.9355955.9110696.08054124.970932.9475430.9367232.9475436.9408128.9559435.9418456.9081378.60613124.970932.9470630.9503133.9453239.936327.9555336.9405754.9130493.72973109.344732.9480230.9503131.9490436.940127.9552940.9276558.9075179.41604124.968831.9490430.9503131.948835.9425527.957237.9388359.9322393.7674124.968829.9518130.9512630.9503134.9440629.9515738.9378163.8749678.10497124.968529.9518131.9480931.9485734.9435827.9548241.9328261.9003893.7283124.970931.9492829.9518131.9485734.9440629.9515741.9325859.9038678.06563124.982434.9445330.9503133.9455635.9427929.9520539.9358359.904193.77003109.336629.9522930.9500734.9447734.9440627.9586339.9360755.9101178.10187125.762529.9522930.9503133.945834.9438228.9533146.9243555.9103593.72807124.972129.9520532.947334.9450134.9371426.9558450.918155.9103578.11022124.970428.9542732.9463533.9446139.9360725.9585439.9355954.9118593.7283109.343529.9522930.9505534.9438235.9420826.956841.9352154.9118578.09997124.9728.9535530.939133.9455634.9445326.9563240.9343254.9118593.72449124.967128.96530.9500733.9453235.9423226.956845.9263353.9138378.11022124.9729.9520531.953133.9455634.9445325.958344.9256956.9093293.72616124.972327.9548230.9500731.9490434.9438225.9580640.9321855.9101178.10521124.968528.9540329.9518130.9500734.9438225.9578240.9319454.9120978.10879109.34427.9555329.9520530.9503133.9453225.9575840.9290853.9133578.08948124.9728.9542729.9518130.9550833.9465125.9580638.9397154.9120978.10879113.37427.9562528.9537932.9480233.9453224.959841.9323453.9138378.10497124.967127.9555329.9515730.9503133.9455625.9580637.9393160.9023678.10545124.966928.9545129.9515730.9503134.9397725.9580636.9415354.9128193.72759124.969227.9552929.9520531.948838.9487725.9578241.9330657.9066387.67772109.348527.9552929.9518130.9500735.9420825.9578241.9323453.9133582.86047109.347828.9537929.9520530.9503134.9438224.959840.9343255.9110686.40742124.964734.9440629.9518130.9500735.9423225.9466244.9252162.7102983.86588109.348328.9535529.9520530.9500735.9423225.9573540.9343259.9036284.86438109.353328.9540330.9503130.9500736.9405725.9585438.9380557.9063989.18476124.968827.9548229.9518131.948835.9432724.9593338.9375756.9093278.11379109.34428.9542729.9520534.9440635.9432730.9507840.9340953.9131293.74261124.970227.9550630.9507829.9518141.9321125.9580644.9280760.1203478.10879124.9678
评论
我第一次看完发布会也弄混了,后来看到别人在讨论这个,我又去看了一遍发布会才弄清,弄混的很多,也许是曼德拉效应
评论
这根AMD把游戏卡和专业卡完全分离走两条产品线的策略有关吧
评论
问题是,nv也是这个策略啊,还是它自己最先搞的。
评论
FP32:FP16从1:2变回1:1之后半精度不能用TC的话确实反而更慢了…很怀疑用TC的情况下4块3090都没一块A100训练速度快
评论
工艺的性能不仅仅是线宽一个指标
比如45nm节点台积电引入了HKMG,16nm节点引入了FinFET,这些结构变化对性能的影响更大。
评论
我总感觉这个GA102也是临时改方案出来的半成品 老黄估计也有点想法 但是既然签了三星8NM 只能在部分有所妥协
在MCM架构产品出来前,估计会有个“完美版”安培架构的产品来结束这一世代的产品线
评论
我估计也是 各路塞钱 就比几个 光锥和DLSS支持好得游戏
评论
显卡厂商本来就看不上游戏卡
老黄18年发布图灵专业卡时有一个PPT,介绍显卡三大市场,其中游戏只是百亿级,其他的都是trilion级
所以只要自己占了优势,就争着把游戏用户当抹布
当初 the king 回AMD其实也是一样的思路,他在苹果混了两年,发现计算卡来钱快,所以才搞了VEGA一家,结果就是挖矿无敌游戏拉垮
老黄看AMD废了,自己也开始全力搞AI,游戏就对付对付,结果就成了现在的情况。
评论
继续对战,太高端我买不起,消费者还是按实际需求出发。等等党还是好的
评论
衷心希望A卡这次别缺货和耍猴,N卡没人买最好,3080ti非公首发不用抢,我玩DIY至今就没试过要抢购或者预约显卡的,第一次来这么一下,确实恶心……
评论
这一代要完全肛赢NV还是有点难度的,只把这一代看成3年前正面肛英特尔时就好了。。。
评论
把显存拉到21gpbs外加提升频率就行,没必要堆84sm良品率扛不住
评论
AMD Radeon RX 6000 vs NVIDIA GeForce RTX 30 Series
评论
nvidia 还有一招啊 继续提高功耗啊 这次才加了区区100w
3080Ultra 400w 3090Ultra 450w500w版本 出来就可以了 ,反正电源接口都换了,准备的就是用超高功耗先拖时间,花30e 吹一吹rtx 和dlss 然后抓紧时间上台积电7纳米。~
评论
RDNA2只是苏妈三部曲的第二部,好戏应该还在后面。
评论
为什么都这么乐观
我个人认为起码这代AMD还是撼动不了NVIDIA的旗舰地位的
自然撼动不了
自然不需要所谓的“换7nm”,放开限制
评论
10nm是著名的工艺陷阱,还是个半代工艺,8nm是10nm改进工艺,类似12nm之于14/1
评论
这是发布会数据还是vc自己测的?
评论
vc网站上的,不知是他们自己测的还是引用的amd测的 电路 电子 维修 我现在把定影部分拆出来了。想换下滚,因为卡纸。但是我发现灯管挡住了。拆不了。不会拆。论坛里的高手拆解过吗? 评论 认真看,认真瞧。果然有收 电路 电子 维修 求创维42c08RD电路图 评论 电视的图纸很少见 评论 电视的图纸很少见 评论 创维的图纸你要说 版号,不然无能为力 评论 板号5800-p42ALM-0050 168P-P42CLM-01
·日本中文新闻 唐田绘里香为新剧《极恶女王》剃光头 展现演员决心
·日本中文新闻 真子小室夫妇新居引发隐私担忧
·日本中文新闻 前AKB48成员柏木由纪与搞笑艺人交往曝光
·日本学校 {日本国际学校}梅田インターナショナルスクール
·日本学校 LINE:sm287 陳雨菲、20歳、台湾からの留学生、東京に来たばかり
·日本留学生活 出售平成22年走行48000km 代步小车
·日本华人网络交流 円相場 一時1ドル=140円台まで上昇?
·日本华人网络交流 问日本华人一个问题
·日本旅游代购 富山接机
·生活百科 英国转澳大利亚转换插头
·汽车 【求助】修车遇到困难怎么办?