游戏性能大家都知道了,不过这个纯单精度倒是还真的货真价实的巨大提升,和2080Ti比:
AIDA64-GPGPU-2080tiv3080.jpg (216.77 KB, 下载次数: 0)
感觉老黄就是在赌未来游戏浮点运算权重会远大于整数。
如果有一个游戏90%以上运算全都是浮点的话,那就是货真价实2倍提升,如果一个游戏浮点整数五五开,就是没有提升。
从测试来看,目前游戏多数是70%左右的浮点占比
所以,战未来????
评论
然而双精度 emmm
评论
其实这里面有注水,30的cuda的之前的结构不一样,所以性能提升并没有规格差别看起来那么大
评论
时代真的变了,gpu双精度被cpu吊打。10900k论双精度在所有cpu里只是弟弟,上面还有无数比他强的
评论
计算卡游戏卡分家了。计算卡双精度要多少有多少。炼金用单精度,挖矿用整数,还能凑合用游戏卡。
评论
双精度真的变1/64了。。。
评论
跟turing一样每组sm留2个fp64 core,但是现在每组sm的fp32 core翻倍了,所以比值减半
评论
但也就这种纯fp32逞能 实际游戏就跪 1/3是废的
评论
我测试白测了
评论
双精度我们公司搞深度学习都没用,最少采购显卡时问那群博士需求,他们说没用到双精度,都是单精度。
评论
借楼主的图一用
QQ截图20200922095533.jpg (28.51 KB, 下载次数: 0)
评论
single precision julia 提升约 13%。这个在20系之前都直接反应浮点实际性能提升幅度。
不知道这个提升为啥这么低。估计aida64应该优化一下这个算法。
ps. 据说1080ti 这一项只有2602...1070都能1500...
评论
是的,有点奇怪,不过aes256的提升和单精度提升比例相同,应该aida64更新下就好了
评论
倒是2080ti和1080ti单精度提升不多,Julia提升的有点可怕
评论
GA100表示自己的双精度能力依然强大
评论
Ampere的目标或许是让单个SM的性能达到Pascal的水平。
顺带一提,Ampere的SM是64X2 CUDA Cores,而Pascal的SM是128个CUDA Cores
但实际上,Ampere只达到了0.85x的样子。
以NV在GF100时代确定的GPU大体框架来说,Ampere已经走到了尽头,每个GPC拥有5组TPC就是最高效率的极限规格了,6组的性能已经开始变形(TU102、GA102),7组...相比于6组提升已经基本没有了(GV100)
所以NV才只能在SM里头做做文章,填饱Math Dispatch的发射空闲,再次提升效率。
只可惜,FP32 ALU翻倍带来的能耗比代价,大家已经有目共睹了。
NV下一代如果不打破这样的规矩的话,那除了提升频率之外,我也想不出去其他的法子了。
所以大家就别责怪NV这次挤牙膏了,能强行憋出7个GPC就说明,人家已经尽力了。
评论
能效比不高纯粹是20/30系频率太高的问题。真要甜点电压,能效比还是可以的。
而GPU实际渲染器的性能,基本都是对比20系有着远超游戏的大提升。
评论
不是赌未来浮点大于整数,是NV要支持开发者把未来的游戏开发成浮点:整数在安培架构下效率尽量高
游戏和引擎的发展是NV和AMD引导的,不是独立发展的,也是战未来和老架构负优化的来源
评论
现在电压都不足1v了,还能怎么甜点法?
3070都能憋出个220w是没想到的
评论
图像性能比的是流水线性能的提升,不是单纯的fma指令的规模。。。
安培这一代,fp32 fma翻倍了,但其他固定单元都没有啊。。。像素填充率(2080 vs 3080)115:164 = 1.4,才提升了40%,纹理填充率348:465,只提升了33%。
为什么没有等比提升固定单元,因为老黄压根就没想跟你在纯传统渲染性能上决一胜负。可以说安培ga102就是围绕着光追单元和dlss设计的。包括翻倍的fp32 fma性能,因为光追性能翻倍后,光追shader所需的性能也翻倍了。
在开启光追和dlss后,tmu和rop + 光栅化引擎的压力要急剧降低,空间反射和各种ao被光追三特效取代,在dlss基础上,流水线只需要渲染2k分辨率,剩下的由tensor core denoised到8k,固定单元的消耗已经不是以前的计算方式了,所以老黄才敢搞这种非对称的设计。
评论
降点频率,降点电压,功耗直接少30-40%,性能基本损失5-10%,你说能耗比不能高?
评论
我认为你恰好想反了。
分辨率降低,shader中负载占90%以上的screen space下面shader数量大幅减少,FP32压力变低。
分辨率降低,整体帧数升高,前端压力升高,因为低分辨率几何方面的东西也并不会减少。
然后光追性能也远远没有达到翻倍。
8.png (237.27 KB, 下载次数: 0)
最后DLSS,2080跑Control 2K分辨率,80fps下面12.5ms里面也就占1.x ms,远远不是瓶颈。
评论
现在那么早你们就说2XXX MHz,会不会给人印象是。。。是。。。
评论
得了吧,这种小把戏很多显卡都能玩
比如图灵60w就能跑TS 5200分
电路 电子 维修 我现在把定影部分拆出来了。想换下滚,因为卡纸。但是我发现灯管挡住了。拆不了。不会拆。论坛里的高手拆解过吗? 评论 认真看,认真瞧。果然有收 电路 电子 维修 求创维42c08RD电路图 评论 电视的图纸很少见 评论 电视的图纸很少见 评论 创维的图纸你要说 版号,不然无能为力 评论 板号5800-p42ALM-0050 168P-P42CLM-01
·日本中文新闻 唐田绘里香为新剧《极恶女王》剃光头 展现演员决心
·日本中文新闻 真子小室夫妇新居引发隐私担忧
·日本中文新闻 前AKB48成员柏木由纪与搞笑艺人交往曝光
·日本学校 {日本国际学校}梅田インターナショナルスクール
·日本学校 LINE:sm287 陳雨菲、20歳、台湾からの留学生、東京に来たばかり
·日本留学生活 出售平成22年走行48000km 代步小车
·日本华人网络交流 円相場 一時1ドル=140円台まで上昇?
·日本华人网络交流 问日本华人一个问题
·日本旅游代购 富山接机
·生活百科 英国转澳大利亚转换插头
·汽车 【求助】修车遇到困难怎么办?