日本电子维修技术 显卡3080的浮点效率不如图灵,为何也不如帕斯卡
帕斯卡也是只有fp32单元同时执行int32指令,按道理fp32也是跑不满的,为啥到了ampere这里就大打折扣?
老黄的3080白皮书出来了,有专家解析一下吗?
评论
如果你的效率是指在关闭光追和dlss的前提下,fma能力转换到画面帧数的能力,的确没法翻倍。
首先fp32单元本身是货真价实的double了。最近的测试gpgpu运算3080确实可以达到30T左右。不存在假单元或者等效单元的情况,密集运算的时候通过交替发射流水线也是满负荷的。
然后,图灵那边基数不是1,图灵同样有两条数据链路,只不过一条只能执行int32而已。根据nv自己的调查,很多游戏的int32指令数达到同期fp32指令数的30%或者更多。所以光凭单元数的比率保守的算应该是1.3:2的感觉。只是因为int32链路没法执行fp32 fma,老黄并不把它计为cuda核心。
最后最重要的,虽然fp32 fma单元翻倍了,但其他的后端却没有。比如tmu、rop以及光栅化引擎的处理能力。例如80系对比,像素填充率是116:164,贴图填充率是330:465。
老黄赌的是,未来会为3080构成挑战的游戏,都会实装硬件光追和dlss功能,特别是主机实装光追和dlss2.0推出后,老黄是很有自信的。有了这两个功能后,后端的压力会大幅度减轻,因此才可能达成更高的效率。那些不能实装黄技的老破小游戏,反正也不会对3080的纯算力构成威胁。
评论
安培 4352x2 cuda 性能等效图灵 4352x1.3,即8704cuda等效图灵5658,32t=21t
评论
https://www.bilibili.com/video/BV1Pi4y1u7w6
这个up主简单解释了下,干货还是有的
评论
意思就是啪啪卡时代 cuda核心是兼任浮点/整数。图灵时代一个cuda是浮点+整数。现在是浮点+浮点/整数
cuda核心的计算方式就是浮点核心的数量。
可以这么理解吧
评论
实际最完美的情况下,安培FP32x0.75的才是和图灵同样FP32差不多前端性能,实际肯定达不到0.75这个系数,估计3070是最能接近这个系数的型号
评论
才21T啊,真是不够看。 电路 电子 维修 我现在把定影部分拆出来了。想换下滚,因为卡纸。但是我发现灯管挡住了。拆不了。不会拆。论坛里的高手拆解过吗? 评论 认真看,认真瞧。果然有收 电路 电子 维修 求创维42c08RD电路图 评论 电视的图纸很少见 评论 电视的图纸很少见 评论 创维的图纸你要说 版号,不然无能为力 评论 板号5800-p42ALM-0050 168P-P42CLM-01
·日本中文新闻 唐田绘里香为新剧《极恶女王》剃光头 展现演员决心
·日本中文新闻 真子小室夫妇新居引发隐私担忧
·日本中文新闻 前AKB48成员柏木由纪与搞笑艺人交往曝光
·日本学校 {日本国际学校}梅田インターナショナルスクール
·日本学校 LINE:sm287 陳雨菲、20歳、台湾からの留学生、東京に来たばかり
·日本留学生活 出售平成22年走行48000km 代步小车
·日本华人网络交流 円相場 一時1ドル=140円台まで上昇?
·日本华人网络交流 问日本华人一个问题
·日本旅游代购 富山接机
·生活百科 英国转澳大利亚转换插头
·汽车 【求助】修车遇到困难怎么办?