https://lambdalabs.com/blog/2080-ti-deep-learning-benchmarks/
2080ti-deep-learning-benchmarks-resnet152-fp16-2.png (158.47 KB, 下载次数: 0)
2080ti-deep-learning-benchmarks-resnet152-fp32-1.png (157.18 KB, 下载次数: 0)
The RTX 2080 Ti’s single-precision (FP32) training of CNNs with TensorFlow is between 27% and 45% faster than the 1080 Ti for measured networks.The RTX 2080 Ti’s half-precision (FP16) training of CNNs with TensorFlow is between 60% and 65% faster than the 1080 Ti for measured networks.If you do FP16 training, the RTX 2080 Ti is probably worth the extra money. If you don't, then you'll need to consider whether a 71% increase in cost is worth an average of 36% increase in performance.
FP32比1080TI快27~45%,FP16块60~65%
评论
GP102又没有FP16,胜之不武
评论
唔,果然这个Tensor Core比V100上的差了好多?
然后759.99x1.65=1253.98
这还是被机器狗说胜之不武的FP16上场怼的打法…嗯…
1080Ti成功续了自己一代?
评论
你为啥管他叫机器狗娃,多难听呀。
评论
那叫什么
评论
爱波酱
你看我,权天使了
评论
这个明显不是用tensor core跑的。就是普通sp对决,1080ti没双倍半精度。
要是用tensor core跑差距最少是5x以上。
评论
来,坐等树导师的5x测评
评论
原帖method那里说了
The 2080 Ti does have tensor cores which are used in this benchmark.
评论
它用的这个脚本
https://github.com/u39kun/deep-learning-benchmark
也是一样的,如果半精度只是单精度的一倍,那普通sp就能达到。跟我在测的不一样。
评论
没卡。。。
评论
它这个网络也是个最原始的网络,resnet根本不适合做半精度运算,它就用的论文发布的结构测的,resnet highway部分不能用半精度,必须单精度,否则会梯度消失。需要改造。
这个测试随便看一下就一堆问题,真的用上了tensor core没我感到怀疑。
我下下来看了下源码没跑,算看明白了,它的确用了tensor core,但只是网络中的很小一部分,因为他们用的是标准构型的resnet。
假设tensorflow 1.11已经自带“尽可能适用tensor core”的功能了,但网络中还是有一大部分是无法利用tensor core的。
resnet是可以完全适用tensor core的,但需要对网络进行改造,这个去年我们实验室就做过几个网络的半精度改造。使用各种precision refine的方式展开高精度计算,这个测试中明显没有做这个。
所以应该是用了tensor core,但整个训练流程中只有一小部分使用了,这才能解释为什么性能这么低,提速比可能甚至比不上直接用双倍半精度的sp来算。
评论
我定了块2080TI到了你拿程序来我来跑
评论
你如果有卡可以自己用cuda写程序,不要用框架,否则不知道哪里用没用tensor core。
评论
这些测试都太暧昧了,到底哪里用了tensor core占比多少都没说清楚。
如果算上tensor core,在半精度训练上只高这么点,那2080ti真是凉了,远比不上titan v。
评论
关键还是要看每瓦特算力有没提升
评论
看了下文章里的链接,benchmark是tensorflow自带的benchmark改的
仅仅有限地兹磁了FP16训练,基本没考虑TensorCore
除非cuDNN哪天更新了能让老的代码都能用上
评论
这个lamdalabs是个卖整机的厂商,不是什么实验室。别被骗了。
说实话2080ti训练效率低可以预期,但这么低还是超出了我的想象。如果就这效率,2080ti就是张推理卡。
评论
看了眼那个测试脚本自带的测试成绩,2080TI 和 Tesla V100相比,训练Resnet-152速度没差多少,VGG差距稍微大一些也没超出预期
可能脚本的代码也会有影响,我自己复现的shufflenet v2精度和paper里差不多,速度慢了很多
tfbenchmark2.jpg (69.19 KB, 下载次数: 0)
评论
你这是v100的么?
我手上有resnet 50 101 152的半精度改造后的网络,这几天我也用它的代码测下。
评论
测试脚本的github上的,或许TF1.5有点老
电路 电子 维修 求创维42c08RD电路图 评论 电视的图纸很少见 评论 电视的图纸很少见 评论 创维的图纸你要说 版号,不然无能为力 评论 板号5800-p42ALM-0050 168P-P42CLM-01 电路 电子 维修 我现在把定影部分拆出来了。想换下滚,因为卡纸。但是我发现灯管挡住了。拆不了。不会拆。论坛里的高手拆解过吗? 评论 认真看,认真瞧。果然有收
·日本中文新闻 唐田绘里香为新剧《极恶女王》剃光头 展现演员决心
·日本中文新闻 真子小室夫妇新居引发隐私担忧
·日本中文新闻 前AKB48成员柏木由纪与搞笑艺人交往曝光
·日本学校 {日本国际学校}梅田インターナショナルスクール
·日本学校 LINE:sm287 陳雨菲、20歳、台湾からの留学生、東京に来たばかり
·日本留学生活 出售平成22年走行48000km 代步小车
·日本华人网络交流 円相場 一時1ドル=140円台まで上昇?
·日本华人网络交流 问日本华人一个问题
·日本旅游代购 富山接机
·生活百科 英国转澳大利亚转换插头
·汽车 【求助】修车遇到困难怎么办?