nv自带的测试,跑了几个。
30系的sli也需要主板认证,因为我的主板没有,所以没法测试sli相关功能了。x570一些大板是支持sli的,比如c8h,godlike。
部分结果可以和pugetsystem对RTX 2080的测试做对比。
https://www.pugetsystems.com/lab ... ce-with-Linux-1262/
新的nvlink桥接器对电器性能要求比较高,擦拭金手指很多次,终于全部通道认全了(可以只认其中部分通道)。
30系的nvlink 3.0是双工4条lane,对比20系的nvlink 2.0翻倍了(2080是单通道,2080ti + 是双通道),但速度好像下降了。
nvlink-s.JPG (81.57 KB, 下载次数: 0)
simpleP2P.JPG (152 KB, 下载次数: 0)
图中的Link is supported按照pugetsystem的唐纳德博士认为是和power处理器链接的flag,所以这里是disabled。
图中的atomic opeations是nvidia提供的一套自带地址排他锁读修改写操作。
nvlink-c.JPG (343.88 KB, 下载次数: 0)
延迟和带宽测试。
p2p.JPG (158.57 KB, 下载次数: 0)
大家比较关心的tf32性能(单卡)。
tf32.JPG (60.82 KB, 下载次数: 0)
然后是bf16的性能。可以看出其中的蹊跷了么?
bf16.JPG (64.16 KB, 下载次数: 0)
还想跑什么可以告诉我,里面也有一些图形领域的测试,从下面挑选:https://docs.nvidia.com/cuda/cuda-samples/index.html
接下来我会跑一些真实任务再更新结果。
评论
很好奇两个3090跑ResNet50这些经典的图像分类网络训练能达到什么水平
评论
我在godlike上开启不了sli,启动以后就会黑屏重置掉sli,不知道为什么
评论
一直在等3槽的nvlink,也不知道什么时候才会有。
评论
有选项出来说明支持,开不起来的话,少年去擦金手指吧。。
评论
fp16.JPG (61.89 KB, 下载次数: 0)
int.JPG (64.6 KB, 下载次数: 0)
翻了下白皮书,我这性能直逼3080
评论
谢谢建议,目前已经放弃开启sli了,可能是我两张卡不完全一样导致的
最开始我还以为是连接器的问题,返给商家测了一下发现是好的
以后有机会换两张一样的卡再试试吧,至少cuda11的例子和训练什么的都没问题
评论
你是用什么主板 支持的两块3090 nvlink 我没找到有什么主板支持8CM间距
评论
x11dpg-qt
评论
这是7049上跑的?
现在技嘉的双槽涡轮能抢到了嘛
评论
可以买到,但是价格太贵了。
评论
好吧...供应商也是报了个天价 而且和我说一个人只能买2块
你是买了4张这个嘛 还是用了别的方案
评论
我买的是金属大师。
评论
啊..我一直以为是双槽的桥 原来是4槽的桥
评论
我上了GODLIKE x570 被内存困扰 3600 128G的内存 只能2400用 真是难受
两根就没事 四根一插就不行
nvlink在渲染器里面支持 其他应用都不支持
评论
tf32性能才20多T,是在搞笑么。。
评论
楼主 能发一下您的详细配置吗
我现在那台电脑 不直接重启了了 卡死机
我怀疑电源/主板一个有问题
我现在单卡 电脑很稳定。。双卡不行 我估计就是电源供不起来。
电源您是什么牌子 多少W的啊
评论
我这个电源不好买,双路主备2200w。
但是海盗船ax1600i可以带三张3090。
https://static.chiphell.com/foru ... 2ch31n67ff127wf.jpg
评论
哈哈 谢谢 我加了个1300W 挂了一晚上游戏没啥事。 之前双卡掉驱动。我把BIOS里GEN4改成了GEN3 就好了
我感觉不是主板就是CPU 有问题
单卡没事 双卡就掉驱动 改成PCI-E3.0 居然稳定了一晚上
刚才单电源测试 看着CHH又死了一次
真是超级烦躁
评论
我的卡都是跑在pcie3上的。可以这就是原因。。
评论
有的 去找a6000的桥 通用的
评论
啊 A6000有三槽的桥吗
我靠 我要早看到你这个消息 我就不买这个主板了 糟心死了。。
评论
我怀疑这个主板太老了 就不支持GEN4的SLI
评论
我是1300w带了3090+2x titan v基本稳定,平台是1950x+x299。怕不稳定,把3090功耗限到了300瓦。
评论
老黄游戏卡那tensor就是搞笑的。我titan v刚出来时候看tensor数据漂亮支持了一把,后来测试了下后悔死了,理论5倍,实际加速连2倍都没有。现在卷积网逐渐被淘汰,以后tensor提速可能越来越少,瓶颈在gpu利用率而不是算力。实际使用中我常常得一个gpu跑好几个线程来充分利用计算资源。
最近看金坷垃去的那个tenstorrent的ppt,架构上结合data parallel和model parallel,充分利用计算资源,那可能才能带来实打实的性能提升。
评论
理论性能和实际训练网络时候的性能有差距很正常,毕竟现在算子奇怪的操作太多。但是测试简单矩阵乘法,只有20T算力,确实有点低了
评论
a6000 有2种桥,3槽4槽都有。
只不过因为是a6000用的,价钱也很美丽,我这拿一个要2000+了
评论
其实还好 早知道可以选便宜的主板或者inter的主板啊
现在想玩SLI 新主板就只能选X570 TR40 华硕全军覆没
评论
Multi-Instance GPU 这个不就是解决这个问题吗?
然而这玩意巨坑,竟然是按虚拟 GPU 的数量收费的,一个虚拟 GPU 的授权要 1000$
评论
搞了个nvlink 3090 3slot的桥 ,3dmark 成绩爆了也是没搞懂官方一直不出3槽 6cm 的桥,是不是觉得风冷扛不住
IMG_6568(20210427-024604).JPG (226.91 KB, 下载次数: 0)
IMG_6569(20210427-024607).JPG (234.75 KB, 下载次数: 0)
阿里旺旺图片20210427025759.jpg (162.24 KB, 下载次数: 0)
阿里旺旺图片20210427025813.jpg (141 KB, 下载次数: 0)
技嘉有款显卡是3.5slot的,所以老黄肯定是按消费级显卡最宽的做,否则也不会让技嘉出那么宽的显卡了。
评论
技嘉有款显卡是3.5slot的,所以老黄肯定是按消费级显卡最宽的做,否则也不会让技嘉出那么宽的显卡了。而且消费主板也是2slot一间隔。
评论
我可以开启。不过必须显示器插在下面那张显卡上。估计和那个物理加速有关。必须显示是一个卡。物理加速是另外一个。
评论
你从哪里买到的桥。。我为了这个玩意只能换了主板。
评论
这世道连 3 槽桥都要找 Quadro……
当年找 20 系 2 槽桥 费了大半工夫,然而被 3080 单卡性能搞到 10 系 20 系 全卖了,桥留着吃灰。
评论
30卡的设计 和20之前的不太一样 看着规模增加的很爆炸 其实实际算力提升没那么大
评论
大佬,大佬,你怎么买到这个桥的
评论
https://www.ebay.com/itm/3339900 ... :g:9TMAAOSwarFgLMKB
国外还有几个电商网站上有,可以搜搜。
评论
淘宝上都有了。。
https://item.taobao.com/item.htm ... ;abbucket=16#detail
评论
非常感谢~
评论
看到楼上诸君的用法,觉得我们以8张V100/A100为一个单位来train model有点浪费。
评论
看了下简介居然就是30楼的图。 电路 电子 维修 求创维42c08RD电路图 评论 电视的图纸很少见 评论 电视的图纸很少见 评论 创维的图纸你要说 版号,不然无能为力 评论 板号5800-p42ALM-0050 168P-P42CLM-01 电路 电子 维修 我现在把定影部分拆出来了。想换下滚,因为卡纸。但是我发现灯管挡住了。拆不了。不会拆。论坛里的高手拆解过吗? 评论 认真看,认真瞧。果然有收
·日本中文新闻 唐田绘里香为新剧《极恶女王》剃光头 展现演员决心
·日本中文新闻 真子小室夫妇新居引发隐私担忧
·日本中文新闻 前AKB48成员柏木由纪与搞笑艺人交往曝光
·日本学校 {日本国际学校}梅田インターナショナルスクール
·日本学校 LINE:sm287 陳雨菲、20歳、台湾からの留学生、東京に来たばかり
·日本留学生活 出售平成22年走行48000km 代步小车
·日本华人网络交流 円相場 一時1ドル=140円台まで上昇?
·日本华人网络交流 问日本华人一个问题
·日本旅游代购 富山接机
·生活百科 英国转澳大利亚转换插头
·汽车 【求助】修车遇到困难怎么办?