日本电子维修技术 显卡高端显卡做CUDA运算,对PCIE速度有要求吗?
例如用Titant V或者1080Ti这级别的显卡(单卡),执行一些比较重负荷的CUDA运算(例如挖矿,或者视频编码),PCIE 4x或者PCIE 2x这样的带宽,会成为运算的瓶颈吗?
评论
帮你喊一下
@zzz09700
@树导师
评论
挖矿不会,视频编码可能会(看数据量)
评论
我嘈!!现在能艾特了?可以可以
评论
我觉得必然会影响CUDA啊,不然老黄费那劲搞个switch干嘛
评论
挖矿不会,视频编辑不知道,科学计算不会,因为反正这些卡也不能做显存统一寻址,即使是能做显存统一寻址的卡也是通过nvlink。
评论
是不是瓶颈取决于你的具体任务,跟宽泛的用途(比如图形任务或是通用计算)无关。
概括来说:
如果你的任务需要频繁跟内存交换数据,特别是数据量比较大时,较低的PCI-E带宽会成为瓶颈。
而如果你的任务主要时间都花在GPU运算或是GPU和显存间数据传输,那PCI-E带宽就不是瓶颈。
评论
至少要x8、我看主板说明书显卡是这样说的··
评论
宽带树解释的很到位啊
评论
在未来的某个时间点也许我们需要更高的CPU-显卡传输带宽,弄这么个东西从大局上来看对于多卡之间的相互协作肯定也是有好处的,反正对手还躺在地上,酷哒也已经基本统一了世界,所以我们就搞一个玩玩呗…当然最要紧的,多一个NV独享的玩意就是多一条来钱的途径多一种挤兑友商的姿势
----老黄
评论
上面宽带树这一波强行细分看得我都不知道应该说啥
真的需要疯狂交换大量数据计算时间还贼短的,我觉得,还是忘了有酷哒这回事老老实实做NUMA优化然后捞几个E5 E7和按摩店的那些啥啥啥跑跑,就这么算了吧(想想经常在学校里被当成酷哒入门101的GPU版BFS…实际上并不能跑得过写的好点的CPU版BFS
视频编码那可怜的吞吐量…3.0x1带宽从未觉得自己如此的牛X
挖矿?拒绝回答挖矿相关问题
评论
视频编解码,挖矿这种,算法都很成熟了,优化的很好,3.0x2基本就完全够用了。
你要是做深度学习,程序又写的不好,那就难说了。
评论
DL研究过,会,8X都会
评论
你们聊,我只是路过的!!
评论
会,具体看情况,一般来说都会。
评论
原来还有这功能,哈哈。
评论
如果我自己写一些CUDA的程序,如果能把数据预装到显存里面,比较长时间都在GPU内运算,显卡不需要经常与内存交换计算结果,是不是这样子对PCIE的要求就可以比较小了?
评论
咋叫我强行细分了?是你在强行曲解我的意思好么?
我什么时候说过"需要疯狂交换大量数据计算时间还贼短"的情况了?这种情况本来就不适合用GPU好么。举这种极端例子除了抬杠有别的意义么。
我在实际中确实遇到过一些内存和显存间数据传输占据可观时间的情况,这时候弄个2X 4X带宽就会拖慢性能,有错?
比如多卡training,卡间同步gradient时PCI-E经常成为瓶颈,不管是Peer2Peer还是通过内存中转都要走PCI-E,特别是model比较大时,你砍成X8都能看到性能下降。
图形那边也一样,某些物理模拟或是其它东西需要在CPU上算完传给GPU,这种每帧都要传的东西数据量大一点的时候PCI-E也会成为瓶颈。
上面这俩种情况你还真都不能扔掉GPU。
评论
当年好像有个梗
巨硬的程序媛回复起来总是原理上十分正确,而又完全没卵用。
以这个标准,我觉得树娘的回复简直教科书
评论
然而楼主抛开具体任务直接问做CUDA对PCI-E速度有无要求这个问题本身就不存在“有卵用”的答案啊。
那看来我等小卒还是别再发话了,省的抢了大神们的装逼权。
评论
其实楼主的这个问题,只有一个答案。
必须不够用
这个答案的优点是,既易懂,又易操作,还最不容易遇到问题。
(根本不需要区分场景分别对待)
评论
楼主都单卡了你还多卡training,卡间同步gradient啥啥啥
然后宽带树乃玩的这种先需要CPU高精度物理模拟,后面还需要酷哒在那不知道搞什么飞机的东西,这肯定已经在我的认知范围外了
说起来,这种大规模高精度物理模拟,CPU先死?GPU先死?显存先爆?PCIe还真的有拖后腿的机会吗?
评论
难道是笔记本外接cuda卡?
这种方案想起来很带感,实际使用起来通常会非常蛋疼,而带宽不够肯定不会是最主要的问题。
评论
可以。。但是如果是自己写的程序,大部分时候并没有那么理想的表现。。
评论
imagenet跑一遍少说2个T,x1的话光传数据就要2000秒...
评论
其实没有这功能,只是在灌水
评论
被召唤过来了好开心
这样就有种连死宅都能在哪里派上用场的错觉
评论
imagenet用一张1080ti或者titan v来跑,也要跑好多天吧?
评论
resnet18用TitanV跑90遍一天半,resnet101时间就长了。
评论
我在想 至少要x8会不会是因为显卡pcie的长度都是x8 x16的
x1 和x4的槽位太短插不下 需要转接
但是对Pcie x4的速度要求不大呢
另外顺便一提,跑gpu渲染Pcie x1的性能不够,具体引擎是redshift
我朋友用3路1070试过了,慢1/3-1/2
可能至少要x4
谢谢你的分享 电路 电子 维修 求创维42c08RD电路图 评论 电视的图纸很少见 评论 电视的图纸很少见 评论 创维的图纸你要说 版号,不然无能为力 评论 板号5800-p42ALM-0050 168P-P42CLM-01 电路 电子 维修 我现在把定影部分拆出来了。想换下滚,因为卡纸。但是我发现灯管挡住了。拆不了。不会拆。论坛里的高手拆解过吗? 评论 认真看,认真瞧。果然有收
·日本中文新闻 唐田绘里香为新剧《极恶女王》剃光头 展现演员决心
·日本中文新闻 真子小室夫妇新居引发隐私担忧
·日本中文新闻 前AKB48成员柏木由纪与搞笑艺人交往曝光
·日本学校 {日本国际学校}梅田インターナショナルスクール
·日本学校 LINE:sm287 陳雨菲、20歳、台湾からの留学生、東京に来たばかり
·日本留学生活 出售平成22年走行48000km 代步小车
·日本华人网络交流 円相場 一時1ドル=140円台まで上昇?
·日本华人网络交流 问日本华人一个问题
·日本旅游代购 富山接机
·生活百科 英国转澳大利亚转换插头
·汽车 【求助】修车遇到困难怎么办?