日本电子维修技术 显卡高端显卡做CUDA运算,对PCIE速度有要求吗?



例如用Titant V或者1080Ti这级别的显卡(单卡),执行一些比较重负荷的CUDA运算(例如挖矿,或者视频编码),PCIE 4x或者PCIE 2x这样的带宽,会成为运算的瓶颈吗?


评论
帮你喊一下
@zzz09700
@树导师




评论
挖矿不会,视频编码可能会(看数据量)

评论

我嘈!!现在能艾特了?可以可以

评论
我觉得必然会影响CUDA啊,不然老黄费那劲搞个switch干嘛

评论
挖矿不会,视频编辑不知道,科学计算不会,因为反正这些卡也不能做显存统一寻址,即使是能做显存统一寻址的卡也是通过nvlink。

评论
是不是瓶颈取决于你的具体任务,跟宽泛的用途(比如图形任务或是通用计算)无关。

概括来说:
如果你的任务需要频繁跟内存交换数据,特别是数据量比较大时,较低的PCI-E带宽会成为瓶颈。
而如果你的任务主要时间都花在GPU运算或是GPU和显存间数据传输,那PCI-E带宽就不是瓶颈。

评论
至少要x8、我看主板说明书显卡是这样说的··

评论

宽带树解释的很到位啊

评论

在未来的某个时间点也许我们需要更高的CPU-显卡传输带宽,弄这么个东西从大局上来看对于多卡之间的相互协作肯定也是有好处的,反正对手还躺在地上,酷哒也已经基本统一了世界,所以我们就搞一个玩玩呗…当然最要紧的,多一个NV独享的玩意就是多一条来钱的途径多一种挤兑友商的姿势

----老黄

评论

上面宽带树这一波强行细分看得我都不知道应该说啥
真的需要疯狂交换大量数据计算时间还贼短的,我觉得,还是忘了有酷哒这回事老老实实做NUMA优化然后捞几个E5 E7和按摩店的那些啥啥啥跑跑,就这么算了吧(想想经常在学校里被当成酷哒入门101的GPU版BFS…实际上并不能跑得过写的好点的CPU版BFS
视频编码那可怜的吞吐量…3.0x1带宽从未觉得自己如此的牛X

挖矿?拒绝回答挖矿相关问题




评论
视频编解码,挖矿这种,算法都很成熟了,优化的很好,3.0x2基本就完全够用了。
你要是做深度学习,程序又写的不好,那就难说了。

评论
DL研究过,会,8X都会

评论
你们聊,我只是路过的!!

评论
会,具体看情况,一般来说都会。

评论

原来还有这功能,哈哈。

评论

如果我自己写一些CUDA的程序,如果能把数据预装到显存里面,比较长时间都在GPU内运算,显卡不需要经常与内存交换计算结果,是不是这样子对PCIE的要求就可以比较小了?

评论

咋叫我强行细分了?是你在强行曲解我的意思好么?

我什么时候说过"需要疯狂交换大量数据计算时间还贼短"的情况了?这种情况本来就不适合用GPU好么。举这种极端例子除了抬杠有别的意义么。

我在实际中确实遇到过一些内存和显存间数据传输占据可观时间的情况,这时候弄个2X 4X带宽就会拖慢性能,有错?
比如多卡training,卡间同步gradient时PCI-E经常成为瓶颈,不管是Peer2Peer还是通过内存中转都要走PCI-E,特别是model比较大时,你砍成X8都能看到性能下降。
图形那边也一样,某些物理模拟或是其它东西需要在CPU上算完传给GPU,这种每帧都要传的东西数据量大一点的时候PCI-E也会成为瓶颈。

上面这俩种情况你还真都不能扔掉GPU。






评论

当年好像有个梗

巨硬的程序媛回复起来总是原理上十分正确,而又完全没卵用。
以这个标准,我觉得树娘的回复简直教科书


评论

然而楼主抛开具体任务直接问做CUDA对PCI-E速度有无要求这个问题本身就不存在“有卵用”的答案啊。


那看来我等小卒还是别再发话了,省的抢了大神们的装逼权。

评论

其实楼主的这个问题,只有一个答案。

必须不够用

这个答案的优点是,既易懂,又易操作,还最不容易遇到问题。
(根本不需要区分场景分别对待)

评论

楼主都单卡了你还多卡training,卡间同步gradient啥啥啥

然后宽带树乃玩的这种先需要CPU高精度物理模拟,后面还需要酷哒在那不知道搞什么飞机的东西,这肯定已经在我的认知范围外了
说起来,这种大规模高精度物理模拟,CPU先死?GPU先死?显存先爆?PCIe还真的有拖后腿的机会吗?


评论
难道是笔记本外接cuda卡?

这种方案想起来很带感,实际使用起来通常会非常蛋疼,而带宽不够肯定不会是最主要的问题。



评论

可以。。但是如果是自己写的程序,大部分时候并没有那么理想的表现。。

评论
imagenet跑一遍少说2个T,x1的话光传数据就要2000秒...

评论

其实没有这功能,只是在灌水

评论

被召唤过来了好开心
这样就有种连死宅都能在哪里派上用场的错觉


评论

imagenet用一张1080ti或者titan v来跑,也要跑好多天吧?

评论

resnet18用TitanV跑90遍一天半,resnet101时间就长了。

评论

我在想 至少要x8会不会是因为显卡pcie的长度都是x8 x16的

x1 和x4的槽位太短插不下 需要转接

但是对Pcie x4的速度要求不大呢

另外顺便一提,跑gpu渲染Pcie x1的性能不够,具体引擎是redshift
我朋友用3路1070试过了,慢1/3-1/2
可能至少要x4



谢谢你的分享 电路 电子 维修 求创维42c08RD电路图 评论 电视的图纸很少见 评论 电视的图纸很少见 评论 创维的图纸你要说 版号,不然无能为力 评论 板号5800-p42ALM-0050 168P-P42CLM-01 电路 电子 维修 我现在把定影部分拆出来了。想换下滚,因为卡纸。但是我发现灯管挡住了。拆不了。不会拆。论坛里的高手拆解过吗? 评论 认真看,认真瞧。果然有收
 ·日本中文新闻 唐田绘里香为新剧《极恶女王》剃光头 展现演员决心
·日本中文新闻 真子小室夫妇新居引发隐私担忧
·日本中文新闻 前AKB48成员柏木由纪与搞笑艺人交往曝光
·日本学校 {日本国际学校}梅田インターナショナルスクール
·日本学校 LINE:sm287 陳雨菲、20歳、台湾からの留学生、東京に来たばかり
·日本留学生活 出售平成22年走行48000km 代步小车
·日本华人网络交流 円相場 一時1ドル=140円台まで上昇?
·日本华人网络交流 问日本华人一个问题
·日本旅游代购 富山接机
 ·生活百科 英国转澳大利亚转换插头
·汽车 【求助】修车遇到困难怎么办?

维修经验

CPUcpu-z 1.77版低调发布

日本维修技术更新: New benchmark “submit and compare” feature New clocks dialog reporting all system’s clock speeds in real-time Preliminary support for Intel Kaby Lake AMD Bristol Ridge processors 主要是增加了支持I、A两个新架构的 ...

维修经验

CPU这几天经常开机黑屏,热重启后又正常

日本维修技术这几天经常开机黑屏,热重启后又正常,今天热重启也不管用了。折腾半天总算点亮,显示超频失败,以前出这个画面我是不理它的,直接重启就能正常进系统了,今天不敢托大,因为 ...

维修经验

CPU超频求助!关于华擎H170和6700K

日本维修技术问题见楼主的show贴 https://www.chiphell.com/thread-1634895-1-1.html 这次华擎的H170 Hyper最大的特色应该是自带时钟发生器可以自由超外频 可是楼主好久没有折腾超频了。。。 两图中除了CPU外频 以 ...

维修经验

CPU液态金属会侵蚀cpu核心吗?

日本维修技术前阵子看到有人说,液态金属时间长了会侵蚀cpu铜盖,那么问题来了,这货会不会侵蚀核心呢? 评论 这玩意儿好像只对铝起反应 评论 不是说,cpu的盖子是铜的吗。。。 评论 不会,核 ...

维修经验

CPUm6i究竟支不支持e3 1231v3

日本维修技术官网上看支持列表没写有e3 1231v3,装机帖又有人晒,百度也没个明确答案,那究竟能不能点亮?有在用的chher说一下么 评论 升级最新bios肯定可以支持 评论 我的p67evo官网上也没说支持12 ...

维修经验

CPU华擎 HYPER 妖板 正确玩法

日本维修技术600元的 B150,10相供电,释放洪荒之力 注意必须官网 Beta 区的 BIOS 有 AVX 的 CPU 可能会掉缓存 启动时按 X 键激活 SKY OC,重启后进入 BIOS 160924164727.jpg (95.63 KB, 下载次数: 1) 2016-9-24 17:47 上传 ...

维修经验

CPUE5 2686 V3和i7 6800K如何选择

日本维修技术默认用,不超频,两者功耗是一模一样的 E5 2686 V3:2.0主频,3.5睿频, 18核心36线程 ,45M L3 咸鱼大约2500~3000元 i7 6800K : 3.5主频,3.8睿频 ,6核心12线程 ,盒装3000元 评论 性能应该是26 ...

维修经验

CPUHD530硬解4K能力还是有点弱呀!

日本维修技术播放器用PotPlay 64bit,各种优化后,跑4K @120Hz视频只能到70帧左右的速度,勉强能用! 显示器用的4K的优派VP2780 未标题-1.jpg (211.97 KB, 下载次数: 0) 2016-9-26 21:29 上传 评论 这个估计你没优化 ...

维修经验

CPU6900k 1.25V到4.2体质怎么样

日本维修技术如图,体质怎么样,ring是35,没敢试了,都说ring高了毁硬件 评论 不错的U,但不算雕,上4.4就大雕了,这电压上4.5的目前没见有人发图 评论 谢谢前辈告知 评论 我这个用1.2V超的4.2,R ...

维修经验

CPUI3 6100 华擎B150M pro4超4.5g测试。

日本维修技术看看论坛没多少i3 6100的帖子,就转下自己发的show贴里面的数据,给大家参考下。家里还有当年的神U i3 540 oc 4.5G在给老妈用。 不知道数据上正常吗?有6100的朋友可以告诉下,另外是不有 ...

维修经验

CPU7系u会兼容100系主板吗?

日本维修技术RT,听说要推200系板,100系还能用吗以后。。 评论 兼容的 评论 感谢!以后换u就行了,目前消息200系板会有新的特性吗? 评论 24条PCI-E 3.0通道、支持Intel Optane混合存储技术、十个USB 3 ...

维修经验

CPU有心入5820k了,求教下温度问题

日本维修技术一直徘徊在6700k和5820k之间,6700k现在这德行直接把我推向了5820k啊,从2600k升级上来,三大件都要换,现在唯一疑惑的是IB-E ex这种顶级风冷能不能压住4.5g的5820呢?毕竟刚刚买一个多月。 ...

维修经验

CPU6600&6600K才100的差价

日本维修技术太少了吧。。。 6600.JPG (106.91 KB, 下载次数: 0) 2016-10-1 10:30 上传 评论 毕竟只是i5而已…… 评论 上z170 6600也能超,等于没区别,差价能有100已经不错了 评论 然后又见不超频人士推荐超频 ...