1,RT Core在干什么?
老黄并没有详细说明,但在介绍RT Core的时候,ppt上有这两个词组Ray Triangles Intersection 和 Bounding Volume Hierarchy Traversal。
在计算光线追踪的时候,并不是如同真实世界一样从光源开始顺着反射逐一计算,光线追踪是非常重的处理,我们只能关注我们肉眼能看到的范围,看不到的地方要尽量减去,所以一般是从虚拟摄像机开始反向追踪光线的反射。
在这个过程中,需要计算光线与多边形交汇的节点,这是一个相当繁重的处理。这个交汇点计算的任务就是nvidia重点硬件化的部分,就是RT Core的担当任务之一。这是前者。
后者BVH则是遍历整个多层空间结构的任务,剔除不需要参与光线追踪运算的部件,这也是交给RT Core执行。
2,新设计的SM单元有什么不同?
cuda核心呈72*64的布局,核心在计算TFlops的时候,可以同时用于TIPs的计算。
因为新设计的shader核心可以同时运行浮点单元与整型单元,SM内置指令可以以可变长的形式访问寄存器。所以它的峰值其实是16Tflops + 16TIPs,不知道挖矿性能会不会翻倍。
3,新Tensor Core有什么不一样?
明显它是由volta的Tensor Core改进而来,增加了新的INT8和INT4的SIMD指令,性能也分别是2倍和4倍于fp16。
低精度性能的大幅增强,极大提升了这个核心的推理性能,为消化DLAA庞大的性能需求做好准备。
图灵是一款很认真的产品,这个命名也看的出来。但目前的RTX 8000/6000/5000是用于内容生产(content create)的,用于内容消费(content consume)的游戏卡会不会有RTX版本的呢,我感觉并没有什么能砍的部分,除了显存,那么999刀买得到么。
gameworks的rtx和这里的rtx真的是同一个东西么。
评论
看到这句话,
我心里咯噔一下.....
评论
咦?999都买不到吗?
那我是不是应该给大V寄点啥……悠悠的抱枕?
评论
2080ti估计会上万。。。。
评论
支持树导师的科普讲座
评论
砍点SM、砍点显存及带宽、砍掉双精度
评论
本来就没有双精度,还能砍的就是RT core了
评论
RTX 8000不是Quadro系列?Quadro系列现在连双精度都没有了?这么堕落了?太久不关心这些了
评论
是啊,但Quadro也分几种版本的啊,大的核心像GP100和GV100这种才有双精度单元,其他都没有
评论
volta浮点和整型alu也是分开的,能不能同时运行浮点和整型?
评论
除了GV100和GP100,GeForce和Quadro都是用GP102/104/106/107,凭什么Quadro有双精度
评论
嗯嗯嗯,真是堕落啊,不过还是可以砍显存容量、砍显存带宽、砍ROP,还有你说的那个什么砍RT,无非就哪几种刀法嘛。下一代准备用核显了,游戏都戒了
评论
rendering专精的核心,没双精度正常。
评论
你是人吗
评论
想想9年前编CUDA应用的时候,连游戏卡的双精度都是单精度的1/4,老黄真是练就了少林还是武当刀法
评论
这不是,感觉真的因为大V我才能躲开一发根本买不起的卡
然后大V又被好多ID花式欺负想安慰一下大V嘛……
怎么就不是人了呢?
评论
在没用到光追的游戏里不就浪费了么。多了60%的面积和晶体管,但才比gp102多30%的单精度浮点。难道也是战未来?
评论
反正现在大家都砍了,你买amd的新Radeon Pro也一水的1/16
评论
所以rtx2080很贵并不是空穴来风,起码就目前看来和专业卡相比除了显存没啥地方可以再阉割了
评论
说不定老黄会掏出安培。
评论
买啥哦,都米不起了,下一代直接核显走起了
评论
但nvidia是1/32
评论
不用独显了?
评论
云里雾里
评论
intel的核显是1/4 DP... 真的是...
评论
GTX680,[email protected],SP 3100+, DP 150+
UHD630,[email protected],SP 400+,DP 100+
评论
真不用了,生存都成问题了,以后要么牙膏核显要么APU
评论
quadro的价格历来都是对应geforce的5倍,其他的自己想
评论
那双11上9900k吗?
评论
看价格溢出情况,>3500 肯定不会上这样看来INTEL还真是良心企业,舅妈不是说明年3月就有INTEL显卡了吗?可以期待一下,AMD是别指望了
评论
貌似这代Intel集显的EU是512bit宽度,所以理论上1EU = 16ALU吧?
评论
核显和APU不惹矿老板啊。哪有什么独立显卡,都是独立矿卡装成显卡的样子搞个发布会
评论
有区别嘛,一般人一辈子用不上真需要的人无论是1:16还是1:32都完全不够用只会去买有完整dp的计算卡。
评论
所以说三家里最没商业头脑(最良心)的就是酥麻
评论
不关心咯,没挖过矿,也不太了解现在是否能盈利
评论
带宽比TTV还高了,除去HPC应用,双精度要来没啥用
评论
我现在怎么觉得有这钱还不如买台ps4,便宜又好玩
评论
嗯,DP算力上来看,是的...
想不明白为毛intel要搞DP性能...
评论
没错,买台ps4pro和switch,玩游戏很舒坦啊,电脑就让它干它应该干的
评论
RTX原理都是一样的,不分工作站和游戏之分
区别只有软件,
评论
谢东哥关心,不过游戏也不玩了,9900K价格合适也是买来玩一玩DIY,也许再过2年彻底不玩机了
评论
RTX是nv单方面在推还是伙同ms一起呢?
如果是前者的话,AMD未来几年内都不跟进(主动或被动),次时代主机都不鸟的话
这个项目会不会和physx一样沦为边缘
评论
我有个疑问就是跑传统游戏时候TC跟RT单元都在休眠状态这TDP还能压制在正常的200W左右,那一但跑用上RTX的游戏让那两个平时偷懒睡觉的单元也全速工作的话这功耗又要怎么算呢?
评论
我电脑总共花了3w多,结果现在不是玩守望就是刷论坛,都够买全套的游戏主机了
评论
控制单元不够···
另外L2不够
Turing几乎都是加倍··
评论
现在配电脑不就是为了开开关关看看灯,刷刷论坛看看剧么。。。。
评论
能高特效280F+玩守望也未必不值我玩守望开个中特效都感觉心情和低特效明显不一样
评论
主机画质垃圾,帧数也低,只能玩那几个独占游戏
评论
[email protected] , 把1080ti出了换了个1063,等着换2080ti,目前发现1063足够我用了。。。。
评论
说实话,那几个独占挺诱惑人的,目前pc上没几个好玩的游戏
神海 美国末日 战神 塞尔达 都想玩玩试试
评论
正是因为只有60hz所以才更需要高帧数啊,我用着60hz感觉没有240fps以上,跟枪都很困难,[email protected]��多了
评论
die大任性啊。挖矿只用整型,貌似有的算法还可以改得不用过显存,以后看看会不会有边挖矿边打游戏的操作。
评论
我平时都开垂直同步的,可能水平太次了吧,也准备换个120或者144的
评论
因为intel集显多少要办点正事儿的……
虽然聊胜于无
这么大出货量和极低的晶体管成本,一股脑造了兴许成本还低一些
评论
可能我比你更次,60hz开了垂直同步我莫伊拉都吸不到人
评论
。。。volta可以啊
volta和turing都是16 lane simd,warp是32 wide的,通过交替发射,可以让任意两个或者两个以上的不同类型的simd满载。
和l2没半毛钱关系
评论
Volta
可以让FP32 INT32同时满载?
我记得Volta 描述FP&INT是Simultaneous ExecutionEach iteration of a pipelined loop can update addresses (INT32 pointer arithmetic) and load data for the next iteration while simultaneously processing the current iteration in FP32.
老黄描述Turing SM:Concurrent FP&INT Execution
如果我没理解错··前者是依赖关系并发进程同步 后者是并发
评论
要是与L2没关系··那老黄干嘛把Shared Memory Size / SM提升为Configurable up to 96 KB,相当于最大值提升到GM200的2倍,GP100的1.5倍··
目前没看到Turing的数字··但是总数6MB与GV100相当··SM数却降低了··
评论
。。。那随你理解吧
明明上一段都给你说了两者都能达到full throuput了,
还非要找一段本来也没什么歧义的东西来脑补曲解。
别说L2,就是L1也和SM能跑成什么样没关系,这些东西只是缓存而已。唯一有关系的只有寄存器bank够不够,port够不够而已,执行单元打交道的只有这个。
评论
要是觉得并发执行,进程同步,并行是同样的东西··
那就当没讨论过吧
评论
通篇都没有process甚至thread这个词,愣是被你理解出来了进程同步。
英语不好,不妨查一下词典,或者google翻译。
simultaneous : 同时的; 同时发生的,同时存在的; 联立的;
concurrent:同时发生的; 同时完成的; 同时存在的;
TIM截图20180819125549.jpg (27.15 KB, 下载次数: 0)
评论
砍tensor啊
评论
办公这种事情,为啥要DP性能...
且,单就整个GT的die size来说,不小了,GT2都有4个Core大了
评论
就数这句最真实。。。。毕竟游戏很多都得照顾现阶段主机。。。主机性能又如此弱鸡。。。
评论
了解了一下, DXR已经标准定好了
就看农企跟不跟和怎么跟了
nv先走一步, 就是短期前景未明
评论
我就搅不懂那些移植的作品画面肯定是不怎么好的,而且很多特效都不是顶尖,问题要求却很高。。。比如最近的猛汉世界。。
评论
又是Tensor Core又是RT Core的,感觉又回到了Vertex Shader和Pixel Shader的时代
评论
移植和硬件优化是技术活,基本只有最顶尖的几家具备
卡婊这方面还是欠缺吧
看看几年前国产泰坦陷落6就是最好的反例 电路 电子 维修 我现在把定影部分拆出来了。想换下滚,因为卡纸。但是我发现灯管挡住了。拆不了。不会拆。论坛里的高手拆解过吗? 评论 认真看,认真瞧。果然有收 电路 电子 维修 求创维42c08RD电路图 评论 电视的图纸很少见 评论 电视的图纸很少见 评论 创维的图纸你要说 版号,不然无能为力 评论 板号5800-p42ALM-0050 168P-P42CLM-01
·日本中文新闻 唐田绘里香为新剧《极恶女王》剃光头 展现演员决心
·日本中文新闻 真子小室夫妇新居引发隐私担忧
·日本中文新闻 前AKB48成员柏木由纪与搞笑艺人交往曝光
·日本学校 {日本国际学校}梅田インターナショナルスクール
·日本学校 LINE:sm287 陳雨菲、20歳、台湾からの留学生、東京に来たばかり
·日本留学生活 出售平成22年走行48000km 代步小车
·日本华人网络交流 円相場 一時1ドル=140円台まで上昇?
·日本华人网络交流 问日本华人一个问题
·日本旅游代购 富山接机
·生活百科 英国转澳大利亚转换插头
·汽车 【求助】修车遇到困难怎么办?