一、前言不要给我谈什么Maxwell老古董,不要跳,你Pascal(GP100除外)也就是个Maxwell3.0,NV官网上Pascal架构介绍写的第一个提升就是写的制程提升,铁Tick。https://www.nvidia.com/zh-cn/data-center/pascal-gpu-architecture/GTC2015,2015年3月18日,黄总发布了GeForce GTX TITAN X,最牛Maxwell以下简称GM200。不过有所关注的都知道,GM200的成品是捂了小半年才发布的,故我们以拆解上GM200核心的生产日期1448周作为基准。
GM200 die.jpg (182.05 KB, 下载次数: 0)
上个月,黄总低调发布了GeForce GTX 1660 Ti,最鸡Turing(是TU117发布之前的最鸡哈哈)以下简称TU116,没有Tensor,RT Core等传统光栅化渲染不需要的东西,适合本次对比。按你胃,这次老黄还是捂了小半年,依然以拆解上TU116核心的生产日期1848周作为基准。是不是十分巧合,都四年了,更巧合的还在后面!
TU116 die.jpg (273.19 KB, 下载次数: 0)
二、GM200和TU116浅析和变量控制1、概述(1)GM200是NV在28nm制程节点打造的最后一个大核心,为28nm盖棺定论。根据CB的推算,12nmFFN对比16nm FF+没有密度提升,实测频率也没有什么提升,属于小幅优化,所以TU116是NV在16nm制程节点打造的最后一个甜点核心,是GP100和Volta两代架构尝试后的集大成者,为16nm盖棺定论。(2)两款核心都是制程终极款,架构首发款,类比于Tick-Tock中的Tock年(架构年),更新微架构,矮马对比起来有看头了。图灵有2xFP16,独立的INT32单元
arch2.jpg (132.24 KB, 下载次数: 0)
有INT32并发
arch3.jpg (134.8 KB, 下载次数: 0)
有更多的寄存器
arch4.jpg (90.63 KB, 下载次数: 0)
还有实测更强的色彩压缩节约带宽2、细节本次测试项目,不涉及DLSS,不涉及VRS,不涉及任何因为画质损失导致的无法控制的变量。(1)巧合的是,不考虑单元结构变化,GM200对比TU116刚好是规模2打1,如果将频率控制在1打2,那么做个简单的乘法,2打2走起,变量控制住了。于是,我对比的计划是将两张卡的FP32单精度性能,显存带宽尽量控制到一致。(由于boost机制的存在,频率只能尽量吻合,后面的理论测试可以看出TTX稍占便宜)(你问我为啥不用MBT把TTX定频,我也想啊,可惜改bios降频超过一定幅度后,TTX变得非常不稳定,无法测试,只得用AB降频(2)GM200,本次测试将核心降频77MHz后模拟一张奔雷手TTXmax从1202.2降到1124.8左右,根据AIDA64 GPGPU测试,计算出频率大致稳定在1.05G/7G核心架构大致是6GPC*4TPC*1SM*128CUDA=3072CUDA,384bit,96ROPs,3M L2,不刻意忽略示意图上没标的TPC(又想起某村神论2333
蜂蜜浏览器_GM200.jpg (433.35 KB, 下载次数: 0)
(3)TU116,本次测试将核心和显存超频150/1000MHz后,频率大致稳定在2.1G/14G不考虑单元结构的变化,核心架构大致是GM200的一半,3GPC*4TPC*2SM*64CUDA=1536CUDA,192bit,48ROPs,1.5M L2
TU116.jpg (322.3 KB, 下载次数: 1)
三、测试平台CPUAMD Ryzen ThreadRipper 1920X主板ASUS ROG ZENITH EXTREME内存海盗船 Dominator RGB DDR4 3000C15*4硬盘Samsung PM963 960G电源ASUS ROG THOR 850W机箱Streacom BC1
评论
黄家还是很有黑科技的
评论
围观一下柯桑
评论
naive靠着7nm靠着黄卡一时的自乱阵脚
应该可以和图灵平分秋色 就像5870对费米那样 就是时间晚了点
不过也算是给农企一个较(hui)好(guang)收(fan)官(zhao)吧
评论
能通过布线提高足够的频率也是技术........
君不见RX480 580乃至590换了工艺还是没有老黄那种boom式的频率提升~
确实期待NAVI以及NV家的7FF/7FF+显卡性能~
评论
所以,你买卡了吗?
评论
回光返照?navi是临死前踹老黄一脚?
前面看到一个新闻,i把显卡研发中心搬到了ati总部的附近,这样,a家的人跳过去都不用搬家了。
这样也好,优化资源配置,i和a本质上只不过是美帝资本家的左口袋和右口袋。
a:无可奈何花落去
i:似曾相识燕归来
评论
给三哥把研发中心搬到他老家海得拉巴了
评论
一个架构,打了人家5代人,等David Wang的新架构吧
评论
技术,回了,慢慢看
评论
毕竟连推土机都扛了23456五代酷睿呢
评论
所以自乱阵脚的结果就是自家独显市占率直接被干到了18%……而黄卡来了个近年市占率新高……这……
评论
AMD yes
评论
如果有显卡摩尔定律的话~~我觉得现在一直在对标执行着~虽然没有那么标准
评论
最近apu强势替独显遮了不少丑,比如季度总出货降幅比老黄少这种指标
评论
额,还可以这么思考啊~这么一看,是TU116自高身价,还是GM200凤凰落地,且听下回分解
评论
FSE分上面的差距可以说是代表着旧游戏的差距而TS分上面的差距可以说是未来优化1~2年后两者在同样的新游戏里面的差距。图灵的INT跟FP并发架构确实是个重大革新但也不是什么别人无法跟随的技术AMD在大角星这代卡上面也搞类似设计应该不是难事。
评论
不错不错,好贴
评论
老黄有自己的定律,每隔多少个月推新产品,之前都是一直遵守的,可最近几代开始延长迭代周期了,原因大家都懂。
评论
3080今年能出来吗
评论
GCN一战四。。。。也从侧面反映了 GCN 的确也是很优秀 只是现在的确是太老了。。。
评论
N吹客机,十分邪恶!
评论
十分客观,看到最后建议授予AMD卧底小吹手荣誉
评论
何止一战四 战八也不是难事
毕竟战6010也是战嘛
评论
乃快去给柯基当RBQ(如果柯基不嫌弃的话)套点安培的资料来
评论
最初的GCN(Tahiti、Pitcairn、Cape Verde、Hawaii)恰好是Wang参与的作品
评论
教主就是法律,苏妈还需努力
评论
闭嘴RBQ!!
评论
闭嘴RBQ!!
评论
话说老游戏对比性能差距如何?毕竟老黄没对老卡优化新游戏。
我对steam上软硬件统计里一片翠绿已经习惯了........
评论
当年也不知道是谁说自己要靠那个啥羞耻的东西来赚钱了
评论
柯基真的厉害
柯基你什么时候拿到AMD的分析师OFFER?
评论
好奇跑深度学习有差距吗?还是和浮点计算能力一致(不开int8情况下)
评论
这个测试还有一些问题,比如TTX是12G显存而1660Ti只有6G
我会尽量找一张1660 GD6来对比980Ti
这样会更好
评论
肯定1660Ti吊打,有双倍FP16
评论
Turing相对于Maxwell最大的更新是增加了每线程独立的pc和堆栈,虽然实际上是Volta加的但是Volta没有游戏卡
评论
嗯,我记得好像volta的白皮书上有
等会儿去复习下
评论
GCN 1v4的另外一个好处大概就是驱动支持时间特别长吧
核弹黄那边Kepler的笔记本显卡都要EOL了
评论
迭代周期变长是因为制程进步速度开始放缓了,显卡要用上便宜7nm evu。要明年才行吧。老黄18年还给你整除个12nm升级版不错了。。。
评论
如果都跑fp32呢?好奇cuDNN有没有针对新卡做特殊优化
评论
线程独立调度turing白皮书没有提呢,对游戏意义可能不是很大,实际2080ti游戏还吊锤ttv呢,volta要比图灵少一些游戏渲染特性是主要的
评论
int指令越多,自适应着色率渲染比例越大,图灵优势就越大[td]
Babel Tech ReviewsTechPowerUpGame titles26 titles by the year 2017 vs. 14 titles of the years 2018/1910 titles by the year 2017 vs. 10 titles of the years 2018/19GeForce GTX 1660 Ti vs. GTX 1070 (@ 100%)-2.6% vs. + 3.1% = ▲ 5.7-1.6% vs. + 2.0% = ▲ 3.6GeForce GTX 1660 Ti vs. GTX 1060 6GB (@ 100%)+ 26.5% vs. + 34.7% = ▲ 8.2+ 35.8% vs. + 38.2% = ▲ 2.4Radeon RX Vega 64 Vs. GTX 1070 (@ 100%)-+ 0.5% vs. + 10.9% = ▲ 10.4Radeon RX 590 vs. GTX 1060 6GB (@ 100%)+ 6.0% vs. + 16.7% = ▲ 10.7+ 5.3% vs. + 13.9% = ▲ 8.6according to the benchmarks of Babel Tech Reviews (with factory overclocked maps) and TechPowerUp
评论
没说不代表没有吧,线程独立调度对光追的意义非常大,rtx单元只加速层次包围盒的遍历和射线三角形求交。光线的递归迭代还是靠sm单元的通用计算。在不支持rtx的gpu离线渲染器上相同浮点能力的turing对pascal有很大优势
评论
想看3DMark06所有细项成绩和老游戏对比,包括显卡危机这类。
评论
因为这玩意还是自动布线啊。。。
评论
除了单独的计算能力测试有一些说服力
其他的游戏或者3DMark之类的和驱动优化有关
楼主选了一款新驱动,对新卡肯定有作弊优化
对老卡只有移除了作弊代码的一般优化
所以出现了吊打的情形
老黄家驱动负优化是有了名的,不管怎么洗
新架构显卡出现后肯定会降低已停产上一代架构显卡的性能的
也许从某个角度上有吹嘘新卡的可能
但是二手980Ti的价格貌似会比1660便宜一点但是性能基本上相同
买新买旧就是个人选择问题
个人理解更多还是有点抵制二手卡
知根知底可以,撕逼鱼上的不知道是不是挖过矿或者有暗伤
推一波新卡不为错
评论
线程独立调度优势很大,2080ti咋还把ttv吊起来锤呢?ttv对比ttxp提升简直可怜
评论
好文章,收藏了
AMD你学着点
评论
AMD那边从初代GCN到现在的Vega,总共也没积累出20%的同频性能提升吧……
评论
从RX550对比7750的情况来看 20%有的
不过多半是蛆洞优化来的
评论
因为cuda是两倍,所以频率就减半?不能这么简单类比吧
评论
纯gpgpu的光追octanebench 4.0中ttv 397分,ttrtx 325分,2080ti 303分,考虑规模和显存的差距turing和volta的每流处理器效率在同一水平,都得益于线程独立调度而大幅领先ttxp的238分
评论
老铁,这篇文章我能转载么
评论
请随意处置,完全没有问题,没有任何版权2333333333
其实相比转载,我更希望我是抛砖引玉,希望能吸引大家补充更多的测试项目
主要是我不太懂计算和渲染这边,我一拍脑袋找不到合适的项目对比
而且也需要更多的老游戏测试,最近没多少时间弄啊
评论
帖子最后补上了主题图
评论
好想看到4850HD的7nm盛世再现
评论
是啊 就那一代主频大幅度提升开始AMD完全拼不过了
评论
王:我过了几年回来了,没想到还是我的GCN 真香 电路 电子 维修 求创维42c08RD电路图 评论 电视的图纸很少见 评论 电视的图纸很少见 评论 创维的图纸你要说 版号,不然无能为力 评论 板号5800-p42ALM-0050 168P-P42CLM-01 电路 电子 维修 我现在把定影部分拆出来了。想换下滚,因为卡纸。但是我发现灯管挡住了。拆不了。不会拆。论坛里的高手拆解过吗? 评论 认真看,认真瞧。果然有收
·日本中文新闻 唐田绘里香为新剧《极恶女王》剃光头 展现演员决心
·日本中文新闻 真子小室夫妇新居引发隐私担忧
·日本中文新闻 前AKB48成员柏木由纪与搞笑艺人交往曝光
·日本学校 {日本国际学校}梅田インターナショナルスクール
·日本学校 LINE:sm287 陳雨菲、20歳、台湾からの留学生、東京に来たばかり
·日本留学生活 出售平成22年走行48000km 代步小车
·日本华人网络交流 円相場 一時1ドル=140円台まで上昇?
·日本华人网络交流 问日本华人一个问题
·日本旅游代购 富山接机
·生活百科 英国转澳大利亚转换插头
·汽车 【求助】修车遇到困难怎么办?