日本电子维修技术 显卡转:疑似nvidia的安培核心的参数流出




https://news.mydrivers.com/1/675/675122.htm

这段时间,有关NVIDIA、AMD各自下一代旗舰级GPU核心的曝料不断,但都是各种传闻,让人捉摸不定。现在,我们从GeekBench 5测试数据库里挖出了NVIDIA的两个新核心,规模都相当庞大。其中一个显示有118个计算单元(NVIDIA的叫法是SM流式多处理器),假如每组延续64个流处理器(CUDA核心)的配置,总数就是7552个,同时核心频率为1.11GHz,搭配显存24GB(检测值23.8GB)。另一个则是108个计算单元,对应6912个流处理器,核心频率1.01GHz,搭配显存48GB(检测值46.8GB)。
很显然,它们都是NVIDIA的下一代核心,或许就是传说中的“Ampere”(安培),7nm工艺制造,甚至有可能是更下一代的“Hopper”(赫柏)NVIDIA也做过双架构核心并行的事儿,比如Tesla V100系列是Volta(伏特)核心,仅供专业市场,GeForce RTX 20、GTX 16系列则是Turing(图灵)核心,仅供消费级市场。由于缺乏其他佐证,目前还无法确认这两个核心属于计算专业卡Tesla、图形专业卡Quadro、半专业卡Titan、游戏卡GeForce之中的哪个序列,按照NVIDIA的产品研发和发布规律来说Tesla的可能性很大,比如Tesla A100,但也不排除GeForce,比如RTX 3080 Ti。如果118个单元、7552个流处理器的大核心是RTX 3080 Ti,那么规模要比现在68个单元、4352个流处理器的RTX 2080 Ti增大了足有74%。而且,这极有可能还不是完整版核心,128个单元才是最合理的全部实力,那样就是8192个流处理器,相比于RTX 2080 Ti大了88%,即便相比72个单元4608个流处理器、完整TU102核心的Titan RTX也大了78%。24GB显存如果是游戏卡的GDDR6,对比RTX 2080 Ti可就翻了一番还多,而如果是专业卡的HBM2,对比现在Tesla V100 16/32GB也只算是个低配版。
108个单元、6912个流处理器的核心则肯定不是RTX 3080,一来这样会比RTX 2080的规模增大135%,非常离谱,二来显存容量高达48GB,绝无可能用于游戏卡,只能是Tesla乃至是Quadro专业卡。 至于1.01GHz、1.11GHz的低频率,这很容易理解,都是早期的工程样品而已,分别出现在去年10月底和11月底。核心规模猛增的同时,即便在如此低频率下的性能也相当凶猛,118单元、108单元的OpenCL计算跑分分别为184096、141654,作为参考Tesla V100 154606、Quadro GV100 142837、Titan RTX 132804。



吃瓜群众表示喜闻乐见




评论
那个108CU的铁定定位是RTX6000的下一代


118CU那个可能是Titan A

评论

我只是一个吃瓜的搬运工而已

评论
7552 cu是18T 双精度的话就是1.2G,差不多吧。

评论
不感兴趣,只买得起5000以内的卡

评论

感觉这个频率有点低

评论
买不起了 下了

评论

TITAN A才24G显存那3080TI的定位就不好办了吧,给12G甚至11G显然不够用。

评论

计算卡低频保平安的。超频能力惊人。

评论

1. Jensen又没规定Titan显存容量一定是3080ti的两倍,更何况现在游戏卡公版不是涡轮了,无所谓。

2. 游戏显卡未必用安培,可以是葛蕾丝-赫柏这类新架构。

3. Titan V才12GB。

评论

v100 5120cuda的双精度才7-8t,7500cuda要跑18t怎么可能只要1.2g,除非单双1:1

评论

只说双精度。现在单双配比不清楚。

评论

7552 CUDA*1.2Ghz单精度才18T左右吧

评论

是的。我算错了,目前不知道dp单元数和cuda的配比,没法算。看错了,以为是dp单元数。


评论

“越新越好,越高越好,越高越新我也就越高兴"
地铁离去,2080开个缩成弟弟的RTX GI,1440P全高山姆DLC都能掉到30多FPS,真实的故事,
图灵的算力和规模太匮乏,今年还有这么多未出世的光追大作,更是需要新卡的支援。


评论

感觉现在的单机游戏的优化和一坨屎一样,吃硬件的同时各种bug漫天飞

评论

2080ti是多少来着??13.4 挤牙膏 到18???

评论

计算卡型号显存吞吐量(GB/s)单精度浮点(TFLOPS)半精度浮点(TFLOPS)双精度浮点(TFLOPS)NVIDIA GeForce RTX 2080ti61613.4526.9420.2 GFLOPS (1:32)NVIDIA RTX TITAN67216.3132.62509.8 GFLOPS (1:32)NVIDIA TITAN V651.314.929.87.450 (1:2)NVDIA Tesla V100 16G89714.1328.267.066 (1:2)NVDIA Tesla V100 32G(PCIE)89714.1328.267.066 (1:2)NVDIA Tesla V100 32G(SXM2)89715.6731.337.834(1:2)

评论

如果下一代旗舰3080ti没有到20,和挤牙膏也没什么区别了。

评论

这是ES啊。。。正式版频率应该起码1.5左右

评论

个人觉得最早的18t比较可信,因为是hpc端流出的。那么单精度36t。但可能跟3080ti没关系。现在讨论30系感觉为时尚早。


评论
价格是不是也要起飞...

评论

单精度36T是肯定没有戏的,从工艺/核心面积。。等等来说都没有可能

理性点23-25T大概是这样

评论

承认2080ti 13.4就得承认2080ti频率就那个纸面的1545mhz(1545*2*4352≈13.45T),当然谁都知道那个纸面的1545mhz毫无意义
如果118CU是titanA,那实际频率就毫无理由倒退,那单精度至少也得是(1950*2*7552≈29.45T),若是做不到,那这爆料必然是有假或者有推断不正确的部分


评论

发错编辑

评论

因为我怕某个人说我看见N卡爆料就说NB买买买

评论

不是3080ti。23t是有点低的,titan v都可以分体水拉到20t。

评论

嗯,超频是另外一回事了,[email protected] CUDA或者7752 CUDA

评论
这108cu和118cu应该都是ga100试刀,20多天后gtc上真正发布的应该也不是这两种刀法

评论

其实是很难用gv100预测ga100,因为是隔代的。

ga100的fp32性能很可能是concurrent发射的fp32和fp64混合而成的。

在turing构架中,double了每tpc的带宽从而实现了int8和fp32的concurrent发射,这个技术直接留用到ga100中就行。那我也来脑补下,navi21单精度20t。

评论

我现在关心的是有没有titan a,否则玩不起。。。

评论

你是说阴阳人反应堆嘛

评论
反正买不起,我只看看

评论

一个vbios就能fuse的东西,不可逆而已

评论

这次A100已经是两大刀的一等残废,太贪A几乎没可能用GA100
其实偶神马都不知道,是乃楼下那个RBQ偷偷告诉偶的

0023.png (5.5 KB, 下载次数: 0)

2020-3-1 01:27 上传




评论

有就行了,不如多阉割点,这样价格会便宜。

毕竟titan v是个例,极度的让利行为,老黄不知道会不会来第二次。

评论
18t的单精度有点低了,2080ti正常的运行频率在1900多,都有接近17t,体制稍好的卡能上2000以上,可以接近18t了

评论

titan v感觉是处理残次品,提高gv100残次核心的利用率,商业行为,不应该算让利吧

评论

titan v的核心哪里是残次品?核心完全一样,唯一阉割的是nvlink,这是外围电路。

评论

GV100完整参数:5376个cuda,4096bit

Quadro GV100参数:5120个cuda,4096bit

titan v参数:5120个cuda,3072bit

评论

那tesla v100也是阉割的咯?

截屏2020-03-01上午10.55.24.png (510.4 KB, 下载次数: 0)

2020-3-1 10:55 上传




评论
看来3080TI必须得买啊,希望3080TI的显存在16G以上

评论
计算卡参数提升这么大  游戏卡没道理不跟进   大navi能不能够得着啊

评论

这顶楼的1.0,1.1的频率,感觉明显是在控分,不想暴露实力而已。毕竟大角星还没出呢。

虽然计算卡一向频率低也不至于这么低的。话说已经3月份了,不到一个月,各位的预言是大佬还是带佬将接受检验。

评论

GV100 后面有完整版的推出的,只不过没大肆宣传而已

评论
老黄是时候把安培拉出来溜溜了

评论

Volta家族的顶级核心代号GV100,将会取代GP100成为新的旗舰。

它采用台积电专门为NVIDIA定制的12nm FFN新工艺(N代表NVIDIA),或者说是16nm FinFET的改良升级版,集成多达211亿个晶体管,核心面积达到了恐怖的815平方毫米,相比于GP100分别增加了38%、34%,顺利成为史上第一大GPU核心。

其内部拥有5376个32位浮点核心、2688个64位浮点核心(还是2:1),划分为84组SM阵列、42组TPC阵列、7组GPC阵列,同时搭配336个纹理单元,都比GP100增加了40%,同时还首次加入了672个Tensor Core。

Tensor Core是一种新的核心,专门为深度计算操作加入的,更加刚性,不那么弹性,但是依然可以编程。

它本质上是一系列ALU单元的集合,可以执行4x4矩阵操作、融合乘加操作(A×B+C),还可以计算两个4xx 16位浮点矩阵的乘积,再加上一个4x4 16/32位浮点矩阵,得到一个4x4 32位矩阵。

通过在一个单元内执行大规模的矩阵乘积操作,GV100可以获得更强大的浮点计算性能。单个Tense Core每时钟周期能执行64个FMA操作(128FLOPS),官方号称整体性能比Pasal提升4倍。


并不是我觉得GV100是阉割版本,而是815mm的核心面积,市面上所有的GV100都是没有瑕疵的5120sp良品的可能性,和从5376sp阉割256sp到5120sp保证良率的可能性,从商业角度上而言,后者的可能性更高而已,因为GV100本身并不定为游戏卡,我只是保留自己的主观意见,不做过多讨论,因为不是游戏卡,感觉没什么意义

评论

titan v也不是游戏卡,它没有geforce的title,也砍了rops(前面说只看了nvlink是不对的,它砍了两刀,nvlink为了避开tesla,rops为了避开quadro,是非常有意图性的)。所以它跟tesla v100就是高低搭配的问题。tesla v100自己就有3个版本,当然不能说低版本是为高版本处理瑕疵品的。

是否是处理瑕疵品,要看设计意图。如果设计上就是主要为5376sp,而少量5120sp做瑕疵品处理,那么才是你说的处理瑕疵品。如果设计上就是5120sp,但为了良率保证过度设计到5376sp,这个当然不能算处理瑕疵品,只能算良率的提高手段。

评论

老黄一直是拿次期间当主力来销售的,这点我很认同

评论

说titan v是残次品也有道理
毕竟胶水hbm的时候也有可能坏了一片,然后就改成12g的ttv
毕竟不像ti那样一开始就只给11g显存

当然显示老黄肌肉/面子的JHH版不属于此列


评论

V100S只拉了核心频率和显存频率,你不会把某些新闻瞎猜的当真了吧

TIM截图20200301175549.jpg (122.04 KB, 下载次数: 0)

2020-3-1 17:56 上传


TIM截图20200301175605.jpg (191.88 KB, 下载次数: 0)

2020-3-1 17:56 上传




评论

还真挺可能,那么可能是多少SP呢 电路 电子 维修 我现在把定影部分拆出来了。想换下滚,因为卡纸。但是我发现灯管挡住了。拆不了。不会拆。论坛里的高手拆解过吗? 评论 认真看,认真瞧。果然有收 电路 电子 维修 求创维42c08RD电路图 评论 电视的图纸很少见 评论 电视的图纸很少见 评论 创维的图纸你要说 版号,不然无能为力 评论 板号5800-p42ALM-0050 168P-P42CLM-01
 ·日本中文新闻 唐田绘里香为新剧《极恶女王》剃光头 展现演员决心
·日本中文新闻 真子小室夫妇新居引发隐私担忧
·日本中文新闻 前AKB48成员柏木由纪与搞笑艺人交往曝光
·日本学校 {日本国际学校}梅田インターナショナルスクール
·日本学校 LINE:sm287 陳雨菲、20歳、台湾からの留学生、東京に来たばかり
·日本留学生活 出售平成22年走行48000km 代步小车
·日本华人网络交流 円相場 一時1ドル=140円台まで上昇?
·日本华人网络交流 问日本华人一个问题
·日本旅游代购 富山接机
 ·生活百科 英国转澳大利亚转换插头
·汽车 【求助】修车遇到困难怎么办?

维修经验

CPUcpu-z 1.77版低调发布

日本维修技术更新: New benchmark “submit and compare” feature New clocks dialog reporting all system’s clock speeds in real-time Preliminary support for Intel Kaby Lake AMD Bristol Ridge processors 主要是增加了支持I、A两个新架构的 ...

维修经验

CPU这几天经常开机黑屏,热重启后又正常

日本维修技术这几天经常开机黑屏,热重启后又正常,今天热重启也不管用了。折腾半天总算点亮,显示超频失败,以前出这个画面我是不理它的,直接重启就能正常进系统了,今天不敢托大,因为 ...

维修经验

CPU超频求助!关于华擎H170和6700K

日本维修技术问题见楼主的show贴 https://www.chiphell.com/thread-1634895-1-1.html 这次华擎的H170 Hyper最大的特色应该是自带时钟发生器可以自由超外频 可是楼主好久没有折腾超频了。。。 两图中除了CPU外频 以 ...

维修经验

CPU液态金属会侵蚀cpu核心吗?

日本维修技术前阵子看到有人说,液态金属时间长了会侵蚀cpu铜盖,那么问题来了,这货会不会侵蚀核心呢? 评论 这玩意儿好像只对铝起反应 评论 不是说,cpu的盖子是铜的吗。。。 评论 不会,核 ...

维修经验

CPUm6i究竟支不支持e3 1231v3

日本维修技术官网上看支持列表没写有e3 1231v3,装机帖又有人晒,百度也没个明确答案,那究竟能不能点亮?有在用的chher说一下么 评论 升级最新bios肯定可以支持 评论 我的p67evo官网上也没说支持12 ...

维修经验

CPU华擎 HYPER 妖板 正确玩法

日本维修技术600元的 B150,10相供电,释放洪荒之力 注意必须官网 Beta 区的 BIOS 有 AVX 的 CPU 可能会掉缓存 启动时按 X 键激活 SKY OC,重启后进入 BIOS 160924164727.jpg (95.63 KB, 下载次数: 1) 2016-9-24 17:47 上传 ...

维修经验

CPUE5 2686 V3和i7 6800K如何选择

日本维修技术默认用,不超频,两者功耗是一模一样的 E5 2686 V3:2.0主频,3.5睿频, 18核心36线程 ,45M L3 咸鱼大约2500~3000元 i7 6800K : 3.5主频,3.8睿频 ,6核心12线程 ,盒装3000元 评论 性能应该是26 ...

维修经验

CPUHD530硬解4K能力还是有点弱呀!

日本维修技术播放器用PotPlay 64bit,各种优化后,跑4K @120Hz视频只能到70帧左右的速度,勉强能用! 显示器用的4K的优派VP2780 未标题-1.jpg (211.97 KB, 下载次数: 0) 2016-9-26 21:29 上传 评论 这个估计你没优化 ...

维修经验

CPU6900k 1.25V到4.2体质怎么样

日本维修技术如图,体质怎么样,ring是35,没敢试了,都说ring高了毁硬件 评论 不错的U,但不算雕,上4.4就大雕了,这电压上4.5的目前没见有人发图 评论 谢谢前辈告知 评论 我这个用1.2V超的4.2,R ...

维修经验

CPUI3 6100 华擎B150M pro4超4.5g测试。

日本维修技术看看论坛没多少i3 6100的帖子,就转下自己发的show贴里面的数据,给大家参考下。家里还有当年的神U i3 540 oc 4.5G在给老妈用。 不知道数据上正常吗?有6100的朋友可以告诉下,另外是不有 ...

维修经验

CPU7系u会兼容100系主板吗?

日本维修技术RT,听说要推200系板,100系还能用吗以后。。 评论 兼容的 评论 感谢!以后换u就行了,目前消息200系板会有新的特性吗? 评论 24条PCI-E 3.0通道、支持Intel Optane混合存储技术、十个USB 3 ...

维修经验

CPU有心入5820k了,求教下温度问题

日本维修技术一直徘徊在6700k和5820k之间,6700k现在这德行直接把我推向了5820k啊,从2600k升级上来,三大件都要换,现在唯一疑惑的是IB-E ex这种顶级风冷能不能压住4.5g的5820呢?毕竟刚刚买一个多月。 ...

维修经验

CPU6600&6600K才100的差价

日本维修技术太少了吧。。。 6600.JPG (106.91 KB, 下载次数: 0) 2016-10-1 10:30 上传 评论 毕竟只是i5而已…… 评论 上z170 6600也能超,等于没区别,差价能有100已经不错了 评论 然后又见不超频人士推荐超频 ...