https://news.mydrivers.com/1/675/675122.htm
这段时间,有关NVIDIA、AMD各自下一代旗舰级GPU核心的曝料不断,但都是各种传闻,让人捉摸不定。现在,我们从GeekBench 5测试数据库里挖出了NVIDIA的两个新核心,规模都相当庞大。其中一个显示有118个计算单元(NVIDIA的叫法是SM流式多处理器),假如每组延续64个流处理器(CUDA核心)的配置,总数就是7552个,同时核心频率为1.11GHz,搭配显存24GB(检测值23.8GB)。另一个则是108个计算单元,对应6912个流处理器,核心频率1.01GHz,搭配显存48GB(检测值46.8GB)。
很显然,它们都是NVIDIA的下一代核心,或许就是传说中的“Ampere”(安培),7nm工艺制造,甚至有可能是更下一代的“Hopper”(赫柏)。NVIDIA也做过双架构核心并行的事儿,比如Tesla V100系列是Volta(伏特)核心,仅供专业市场,GeForce RTX 20、GTX 16系列则是Turing(图灵)核心,仅供消费级市场。由于缺乏其他佐证,目前还无法确认这两个核心属于计算专业卡Tesla、图形专业卡Quadro、半专业卡Titan、游戏卡GeForce之中的哪个序列,按照NVIDIA的产品研发和发布规律来说Tesla的可能性很大,比如Tesla A100,但也不排除GeForce,比如RTX 3080 Ti。如果118个单元、7552个流处理器的大核心是RTX 3080 Ti,那么规模要比现在68个单元、4352个流处理器的RTX 2080 Ti增大了足有74%。而且,这极有可能还不是完整版核心,128个单元才是最合理的全部实力,那样就是8192个流处理器,相比于RTX 2080 Ti大了88%,即便相比72个单元4608个流处理器、完整TU102核心的Titan RTX也大了78%。24GB显存如果是游戏卡的GDDR6,对比RTX 2080 Ti可就翻了一番还多,而如果是专业卡的HBM2,对比现在Tesla V100 16/32GB也只算是个低配版。
108个单元、6912个流处理器的核心则肯定不是RTX 3080,一来这样会比RTX 2080的规模增大135%,非常离谱,二来显存容量高达48GB,绝无可能用于游戏卡,只能是Tesla乃至是Quadro专业卡。 至于1.01GHz、1.11GHz的低频率,这很容易理解,都是早期的工程样品而已,分别出现在去年10月底和11月底。核心规模猛增的同时,即便在如此低频率下的性能也相当凶猛,118单元、108单元的OpenCL计算跑分分别为184096、141654,作为参考Tesla V100 154606、Quadro GV100 142837、Titan RTX 132804。
吃瓜群众表示喜闻乐见
评论
那个108CU的铁定定位是RTX6000的下一代
118CU那个可能是Titan A
评论
我只是一个吃瓜的搬运工而已
评论
7552 cu是18T 双精度的话就是1.2G,差不多吧。
评论
不感兴趣,只买得起5000以内的卡
评论
感觉这个频率有点低
评论
买不起了 下了
评论
TITAN A才24G显存那3080TI的定位就不好办了吧,给12G甚至11G显然不够用。
评论
计算卡低频保平安的。超频能力惊人。
评论
1. Jensen又没规定Titan显存容量一定是3080ti的两倍,更何况现在游戏卡公版不是涡轮了,无所谓。
2. 游戏显卡未必用安培,可以是葛蕾丝-赫柏这类新架构。
3. Titan V才12GB。
评论
v100 5120cuda的双精度才7-8t,7500cuda要跑18t怎么可能只要1.2g,除非单双1:1
评论
只说双精度。现在单双配比不清楚。
评论
7552 CUDA*1.2Ghz单精度才18T左右吧
评论
是的。我算错了,目前不知道dp单元数和cuda的配比,没法算。看错了,以为是dp单元数。
评论
“越新越好,越高越好,越高越新我也就越高兴"
地铁离去,2080开个缩成弟弟的RTX GI,1440P全高山姆DLC都能掉到30多FPS,真实的故事,
图灵的算力和规模太匮乏,今年还有这么多未出世的光追大作,更是需要新卡的支援。
评论
感觉现在的单机游戏的优化和一坨屎一样,吃硬件的同时各种bug漫天飞
评论
2080ti是多少来着??13.4 挤牙膏 到18???
评论
计算卡型号显存吞吐量(GB/s)单精度浮点(TFLOPS)半精度浮点(TFLOPS)双精度浮点(TFLOPS)NVIDIA GeForce RTX 2080ti61613.4526.9420.2 GFLOPS (1:32)NVIDIA RTX TITAN67216.3132.62509.8 GFLOPS (1:32)NVIDIA TITAN V651.314.929.87.450 (1:2)NVDIA Tesla V100 16G89714.1328.267.066 (1:2)NVDIA Tesla V100 32G(PCIE)89714.1328.267.066 (1:2)NVDIA Tesla V100 32G(SXM2)89715.6731.337.834(1:2)
评论
如果下一代旗舰3080ti没有到20,和挤牙膏也没什么区别了。
评论
这是ES啊。。。正式版频率应该起码1.5左右
评论
个人觉得最早的18t比较可信,因为是hpc端流出的。那么单精度36t。但可能跟3080ti没关系。现在讨论30系感觉为时尚早。
评论
价格是不是也要起飞...
评论
单精度36T是肯定没有戏的,从工艺/核心面积。。等等来说都没有可能
理性点23-25T大概是这样
评论
承认2080ti 13.4就得承认2080ti频率就那个纸面的1545mhz(1545*2*4352≈13.45T),当然谁都知道那个纸面的1545mhz毫无意义
如果118CU是titanA,那实际频率就毫无理由倒退,那单精度至少也得是(1950*2*7552≈29.45T),若是做不到,那这爆料必然是有假或者有推断不正确的部分
评论
发错编辑
评论
因为我怕某个人说我看见N卡爆料就说NB买买买
评论
不是3080ti。23t是有点低的,titan v都可以分体水拉到20t。
评论
嗯,超频是另外一回事了,[email protected] CUDA或者7752 CUDA
评论
这108cu和118cu应该都是ga100试刀,20多天后gtc上真正发布的应该也不是这两种刀法
评论
其实是很难用gv100预测ga100,因为是隔代的。
ga100的fp32性能很可能是concurrent发射的fp32和fp64混合而成的。
在turing构架中,double了每tpc的带宽从而实现了int8和fp32的concurrent发射,这个技术直接留用到ga100中就行。那我也来脑补下,navi21单精度20t。
评论
我现在关心的是有没有titan a,否则玩不起。。。
评论
你是说阴阳人反应堆嘛
评论
反正买不起,我只看看
评论
一个vbios就能fuse的东西,不可逆而已
评论
这次A100已经是两大刀的一等残废,太贪A几乎没可能用GA100
其实偶神马都不知道,是乃楼下那个RBQ偷偷告诉偶的
0023.png (5.5 KB, 下载次数: 0)
评论
有就行了,不如多阉割点,这样价格会便宜。
毕竟titan v是个例,极度的让利行为,老黄不知道会不会来第二次。
评论
18t的单精度有点低了,2080ti正常的运行频率在1900多,都有接近17t,体制稍好的卡能上2000以上,可以接近18t了
评论
titan v感觉是处理残次品,提高gv100残次核心的利用率,商业行为,不应该算让利吧
评论
titan v的核心哪里是残次品?核心完全一样,唯一阉割的是nvlink,这是外围电路。
评论
GV100完整参数:5376个cuda,4096bit
Quadro GV100参数:5120个cuda,4096bit
titan v参数:5120个cuda,3072bit
评论
那tesla v100也是阉割的咯?
截屏2020-03-01上午10.55.24.png (510.4 KB, 下载次数: 0)
评论
看来3080TI必须得买啊,希望3080TI的显存在16G以上
评论
计算卡参数提升这么大 游戏卡没道理不跟进 大navi能不能够得着啊
评论
这顶楼的1.0,1.1的频率,感觉明显是在控分,不想暴露实力而已。毕竟大角星还没出呢。
虽然计算卡一向频率低也不至于这么低的。话说已经3月份了,不到一个月,各位的预言是大佬还是带佬将接受检验。
评论
GV100 后面有完整版的推出的,只不过没大肆宣传而已
评论
老黄是时候把安培拉出来溜溜了
评论
Volta家族的顶级核心代号GV100,将会取代GP100成为新的旗舰。
它采用台积电专门为NVIDIA定制的12nm FFN新工艺(N代表NVIDIA),或者说是16nm FinFET的改良升级版,集成多达211亿个晶体管,核心面积达到了恐怖的815平方毫米,相比于GP100分别增加了38%、34%,顺利成为史上第一大GPU核心。
其内部拥有5376个32位浮点核心、2688个64位浮点核心(还是2:1),划分为84组SM阵列、42组TPC阵列、7组GPC阵列,同时搭配336个纹理单元,都比GP100增加了40%,同时还首次加入了672个Tensor Core。
Tensor Core是一种新的核心,专门为深度计算操作加入的,更加刚性,不那么弹性,但是依然可以编程。
它本质上是一系列ALU单元的集合,可以执行4x4矩阵操作、融合乘加操作(A×B+C),还可以计算两个4xx 16位浮点矩阵的乘积,再加上一个4x4 16/32位浮点矩阵,得到一个4x4 32位矩阵。
通过在一个单元内执行大规模的矩阵乘积操作,GV100可以获得更强大的浮点计算性能。单个Tense Core每时钟周期能执行64个FMA操作(128FLOPS),官方号称整体性能比Pasal提升4倍。
并不是我觉得GV100是阉割版本,而是815mm的核心面积,市面上所有的GV100都是没有瑕疵的5120sp良品的可能性,和从5376sp阉割256sp到5120sp保证良率的可能性,从商业角度上而言,后者的可能性更高而已,因为GV100本身并不定为游戏卡,我只是保留自己的主观意见,不做过多讨论,因为不是游戏卡,感觉没什么意义
评论
titan v也不是游戏卡,它没有geforce的title,也砍了rops(前面说只看了nvlink是不对的,它砍了两刀,nvlink为了避开tesla,rops为了避开quadro,是非常有意图性的)。所以它跟tesla v100就是高低搭配的问题。tesla v100自己就有3个版本,当然不能说低版本是为高版本处理瑕疵品的。
是否是处理瑕疵品,要看设计意图。如果设计上就是主要为5376sp,而少量5120sp做瑕疵品处理,那么才是你说的处理瑕疵品。如果设计上就是5120sp,但为了良率保证过度设计到5376sp,这个当然不能算处理瑕疵品,只能算良率的提高手段。
评论
老黄一直是拿次期间当主力来销售的,这点我很认同
评论
说titan v是残次品也有道理
毕竟胶水hbm的时候也有可能坏了一片,然后就改成12g的ttv
毕竟不像ti那样一开始就只给11g显存
当然显示老黄肌肉/面子的JHH版不属于此列
评论
V100S只拉了核心频率和显存频率,你不会把某些新闻瞎猜的当真了吧
TIM截图20200301175549.jpg (122.04 KB, 下载次数: 0)
TIM截图20200301175605.jpg (191.88 KB, 下载次数: 0)
评论
还真挺可能,那么可能是多少SP呢 电路 电子 维修 我现在把定影部分拆出来了。想换下滚,因为卡纸。但是我发现灯管挡住了。拆不了。不会拆。论坛里的高手拆解过吗? 评论 认真看,认真瞧。果然有收 电路 电子 维修 求创维42c08RD电路图 评论 电视的图纸很少见 评论 电视的图纸很少见 评论 创维的图纸你要说 版号,不然无能为力 评论 板号5800-p42ALM-0050 168P-P42CLM-01
·日本中文新闻 唐田绘里香为新剧《极恶女王》剃光头 展现演员决心
·日本中文新闻 真子小室夫妇新居引发隐私担忧
·日本中文新闻 前AKB48成员柏木由纪与搞笑艺人交往曝光
·日本学校 {日本国际学校}梅田インターナショナルスクール
·日本学校 LINE:sm287 陳雨菲、20歳、台湾からの留学生、東京に来たばかり
·日本留学生活 出售平成22年走行48000km 代步小车
·日本华人网络交流 円相場 一時1ドル=140円台まで上昇?
·日本华人网络交流 问日本华人一个问题
·日本旅游代购 富山接机
·生活百科 英国转澳大利亚转换插头
·汽车 【求助】修车遇到困难怎么办?