一、前言 其实结合安培架构的实际产品表现,我很想在标题写上Poor Ampere。 后来想了想,其实提升和Maxwell2.0到Turing的幅度差不多,算不上Poor(【第四年的见异思迁】对比测试看图灵架构性能提升,当时得出的结论是,经过4年的研发,Turing对比Maxwell2.0纯架构提升2成)。那就写个遗憾吧。二、核心浅析和变量控制1、概述 (1)Ampere是NVIDIA用三星8nm制程打造的最新游戏显卡架构,按Tick-Tock玩法是Tick、Tock均有,即制程架构双提升,按理说应该是提升很大。其第三定位的游戏核心GA104是利用该制程节点打造的中高端级别核心,对比Turing的TU104,两者定位类似,功耗级别类似,可以说符合NVIDIA的一贯定位,甚至在发布前后被脑残舆论推到了打NAVI21的定位上,当然这是后话。 (2)安培的白皮书给到了6个关键特性,我试着逐一用几行字概括。 2x FP32 Processing:从图灵的FP32+INT32变成FP32+FP32/INT32,纯FP32吞吐翻倍。 Second-Generation RT Core:数量不变,每个单元增加一组三角形求交单元和插值运算单元,加强动态模糊下的光追性能,但是和游戏无关。白皮书原话:GA10xhardware-accelerated motion blur is supported by Blender 2.90, Chaos V-Ray5.0,Autodesk Arnold, and Redshift Renderer 3.0.X using the NVIDIA OptiX 7.0API. 也就是说,渲染用的。 Third-Generation Tensor Cores:单SM的TensorCore数量减半,每个单元的FP16操作数翻倍。 GDDR6X Memory:GA104不搭载。将显存颗粒的速度从16-18Gbps推进到了19-21Gbps,目前暂无2GB单颗颗粒。 Third-Generation NVLink:GA104不搭载。对于安培架构来说,由于NV已经放弃了SLI,所以这个特性只对科学计算有用。 PCIe Gen 4:追上业界最新标准,引入新特性DirectStorage,现在用不上。2、变量控制 本次测试选用的显卡是RTX 2080和RTX 3070,因为两款核心的规模类似,所以本次测试的原则是尽量同频。 (1)核心频率相同,3070保持1905MHz,2080用Afterburner降频121MHz(此时实际运行频率是1905MHz),保持基本一致的核心频率。 (2)显存频率相同,3070和2080均通过Afterburner调整到15000MHz,显存带宽完全一致为480GB/s。 (3)核心功耗相同,2080通过Afterburner降低功耗到91%(205W),此时,3070和2080的核心功耗均为165W左右(参考3DMarkTS测试)。 (4)3070对比2080的ROP增加了50%,解决了ROP的问题,这点变量无法控制。参考我之前的帖子(【黄氏刀法】震惊!NVIDIA主流显卡竟然采用“饥饿ROP”设计)。三、测试平台 AMD Ryzen7 4700GE ES 4.3GHz GIGABYTEAORUS X470 GAMING 7 WIFI CrucialBallistix Elite DDR4 3600 8G*4 WD Black SN750 1T ASUS ROG THOR 850W STREACOM BC1四、测试项目 1、理论性能 (1)测试数据GPUTU104GA104CUDA30726144ROP6496MC256bit256bitL24M4M驱动457.09457.09最大核心频率1905MHz1905MHzAIDA64 理论显存带宽480.0GB/s480.0GB/sAIDA64 理论像素填充率121920182880AIDA64 理论纹理填充率365760365760AIDA64 FP321168822999AIDA64 FP64365.4357AIDA64 INT321142411444AIDA64 memory copy398444410256Fire Strike Extreme1291116369Fire Strike Ultra64118449Time Spy1092313663Time Spy Extreme50866796Port Royal65628087DXR 1.121.1131.66VRS TEST2 uplift66.467.3DLSS uplift134.4140.13DMark06 Single-Texturing Fillrate89720.063118290.23DMark06 Multi-Texturing Fillrate188018.063221098.53DMark Vantage Color Fillrate47.9774.43DMark Vantage Texture Fillrate269.52296.83
评论
懂了,这就去买A卡
评论
懂了,算力喂楼主
评论
懂了 AMD YES
评论
ok,楼主请吃饼
评论
我觉得算力的优势还依赖于游戏和应用的跟进
就像当年X1900那样,初期游戏和应用下对7900优势不明显,但在后期游戏下完全是碾压的
评论
你这个比较一点都不科学啊。
买图灵你学习不了原来在显卡上还有保险丝,明白了什么叫MLCC电容,什么叫POSCAP电容。大家开始渐渐知道生产这些电容的厂商,开始知道它们之间的成本物料区别,开始知道它们的电气性能差异。
所以安培的提升要考虑这些启发民智的部分,那就是1145.14%提高
评论
真实N狗的测试
评论
懂了,这就去买a卡
评论
懂了,算力提升对我来说全都应验,反正游戏只是需求的一部分。
所以不买A卡
评论
临24小时发文,很六啊。
评论
不仅算力喂狗
填充率也喂狗
带宽也喂狗了
评论
《感觉这次 AMD 但凡争气一点,黄卡都要翻车》
评论
解除220w功耗限制,跑2.1还是可以的,超频能力并没有比20系低,没什么提高就是了
评论
乱说,这些gpu专家早就科普过了!!!都是你们这帮人天天恶意黑老黄!!!
评论
柯基,你邪恶指数马上正分了
评论
本质就是老黄根本就是没用心弄安培这代的游戏卡 随便弄个翻倍FP32和GDDR6X 应付应付 虽然FP32对于将来光追的变态算力要求 很重要 ,但是只增加FP32 其他部分单元不见同步增长多少 加上配合三星那个廉价工艺 完全就是为了对抗新A卡 敷衍了事。
只能期盼是老黄是为了下一代全新架构的推出而缓冲 不是真的为了敷衍PC玩家
另外我觉得安培产品明明有性能更好的方案,但是老黄却选择了毛利率最高那种
评论
工艺一定程度上和架构是一样的重要
评论
老黄又不是第一次这样了
评论
明天你就来老黄家上班吧
评论
104再拉跨 苏妈似乎拿不出同级别的核心
评论
这对比清晰明了
评论
啊 最后一句点醒了我
评论
实际上最适合用作对比的卡是3060和2060,ROP是一样的
但是这样结果会更难看,因为中低端卡只能用低分辨率才能跑出来能用的帧数
评论
继承了这么多sp还是这么菜
QQ图片20201030151315.jpg (23.37 KB, 下载次数: 0)
评论
我有六个粪瓢哥表情,你有几个
粪瓢1.jpg (21.35 KB, 下载次数: 0)
评论
老黄的30系卡,极大带动了千瓦级电源的销量,这是实实在在的给消费者带来更大的温暖啊!!
评论
等A卡发布看看测试,是不是能真的N转A。
评论
ga100和ga102这两个差异巨大的核心共用ampere开发代号是有道理的。因为它们共同完成了一个任务。
ga100专攻矩阵指令,ga102专攻向量指令。
评论
懂了,这就去喂狗。“道理我都懂,但是3070游戏几乎可以和2080ti一战了,而且价格便宜几乎一半了。”所以我选30系
评论
你就是蒜粒?
评论
建议把文中的2080改成2080Super
评论
选三棒子就是个败笔
评论
懂了,算力喂醉熊
评论
难怪 FP32从10多点 到30T 游戏提升50%都没有,,,
评论
人民币今天跌了不少
评论
从结果来看,老黄完全没有把pc玩家当一回事,安培也不是给游戏用的。一,老黄的利润不依赖pc游戏,实际上做显卡的在做cpu面前毛都不是,老黄的市值和利润近年来快速增长靠的是异构计算,ai,挖矿,深度学习这些乱七八糟的东西,核心是计算而不是图形,简单来说还是cpu而不是gpu;二是amd的7nm已经两代了,按理说工艺红利已经早就榨干,nv这边却是刚刚提升工艺,没想到第三代居然真的如此给力,简单来说轻敌;第三是,如果老黄只换工艺,不改架构,2080ti用8nm重新流片再加一下规模,就现在这个图形的结果来看,提升可能也差不多,但是老黄选择翻倍Cuda,效果却几乎没有,老黄还说这一代是重大突破,这翻倍的算力还是剑指计算而不是图形,ga100和ga102就是不同的计算取向。
评论
唯一能比较实在的反应算力提升的是各种gpgpu离线渲染器测试。实际上octane渲染器的提升比octanebench还高一点,3090约有2080ti的1.9倍
评论
反正我的观点就是买这卡一般都是为了升级的,以3A为参考,可以从现在1080的4K全开下20~30帧升级到60帧就够了,换这代卡我起初目标就是为了渡过4K60年代的,功耗增加我也认了。但是升级不等于我没卡用,加价这种事我不会认。
但是横向来看,这代AMD太给力,我有可能就不选择老黄家了……
评论
不要喂狗,20、30系我统统50包邮收...
评论
我不是……我没有……你别乱说……
评论
哈哈, N卡要隔代买的魔咒被打破了,以后要隔两代才能买
评论
感觉硬件行业就算没竞争对手
也会自己开翻车
评论
看着手里的2080super,心里默默的拔了草
评论
这样就没了?我很失望啊。
评论
QQ图片20201031093547.jpg (6.6 KB, 下载次数: 0)
我就看看那张gpuz图
评论
哪儿有GPU-Z图
评论
白皮书架构图什么的没说到的太多了
你以为A100的SM里每个sub core里有16个FP32,16个INT32,8个FP64和1个Tensor Core?
其实白皮书那只是示意图,和实际单元无关
实际上A100的SM里每个sub core里有有16个FP32/INT32,16个FP16和1个Tensor Core
A100的架构是GV100的延续,和图灵无关,瞎了狗眼
电路 电子 维修 求创维42c08RD电路图 评论 电视的图纸很少见 评论 电视的图纸很少见 评论 创维的图纸你要说 版号,不然无能为力 评论 板号5800-p42ALM-0050 168P-P42CLM-01 电路 电子 维修 我现在把定影部分拆出来了。想换下滚,因为卡纸。但是我发现灯管挡住了。拆不了。不会拆。论坛里的高手拆解过吗? 评论 认真看,认真瞧。果然有收
·日本中文新闻 唐田绘里香为新剧《极恶女王》剃光头 展现演员决心
·日本中文新闻 真子小室夫妇新居引发隐私担忧
·日本中文新闻 前AKB48成员柏木由纪与搞笑艺人交往曝光
·日本学校 {日本国际学校}梅田インターナショナルスクール
·日本学校 LINE:sm287 陳雨菲、20歳、台湾からの留学生、東京に来たばかり
·日本留学生活 出售平成22年走行48000km 代步小车
·日本华人网络交流 円相場 一時1ドル=140円台まで上昇?
·日本华人网络交流 问日本华人一个问题
·日本旅游代购 富山接机
·生活百科 英国转澳大利亚转换插头
·汽车 【求助】修车遇到困难怎么办?