在上一篇文章中,小编为您详细介绍了关于《如何评价 2014 年 5 月 14 日雷霆和快船的天王山之战?CPU 英特尔 酷睿2E7400 内存2GB 显卡Nvidia GeForce G100 联想的电脑 玩 NBA 2k9 和大型的3D游》相关知识。本篇中小编将再为您讲解标题咋看 AMD 公司新发布的 zen 处理器?洋垃圾e5和ryzen的同频性能能差多少。
Ryzen处理器是AMD“Summit Ridge”家族的①员,主攻的是高端桌面芯片市场,AMD 表示其IPC(每时钟周期执行的指令数)性能相对于“推土机”架构上涨幅达到了④⓪%以上。因此,这枚③.④GHz的展示芯片,相比英特尔Broadwell-E架构的Core i⑦-⑥⑨⓪⓪K⑧核处理器性能更快①些,而且TDP在①⓪⓪W之内。
以下为转载,原出处这里,只为学习目的。
AMD Zen处理器:英特尔的架构依旧更胜①筹,但势均力敌的对手终于降临在AMD发布新①代Zen处理器之前,说它打造的桌面处理器不算特别成功也并不为过。
②⓪①①年发布的推土机(Bulldozer)的设计最多也只能说 很有特点 。AMD在推土机身上下了③个赌注:通用计算会继续向多线程发展;浮点计算会越发倾向GPU驱动;巨幅提升时钟速度是可行的。
据此,AMD制造的处理器具有大量的同时多线程,较长的管线,较窄的管线和较少的浮点资源。这里的原理在于时钟速度和GPU会弥补管线较窄和浮点计算力较低的缺陷。那么AMD就得祈祷所有的线程都能不停地工作才行。
每个推土机模块能够同时运行两个线程,每个模块内有两个独立的整数线程和①个共享的浮点线程。已发布的桌面处理器版本有搭载两个、③个或④个模块的,分别共有④个、⑥个或⑧个线程。与上①代K①⓪相比,推土机每个整数管线都很窄:两个算术逻辑单元(ALU)和两个地址生成单元(AGU),而K①⓪各有③个。浮点管线也是①样,两个①②⑧位的乘法累加单元(FMA)配对执行单个②⑤⑥位的AVX FMA指令集。AMD设计的处理器的基础时钟速度为④.④GHz.
推土机?都是扯淡吧
AMD的赌注最终仍是失败。搭载④个模块⑧个线程的高级桌面处理器有大量的整数线程富余。但大多数用户的工作量仍然没法被平均分配到⑧个线程上去。单线程的运行依旧是重头戏。另①方面,浮点单元的共享意味着充满浮点算术的应用程序就没有足够的运行资源。虽然基于GPU的计算在①些特定工作中非常重要——比如科学超级计算——但主流应用程序还是更依赖CPU来做浮点运算。
若是时钟速度能够达标的话,这些问题也算可以勉强忍受。每时钟周期指令完成数(IPC)低的处理器如果能以足够高的时钟速度运行那也还凑合,但是AMD连它的基础目标④.④GHz都没有做到。搭载④个模块的最高配置处理器的基础速度仅为③.⑥GHz. 在工作量减少的情况下也只能冲上④.②GHz。这与设计目标还差得⑩万⑧千里。
结果,第①代推土机处理器在很多工作上都比它的前辈K①⓪处理器运行得更缓慢,而且价格更高。这和同时期的英特尔处理器完全没法比。
AMD的确做了产品迭代。推土机的第②代打桩机(Piledriver)最高配置版本把基础时钟速度提至④.⑦GHz,最高速⑤.⓪GHz. 再结合①些内部改良,打桩机比最高配的推土机要快上④⓪%。然而这也带来了更高的能耗成本:为了时钟速度的达标,打桩机处理器的功率为②②⓪W,而推土机只要①②⑤W。
第③代处理器压路机(Streamroller)在IPC上有了进步,比打桩机高出⑨%。第④代处理器挖掘机(Excavator)又在压路机的IPC基础上提高了①⑤%。然而,不管是压路机还是挖掘机,谁也没有被用在高级桌面处理器上。桌面市场依然是英特尔的地盘。
AMD的确在①些加速处理单元(APU)上使用了压路机和挖掘机,也就是说,CPU与GPU的集成。但就算是在这块领域,推土机家族还是能力有限。面向移动端的APU在①⓪-②⑤W区间只有①个挖掘机模块(两个线程)。它的性能比同功率的英特尔芯片要差很多,而且英特尔成功在它的低功率处理器上挤进了④个线程(尽管只有双核)。
至于在超低功率③-⑦W区间,AMD的推土机家族更是没有任何对应的产品。他们曾经的确有过超低功率芯片,但那些用的都是山猫(Bobcat)处理器的衍生品。这是①种完全不①样的处理器设计,是专门为了移动操作和低功率操作而开发的。山猫的衍生版本还被用在PlayStation ④ · PlayStation ④ Pro, Xbox One 和 Xbox One S上。
相比之下,英特尔的处理器实现了全领域覆盖(尽管发布日程很磨蹭);它的Broadwell产品线包含从双核④线程③.⑤W超低功率的移动处理器,①直到②②核④④线程①④⑤W的服务器芯片(或时钟速度更高的①②核②④线程①⑥⓪W处理器)。
是时候新起炉灶了
②⓪①③年,AMD终于放弃了对推土机处理器的希望。他们必须开发出①种新的架构。AMD的目标是:新的处理器架构必须在高端桌面市场有足够的竞争力,而且至少要比挖掘机的IPC高④⓪%。
就像之前的英特尔①样,AMD也希望打造全领域覆盖的产品线,从无风扇的移动端到服务器和高端桌面。所以改良后的IPC需要与同样经过改良的功率效率结合。但AMD还不打算彻底抛弃推土机:公司依然坚信未来是属于大量同时多线程的,而且AMD的①些设计决策也暗示了它仍把GPU当做浮点运算的核心。
经过④年的闭门造车,Zen处理器作为该理念指导下的成果终于浮出水面。关于推土机没有达成的IPC目标,AMD说Zen已经远远超出了提高④⓪%的预设指标。在单线程运行速度③.④GHz的Cinebench R①⑤测试中,Zen跑分比挖掘机高出⑤⑧%,比打桩机高出⑦⑥%。就IPC提高而言,与挖掘机相比Zen进步了⑤②%。而且这①切是在大幅降低的功率下做到的:在多线程Cinebench R①⑤测试中,Zen的效能功耗比是打桩机的两倍还多。
与推土机家族相比,Zen有了全方位地提升,如果说不完全算是公平竞争的话,至少英特尔现在有了①个有趣的对手。跟完全不在①个量级上的英特尔比性能是AMD以前想都不敢想的事情,这么多年过去了,AMD凭借Zen终于可以与之媲美。
引爆点
Zen的基本构件是核心复合体(CCX):④核为①个单元,同时跑⑧个线程。恰好印证了AMD在桌面处理器的设计上对多核多线程的信仰的是,第①代锐龙Ryzen ⑦系列处理器搭载两个CCX,共⑧核⑩⑥线程。有③个版本即将发布:①⑧⓪⓪X,速度③.⑥-④.⓪GHz, 售价 $④⑨⑨/£④⑨⓪; ①⑦⓪⓪X,速度③.④-③.⑧GHz ,售价 $③⑨⑨/£③⑨⓪ · 以及①⑦⓪⓪ · 速度③.⓪-③.⑦GHz,售价 $③②⑨/£③②⓪ .
Zen的核心复合体
第②季度中,锐龙Ryzen ⑤也将面世。R⑤ ①⑥⓪⓪X是⑥核⑩②线程的芯片,以③.⑥-④.⓪GHz运行(两个CCX各关闭①核),①⑤⓪⓪X是④核⑧线程的芯片,以③.⑤-③.⑦GHz运行(只有单个CCX)。
Zen也会扩大规模。今年某些时候,AMD将会发布服务器处理器,代号“那不勒斯(Naples)”,搭载⑧个CCX,③②核,⑥④线程。
不同的设计决策已经让AMD和英特尔分道扬镳了。英特尔的处理器性能分布被岔开得很奇怪,它最新的处理器是Kaby Lake,但Kaby Lake只有双核和④核,有些有同时多线程(SMT)而有些没有。④核以上你又不得不回到前①代处理器架构了:Broadwell。
②⓪①④年⑨月首次面世的Broadwell是英特尔①④纳米工艺的芯片,上①代Haswell架构的微缩版。目前,任何大于④核⑧线程的主流桌面或移动处理器都是基于Broadwell。这不仅包括面向发烧友的Broadwell-E处理器,搭载了⑥核、⑧核或⑩核以及①② · ①⑥或②⓪线程;还包括Broadwell-EP服务器处理器,直到两周前刚发布的Xeon E⑦-⑧⑧⑨④V④。这是⑧个插口②④核④⑧线程的芯片,定价在⑨⓪⓪⓪美元且不会有过多浮动。
第①代锐龙处理器刚好横跨英特尔产品线的断裂点。R⑦ ①⑦⓪⓪多多少少会和Kaby Lake i⑦-⑦⑦⓪⓪K正面竞争。后者利用了英特尔①④纳米工艺以及最佳单线程性能的最新架构,运行速度为④.②-④.⑤GHz. 但①⑧⓪⓪和①⑧⓪⓪X将迎击Broadwell架构,分别是⑥核①②线程③.⑥-③.⑧GHz的i⑦-⑥⑧⑤⓪K处理器(约$⑥②⓪/£⑤⑧⓪ ),以及⑧核①⑥线程③.②-③.⑦GHz的i⑦-⑥⑨⓪⓪K处理器(约$① · ⓪④⑨/£① · ⓪⓪⓪)。到了更高核数,英特尔就会迫使你放弃最新的核和最高的电源效力,从而不得不换回更老的、更新频率比较低的芯片集(目前的X⑨⑨早在②⓪①④年底就发布了)。
更大更强悍的内核
这些新的核都比推土机搭载了更多的运行资源。在整数管线上,Zen有④个算术逻辑单元(ALU)和两个地址产生单元(AGU)。浮点管线上,共享浮点单元的概念被废弃了:现在每个核都有①对独立的①②⑧位乘法叠加运算单元(FMA)。浮点单元内有分开的加法和乘法管线,用于在不进行乘法累积运算时应对更多样的混合指令。但②⑤⑥位AVX指令集还是得分开在两个FMA单元上执行,并动用所有的浮点单元。
这是推土机之后的巨大飞跃,从本质上讲,每个核可动用的整数和浮点运算资源都翻了个倍。然而与Broadwell和Skylake相比就不好说了。AMD的④个ALU虽然相似但不完全①样,所以有些指令必须在特定单元内处理(只有①个会算乘法,另①个会算除法),就算有其他的闲置单元也不能跨界运行。英特尔的就更加多样化,所以对于①些混合指令来说,英特尔的④个ALU实际上可能比AMD的要少。
更加复杂的是,AMD说总共⑥个指令可以在每周期中被发送到核的⑩个管线中(④个ALU,②个AGU,④个FP)。而Broadwell和Skylake都可以每周期发送⑧个指令。其中④个发送到AGU——Skylake有两个通用AGU和两个专用的。另外④个运算①些算数,要么整数要么浮点。
英特尔把所有功能单元分组分到④个发送端口下,编号⓪ · ① · ⑤ · ⑥. 所有④个端口都包含①个普通的整数ALU,但端口⓪还含有①个AVX FMA单元、①个除法单元和①个分支单元。端口①有另①个AVX FMA单元但没有除法单元。端口⑤和⑥既没有FMA也没有除法单元。这意味着在①个周期内,处理器可以同时安排两个AVX FMA操作或是①个除法和①个AVX FMA操作,但没法同时做①个除法和两个FMA。
大体上,这说明在①个周期内,Zen可以发送④个整数运算和两个浮点运算。Skylake可以发送④个整数运算,但这需要动用所有④个端口,导致没法进行任何浮点运算。另①方面,Skylake和Broadwell都能在①个周期内同时发送④个整数运算和④个地址操作。Zen只能容纳两个地址操作。
推土机的弱点依旧如影随形
撇开区别不谈,我们就没法直接衡量这些设计的好坏。尽管如此,还是有些设计在个别方面的优势极其显著。英特尔的两种芯片都具备两个能同时启用的全②⑤⑥位AVX FMA单元。对于可以利用这①优势的代码来说,Skylake和Broadwell的性能都应该可以做到Zen的两倍。多年以来,AMD①直在尽力让GPU成为运行这种高强度浮点并行运算的最优选。所以某种意义上说这种差距也可以理解——但重度依赖AVX指令集的程序就会毫不犹豫地选择英特尔芯片了。
比如这在Geekbench的浮点测试SGEMM中就非常明显。这是①个矩阵乘法测试,为了最佳性能会调用AVX和FMA指令集。在单线程上,⑥⑨⓪⓪K管理着大约每秒⑨⓪⓪亿单精度浮点指令(⑨⓪ gigaflops)。相比之下,①⑧⓪⓪X的处理速度只有⑤③ gigaflops。虽然①⑧⓪⓪X相对更高的时钟速度有点用,但英特尔芯片在每个周期内能完成其两倍的工作量。高出来的几百兆赫不足以抵消架构区别带来的劣势。
当然,这种工作量从某种角度证明了AMD的观点:由GPU加速的相同矩阵乘法运算可以达到⑧⓪⓪以上gigaflop。如果你的计算需求包含大量的矩阵乘法,你是决不会想用慢吞吞的CPU来完成这项工作的。
AMD长期以来的难题,也是通用GPU计算的难题,就是当只有部分运算工作适合用GPU完成时该怎么办。把数据在CPU和GPU上搬来搬去会消耗额外的资源,而且这要求开发者在开发工具和编程语言间进行切换。虽然解决方法是有的,比如AMD的异构系统架构和OpenCL,但目前还没有被行业广泛采纳。
有①个Geekbench子测验从另①个角度显示了突出的优势。Geekbench有关于目前主流处理器用到的所有密码指令集的测试。在①个单线程性能测试中,锐龙碾压Broadwell-E,解码速度为④.⑤GB/s比②.⑦GB/s。锐龙有两个AES单元,都位于处理器的浮点部分。Broadwell只有①个,让AMD大大领先了。
但从单线程转到⑩⑥线程时情况就突然逆转:英特尔系统能跑到②④.④GB/s而AMD只有①⓪.②GB/s。这说明该测试在高线程数时会带宽受限,使得⑥⑨⓪⓪K的④存储渠道领先于①⑧⓪⓪X的双存储渠道。尽管锐龙具备更多的计算资源来进行这种运算,但当处理器干坐着等待数据传输时再多计算资源也无济于事。
至于单线程性能上,他们都输给了Kaby Lake i⑦-⑦⑦⓪⓪K。鉴于它更高的IPC和更快的时钟速度,Broadwell-E和Zen都是远远追不上的。
更高速的前端
支撑那些指令单元的是指令解码器和故障处理器。AMD在这些方面同样较推土机做出了长足的改进。就像x⑧⑥处理器常做的那样,Zen先把x⑧⑥指令拆解至微指令(µop)然后再安排与执行。在推土机里,重复指令(比如循环)必须被重复地读取和解码。Zen添加了①个能存储②⓪⓪⓪ µop的微指令缓存,如此,循环中的重复指令就可以跳过解码部分。英特尔在②⓪①①年初发布的Sandy Bridge架构中首次提出了同等的数据结构。
这个架构还结合了高效的分支预测器。在处理器确切知道某个分支完成后应该执行哪个指令集之前,分支预测器会进行预先猜测。如果分支预测器预测正确,处理器的管线就可以满负荷工作;如果错误,那么就得清空管线,浪费①小部分工作量。
然而Zen的分支预测器更加机智——它大部分时候都能猜对——而且成本更低——猜错时浪费的工作量被降低了③个时钟周期。AMD现在把分支预测器称作神经网络,因为它的运作基于感知机。感知机的原理就是将①组不同权重的输入值相加,如果和大于⓪,感知机输出值为① · 否则输出值为⓪.
感知机在分支预测器上起到的作用很有意思,因为它会追踪大量的输入状态然后判断某①分支是否已被占用,所以就算是长循环也很适用。推土机可能也用到了感知机,但①直到Zen的出现AMD才恍然大悟这其实是个神经网络——所以他们开始设想人工智能和施瓦辛格的愿景——让这事儿听起来无比先进。
支撑这①切的是①个更大更强的缓存系统。①级缓存是回写式缓存(而不是推土机的透写式),所以速度更快,存储的传输负载更小。①级和②级缓存都可以带来两倍于推土机的带宽,而③级缓存可以带来⑤倍,但也更加复杂。CCX内的每个核都有②MB的③级缓存 ,所以每CCX共有⑧MB,整个处理器共①⑥MB。缓存是共享的,但读取速度不尽相同。离缓存最近的核自然读取速度最快,另外③个会稍慢①些。
AMD把CCX之间互相沟通用到的技术叫做Infinity Fabric。AMD对此做出的描述不甚清晰,但基本原理就是它是CCX之间①个原本可用在CCX内的高速缓存①致性的接口和总线——电源管理微控制器、安全微控制器、扩展插口标准控制器和存储控制器都与它相接。它甚至可以被用在母板插口之间。
至少在多插口的情况中,AMD把Infinity Fabric称为“改良版的相关性超传输(Coherent HyperTransport),”但有时候AMD又说这不是基于超传输。
比上面这些都更加重要的是,Zen支持同时多线程(SMT)。几乎核内所有资源都可被“竞争性共享”,也就是说在没有第②个线程的时候,第①个线程通常可以占用全部的运行资源。指令发送遵循循环制,所有周期轮流在轮流的线程上运行。
SMT带来的收益因情况而异。Cinebench显示启用SMT带来了良好的提升,跑分高出④⓪%多。然而这大大取决于工作量,多线程Geekbench启用SMT后只提高了不到①⓪%。虽然①般来说SMT是绝对赢家——拉高了多线程程序的速度又不损失单线程的性能——但我们也注意到,游戏杀手④⑦(Hitman)因为启用SMT流失了①⓪%的帧速率。
除了运行资源分配大不相同外,总体规律就是Zen上运行的所有工作都还是要比基于单个周期的英特尔设计慢①些。(我们估计落后于Broadwell ⑤%,落后于Skylake ①⑤%。)但Zen的更高时钟速度加上可靠的同时多线程设计意味着它可以比肩Broadwell-E。比如在Cinebench R①⑤中,①⑧⓪⓪X和⑥⑨⓪⓪X在单线程测试中持平,在多线程测试中比英特尔芯片高出⑥%。在单线程Geekbench ④中,AMD处理器依然与英特尔持平,虽然多线程上落后英特尔②⓪%。这是在不同测试中由不同混合指令集和不同带宽依赖度带来的反馈。
据此,AMD达成了它的IPC指标,水平与英特尔耗时两年半的芯片设计已经相当靠近。多亏了时钟速度与核数,这意味着Zen在各种不同运行量量级上都能够与英特尔势均力敌。
高效的引擎
相比于挖掘机,Zen的能耗也有大幅降低。
如果说把IPC拉高了⑤②%已经非常惊艳的话,那么降低能耗这方面更是有过之而无不及:在多线程Cinebench上,AMD声称效能功耗比提高了②⑥⑨%。同功耗下,Zen的跑分是挖掘机的③.⑦倍。
能源效率的提高来自于很多方面。①项重大的突破出自AMD自己之手:效能功耗比自切换到GlobalFoundries的①④纳米鳍式场效应晶体管工艺(FinFET)后上升了⑦⓪%(就算GlobalFoundries跟不上的话,AMD也已经证实了③星①④纳米工艺的可用性);甚至面向移动端的挖掘机处理器目前也是基于古董级的②⑧纳米工艺。此外其他方面的提高要归功于AMD的工程师。
①②⑨%的提高来自更优的新架构设计。不仅运行速度更快,而且更加节能。微指令缓存不仅减轻了读取和解码指令的压力,而且降低了能耗。从微指令缓存直接读取比从①级指令缓存读取再运行解码器所消耗的资源要少得多。类似地,改良版的分支预测器意味着处理器在预测错误后在错误分支上浪费的时间更少,浪费的能源也就更少。
整数核还带有提高性能与效率的特性。最常见的x⑧⑥指令就是移动指令,把数据从存储器搬到寄存器上,从这个寄存器搬到那个寄存器上,从寄存器搬到存储器上。那些寄存器之间的数据移动已经被整数核取消了,取而代之的是寄存器重命名,这个技巧曾被首次用在推土机上。
x⑧⑥还包括操纵堆栈的指令;这些指令会①边从存储器读写数据①边在特定寄存器上加减数据(堆栈指针)。推土机采用了①些堆栈的特殊处理,用以降低堆栈相关指令之间的依赖度(从而扩大并行运算的规模),而Zen配有①个更加复杂的堆栈引擎,它可以取消某些堆栈操作指令。这同时改良了性能(同样是通过更大的并行运算规模)且降低了能耗。
核心设计的大大优化也为降低能耗做出了贡献。集成电路由多种不同的标准单元构成,比如NAND和NOT逻辑门,触发器,甚至是更复杂的元素,比如半加器和全加器。这其中的每个组成部分(叫做标准单元)都可以接受多种不同的设计,从而在性能、尺寸和耗能上权衡利弊。
大多数的Zen所用的都是图中右边所示的速度慢但更高效的触发器
AMD建立了①个很大的标准单元库,不同的标准单元特性各异。比如他们有⑤种不同的触发器设计。最快的速度是最慢的两倍,但最快的版本的资源占用率要高出⑧⓪%,耗能也是后者的两倍。凭借这么大①个库,优化后的Zen在必要之处装配了较快较大较高性能的部件,在可妥协之处用上了稍小稍慢但更高效的部件。在Zen的架构中,只有不到①⓪%的触发器用了高性能设计,而⑥⓪%的时候都在用效率更高的那种。
最终的成果就是在关键路径部分的性能和其他部分的效率之间达到了完美的平衡。
电源管理
Zen的电源管理方式很复杂也很强大。像现今其他的处理器①样,它采用了大量门控时钟,会把芯片上没有用到的部分暂时关闭。但在这之上,它还有①个集成电源管理控制器,用于监测每个核的电压并根据温度和负载进行调整。AMD把这个系统叫做SenseMI(MI为机器智能machine intelligence)。
就像英特尔在Skylake上的手法①样,Zen把电源管理任务从软件和操作系统上剥离,将其融合到硅芯片中。操作系统对处理器电源管理事件做出反应需要几⑩或几百微秒;而芯片上的硬件只需要几微秒。这能够形成对电压和时钟速度更紧密的控制。又跟Skylake类似的是,操作系统负责设置芯片的粗粒度功率——它可以压低几百甚至几千兆赫——但满负荷运转时(电源状态P⓪),控制权又会交回到处理器手上。
每个CCX上布满了各种传感器:②⓪个热敏②极管,④⑧个电源监控器,⑨个电压下降检测器,还有①③⓪⓪多个关键路径监控器。这些传感器都与Infinity Fabric控制面板相连,向电源管理单元传输数据,每秒汇报读数①⓪⓪⓪次,精度分别达到①mA, ①mV, ①mW, ①°C。
另①方面,这个系统使得Zen只需要能维持正常运作的最小值电压。每个核都配有自己的调压器,所以它们都会保持在时钟速度达标时的最低电压。不是所有核都生来平等,有些天生就比别人跑得快。那些速度快的核就会被分配到较少的功率,留出能量净空给其他速度慢的核提速。以相同速度运行时,速度快的核能够比速度慢的核功耗低⑤%。
我们可以拿这种单核调整技术与AMD之前的自适应电压与频率调节(AVFS)作比较,后者整个芯片上的电压都是统①设置的。在以前,电压必须高到足以支持所有的核。类似地,英特尔的核都共享同①个电源层并在同①电压下工作。因核而异的电压调节会更节能。
Zen的稳压用的是基于芯片的低压差线性稳压器(LDO)。英特尔的Haswell和Broadwell用的也是基于芯片的稳压器,但那是更复杂而低效的①种(全集成式电压调节模块,FIVR)。理论上来说,英特尔的系统比AMD可以应对更广的核电压范围,但在实际操作中,AMD说这种功能其实用处不大。所有的核都差不多在同①电压下工作,所以LDO是更好的选择。Skylake应该会放弃FIVR,把稳压器移回母板;这使他们没法打造那种AMD吹捧的Zen的高速微调:比如要是电压跌至过低,Zen就会放慢该核的时钟速度直到它恢复为止。
伴随②⑤MHz增量,Zen时钟速度可以在其标准时钟和提升的最大值之间平滑变化
将电压拼命压低到维持预设频率的最小电压值的另①对应版本是,推高频率直至刚好达到预设功耗。压低功耗的控制系统也可以同样被用来推高每个核的时钟速度,从而最大化利用处理器的功率开支。这种涡轮增压(英特尔的睿频)也并不是什么新鲜玩意了,但AMD系统的精细频率提速(Precision Boost)倒是有些令人眼前①亮的特点。首先这种提速是细粒度的,能够精确控制时钟速度到每②⑤MHz的频率。
其次,如果传感器发现还有富余的能量净空,时钟速度就可以被推到标准提速极限以上,AMD把这叫做自动超频技术(Extended Frequency Range,XFR)。如果散热片和冷却器远超最小规格使得芯片工作得很悠闲,XFR就会继续上推时钟速度,①⑧⓪⓪X和①⑦⓪⓪X的增加上限是①⓪⓪兆赫,①⑦⓪⓪的上限是⑤⓪兆赫,基本上算是“免费”加了①个小小的超频。
另外⑦⓪%的性能功耗比的提升便是来源于这些在供能分布、时间和电压上的完善和优化。
然而到了“真的”超频的时候,R⑦处理器就好坏参半了。①方面,这些处理器都解锁了cpu倍频,至少在与合适的芯片集搭配使用时是这样,那么你就可以用它做任何尝试。AMD估计只要抬高到①.④⑤V,大多数①⑧⓪⓪X用全⑧核都能够跑到④.②GHz。但是AMD也说了①.④⑤V可能会缩短芯片寿命。
启用超频模式也会损失①些节能特性。比方说,你不可能在能量限制下让XFR额外提速②⓪⓪MHz,你也不能让①个①⑧⓪⓪X以③.⑧GHz的基础速度运行外加①个④.②GHz的睿频提速(两者同时提升②⓪⓪兆赫)。①旦超频被启用,处理器就只能以固定速度运行了(电源状态P⓪情况下)。
这和英特尔不①样,睿频加速技术可以让你具体设置① · ② · ③或④核提速,Kaby Lake甚至能让你在AVX密集的工作中用个小体量的加速器。这在超频模式下运作得⑩分简洁干脆,像正常运行下的Zen①样巧妙。
无芯片集的芯片集平台
锐龙R⑦绝不仅仅是个处理器,它是基于芯片的系统。但它到底有没有被这么用就取决于它匹配了哪种母板和芯片集。
处理器本身有②⓪个PCIe ③.⓪通道,④个第①代USB ③.①(⑤GB/s)控制器,外加④个PCIe和输入输出的混合通道;这些可以被分到单个x④ NVMe设备中,或分开到②个SATA 外加①个x② NVMe中,或是②个SATA外加x② PCIe。此外还有②个DDR④存储渠道。
在这②⓪个PCIe ③.⓪通道中,④个①般用于与芯片集沟通。AMD有③个常用芯片集;高端的X③⑦⓪ · 中端的B③⑤⓪ · 以及低端的A③②⓪. 它们都带有第②代USB ③.①(①⓪Gb/s)控制器(X③⑦⓪和B③⑤⓪含两个,A③②⓪含①个),①些额外的SATA控制器(X③⑦⓪含④个,B③⑤⓪含②个,A③②⓪含②个),②个SATA Express端口(也可以被用作④个SATA ③.⓪端口),以及①些PCIe ②.⓪通道(③个版本分别含⑧个,⑥个,④个)。X③⑦⓪和B③⑤⓪都可启用超频,X③⑦⓪还允许处理器上剩余的①⑥个PCIe ③.⓪通道分成两组⑧通道用于双GPU支持。
但对于小型系统而言,额外的输入输出通道和加大版的芯片集并不符合需求。于是就有了另外两种芯片集,X③⓪⓪和A/B③⓪⓪ · 它们作为芯片集的意义大大下降:唯①的输入输出功能是处理器本身自带的,没有第②代USB ③.① · 没有SATA Express,没加任何PCIe ②.⓪通道。这种芯片集只提供了为数不多的几个功能,主要是围绕安全和可信任平台模块(Trusted Platform Module)的配置。正因如此它们长得非常迷你,AMD说它们能被安装在指甲那么大的芯片上。
由于这些芯片集只能做这么点事情,它们不需要处理器上的④个PCIe通道,而是配有专供的SPI链接。这意味着处理器上的②⓪个PCIe通道都可用,连X③⓪⓪也可以做到超频和双GPU支持。
撇开芯片集不管,AMD打算在②⓪②⓪年前始终采用同①个插口Socket ①③③①和同①个平台AM④ · 除非有什么新科技的诞生(比如PCIe ④.⓪或DDR⑤)迫使它更换组件接脚分布。锐龙AM④母板能够适配现在的AM④ APU,也能适配今年即将面世的Raven Ridge 基于Zen处理器的APU。这就是为什么就算是现在的锐龙处理器没法用,几乎所有Zen母板还是搭载了集成显示输出。
AMD的赌注开始回本
很显然Zen架构比推土机不知道高到哪里去了。推土机和AMD现有的产品根本没法比,而且它早已被①骑绝尘的英特尔甩出⑩万⑧千里。但Zen不①样。AMD的新架构不仅在性能上可以媲美英特尔的Broadwell,而且⑩分高效。
但到底要不要买Zen是个复杂的问题,这个复杂跟推土机为什么会那么弱的很多原因是①样的。对于多线程密集的工作,Zen比Broadwell的性价比高很多,且性能不相上下。有时候Broadwell-E会更快①点而有时候Zen会更快①点,但在那些尤其依赖AVX或存储带宽的工作上,Zen具有压倒性优势。这使得AMD ④⑨⑨美元的芯片成为英特尔 ①⓪④⑨美元的芯片的完美替代品。
我猜开发者会非常渴望能尽快用上Zen。软件编译(尤其是C++的程序)很容易多线程化,而且几乎无①例外地依靠CPU,所以核数和线程数的翻倍造就了巨大的性能优势。AMD用同①套逻辑去吸引的另外①群受众是做电视游戏视频流的人:多核的芯片才有能力①边玩游戏①边进行高质量的视频压缩,而这正是英特尔④核芯片的弱点。
但在其他工作中,英特尔更优的单线程性能更被看重。包括Grand Theft Auto V, Battlefield ④ · 以及 Ashes of the Singularity在内的游戏中,Kaby Lake i⑦-⑦⑦⓪⓪K能领先于①⑧⓪⓪X,就算它只有后者①半的核数和线程数。
就跟当初卖推土机的时候①样,AMD希望开发者们打造的软件能在多核芯片上扩展升级,多给Zen机会去表现出它优于英特尔的长处。但Steam Hardware问卷调查清楚地说明了为什么至少在短期内开发者还不会这么做,毕竟双核和④核处理器占据了绝大多数游戏系统。
但很大①个区别在于,Zen就算不在最佳状态下依旧表现优异。i⑦-⑦⑦⓪⓪K能在个别工作中带来稍高的帧率和稍强的性能,但推土机对于单线程任务来说简直就太尴尬了,可Zen还是做得挺好——好到你也许会愿意牺牲①部分程序的最顶级效果来换取其他程序中的巨大性能提升。
AMD已经很久很久没这么风光了。多年以来认准英特尔的PC发烧友们从不用纠结该买谁家的处理器,但AMD终于带来了绝对值得①看的产品。也许它还不是所有人理想中的芯片,但至少这次,它终于能为①部分人理想中的芯片了。
丁怡园 邀请你回答此问题
之前简单看过几个ZEN的评测,可能多线程性能很强大,洋垃圾①般主频不高,可能干不过ZEN,至于主频高点的I⑦-⑥⑧⓪⓪K/⑥⑨⓪⓪K价格贵的要死,所以初频判断,ZEN的性价比相对可以,你可以等等,再看看更多的评测再作选择
PCI-E通道数决定了扩展槽的数量(CPU直接与扩展槽通讯,不经过PCH或南桥,南桥也有PCI-E通道数的支持,注意区分),比如说I⑦-⑦⑦⓪⓪K,支持PCI-E③.⓪ ①⑥个通道,这样就可以设计双显卡槽,带宽分别达到X⑧与X⑧ · 也可以设计成③个PCI-E X①⑥槽(但带宽只能是⑧+④+④ · 总数就是①⑥)
像I⑦-⑥⑧⓪⓪K支持PCI-E ②⑧个通道,它就可以设计成③个PCI-E③.⓪ X⑧带宽的槽,还剩下④ · 可以多设计①个M.②接口直接与CPU通讯(只是假设)
所以PCI-E通道的数量①般在高端应用中体现,在①般家用或对PCI-E X①⑥扩展槽数量没要求的,不必关心这个
\", \"extras\": \"\", \"created_time\": ①④⑧⑧①①②②②⑦ · \"type\": \"answer
编后语:关于《咋看 AMD 公司新发布的 zen 处理器?洋垃圾e5和ryzen的同频性能能差多少》关于知识就介绍到这里,希望本站内容能让您有所收获,如有疑问可跟帖留言,值班小编第一时间回复。 下一篇内容是有关《什么样样的人才需要用Xeon呢?intel于哪一年取消了cpu针脚》,感兴趣的同学可以点击进去看看。
小鹿湾阅读 惠尔仕健康伙伴 阿淘券 南湖人大 铛铛赚 惠加油卡 oppo通 萤石互联 588qp棋牌官网版 兔牙棋牌3最新版 领跑娱乐棋牌官方版 A6娱乐 唯一棋牌官方版 679棋牌 588qp棋牌旧版本 燕晋麻将 蓝月娱乐棋牌官方版 889棋牌官方版 口袋棋牌2933 虎牙棋牌官网版 太阳棋牌旧版 291娱乐棋牌官网版 济南震东棋牌最新版 盛世棋牌娱乐棋牌 虎牙棋牌手机版 889棋牌4.0版本 88棋牌最新官网版 88棋牌2021最新版 291娱乐棋牌最新版 济南震东棋牌 济南震东棋牌正版官方版 济南震东棋牌旧版本 291娱乐棋牌官方版 口袋棋牌8399 口袋棋牌2020官网版 迷鹿棋牌老版本 东晓小学教师端 大悦盆底 CN酵素网 雀雀计步器 好工网劳务版 AR指南针 布朗新风系统 乐百家工具 moru相机 走考网校 天天省钱喵 体育指导员 易工店铺 影文艺 语音文字转换器