去年10月左右,12代英特尔CPU发布,架构变化带来了不错的性能提升(据说比11代提高19%),就是每代都可能换主板,这个略麻烦。期待7纳米级别CPU。
可以说是这几年最好的英特尔处理器了,混合架构的设计,Intel 7制程工艺,IPC的提升,首发支持DDR5内存、PCIe 5.0标准,更好的功耗控制,这次真没有挤牙膏,牙膏管这次真的挤爆了。期待了这么久英特尔12代酷睿处理器没有让人失望,对得起大众的这份期望。从行业来说,英特尔12代酷睿处理器将PC处理器带入了混合架构时代,连同Win11的系统调度、主板厂商的更新,更强的性能带来的游戏体验,影响是全方位的。
下面我们就具体的聊一聊英特尔12代酷睿处理器
Hybrid混合架构,PC的混合架构时代来临
英特尔12代酷睿处理器有很多创新的地方,如果非要说最显著的变化那就是采用了Hybrid混合架构:
- 性能核:Performance Core,简称P-Core,采用Golden Cove微架构。
- 能效核:Efficient Core,简称E-Core,采用Gracemont微架构。
Hybrid混合架构的设计并不稀奇,在处理器领域已经存在多年,不过是在手机移动端现在英特尔率先将混合架构的设计应用在12代酷睿处理器上,引入到了PC领域。
这种混合架构有什么好处呢?我们用一个小例子来说明,比如全家一起要出去旅游,不管是近距离的城市周边游,还是远行的自驾游,有一辆车就可以搞定。但是现实中有很多的限制因素,就像汽车与飞机/高铁都是交通工具,但是他们有各自的特点,汽车适合中短途周边游,飞机/高铁适合远途旅行。当假期时间有限,远途的旅游就要换飞机/高铁等交通工具了,更加的快捷。
如果我们能够合理的利用这些交通工具的特性,就可以将旅游安排得既轻松又舒适,这就像是处理器的混合架构设计一样,E-Core负责负载较轻的任务,处理及时又省功耗,P-Core负责高负载的任务性能更强,速度更快,如果能够合理的分配和调度这些处理器核心,就可以高效快速的处理任务,下面就说说任务调度。
集成线程调度器Intel Thread Director,Win11的绝配
混合架构设计早已有之,但是并不是每个混合架构的处理器都能做好,即便是多核的同构处理器的调度有时候也一团糟,胶水核也不少见,异构混合架构的12代酷睿处理器在调度上表现的如何呢?
从结构上来说,异构核之间通过缓存的一致性可以解决相互间的同步问题,英特尔在12代酷睿处理器上重新设计了缓存架构
- 每个P-Core都有单独的二级缓存;
- 每簇中的E-Core共享二级缓存;
- P-Core、E-Core以及显卡之间智能共享30MB的三级缓存;
英特尔首次采用了混合架构的设计,如何更好的利用P-Core和E-Core呢?这需要英特尔和微软更好的协调:英特尔为此加入了全新的线程调度器(Intel Thread Director),通过一个微型控制器来监视每个线程的计算负载与参数,包括延迟、指令类型等。这些参数英特尔都会传递给操作系统比如微软Win 11中的系统调度器,操作系统对硬件资源进行统一的调度分配。这样做的好处是可以最大限度地解放开发者,开发者不需要将精力集中在如何调用分配不同核的资源上,也不需要进行特别的优化,这也改进传统的操作系统与处理器之前的简单线程管理模式,提供了更精细、合理、智能化的线程调度。当然,Win10下英特尔12代酷睿处理器也表现不错,只是Win11下更加优秀。
具体到英特尔12代酷睿处理器核之间的调度顺序,优先级为:P-Core —> E-Core —> HT超线程。比如有个高性能任务进来,会首先进入到P-Core中,如果P-Core资源队列排满的话就安排到E-Core,当有更高优先级的任务比如说浮点运算进来的话会优先安排到P-Core,P-Core中内排挤出的任务进入E-Core,加入还需要更高性能,此时就需要打开超线程。这样会将处理器的性能发挥到最佳,
这么说太抽象,以游戏为例说明,比如说在《骑马与砍杀 2:霸主》中,i9-12900K的平均帧率比i9-11900K处理器提升了19%,这个提升很大,但是并不能完全体现出12代酷睿处理器的优势。我们在游戏的时候进行多任务操作,比如打开LR进行图片编辑,同时在用PR进行视频渲染,那么性能提升在29%,如果将视频渲染放到后台,使用LR编辑图片,性能提升幅度可以达到47%。在这个调度中,E-Core在效率上比HT超线程技术更高,会承载更多的后台应用程序,所以与之前相比提升幅度更大。这就是Intel Thread Director以及操作系统合作带来的优化效果,不过目前因为Intel Thread Director是新事物,很多应用厂商还不够了解,目前尚不能完全发挥其作用。因此,英特尔将会在12代酷睿处理器发布之后推出白皮书来详细指导应用开发者如何利用Intel Thread Director让应用充分压榨CPU的资源,从而提升效率。
IPC大幅提升,多核同性能功耗只要1/4,离谱!
聊完混合架构设计和调度,我们聊聊大家喜闻乐见的性能,12代酷睿处理器采用了Intel 7制程工艺(10nm Enhanced SuperFin)制造以及全新的微架构,因此在IPC(Instruction Per Clock)上有了大幅的提升。相比上一代,12代酷睿处理器的P-Core 在IPC上提升大约28%,E-Core提升1%,对,你没有看错, E-Core的IPS与上一代比也是不相上下,这个并不性能可不小,功耗还更有优势。
在多核性能上,酷睿i9-11900K在实际功耗250W的负载中,酷睿i9-12900K实际功耗241W的情况下性能提升50%,也就是说每瓦的性能提升了约50%。比这更夸张的是酷睿i9-12900K只需要65W的功耗就能有酷睿i9-11900K的性能,只用约1/4的功耗就能达到相同的性能,真的离谱。不过这里需要注意的是只是酷睿i9-11900K的规格为8核16线程,而酷睿i9-12900K的规格为14核28线程,但是在性能上的提升是有目共睹的,这种提升与混合架构的设计也有关系。
就像跑分跟实际使用体验不同一样,我们也还是要看一些真实的使用体验,在游戏性能上 酷睿i9-12900K也比酷睿i9-11900K有大幅提升。如果考虑到12代酷睿处理器第一次在PC领域采用混合架构设计,以及Intel Thread Director的加入,应用以及游戏厂商还有很大的优化空间,这个表现还有进一步提升的空间。
混合架构超频?安排!可玩性更高
12代酷睿处理器的性能已经很强大了,但是对于DIY发烧友来说挖掘潜力、挑战极限才是最爱。12代酷睿处理器采用的是P-Core与E-Core的异构设计,怎么超频呢?对此英特尔也对旗下的超频工具进Intel Extreme Tuning Utility 7.5超频工具进行了升级,P-Core与E-Core是相互独立的超新设计,不仅如此还增加了对DDR5内存的超频支持,而且操作起来非常的简单。从可玩性方面来说12代酷睿处理器的超频更加的好玩,不同的超频组合也许能玩出不同的花样。
与12代酷睿处理器相配套的是Intel 600系列芯片组,因为12代酷睿处理器引入了PCIe 5.0与DDR5,整个平台的数据传输和吞吐能力得到了巨大提升。
引领PC进入异构时代
12代酷睿处理器在众人的期盼中终于来了,它的表现对得起众多DIY玩家长久的期盼,混合架构的设计被引入到了PC领域并且有着如此优秀的表现,相信未来PC领域的处理器都将追随英特尔的脚步推出混合架构设计的处理器。从这一点来看英特尔无愧是PC领域的引领者,与此同时我也开始期待英特尔的移动标压处理器。
观前需知:由于主板前期托朋友借用,时间有限,本文不含超频方面内容,后期将补充12代超频分享,望见谅!
异构这一词,在2018年以前还与普通消费者们相距甚远,这一概念最早起源于高性能计算领域,通过CPU、DPU、GPU等不同类型的计算单元整合提供满足不同需求的算力支持。第一个与普通消费者亲密接触的异构半导体芯片是2018年英伟达推出的图灵架构,在体验到异构设计的巨大提升后,很多玩家迫切的希望这一类型的设计能应用于CPU,将发展常年迟滞的X86领域注入一针强心剂。
在Jim Keller吉姆·凯勒跳槽英特尔后,经过数年打磨,推出了Alder Lake这一革命性的CPU架构,不同强度的任务以性能核P-Core与E-Core能效核进行分类支持,非常驻的请求,比如I/O资源的读写、int中断指令都将通过E-Core进行,而长时高负荷任务将由P-Core提供,这样一来既能拓展足够多的小核心用于简单重复工作,又能保证大核心性能得以充分发挥。
如下图所示,如果需要升级第12代酷睿产品,因为主板插槽为了支持更大电流,将LGA1200插槽升级为了LGA1700,所以我需要将现在的主板升级为Z690主板。今天的首发评测中,老黄将使用微星提供的Z690主板作为搭载平台。
下图为两颗第12代酷睿处理器,分别为i9-12900K和i5-12600K,i9-12900K是我们今天的主角,两颗CPU的尺寸相比第11代酷睿有较大的变化—长度增加了,防呆口也移动到了上下端。
两款CPU的背面电容图几乎一模一样,同时我们可以发现,由于采用了全新工艺,第12代酷睿核心数虽然增加了,但是核心面积与基板比率相对11代反而更小了。
测试平台
第12代酷睿平台同时支持DDR4和DDR5平台,低端Z690芯片组支持DDR4,中高端Z690平台支持DDR5。本次使用的是微星Z690暗黑主板,支持DDR5,所以搭配的内存为英睿达DDR5 4800Mhz 32G套条,英睿达是镁光旗下的一流内存厂商,可获得镁光原厂最好的颗粒支持。DDR5让科学工作者与专业设计师感到惊喜的不仅是内存读写性能的大爆发,还有支持ECC内存校错的特性,唯一的缺点也许就是价格略高。
显卡为一线AIC厂商索泰旗下的旗舰产品RTX3080Ti PGF OC玩家力量至尊,该卡属于LHR算力限制型显卡,Boost频率1710Mhz,16+3相供电,整卡功耗400W,风扇采用了索泰独家研发的暗影疾风扇叶,风压风量更大;GPU接触面进行了镜面处理,配合8条热管,温度表现更好,不愧为堆料泰的美誉。
为了压制12代旗舰产品,散热器一定不能寒碜。微星推出的这款MPG CORELIQUID K360,专为LGA1700设计。冷头加装了一片2.4英寸显示屏,可以显示温度、时间和自己上传的图片动画等自定义信息。
关于冷头的细节还有不少,在传统玩家的心中,CPU体质、供电和核心温度成为了限制CPU超频的三座大山。可是随着CPU功耗的增加、ATX有限空间的限制,每相供电模组的温度压力也逐渐增加。传统水冷对于供电模组的高温无能为力,为了降低供电模组的温度,微星水冷冷头上还加装了一个下压风扇,对散热模组进行降温。
Z690的LGA1700底座安装CPU方式相比以往LGA1200、LGA1151、LGA2066等插槽安装CPU的方式完全不同。以往安装CPU需要拉起压杆、向北桥方向掀起金属盖、安装CPU、按下金属盖并压杆固定。LGA1700插槽的安装方式变成了拉起压杆、向PCIE插槽方向掀起金属盖、安装CPU、按下金属盖并压杆固定,如下图。
搭载这块i9-12900K的微星MPG Z690 CARBON WIFI定位微星主流产品系列,强调了一定的超频潜力和充足的性价比,所以CPU供电方面微星从不吝啬给玩家以最好的IC,供电为18+1+1直出式。
从微星Z590开始,暗黑主板的CPU供电接口就从4+8升级成了8+8,这意味着微星的中端主板拥有了和旗舰级主板相同的i9级供电基础。
I/O面板上微星集成了flash bios button盲刷bios按钮,关机状态下插入包含bios文件的u盘并按下这个按钮,可在10分钟内完成bios更新,全程不需要显示器。USB方面,红色USB接口为USB 3.2 Gen 2,速率为10Gbps,黑色USB接口为USB2.0,建议用来插键鼠等非存储类外设。HDMI、DP视频输出接口、Type-C、2.5G网口、WIFI 6E无线网卡和音频接口一应俱全。
Z690芯片组给用户提供了12xPCIE Gen4+16xPCIE Gen3通道,意味着主板可以将PCIE x4插槽完全插满时让PCIE x16依然正常工作。
在古老的X79平台上,信号拆分芯片用于拓展PCIE数量在(总带宽不变的情况下),而在服务器上则采用了PCIE拆分卡,后来在超微Z490系列消费级主板上开始出现了针对PCIE的信号拆分芯片。MPG Z690 CARBON WIFI的背后,在PCIE_1焊位下有4颗丝印为jys13008的信号拆分芯片,应该是为了PCIEx16的拆分通道以适应多设备接入而设计。
平台设置
I9-11900K将作为i9-12900K的对比参考,同样采用了旗舰级Z590女武神主板,设置上采用了默频/TVB自动超频开启/关闭C模式/解锁4096W功耗/内存XMP 3600C18 CR1。而i9-12900K则直接未对主板bios进行修改操作,默频/TVB自动超频关闭/开启C模式。测试环境是Windows 11 21996.1(没有激活),电源管理策略为高性能。测试内容涵盖了渲染、开发与通用计算性能基准、游戏基准测试与实测帧数,待机功耗、FPU烤机功耗与R23渲染功耗,表现方式为将11900K性能表现作为基准,以柱状图体现变化。
首先是基准测试方面,一般来说玩家拿到新品第一时间会上机跑个分,这里老黄将把几个通用测试的跑分给大家进行一个展示,通用基准测试上进行了Time spy(取CPU得分)、CPU PRO和CPU-Z跑分,渲染方面使用了Corona 1.3、V-ray(CPU)和R20进行测试,编译性能上测试了Matlab的LU分解运算、FFT快速傅里叶变换、微分方程组的ODE算法、Sparse稀疏矩阵、2-D和3-D绘图运算速度。
游戏测试上选择了电脑里现成的游戏:守望先锋、CS:GO、英雄萨姆4、永劫无间、使命召唤6重置版、杀手2和地铁离去。游戏在1080P分辨率下运行,特效默认高设置,守望先锋200%渲染分辨率(否则会吃满400帧上限),统一关闭DLSS(如有)。PS:由于无法下载Win11完整中文包导致软件乱码,图表只能用英文展示。
在基准测试中,i9-12900K以绝对的多核性能碾压了上一代旗舰i9-11900K,多核最大差距拉开了近79%,单核性能上CPU PRO与CPU-Z中i9-12900K分别取得了11%~19%不等的优势,大致符合intel宣传的“对比上一代提升19%”说法。
在第二项渲染与通用计算项目基准测试中i9-12900K在每一项渲染测试中均以52%~77%的巨大优势领先了i9-11900K,然而在以单核模式计算圆周率时却遭遇滑铁卢,y-cruncher疑似不能调用P-Core进行运算,计算速度仅为11900K的79%怀疑时长期未对软件进行更新导致的BUG。
在Matlab编译平台上进行的测试中,领先幅度最大的项目为快速傅里叶变换,12900K速度比11900K快了2.38倍;领先幅度最低的项目为稀疏矩阵,领先程度5%,老黄进一步查阅资料后发现现有稀疏矩阵运算算法多数基于单线程,无法充分利用多核cpu的优势,且可能可能无法正确识别P-Core,目前该项目更多是使用GPU并行计算。
游戏测试中守望先锋在4K渲染分辨率下依然提升了13%的帧数,足以看出一个强悍的CPU对电竞游戏有多重要。CS:GO的帧数提升比我想象中的更低,基准测试中11900K为624,换12900K后提升到了756,提升幅度仅有21%;英雄萨姆4这款著名的快节奏射击游戏中,升级了i9-12900K后,帧数提升高达81%,堪比更换显卡;永劫无间对显卡要求非常高,CPU对其影响较低,提升幅度16%;使命召唤6现代战争2重置版和地铁离去两款3A大作帧数提升分别为21%和17%,而杀手2竟然在游戏实测中取得了平均帧数282持平的结果。综合数据来看,12900K在游戏高特效下对帧数的影响依然非常明显。
最后的测试为玩家们都非常关心的功耗问题,本次测试使用的电源没有更换,依然是鑫谷昆仑KL-750 750W额定电源。测试项目分别为待机功耗、FPU单烤CPU功耗峰值、守望先锋游戏战斗环境功耗峰值,功耗记录设备为UT230A二型功耗计,所展示帧数为表测整机帧数,实际帧数应为x90%转换效率后实际值。从测试结果来看,E-Core在低负载环境下确实起到了节能的效果,待机功耗比11900K平台低了70W,而满载功耗由于P核心的介入,更多晶体管的12900K峰值功耗高于11900K约100W,但是到了实际游戏环境下12900K的功耗依然是低于11900K的。由此对于i9-12900K这颗CPU的正确看法应该是:相同的轻负载下,12代酷睿功耗更节能;相同的重负载下,12代酷睿功耗略高,但是换来的性能差距也远高于功耗带来的差距。(下表单位为W)
总结
英特尔基于Alder Lake全新架构和Intel 7全新工艺下的12代酷睿,在面对11代时的功耗与性能表现对比令人惊喜,游戏性能有不小提升,功耗却小幅下降;高负荷运行下虽然功耗略有提升,但是换来的时间成本远非功耗可相提并论。如果要我说谁更适合入手12代酷睿产品,我首先会推荐设计师,单核性能的巨大提升无疑是生产力的最重要保证;其次是网游和电竞玩家,CPU核心性能是决定游戏帧数差—也就是流畅度的保证,在这一点上,12代酷睿有绝对的发言权。
但是12代平台并非没有缺陷,目前而言,有少数专业领域的应用软件并不能完全调用Alder Lake强大的核心,这依然需要软件厂商与英特尔密切合作,尽快完善软件对CPU的优化;另外,全新一代DDR5内存目前首发频率较高但时序同样较大,在未来1-2年内DDR5将会以更高的频率来弥补高时序对游戏带来的微弱影响。