19. Intel最新微架构 Alder Lake

59 篇文章 11 订阅
订阅专栏

Alder Lake简介

Alder Lake是Intel耗时多年打造的一款全新架构,它是未来将要发布的第12代酷睿处理器的核心

和以往的Intel处理器架构一样,Alder Lake包含了CPU、GPU、内存控制器、IO、显示输出和AI加速器等部件。它也是Intel首个采用大小核设计的高性能处理器,改动主要有以下几点:

  1. CPU部分采用大小核混合计算架构,最高由8大核8小核组成16核心24线程
  2. CPU大核升级到Golden Cove架构,IPC提升约19%
  3. CPU小核升级到Gracemont架构,性能接近Skylake,能效比很高
  4. 采用Intel 7工艺制程,频率相较于10nm SuperFin工艺会有进一步提升
  5. 内存控制器升级支持DDR5和LPDDR5内存
  6. PCIe升级到5.0版本
后面比较长,如果只是路过,看完这个总结就可以关掉了,不过,咱们得记得收藏 毕竟这篇已经是互联网环境下比较全的说明了

现在,让我们一点点来看Alder Lake的进化——

x86大小核异构(效率核心Gracemont)

Alder Lake上最大的变化点便是它采用大小核异构的架构,此前Intel曾在Lakefield上试水大小核异构,并推出了两款正式产品(比如ThinkPad X1 Fold),不过它们都是低功耗处理器,性能不强。

因此Alder Lake可以说是首款大小核异构设计的高性能x86处理器,在继承Lakefield的大小核异构设计之上,进行了深度改进。

首先来看被Intel称为效率核心(E-Core)的Gracemont

“小核”E-Core:整体性能接近Skylake、但能耗更低的Gracemont

在大小核异构设计中,一般小核的设计目标是高能效比,而大核的目标则是提供极限高性能,Gracemont便是一个非常高效的核心。

Intel的小核心设计是独立于大核心的另外一条线,现在一般称为Atom核心。一脉相传下来,Gracemont的上代是Tremont。

从Tremont到Gracemont,Intel着重加强了小核心的后端执行能力,尤其是整数性能

上图左边是Tremont,右边是Gracemont,可以非常明显的看到,Gracemont的执行端口多了不少,从原本的10个猛增至17个,而跟着的就是执行单元数量变多了。

整数部分ALU从3个增加到4个,AGU从2个倍增到4个,对应还增加了一组MUL和DIV单元,整数执行能力得到大幅增强;

浮点运算部分也有一定提升,原本只有一个的FADD和FMUL单元现在均有两个,能够拼合处理256-bit宽度的数据,也就是说能够满足执行AVX2指令集的需求;

浮点ALU和STD均增加一个,计算能力会有较大提升。

为了满足大幅膨胀的后端,前端也相应做了较大增强,解码部分仍然是两组三宽度设计,可以同时启用达成六解码。

L1指令缓存(L1I)倍增至64KB,同时分支预测器得到加强,拥有更大的缓存

中核部分,ROB增大到256,这一数值比Skylake的224更大,与Zen 3持平。

最后是缓存子系统,前面说过AGU从2个倍增到4个,分配成2个Load和2个Store。

L1D的大小没有变化,仍为32KB,L2的缓存最高可达4MB,需要注意的是,L2缓存是4个小核一起共用的,同时容量可配置。

对了,还需要提到的是,小核以4个为一组,一组小核的面积与一个Golden Cove(也就是大核)差不多。

总的这些改进加起来,Gracemont的性能提升相当可观。

官方将它与Skylake进行了对比,在单线程的整数性能方面,Gracemont同功耗性能可提升超过40%,同性能下节约40%左右的功耗,能效比超群

而在多线程方面,同样是4线程,与开启超线程的2个Skylake内核相比,4个Gracemont内核能够在少用80%功耗的情况下输出同样的整数性能,而如果火力全开,那么能够提供约1.8倍的整数性能,同时功耗还更低。

总的来说,Alder Lake使用Gracemont来提升处理器在多线程情景下的总性能,同时在注重节能的场景下,可以凭借小核优异的能效比实现更长的续航表现。

“大核”P-Core:IPC提升约19%的Golden Cove

小核很强,而大核——Intel称为性能核心(Performance Core,简称P-Core)——的Golden Cove内核只能说是改的更大提升更多。

用Intel的官方说法,变得更宽、更深和更智能了。

更宽指的是内核解码、执行指令的并行程度更大

更深指的是内核中的各种指令缓存变得更大

更智能指的是部分组件具有更准确的判断能力

Golden Cove的前端部分改动相当大,最明显的就是多年未变的4宽度(实际上是4+1宽度)解码器升级成了6宽度解码器(应该是6+1)

不像Arm等RISC体系的内核,属于CISC体系的x86要增加指令解码器的代价相当大,因此不管是AMD还是Intel都把前端解码器维持在4宽度,现在Intel首先前行一步。

同时L1I缓存的带宽也扩大一倍到32Bytes以满足6宽度解码器的需要。

增加解码器宽度会增加处理器的流水线长度,这让分支预测错误的惩罚更重。

Intel选择增加分支预测缓冲区(BTB)来应对这一问题,其分支条目数量从5K直接增加到12K,比Zen 3的6.5K多将近一倍。

分支预测器本身也变得“Smarter”了,准确率继续提升。

宏指令(µOP)的吞吐量从多年未变的每周期6个增加到8个,同时用于缓存宏指令的宏指令缓存(µOP Cache)继续增大,从2.25K直接增大到4K,与Zen 2/Zen 3持平。

宏指令队列的结构有所调整,现在为超线程进行了更多优化,双线程同时利用的情况下,单线程队列深度为72;而如果是单线程利用核心的情况则可以完整利用144的队列深度。

中核部分,同步变得更宽,发射区从原本的5宽度加宽到6宽度,ROB缓存从Sunny Cove的384加大到512,直逼苹果Firestorm内核的600+,ROB增大会显著增加内核功耗。

另外,执行端口方面增加两个,现在共有12个端口,不过整数和浮点仍然共用发射端口,没有改成流行的分离式

虽然是共用端口,不过Intel还是把整数和浮点的改进分开讲了。

后端执行部分的改动相对较小,从上面两张图中可以看到,整数部分增加了一个ALU;FPU部分增加了两个FADD单元,它比FMA单元更高效,指令周期也更短了;而FMA单元增加了对FP16数据的支持,对低精度计算有帮助,不过因为需要调用AVX-512指令集,所以在Alder Lake上我们无法利用到它。

另一个新增的端口被用于缓存子系统,新增了一个Load AGU,这样每周期的Load带宽提升至3,和Zen 3持平。

L2沿用Willow Cove的设计,仍然是非包含式设计,每核心具有1.25MB。不过加入了新的预取机制,降低了DRAM的读取次数。

总的改进加起来让Golden Cove相比起Cypress Core有了平均约19%的同频性能提升,最高甚至能有60%左右的提升。不过比较奇怪的是,有几个项目的成绩出现了倒退。

总的来说,Golden Cove是一次全面的大改,可能是自Skylake以来改动最大的一个内核微架构

Intel Thread Director:调度大小核的关键角色

大小核心的性能提升都非常可观,但要如何调度它们,让它们充分发挥自己的长处呢?

其实Arm已经替x86淌过浑水了,big.LITTLE架构发展至今已有十余年时间,主流的操作系统都添加了对大小核的调度支持,包括Windows。

操作系统是知道处理器上多个性能不同的内核的。

但之前在Lakefield上我们也看到了Windows在调度大小核x86处理器时候的糟糕表现了,该怎么解决这个要命的问题呢?

Intel选择了一个软硬件结合的方案,称为线程总监(Thread Director,暂译,等官方中文名)。

在操作系统层面上,Intel和微软合作改进了Windows的任务调度,从Windows 11开始,系统的任务调度器能够获取更多信息,用于判断当前正在运行的线程需要什么样的性能模式,它要调用哪些指令集,同时它还懂得让硬件为高优先级任务让位。

同时,Intel在Alder Lake处理器中集成了一个非常小的MCU,用来监控当前处理器内核的运行情况,能够监测到每个线程的特征,比如它运行什么样的指令集、它的性能需求如何等等

在收集完信息之后,它会将收集到的信息反馈给Windows 11,而后者将会把这些信息与自己收集到的信息相结合,判断是否应该将线程转移到别的核心上。

这一切发生在短短30微秒以内,而传统的调度器可能需要100多毫秒才能判断出结论。

当然,Alder Lake默认还是会把线程安排在P-Core上,除非高性能核心上面都有任务在跑。Intel将Alder Lake分为以下三个性能层级:

  1. 每个P-Core上只跑1个线程
  2. E-Core上只跑1个线程(当然它也只能跑1个)
  3. 在P-Core的超线程上跑线程

也就是说,在一般情况下,系统调度器会优先把线程安排到P-Core原生的线程上,8个原生P-Core线程被放完后,轮到的是E-Core,如果还不够用,它才会去利用P-Core超线程出来的线程(因为超线程出来的线程性能肯定是不如E-Core的好嘛)。

比如: 一个20线程的任务,会利用上P-Core原生的8个线程+E-Core原生的8个线程外加4个P-Core超线程出来的4个线程。

当然,Windows 10也还是有大小核调度的能力的,但是说简单点就是不够智能。

在Windows 11下Alder Lake应该会有更好的能效表现。

支持DDR5与LPDDR5内存,仍然兼容DDR4和LPDDR4

讲完内核部分,我们略过没有实质性变化的Xe GPU,直接来看其他的一些变化点,首先是内存控制器:

可以看到Alder Lake新增了对DDR5和LPDDR5内存的支持。默认情况下DDR5支持到4800MT/s,LPDDR5支持到5200MT/s,前者在今年晚些时候会开始出货,而后者在移动设备上已经被广泛应用,本来Tiger Lake是号称支持LPDDR5的,后来因为种种原因没能最终实现。

而在Alder Lake正式推出之后,应该会有很多轻薄本用上LPDDR5内存。 

@联想YOGA

@联想小新

支持PCIe 5.0的新IO

Alder Lake的PCIe支持非常激进,直接一步升级到最新的PCIe 5.0,带宽较PCIe 4再翻一番,x16下数据带宽高达64GB/s。当然因为功耗原因,这应该是桌面平台独有的。

在Rocket Lake-S和Tiger Lake上新增的x4通道则仍然是PCIe 4.0规格的,可以用于连接SSD。

虽然没有明说,但与PCH互联的总线应该是升级到DMI 4.0了,至少会是x4的宽度,而高端PCH应该会通过DMI 4.0 x8与CPU相连

PCH能够再导出12条PCIe 4.0和16条PCIe 3.0,扩展性比起以前来可谓是一个天上一个地下!

大一统的Alder Lake

相比起11代酷睿在桌面和移动端的分裂,Alder Lake又重新统一了回来,当然不同平台还是会有不同的规格。

桌面端的Alder Lake最多会有8大核8小核,不过没有集成的Thunderbolt 4控制器,核显规格也仍然只有32EU

移动端最高则是会有最多6大核8小核,外加96EU和4个Thunderbolt控制器,当然还是会集成祖传的IPU。对功耗更为敏感的超轻薄端最高就只有2大核8小核了,Thunderbolt控制器数量也减少到2个。

Alder Lake是近些年来Intel推出的改变最大的一个架构,不管是计算内核本身的改动还是大小核的设计,可以说是非常激进的。很惊喜Intel能给我们带来这样一个很有创造性的新架构,当然Alder Lake也就是第12代酷睿处理器的正式发布我们还需要等待,非常期待它的表现。

Intel 系统级架构概述
m0_67403013的博客
05-17 642
文章目录 前言 一、IA-32 架构Intel 64 架构 简述 二、系统级架构概述 2.1 Global and Local Descriptor Tables 2.1.1 32-bit modes 2.1.2 IA-32e Mode 2.2 System Segments, Segment Descriptors, and Gates 2.2.1 32-bit modes 2.2.2 IA-32e Mode 2.3 Task-State Segments and Task G
90671 Alder Lake-S ES 12代CPU 码.zip
08-31
90671 Alder Lake-S型号代表了Intel的第12代酷睿系列处理器,这是一个混合架构的设计,融合了高性能的Golden Cove核心和高效率的Gracemont核心。 码更新通常是为了修复处理器存在的安全漏洞,提高性能,或者增强...
我的最新架构
rzy
08-14 87
我的最新架构
INTEL最新CPU架构介绍
06-02
Compact PCI(Compact Peripheral Component Interconnect)简称CPCI,中文又称紧凑型PCI,是国际工业计算机制造者联合会(PCI Industrial Computer Manufacturer's Group,简称PICMG)于1994提出来的一种总线接口标准。是以PCI电气规范为标准的高性能工业用总线。为了将PCI SIG的PCI总线规范用在工业控制计算机系统,1995年11月PCI工业计算机制造者联合会(PICMG)颁布了CPCI规范1.0版,以后相继推出了PCI-PCI Bridge规范、Computer Telephony TDM规范和User-defined I/O pin assignment规范
Intel CPU架构简介.docx
04-29
CPU core部分:各个core以及独占的L1指令cache、L1数据cache、L2 cache、L3 cache等,其中L1 cache通过虚拟地址空间寻址,L2\L3通过线性地址空间寻找。 uncore部分主要是system agent:包含PCU(电源控制单元)、DMI控制器与ICH(类似南桥)连接、QPI控制器与其他CPU连接、内存控制器。
最新架构
future-wy
08-16 246
技术架构:spring cloud Alibaba、Sentinel、nacos、gateway、Ribbon、dubbo、 Rocketmq、redis(哨兵模式)、elasticsearch、mysql
2023最新大型分布式架构详解:架构模式+敏捷性+可扩展+案例等
jjc4261的博客
03-07 519
对于安全问题,首先要提高安全意识,建立一个安全的有效机制,从政策层面,组织层面进行保障。首先,需要从架构级别,在规划的时候,就考虑可用性。因为大型网站的复杂性,分布式,廉价服务器,开源数据库,操作系统等特点。要保证高可用是很困难的,也就是说网站的故障是不可避免的。以上采用七层逻辑架构,第一层客户层,第二层前端优化层,第三层应用层,第四层服务层,第五层数据存储层,第六层大数据存储层,第七层大数据处理层。主要参数有较短的响应时间,较大的并发处理能力,较高的吞吐量,稳定的性能参数。以上是大型分布式架构的总结。
90672 Alder Lake-S QS, 12代CPU 码.zip
08-31
Alder Lake-S QS是英特尔第12代台式机处理器架构的一个版本,它代表了Intel在CPU技术上的重大进步。码(Microcode)是嵌入在处理器内部的一系列指令,用于修正硬件级别的错误、优化性能或者增强安全性。这个...
Alder lake 核数
最新发布
06-09
Alder Lake是英特尔公司即将推出的下一代桌面处理器,它将支持英特尔的混合架构技术,即将大核心和小核心结合在一起。预计Alder Lake将有最多16个核心,其中包括高性能的大核心和低功耗的小核心。这种混合架构技术...
Alder lake 核心频率
06-09
据官方资料显示,Alder Lake将采用英特尔新一代的10nm SuperFin工艺,同时还将支持英特尔的混合架构技术,即将大核心和小核心结合在一起,以提高处理器的性能和功耗表现。目前,Alder Lake的具体规格和性能参数尚未...
Intel处理器全系列:结构、编程与接口(第五版)【美】Barry B.Brey著 金惠华等译
06-14
本书的目的是希望帮助读者深入掌握机系统结构、汇编语言程序设计和接口技术,培养开发机应用系统的能力;弥补国内教学内容陈旧的不足。
IntelAMD各代CPU架构及工艺
04-24
1999年开始,截止到2019年12月Intel及AMD各代CPU架构、核心代号,发布日期,制造工艺等信息
英特尔公布下一代处理器架构,大小核心混合设计.pdf
09-25
本篇文章主要介绍了英特尔公布的下一代处理器架构,即大小核心混合设计的Alder Lake处理器。该处理器采用混合架构设计,即将大核心和小核心混合在一起,以提供出色的能耗比。Alder Lake架构中的大核心将采用英特尔下...
【官方指南翻译】Alder Lake 性能混合架构下的游戏开发指南 Game Dev Guide for Alder Lake Performance Hybrid Architecture
Sefank的博客
10-29 623
Alder Lake 是一种新的性能混合架构,其结合了两种处理核心类型:性能核心(Performance-cores,P核(P-cores),采用 Golden Cove 架构)和效能核心(Efficient-cores,E核(E-cores),采用 Gracemont 架构)。本游戏开发指南面向游戏开发人员,并提供架构简介和最佳实践以便于充分利用 Alder Lake 性能混合架构对游戏进行优化。
英特尔确认Alder Lake CPU的UEFI BIOS源代码泄漏
一棹春风一叶舟,一纶茧缕一轻钩
12-05 1085
英特尔确认Alder Lake CPU的UEFI BIOS源代码泄漏
入门系列:基础认知——Intel架构基础知识
weixin_42645653的博客
10-05 577
说明:   本文章旨在总结备份、方便以后查询,由于是个人总结,如有不对,欢迎指正;另外,内容大部分来自网络、书籍、和各类手册,如若侵权请告知,马上删帖致歉。   QQ 群 号:513683159 【相互学习】 内容来源:   《Debug Hacks》 字节序   字节为计算机中存储单元,字节序就是该单元的数据应该以哪种顺序进行传送,用英文单词:Endian表示。   Endian单词的由来是从《格列夫游记》中,主人公畅游小人国中的一个场景,小人国对水煮蛋应从大端(big-end)还是小端(little-e
Intel CPU 架构的演进与发展
OSKernelLAB(gatieme)
11-21 6650
title: Intel CPU 架构的演进与发展 date: 2021-11-21 22:10 author: gatieme tags: - linux - architecture - intel - pipeline categories: - 技术积累 thumbnail: blogexcerpt: Intel CPU 架构的演进与发展 本作品采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可, 转载请注明出处, 谢谢合作 因本人技术水平和知识面有限, 内容如有.
Intel, AMD及VIA CPU的架构(1)
wuhui_gdnt的专栏
08-18 3501
Intel, AMD及VIA CPU的架构 对x86平台的优化指引 对汇编程序员及编译器作者的优化指引 作者:Agner Fog。TechnicalUniversity of Denmark 1.      介绍 1.1.      关于本手册 这是五本手册系列中的第三本: 1.      优化C++软件:对Windows,Linux及Mac平台的优化指引。 2.      优化
Intel, AMD及VIA CPU的架构(17)
wuhui_gdnt的专栏
04-28 679
6.      PentiumPro,II与III流水线6.1.      在PPro,P2与P3中的流水线来自1995年的PentiumPro是一个装备乱序执行的Intel处理器。其架构设计相当成功。这个设计已经被进一步发展,跨越许多代,直到今天的处理器——期间在不那么成功的Pentium4或NetBurst架构上绕了点小弯路。 ...
写文章

热门文章

  • 「TCG 规范解读」初识 TPM 2.0 库 WIP 31789
  • Intel 的 SGX 技术小知识 7502
  • 「TCG 规范解读」简介-TPM 工作组规范之硬件信任根 5638
  • 【机密计算-大厂有话说】微软 Open Enclave SDK 4455
  • 一、分享优秀的视频地址 3779

分类专栏

  • 可信计算 付费 38篇
  • 机密计算 付费 18篇
  • CPU那点事儿 1篇
  • Linux 系统 API 讲解【连载】 20篇
  • RISC-V 专栏 6篇

最新评论

  • 【ARM 调试】如何从 crash 信息找出问题原因

    u010597188: 有个疑惑elr_el3里面存的值一看就不是内核空间的,怎么从vmlinux里面查呢

  • 【高性能网络协议栈】openonload 篇

    Coder-coco: 非常不错的文章,内容丰富,结构清晰,感谢博主分享

  • 【虚拟文件系统】文件系统 API 解读(1)

    简单简单小白: 《【虚拟文件系统】文件系统 API 解读(1)》大佬非常清晰的分析思路给我带来了很多收获,希望大佬持续创造,我们共同学习

  • 【高性能网络协议栈】openonload 篇

    我叫岩雨: 文章内容清晰明了,通俗易懂,非常适合初学者,感谢博主分享

  • 【IPC 通信】信号处理接口 Signal API(7)

    花果山~程序猿: 总结的很详细,学到了许多,期待大佬的更新表情包

大家在看

  • 线程的创建方式 84

最新文章

  • CPU流水线之旅
  • 【高性能网络协议栈】openonload 篇
  • 【虚拟文件系统】文件系统 API 解读(1)
2024年1篇
2023年176篇
2020年2篇
2017年1篇

目录

目录

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

玻璃钢生产厂家湖南玻璃钢西瓜雕塑大同仿铜玻璃钢雕塑定做小鸟玻璃钢雕塑工艺徐州人物玻璃钢雕塑厂家红色玻璃钢人物雕塑商家甘南玻璃钢雕塑价格葫芦岛玻璃钢雕塑价格福建玻璃钢中庆雕塑艺术深圳大型玻璃钢花盆浙江中庭商场美陈厂家直销阜康玻璃钢长颈雕塑青岛开业商场美陈南通玻璃钢雕塑制作通化动物玻璃钢雕塑生产厂家山西大型玻璃钢雕塑制作上饶创意玻璃钢雕塑玻璃钢天壶流水雕塑商场美陈风车深圳人物雕像玻璃钢雕塑工业河源玻璃钢景观雕塑材料玻璃钢雕塑手绘教程玻璃钢花盆生产公司萍乡多彩玻璃钢雕塑价位河北开业商场美陈现价平顶山玻璃钢仿真雕塑开封房地产水景校园玻璃钢雕塑敦煌玻璃钢气球雕塑菏泽铸铜玻璃钢卡通雕塑公司湖南方形玻璃钢花盆大连玻璃钢天壶雕塑香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声单亲妈妈陷入热恋 14岁儿子报警汪小菲曝离婚始末遭遇山火的松茸之乡雅江山火三名扑火人员牺牲系谣言何赛飞追着代拍打萧美琴窜访捷克 外交部回应卫健委通报少年有偿捐血浆16次猝死手机成瘾是影响睡眠质量重要因素高校汽车撞人致3死16伤 司机系学生315晚会后胖东来又人满为患了小米汽车超级工厂正式揭幕中国拥有亿元资产的家庭达13.3万户周杰伦一审败诉网易男孩8年未见母亲被告知被遗忘许家印被限制高消费饲养员用铁锨驱打大熊猫被辞退男子被猫抓伤后确诊“猫抓病”特朗普无法缴纳4.54亿美元罚金倪萍分享减重40斤方法联合利华开始重组张家界的山上“长”满了韩国人?张立群任西安交通大学校长杨倩无缘巴黎奥运“重生之我在北大当嫡校长”黑马情侣提车了专访95后高颜值猪保姆考生莫言也上北大硕士复试名单了网友洛杉矶偶遇贾玲专家建议不必谈骨泥色变沉迷短剧的人就像掉进了杀猪盘奥巴马现身唐宁街 黑色着装引猜测七年后宇文玥被薅头发捞上岸事业单位女子向同事水杯投不明物质凯特王妃现身!外出购物视频曝光河南驻马店通报西平中学跳楼事件王树国卸任西安交大校长 师生送别恒大被罚41.75亿到底怎么缴男子被流浪猫绊倒 投喂者赔24万房客欠租失踪 房东直发愁西双版纳热带植物园回应蜉蝣大爆发钱人豪晒法院裁定实锤抄袭外国人感慨凌晨的中国很安全胖东来员工每周单休无小长假白宫:哈马斯三号人物被杀测试车高速逃费 小米:已补缴老人退休金被冒领16年 金额超20万

玻璃钢生产厂家 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化