Intel12代酷睿大小核架构探秘小核性能暴涨80
上回书说到,Intel Alder Lake 12代酷睿将采用全新的大小核混合架构设计 ,其中大核/性能核(P-Core)基于Golden Cove架构,最多8个,小核/能效核(E-Core)基于Gracemont架构,最多也是8个。
两种架构的核心有何差异?一年一度的架构日活动上,Intel终于揭开了它们的神秘面纱。
当然,CPU架构设计是极为高深的,一般人把握不了,也无需研究太多,我们这里大致过一下最关键的一些技术点。
Golden Cove是此前10代酷睿Sunny Cove、11代酷睿移动版Willow Cove、11代酷睿桌面版Cypress Cove的进一步升级版,但变化非常大,大量基础模块都重构或升级,其设计理念也将影响未来多代产品的演化。
负责指令拾取和解码的前端部分,就发生了翻天覆地的变化,号称近十年来的最大变革,堪比当年的Skylake ,官方称它旨在提高速度、突破低时延和单线程应用程序性能的限制。
最直接、最明显的就是解码器宽度由4个升级为6个,这可是x86架构的第一次 ,同时每时钟周期执行uop从6个增至8个,解码长度从16字节翻番至32字节。?op缓存、队列也都大大强化,缓存可达4K,队列每线程可处理72条目,单线程达144个。
编码预取大大增强 ,分支目标从5K增至12K,4K iTLB、2K/4M iTLB分别翻番至256、32,同时改进了分支预测精度,编码预取机制更加智能。
乱序引擎部分,同样更宽、更深、更智能 ,分配由5路增至6路,执行端口由10个增至12个,调度器尺寸增大,重排序缓冲区(ROB)从352条目增至512条目,两倍多于AMD Zen3,仅次于苹果M1(大约630条目),重命名和分配阶段也可以执行更多指令。
整数执行引擎部分,增加了第五个整数执行端口 ,所有五个端口都可以执行ALU、LEA,理论上就原生ALU吞吐能力而言是最宽的x86内核。
矢量执行引擎部分,增加了新的快速加法器(FADD) ,比传统FMA单元效率更高、延迟更低,FMA单元则增加支持FP16浮点数据类型,属于AVX-512指令集的一部分。
载入和存储部分,通过载入AGU增加了一个专用的执行端口 ,这样载入端口从2个增至3个,同时载入缓冲和存储缓冲更深,载入延迟更低,而针对当今负载不断增加的内存级并行需求,数据处理能力也大大增加。
二级缓存,桌面和移动端每核心还是1.25MB,服务器端的Sapphire Rapids则增加到2MB ,并支持多路径预取、全写入预测带宽优化,可减少内存读取。
Intel宣称, Golden Cove架构相比于现在11代酷睿桌面上的Cypress Cove,实现了平均大约19%的IPC(每时钟周期指令数)提升,可以理解为同频性能的提升幅度。
它还支持 AMX高级矩阵扩展指令 ,内置下一代AI加速技术,用于学习推理和训练,包括专用硬件和新指令集架构,可明显提高矩阵乘法运算。
Gracemont小核心属于Atom凌动家族,是2008年以来的第七代,之前分别是Bonnell、Saltwell、Silvermont、Airmont、Goldmont(包括Plus版本)、Tremont。
按照Intel的说法,Gracemont核心非常迷你, 一个Golden Cove大核心的空间里,可以放入四个Gracemont小核心,以及它们共享的4MB二级缓存。
别看是小核心,性能其实一点都不弱。Intel声称, 单核单线程对比,Gracemont的同频性能相比六代酷睿Skylake提升超过40%,而同等性能下功耗则可降低40%。
四核四线程的Gracemont对比双核四线程的Skylake,峰值性能可提升80%,而同等性能下功耗可降低80%。
Intel表示, 这种小核心设计可以在有限的芯片空间内,实现多核任务负载,并具备宽泛的频率范围,降低整体消耗,为更高频率运行提供果功耗和散热空间,满足更多动态任务负载。
它还可以利用各种技术进步,在不额外增加功耗的情况下,对工作负载进行优先级排序,并直接提升性能。
架构方面,小核心就相对简单不少了,但变化也非常大,比如 指令缓存增大至64KB ,可在不耗费内存子系统功率的情况下保存可用指令,还有 Intel的第一个按需指令长度解码器 ,可生成预解码信息,加速现代工作负载。
同时借助更深的分支历史、更大的指令尺寸,分支预测精度大大增加,拥有5000个条目的分支目标缓存区。
后端也更宽了 ,具备5组宽度分配、8组宽度引退、256个乱序窗口入口、17个执行端口,以及4个整数ALU、2个载入AGU、2个存储AGU、2个跳转端口、2个整数存储数据、2个浮点/矢量存储、2个浮点/矢量堆栈、以及第3个矢量ALU。
内存部分,使用了 双载入、双存储单元 的配置,二级缓存增大至4MB,以及深度缓冲、高级预取器,支持Intel Resource Director资源重定向技术,可以让软件在不同核心、不同软件线程之间实现精准的控制。
哦对了, Gracemont是第一个支持AVX2指令集的能效核心 ,还支持整数AI操作新扩展、Intel控制流强制技术、Intel虚拟化重定向保护技术。
【来源:快科技】【作者:上方文Q】
特斯拉因芯片短缺积压8万Powerwall订单总价值超5亿美元7月15日消息,据国外媒体报道,特斯拉的家用太阳能储能系统Powerwall在住宅太阳能客户中非常受欢迎,它的需求在不断增加。特斯拉CEO埃隆middot马斯克(ElonMusk)
摩根士丹利特斯拉或将涉足飞行汽车市场摩根士丹利分析师AdamJonas在一份报告中指出,特斯拉最终有可能向ldquo飞行汽车rdquo市场提供产品和服务,而且这是ldquo推出早晚rdquo的问题而非ldquo是否推
马斯克如果我不担任CEO特斯拉就会完蛋据国外媒体报道,当地时间周一,特斯拉CEO埃隆middot马斯克(ElonMusk)在法庭上为特斯拉2016年收购SolarCity的交易作证时表示,如果他不担任特斯拉的CEO,该
大型凡尔赛!马斯克谈特斯拉降价特斯拉降价一直是车友网友们讨论的热门话题,日前,标准续航版ModelY(磷酸铁锂)在国内上市,27。6万的价格堪称残暴,官网因此数度瘫痪排产也延后到了9月份。按理说,三电技术品牌知
外媒特斯拉CEO马斯克已购买维珍银河太空旅行船票据国外媒体报道,特斯拉创始人CEO埃隆middot马斯克(ElonMusk)已经购买了其竞争对手亿万富翁理查德middot布兰森(RichardBranson)旗下维珍银河的太空旅
特斯拉光储充一体化超级充电站本周末发布特斯拉中国今日宣布,特斯拉光储充一体化超级充电站将于7月17日在上海发布。特斯拉是太阳能等清洁能源的大力推行者,其官网就上架了太阳能充电装置Powerwall。据悉,特斯拉光储充一
芯片算力超特斯拉!威马首款轿车将年内发布7月15日,有媒体从威马汽车官方获悉,旗下首款轿车将于2021年内发布,并且该车将会配备多激光雷达,同时还将拥有5001000TOPS的算力。此外,未来新车发布后还将启用全新的出行
特斯拉ModelY今年前4个月在美国新注册5。3万辆据国外媒体报道,随着产量的不断提升,特斯拉2019年3月份推出去年一季度开始交付的跨界运动型多用途电动汽车ModelY的交付量也不断提升,在部分市场的交付量,已经超过了Model3
特斯拉得克萨斯州超级工厂有望先于柏林超级工厂投产据国外媒体报道,在上海超级工厂的二期建成投产开始生产ModelY之后,电动汽车厂商特斯拉目前在建设的,主要就是柏林超级工厂和得克萨斯州超级工厂。正在建设的特斯拉柏林超级工厂特斯拉正
ARM架构芯片逐步崛起,2023年前仍难x86抗衡今日,TrendForce集邦咨询发布报告称,随着x86平台进入转换周期,今年IntelIceLake与AMDMilan均已进入量产阶段,在第一季度已小批量出货给特定客户,预计将在
华为P50Pro镜头参数爆料f1。8光圈5倍长焦华为官方今日宣布,华为旗舰新品发布会定于7月29日1930,一起见证万象新生,届时将发布华为P50系列等产品。华为P50系列可能包括P50P50ProP50Pro三款型号,首发搭载