在 2021 架构日活动期间,英特尔详细介绍了 Ponte Vecchio A0 的芯片设计。 考虑到英特尔长期缺乏独立显卡方面的经验,Ponte Vecchio 可算是该公司一项雄心勃勃的登月计划。现在看来,由 Raja Koduri 和 Masooma Bhaiwala 带领的这支开发团队,着实给我们带来了不少惊喜。 (图 via WCCFTech ) 对于英特尔公司的投资者们来说,Ponte Vecchio 有助于其在 HPC GPU 市场抢占更多的份额。 2021 架构日活动期间,英特尔还坦承已扫清 Xe HPC 架构上市前的最后一道障碍。 上图中的蓝色和绿色线条,分别指代了英特尔 Xe 和竞争对手(或许是英伟达)。随着 Ponte Vecchio 在 2021 年的横空出世,英特尔在 HPC GPU 领域也实现了重大的超越。 英特尔透露,在打造 Ponte Vecchio 的设计过程中,他们几乎对所有部分都进行了重新设计和重组。 据悉,Ponte Vecchio 封装中包含了 47 块“瓦片”,且各个瓦片可能基于不同的代工厂(比如 Intel 自家或台积电)。 显然,这需要极高的封装工艺作为支撑,才能最终让 Ponte Vecchio 成为一个有“凝聚力”的整体。 Folsom 团队已经测量了 45 TFLOPs 的 FP32 吞吐量、5 TBps 的显存带宽、以及 2 TBps 的连接带宽,以验证 A0 芯片的所有部分都如预期般正常工作,并且有望为图形领域的重大突破做出贡献。 以 Resnet 基准测试为例,英特尔已经证明了 A0 Ponte Vecchio 芯片可打破世界纪录。 此外英特尔 Xe HPC 将提供 1 个或 2 个堆栈设计,且 Xe Link 链路将用于在多个子系统中连结 Ponte Vecchio 。 与 Xe HPG 不同的是,Ponte Vecchio GPU 中的 Xe HPC 内核,拥有 8 个矢量引擎(512 位)和 8 个矩阵引擎(4096 位)。 很明显,英特尔似乎已经迈过了图形技术停滞不前的低谷,并在高性能图形计算领域迎来了突飞猛进般的重大进展。 值得一提的是,规划中的 Aurora 超算,也将使用该公司的 Ponte Vecchio GPU 加速卡。 该公司甚至搬出了一个 Aurora Blade 刀片组件,无数的 Aurora Blade 单元将可组合成为一个超算集群。 【来源:cnBeta.COM】