教育房产时事环球科技商业
投稿投诉
商业财经
热点动态
科技数码
软件应用
国际环球
晨报科学
新闻时事
信息智能
汽车房产
办公手机
教育体育
生活生物

1000亿晶体管!IntelXeHPC顶级计算卡秀肌肉

  我们知道,Intel Xe GPU架构分为四个层级,或者说四种微架构,其中以上是的Xe LP低功耗版仅供核显、入门独显,即将到来的Xe HPG高性能图形版面向中高端游戏显卡,Xe HP高性能版适合加速计算、AI、ML等但所知最少,  Xe HPC高性能计算版则是最顶级的存在,主攻大型数据中心、超算。
  Xe HPG微架构的Alchmest(DG2)之前已经聊过了 ,这里来看看Xe HPC和首款产品Ponte Vecchio,竞争对手是NVIDIA A系列、AMD Instinct系列。
  当然,它们距离普通人非常非常遥远,但却是技术实力的最高体现。
  Xe HPC架构的基础也是Xe核心(Xe Core)   ,但因为面向的是计算而非图形,内部结构有所不同,包括8个512-bit矢量引擎、8个4096-bit矩阵引擎,数量对比Xe HPG都减半,但位宽分别翻了一倍、两倍,算力更凶猛。
  矢量引擎每时钟周期可执行256个FP32、256个FP64、512个FP16等数据操作,矩阵引擎则每时钟周期支持2048个FP32、4096个FP64、4096个BF16、8192个INT8。
  与矢量引擎、矩阵引擎搭档的,是一个  更宽的宽加载/存储单元  ,每个时钟周期取回512字节数据。
  每个Xe核心集成512KB一级数据缓存,这是目前业内最大的  ,而且可以通过软件配置作为暂存区使用,又称共享内部显存。
  Xe核心的上一层级叫做“切片”(Slice)    ,不同于Xe HPG上的渲染器切片(Slice),毕竟一个是做计算,一个是做图形渲染。
  Xe HPC每个切片集成多达16个Xe核心  ,四倍于Xe HPG渲染切片的规模,同时还有  8MB一级缓存、16个光追单元、一个硬件上下文(Hardware Context)单元  ,其中光追支持光线遍历、边界框相交、三角形相交,提供固定函数计算。
  硬件上下文单元大家可能比较陌生,它能让GPU同时执行多个应用,而无需昂贵的基于软件的文本切换。
  切片的上一级则是“堆栈”(Stack),至此才算一个完整的GPU。
  一个堆栈包含4个切片,因此总计64个Xe核心、64个光追单元、4个硬件上下文。
  同时,堆栈内还有  大规模二级缓存、4个HBM2e内存控制器、1个媒体引擎、8个Xe链路  ,以及拷贝引擎、PCle控制器。
  Xe HPC架构是可以轻松扩展的,  支持多堆栈设计,属于业内首创,依靠的是EMIB封装和堆栈间互连通道  ,可保持堆栈之间的内存一致性。
  比如  这是双堆栈,整体规模直接翻番  ,它就是后边要说的首款Ponte Vecchio,但看架构图,似乎不支持四堆栈。
  不同的Xe HPC GPU之间通过Xe链路互连,支持最多8颗并行  ,算力直接暴力乘以8。
  Ponte Vecchio作为基于Xe HPC架构的首款产品,一切的一切都是全新的,包括验证方法、软件、可靠性方法、信号完整性机制、互连、供电、封装、I/O架构、内存架构、IP架构、SoC架构。
  Ponte Vecchio是个庞然大物,集成晶体管数量突破1000亿个,使用5种不同的制造工艺,在内部封装了多达47个不同的单元(Tile),包括计算单元、Rambo缓存单元、Foveros封装单元、基础单元、HBM单元、Xe链路单元、EMIB单元,等等。
  如此复杂的芯片设计,面临的挑战自然是空前的,  首席架构师Masooma Bhaiwala直言这是她30年来设计的最复杂的芯片,堪称制造奇迹。
  其中,Foveros 3D封装是一个关键,最终的数据传输速度不得不提高到最初规划的1.5倍,以便以把Foveros连接数量降至最低,但依然比之前任何设计都高了两个数量级。
  开发团队还必须在设计初期就锁定Foveros在所有单元上的位置,这意味着必须一开始就搞定整个平面图布局,中途也不允许有明显变更。
  芯片设计和验证也是全新流程,为此开发了大量新的工具、方法、脚本,并独立安排4个主要单元,开发各自的调试软件包,分而治之,加速开发,最终在SoC整体封装完成几天内就成功启动,运行了Hello World。
  再来看几个关键的部分,  计算单元采用台积电N5 5nm工艺,每个集成8个Xe核心、4MB一级缓存  ,Foveros封装凸点间距36微米。
  基础单元是一个连接器,所有复杂的I/O和高带宽组件都在这里汇聚  ,包括PCIe 5.0总线、HBM2e内存、MDFI链路、EMIB桥接,几乎是在挑战物理极限。
  它采用  Intel 7工艺、Foveros封装,面积达640平方毫米  ,集成了多达144MB二级缓存。
  Xe链路单元是台积电N7 7nm工艺制造  ,负责不同GPU之间的连接,是面向HPC、AI的纵向扩展的关键,每个单元有8条,实现了最高90G Serdes,  可以满足“极光”(Aurora)这样百亿亿次级级超级计算机的需求。
  Ponte Vecchio目前处于  A0版本阶段  (一般到A1就投入量产),成功运行了数百个工作负载,实测FP32吞吐性能超过45TFlops,Memory Fabric缓存带宽超过5TB/s,互连带宽超过2TB/s。
  Ponte Vecchio将有多种产品形态,最基本的单芯片做成OAM模块,集成到一个载体基板上,AMD Instinct也有这种。
  四芯并联组成一个子系统,再搭配双路的下一代Sapphire Rapids至强处理器  ,就是一个超算节点,将用于“极光”超算。
  【来源:快科技】【作者:上方文Q】

Minisforum发布Venus系列UM560迷你PC锐龙R55625U加持知名迷你PC制造商Minisforum,刚刚推出了Venus系列UM560新品。特点是采用了AMD锐龙R55625U移动APU,并且预装了微软最新的Windows11桌面操作系统。Bose超迷你蓝牙扬声器上市IP67级防水防尘Bose官方宣布BoseSoundLinkMicro蓝牙扬声器升级上市。据悉,BoseSoundLinkMicro的整个机身采用柔软的硅胶外壳,手感柔软亲肤,并且还具有较强的抗摔性苹果更新过时产品清单长寿神机iPhone6s被抛弃近日,在苹果分发给AppleStore和Apple授权服务提供商的内部备忘录中,苹果宣布将在6月底将iPhone6s6s初代iPadProAppleTVHD等产品列入过时产品清单。吉利高端成了!第20000台极氪001交付均价可买宝马3系5月28日,在正在举办的粤港澳大湾区车展上,极氪汽车现场交付了其第20000台极氪001。作为吉利打造的高端新能源品牌,极氪001自去年10月底开始交付,迄今一共7个月时间,简单换比亚迪海豚劲敌吉利几何E开启预售401公里只卖9。88万5月26日消息,吉利新能源品牌几何汽车旗下全新车型几何E开启预售,新车共推出三款车型,补贴后预售价为8。7810。48万元。几何E是几何汽车打造的全新纯电小型SUV,其车身尺寸为4微软确认Windows10新更新解决应用崩溃等一大堆问题对于微软来说,他们已经在为Windows10用户准备新的更新了,按照官方的说法,将加快文件复制速度并解决应用崩溃问题。Windows10Build19044。1739(21H2)现微软信心爆棚!Windows11满意度与质量系列最高用户都说好很显然,微软正在不遗余力的提高Windows11的用户体验,因为在他们看来,这个系统得到了用户的认可。在2022年的Computex期间,微软的Windows和Surface主管P弯道超车Wintel联盟?国产优麒麟系统已运行在开源CPU上在PC以及服务器行业,Intel的CPU微软的Windows系统都是绕不过去的门槛,Wintel联盟的生态导致其他公司很难进入这个市场,能够弯道超车的机会只有开源系统及开源CPU,MusicMiniPlayeriTunes10怀旧风的实用应用开发者MarioGuzman近日推出了一款名为ldquoMusicMiniPlayerrdquo的新应用,旨在将iTunes10中最有用的功能之一带回Mac。该实用程序复制了适用于MIT研究人员利用AI来帮助自动驾驶汽车避免在红灯前空转没有人喜欢在红灯前等待。但有信号灯的十字路口对司机来说不仅仅是个小麻烦,并且车辆在等待信号灯变化时会存在浪费燃料以及排放温室气体的情况。如果驾驶者可以精确地安排他们的行程从而使他们Linux5。19中新显卡驱动代码新增将近50万行在Linux5。19窗口合并期,DavidAirlie今早发送了对DirectRenderingManager(DRM)子系统更新。其中值得注意的是,在DRM显示图形驱动更新中添加
外媒称英特尔CEO计划下周前往亚洲将到访台积电12月10日消息,据国外媒体报道,本周早些时候曾有产业链的消息称,芯片巨头英特尔的高管,将在本月中旬到访台积电,与台积电方面的高管专门洽谈3nm工艺的代工事宜。而从外媒最新的报道来中国铁塔启动20212022年智能换电柜集采规模2万台中国铁塔官方消息显示,20212022年智能换电柜(3。0版本)产品招标项目已具备招标条件,现进行公开招标。本项目包括四类产品,分别是12仓智能换电柜主柜12仓智能换电柜扩展柜,8京东方发布中国半导体显示首个技术品牌500Hz超高刷12月21日,京东方发布了号称中国半导体显示领域的首个技术品牌,包括三大子品牌高端液晶显示技术ADSPRO高端柔性显示技术fOLED高端玻璃基新型LED显示技术alphaMLED。晶方科技拟进一步加强对以色列第三代半导体公司VisIC的投资苏州晶方半导体科技股份有限公司发布公告称,为积极布局车用半导体前沿技术,有效把握三代半导体相关技术的产业发展机遇,公司与以色列VisICTechnologiesLtd。,(以下简称手机品牌签署采购LTA(LongTermAgreement,长期协议),这是大立光第一次与中国品牌签署LTA。签约前大立光对该品牌的2022年镜头出货量减少约15ndash20Yo曝苹果M2处理器开发已接近完成,采用台积电4nm制程苹果此前推出了搭载M1Pro及M1Max处理器的新款MacBookPro笔电,而将Mac系列处理器过渡到自研Arm架构的AppleSilicon处理器的两年计划已有一年,M1Pro消息称苹果正开发15英寸iPad,有望支持运行Mac应用据外媒报道,苹果工程师及设计团队正在开发巨屏iPad,尺寸可能对应的是15寸,以此挑战亚马逊的EchoShow15,预计这款iPad将会在几年内到来。在彭博社最新一期的PowerOIntel游戏独立显卡终于有名字了桌面笔记本一共四款Intel早已宣布,未来的游戏级高性能独立显卡将命名为Arc锐炫系列,并有消息称具体型号将是A380这样的格式。今天,有消息人士从Intel的一款测试驱动中发现了ArcA系列的型号蓝戟展示Intel独立显卡中国大陆唯一满血96单元12月16日,新势力本土显卡品牌蓝戟(Gunnir)在深圳举办2021全国渠道峰会,共同探讨分析显卡行业前沿趋势。除了全国渠道合作伙伴,蓝戟还特别邀请了Intel,并展示了蓝戟在IiQOONeo5S首发全维护眼调光系统1。6万档调光iQOO手机官微表示,iQOONeo5S将首发1。6万级全维护眼调光系统,保护用户眼睛。从预热海报来看,iQOONeo5S搭载的独显芯片Pro带来的亮度调节算法,搭配光敏感器,带来首款台积电4nm芯片!联发科天玑9000今日发布首发花落谁家?12月16日消息,今日下午1400,联发科将举行MediaTek天玑旗舰战略暨新平台发布会,届时,将正式推出新一代旗舰处理器mdashmdash天玑9000。目前,天玑9000主要