教育房产时事环球科技商业
投稿投诉
商业财经
热点动态
科技数码
软件应用
国际环球
晨报科学
新闻时事
信息智能
汽车房产
办公手机
教育体育
生活生物

1000亿晶体管!IntelXeHPC顶级计算卡秀肌肉

  我们知道,Intel Xe GPU架构分为四个层级,或者说四种微架构,其中以上是的Xe LP低功耗版仅供核显、入门独显,即将到来的Xe HPG高性能图形版面向中高端游戏显卡,Xe HP高性能版适合加速计算、AI、ML等但所知最少,  Xe HPC高性能计算版则是最顶级的存在,主攻大型数据中心、超算。
  Xe HPG微架构的Alchmest(DG2)之前已经聊过了 ,这里来看看Xe HPC和首款产品Ponte Vecchio,竞争对手是NVIDIA A系列、AMD Instinct系列。
  当然,它们距离普通人非常非常遥远,但却是技术实力的最高体现。
  Xe HPC架构的基础也是Xe核心(Xe Core)   ,但因为面向的是计算而非图形,内部结构有所不同,包括8个512-bit矢量引擎、8个4096-bit矩阵引擎,数量对比Xe HPG都减半,但位宽分别翻了一倍、两倍,算力更凶猛。
  矢量引擎每时钟周期可执行256个FP32、256个FP64、512个FP16等数据操作,矩阵引擎则每时钟周期支持2048个FP32、4096个FP64、4096个BF16、8192个INT8。
  与矢量引擎、矩阵引擎搭档的,是一个  更宽的宽加载/存储单元  ,每个时钟周期取回512字节数据。
  每个Xe核心集成512KB一级数据缓存,这是目前业内最大的  ,而且可以通过软件配置作为暂存区使用,又称共享内部显存。
  Xe核心的上一层级叫做“切片”(Slice)    ,不同于Xe HPG上的渲染器切片(Slice),毕竟一个是做计算,一个是做图形渲染。
  Xe HPC每个切片集成多达16个Xe核心  ,四倍于Xe HPG渲染切片的规模,同时还有  8MB一级缓存、16个光追单元、一个硬件上下文(Hardware Context)单元  ,其中光追支持光线遍历、边界框相交、三角形相交,提供固定函数计算。
  硬件上下文单元大家可能比较陌生,它能让GPU同时执行多个应用,而无需昂贵的基于软件的文本切换。
  切片的上一级则是“堆栈”(Stack),至此才算一个完整的GPU。
  一个堆栈包含4个切片,因此总计64个Xe核心、64个光追单元、4个硬件上下文。
  同时,堆栈内还有  大规模二级缓存、4个HBM2e内存控制器、1个媒体引擎、8个Xe链路  ,以及拷贝引擎、PCle控制器。
  Xe HPC架构是可以轻松扩展的,  支持多堆栈设计,属于业内首创,依靠的是EMIB封装和堆栈间互连通道  ,可保持堆栈之间的内存一致性。
  比如  这是双堆栈,整体规模直接翻番  ,它就是后边要说的首款Ponte Vecchio,但看架构图,似乎不支持四堆栈。
  不同的Xe HPC GPU之间通过Xe链路互连,支持最多8颗并行  ,算力直接暴力乘以8。
  Ponte Vecchio作为基于Xe HPC架构的首款产品,一切的一切都是全新的,包括验证方法、软件、可靠性方法、信号完整性机制、互连、供电、封装、I/O架构、内存架构、IP架构、SoC架构。
  Ponte Vecchio是个庞然大物,集成晶体管数量突破1000亿个,使用5种不同的制造工艺,在内部封装了多达47个不同的单元(Tile),包括计算单元、Rambo缓存单元、Foveros封装单元、基础单元、HBM单元、Xe链路单元、EMIB单元,等等。
  如此复杂的芯片设计,面临的挑战自然是空前的,  首席架构师Masooma Bhaiwala直言这是她30年来设计的最复杂的芯片,堪称制造奇迹。
  其中,Foveros 3D封装是一个关键,最终的数据传输速度不得不提高到最初规划的1.5倍,以便以把Foveros连接数量降至最低,但依然比之前任何设计都高了两个数量级。
  开发团队还必须在设计初期就锁定Foveros在所有单元上的位置,这意味着必须一开始就搞定整个平面图布局,中途也不允许有明显变更。
  芯片设计和验证也是全新流程,为此开发了大量新的工具、方法、脚本,并独立安排4个主要单元,开发各自的调试软件包,分而治之,加速开发,最终在SoC整体封装完成几天内就成功启动,运行了Hello World。
  再来看几个关键的部分,  计算单元采用台积电N5 5nm工艺,每个集成8个Xe核心、4MB一级缓存  ,Foveros封装凸点间距36微米。
  基础单元是一个连接器,所有复杂的I/O和高带宽组件都在这里汇聚  ,包括PCIe 5.0总线、HBM2e内存、MDFI链路、EMIB桥接,几乎是在挑战物理极限。
  它采用  Intel 7工艺、Foveros封装,面积达640平方毫米  ,集成了多达144MB二级缓存。
  Xe链路单元是台积电N7 7nm工艺制造  ,负责不同GPU之间的连接,是面向HPC、AI的纵向扩展的关键,每个单元有8条,实现了最高90G Serdes,  可以满足“极光”(Aurora)这样百亿亿次级级超级计算机的需求。
  Ponte Vecchio目前处于  A0版本阶段  (一般到A1就投入量产),成功运行了数百个工作负载,实测FP32吞吐性能超过45TFlops,Memory Fabric缓存带宽超过5TB/s,互连带宽超过2TB/s。
  Ponte Vecchio将有多种产品形态,最基本的单芯片做成OAM模块,集成到一个载体基板上,AMD Instinct也有这种。
  四芯并联组成一个子系统,再搭配双路的下一代Sapphire Rapids至强处理器  ,就是一个超算节点,将用于“极光”超算。
  【来源:快科技】【作者:上方文Q】

格力回应员工持股计划退休后行使限制希望激励员工跟随企业发展前几天,格力公布了第一期员工持股计划(草案)。由于持股计划购价为27。68元股,仅为格力当前股价的一半,粗略计算后有媒体得出,顶格认购后12000名员工平均每人赚25万元。在格力电格力电器增加2020年股东大会临时提案格力电器公告称,6月20日,公司董事会收到持股3以上股东珠海格力集团关于增加珠海格力电器股份有限公司2020年年度股东大会临时提案的函,提请公司董事会将关于lt珠海格力电器股份有限视频主展示AirTag如何帮助找回被偷自行车据外媒报道,通过苹果的ldquoFindMyrdquo网络,这家公司的AirTags可以成功定位丢失或被盗的物品即使是像自行车这么大的东西,只要追踪器还在工作就可以。现在,一位YoASRock预估Q2全球GPU出货量仍有增长华擎(ASRock)预估,尽管受全球组件短缺和加密货币挖矿需求预期下降等因素影响,全球GPU出货量在今年第2季度仍有增长。华擎认为,随着供应链限制的缓解,2021年下半年GPU的供统一推送联盟官宣将纳入中国信通院CMS体系中国信息通信研究院CAICT上周宣布,信通院共建的移动基础服务平台即将发布。统一推送联盟官方今日宣布,联盟旗下所有相关标准与成果将纳入中国信通院与中国互联网协会共建的ldquo中国中国电信在雄安成立数字城市科技公司注册资本9亿元据天眼查信息显示,中电信数字城市科技有限公司成立,法定代表人为赵洪勋,注册资本9亿元,注册地址位于雄安新区。股权穿透图显示,该公司由中国电信股份有限公司100控股。该公司经营范围包不会延期,消息称华为P50Pro发布时间已确定在华为鸿蒙系统及全场景生态产品发布会上,华为消费者业务总裁余承东正式公布了华为P50系列。余承东表示,因为众所周知的原因,华为P50系列的上市时间还没有官宣。华为官方图现在据微博博拍照更强苹果iPhone13ProMax后置摄像头宽度惊人按照之前的爆料的预测,苹果今年的iPhone13(12S)将于9月如期到来,而量产工作也正在如火如荼的进行中,甚至此前曝出郑州富士康加码推荐奖金,将苹果iPhone13Pro系列量三星扩充Odyssey阵容新增四款非曲面屏游戏显示器在过去几年里,电视和显示器市场的厂商一直在积极地向消费者推广曲面屏。不过并非所有人都喜欢曲面屏,他们更偏好于传统的平面屏幕。为了进一步细分这个市场,三星Odyssey系列显示器新推叮咚买菜正式登陆纽交所挂牌上市发行价为23。5美元叮咚买菜昨晚晚间正式登陆纽交所挂牌上市,发行价为23。5美元,为指导区间的下限。以发行价计算,叮咚买菜的市值超55亿美元。今天,叮咚买菜向美国证券交易委员会更新招股书,将在美股IP新型铝合金使飞机和铁路运输用上耐热钢丝成为可能据外媒报道,俄罗斯科学家使用先进的铝合金展开实验并由此开发出了一种新型耐热材料。据了解,这种材料可以承受更高的温度。研究人员认为,在将其制成细线后可以作为飞机和铁路运输中较重铜材料
瑞思一季度总营收2。615亿元同比增长1405月21日消息,瑞思学科英语(NASDAQREDU)公布截至2021年3月31日的第一季度未经审计财务报告。财报显示,瑞思第一季度总营收为2。615亿,同比增长140。0。值得注意国产自主三代核电出海华龙一号海外首堆投入商业运行2020年11月份,国产第三代核电华龙一号在福清核电5号机组成功并网发电,意味着正式商业化。最新消息称,华龙一号海外首堆投入商业运行,国产三代核电成功出海。科技日报消息,当地时间5特斯拉正考虑在俄罗斯建设欧洲第二家Gigafactory据国外媒体报道,特斯拉CEO埃隆middot马斯克(ElonMusk)今日在俄罗斯的一个线上活动表示,特斯拉已经准备好进入俄罗斯汽车市场,并正考虑在那里开设工厂。而且也不排除在其周2021款MacBookPro机型基于M1X芯片一个有良好记录的消息来源表示,今年的MacBookPro型号的处理器将被命名为M1X,而不是M2,这印证了之前彭博社的说法,即它将是与M1相同的内核,带来了更多的核心,显然会带来性中国移动携手英特尔等打造5G全互联PC5月18日消息,中国移动携手英特尔惠普和MediaTek(联发科)宣布将开展5G移动PC领域的合作,共同打造新一代全互联PC。目前国内5G产业发展迅速,据近期工信部会议上披露的相关Intel强推ATX12VO电源标准主板电源厂商都不爽历史上的PC电源标准都是Intel主导制定推广的,包括已经使用多年的ATX12V,但想要动摇它的根基,就连Intel自己也不容易做到。针对当今PC设备供电变化节能环保需求,InteGalaxyWatchActive4规格泄露配备WearOS和新芯片在Google2021年IO大会的第一天,WearOS成为关注的中心,它将在Fitbit的帮助下为可穿戴设备平台注入新的活力,而三星的出现也令人惊讶。后者将在其即将推出的GalaxIntel出手暴改GTA5代码照片级画质降临GTA5已经发售快8年时间,各种民间MOD层出不穷,包括但不限于画质增强等。这次,IntelISL实验室的工程人员出手,秀了秀肌肉。他们通过机器学习技术,改造了GTA5的画面,让其应对全球缺芯!博世斥资77亿开设芯片工厂下月开工从去年年底全球爆发的汽车芯片短缺问题一直持续至今,由于芯片供应不足,导致部分车企不得不采取停产的措施来应对。今日,据媒体报道,当地时间6月7日,全球最大的汽车零部件供应商德国博世集普通智能手机成功实现北斗三号短报文通信功能据中国北斗卫星导航系统官方发布,兵器工业集团在北京举办北斗三号短报文通信融入大众手机阶段成果展示会,现场演示普通智能手机直接与距地面约3。6万公里高度的北斗卫星通信,成功完成短报文虎牙直播App9。0版本发布多屏同看等多项功能上线虎牙直播APP9。0版本正式上线,全面改版了搜索页直播间个人主页新增了热点页,直播间掉宝及直播开放互动平台持续优化之外,还重磅上线了多屏同看高能剪辑实时内容等诸多新功能。值得一提的