教育房产时事环球科技商业
投稿投诉
商业财经
热点动态
科技数码
软件应用
国际环球
晨报科学
新闻时事
信息智能
汽车房产
办公手机
教育体育
生活生物

ModelMesh走向开源使开发者能够大规模部署AI模型

  模型服务是AI用例的一个关键组成部分。它涉及从人工智能模型中提供推论,以响应用户的请求。那些涉足企业级机器学习应用的人知道,通常不是一个模型提供推论,而是实际上有数百甚至数千个模型在同步运行。
  这在计算上是一个非常昂贵的过程,因为你不可能在每次要提供请求时都启动一个专用容器。这对在Kubernetes集群中部署大量模型的开发者来说是一个挑战,因为存在一些限制,如允许的最大荚数和IP地址以及计算资源分配。
  IBM通过其专有的ModelMesh模型服务管理层为Watson产品(如Watson Assistant、Watson Natural Language Understanding和Watson Discovery)解决了这个难题。由于这些模型已经在生产环境中运行了几年,ModelMesh已经针对各种场景进行了全面测试。现在,IBM正在将这一管理层与控制器组件以及为模型服务的运行时间一起贡献给开放源码社区。
  ModelMesh使开发者能够在Kubernetes之上以"极端规模"部署AI模型。它具有缓存管理的功能,也是一个平衡推理请求的 路由器 ,模型被智能地放置在pod中,对临时中断提供弹性。ModelMesh的部署可以轻松升级,无需任何外部协调机制。它自动确保一个路由新请求到它之前已经完全更新和加载。
  在用一些统计数据解释ModelMesh的可扩展性时,IBM表示:
  一个部署在单个工人节点8vCPU x 64G集群上的ModelMesh实例能够打包20K个简单字符串模型。在密度测试的基础上,我们还对ModelMesh的服务进行了负载测试,通过发送成千上万的并发推理请求来模拟一个高流量的假日季节场景,所有加载的模型都以个位数毫秒的延迟进行响应。实验表明,单个工人节点支持20k个模型,每秒最多可进行1000次查询,并以个位数毫秒的延迟响应推理任务。
  IBM将ModelMesh贡献给了KServe GitHub组织,该组织早在2019年就由IBM、Google、彭博社、英伟达和Seldon联合开发。
  您可以在下面提到的各种GitHub存储库中查看ModelMesh的运用与实现:
  模型服务控制器
  用于协调模型放置和路由的 ModelMesh 容器 运行时适配器
  ModelMesh运行时适配器 - 在每个模型服务 pod 中运行的容器,充当 ModelMesh 和第三方模型服务器容器之间的中介,它还包含了负责从存储中检索模型的"拉动器"逻辑。
  triton-inference-server - NVIDIA的Triton推理服务器
  seldon-mlserver - Python MLServer,是KFServing的一部分
  【来源:cnBeta.COM】

分析师坚信苹果供应链不会受到停工防疫的严重影响在周二致投资者的一份报告中,PiperSandler首席分析师HarshKumar发表了针对苹果亚洲供应链的一些看法。据悉,上海和昆山是苹果部分供应链合作伙伴的关键驻地。不过就算两WindowsHolographic获22H1版本更新在去年10月发布21H2更新之后,WindowsHolographic今天又收到了22H1版本。WindowsHolographic是微软为由Windows驱动的混合现实设备(例如比亚迪一用户长期诋毁比亚迪被判赔礼道歉并赔3万块4月19日,比亚迪网络举报中心发布消息称2022年4月12日,就原审被告二审上诉人勾(今日头条用户ldquo反比亚迪传销集团范董rdquo,账号已注销)在网络发布数篇不实言论,针对微软称Windows1021H2版已向所有人开放全面升级到Windows11可能是PC世界的流行趋势,但Windows10仍在被微软支持,并将在2025年左右采淘汰。而最近微软提供了一个Windows10的更新,也就是Windo2026年中国软件定义存储市场容量将接近45。1亿美元市场研究机构IDC发布的中国软件定义存储(SDS)及超融合存储(HCI)系统市场季度跟踪报告,2021年第四季度报告显示,软件定义存储(SDS)在2021年同比增长45。5超融合存全球可穿戴设备出货量排行苹果居首华为第三据Canalys最新数据显示,2021年全球可穿戴腕带设备出货量达1。93亿台,同比增长4。3。其中,苹果出货量超3900万台,稳居全球第一,增长率为11。8。小米出货量为2900新一代驯龙高手iQOONeo6曝光采用OLED直屏3月25日消息,博主数码闲聊站曝光了iQOONeo6的部分参数,这款新机采用6。62英寸OLED直屏,搭载高通骁龙8旗舰处理器,电池容量为4700mAh(双电芯方案),支持80W有朋友圈别乱发广告了!微信治理恶意营销行为处理9万个账号4月13日晚,微信发布关于治理微信个人帐号恶意营销行为的公告,宣布治理刷单减肥丰胸等恶意营销行为,已经处理了9万个违规账号。微信表示,近期,通过用户投诉,我们发现部分用户存在发布以2021年全球半导体制造设备销售额达到1026亿美元SEMI最新发布的全球半导体设备市场统计报告显示,2021年全球半导体制造设备销售额较2020年激增44至1026亿美元,创历史新高,中国大陆地区再次成为半导体设备的最大市场,销售取代iPhone的革命性硬件!苹果ARMR头显发布时间曝光近日,海通国际证券分析师JeffPu表示,苹果ARMR头显可能会延期发布,将会在2023年第一季度推出。他还推测新款苹果ARMR头显第一年的销量将会在100万150万之间。另外苹果Win11市场份额不尽如人意超越Win10至少要到2025年到本月初,微软的Win11系统发布就正式半年了,它被微软CEO纳德拉成为史上最具革命性的Win系统,不过Win11系统的争议也不少,微软的各种改进让它在用户群体中产生了分裂,赞美与
搜狗回应男子被人脸搜索匹配需内部沟通9月26日消息近日有网友放出的一段ldquo中年男子在音乐节现场与年轻女子亲吻rdquo的视频引发全网关注,后有网友利用搜狗人脸匹配功能,识别出这名男子疑为广西一大学马克思主义学院丰田紧急召回11万辆汽车涉及普锐斯等39款车型据央视报道,丰田汽车近日宣布召回超过11万辆汽车。召回车型涉及ldquo普锐斯rdquo等39款车型,共计111842辆汽车。据悉,召回车辆生产日期为4月8月,主要有两大类问题。一马斯克未来特斯拉将在中国持续投资9月26日消息,今天,ldquo世界互联网大会乌镇峰会rdquo在浙江嘉兴的乌镇开幕,本届大会集中呈现了互联网技术最新成果,聚焦数字赋能共创未来。马斯克通过视频连线发表演讲称,数据索尼Xperia1III系统软61。0。A。11。92发布,优化温度控制算法今年5月份,索尼中国发布了Xperia1III国行手机,12GB256GB售价8499元,12GB512GB售价9499元。该机在今年6月份正式开售。索尼Xperia官方今天发布了腾讯回应解决屏蔽网址链接等问题阿里巴巴字节跳动都表态了9月13日,工信部新闻发言人信息通信管理局局长赵志国在国新办发布会上表示,已要求企业能够按照整改要求,务实推动即时通信屏蔽网址链接等不同类型的问题,能够分步骤分阶段得到解决。赵志国特斯拉2021年度股东大会10月7日举行今年不在加州9月26日消息,据国外媒体报道,电动汽车厂商特斯拉已在官网宣布,他们2021年度的股东大会,将在10月7日举行,举办地将不会是加州。从特斯拉官网公布的消息来看,他们2021年的股东马斯克特斯拉中国所有数据都储存在本地9月26日,2021世界互联网大会开幕。特斯拉CEO埃隆middot马斯克发表视频演讲时表示,特斯拉已经在中国建立数据中心,所有数据都会储存在中国。马斯克称,数据安全是智能联网汽车亨通光电预计前三季度净利润同比增长45到65亨通光电发布2021年前三季度业绩预告。预计报告期内实现归属于上市公司股东的净利润为12。23亿元到13。98亿元,同比增加40到60归属于上市公司股东的扣除非经常性损益的净利润同全栈量子计算公司RigettiComputing宣布计划通过与SPAC合并上市全栈量子计算公司RigettiComputing近日宣布已与SupernovaPartnersAcquisitionCompanyII,Ltd。(ldquoSupernovaIIr新疆移动传输网络优化项目集采总预算240万元从中国移动官网获悉,新疆移动今日启动20212022年传输网络优化项目集采。据采购公告显示,新疆移动本次传输网络优化主要涉及华为中兴和烽火设备,采购的主要内容包括(1)传输网络结构三星称受益于芯片价格上涨Q3利润将创三年来新高三星电子本周五表示,受存储芯片价格上涨和智能手机制造商新旗舰产品显示屏销量上涨的推动,该公司第三季度的营业利润可能将增长28,至三年来的最高水平。这家全球最大的存储芯片和智能手机制