教育房产时事环球科技商业
投稿投诉
商业财经
热点动态
科技数码
软件应用
国际环球
晨报科学
新闻时事
信息智能
汽车房产
办公手机
教育体育
生活生物

ModelMesh走向开源使开发者能够大规模部署AI模型

  模型服务是AI用例的一个关键组成部分。它涉及从人工智能模型中提供推论,以响应用户的请求。那些涉足企业级机器学习应用的人知道,通常不是一个模型提供推论,而是实际上有数百甚至数千个模型在同步运行。
  这在计算上是一个非常昂贵的过程,因为你不可能在每次要提供请求时都启动一个专用容器。这对在Kubernetes集群中部署大量模型的开发者来说是一个挑战,因为存在一些限制,如允许的最大荚数和IP地址以及计算资源分配。
  IBM通过其专有的ModelMesh模型服务管理层为Watson产品(如Watson Assistant、Watson Natural Language Understanding和Watson Discovery)解决了这个难题。由于这些模型已经在生产环境中运行了几年,ModelMesh已经针对各种场景进行了全面测试。现在,IBM正在将这一管理层与控制器组件以及为模型服务的运行时间一起贡献给开放源码社区。
  ModelMesh使开发者能够在Kubernetes之上以"极端规模"部署AI模型。它具有缓存管理的功能,也是一个平衡推理请求的 路由器 ,模型被智能地放置在pod中,对临时中断提供弹性。ModelMesh的部署可以轻松升级,无需任何外部协调机制。它自动确保一个路由新请求到它之前已经完全更新和加载。
  在用一些统计数据解释ModelMesh的可扩展性时,IBM表示:
  一个部署在单个工人节点8vCPU x 64G集群上的ModelMesh实例能够打包20K个简单字符串模型。在密度测试的基础上,我们还对ModelMesh的服务进行了负载测试,通过发送成千上万的并发推理请求来模拟一个高流量的假日季节场景,所有加载的模型都以个位数毫秒的延迟进行响应。实验表明,单个工人节点支持20k个模型,每秒最多可进行1000次查询,并以个位数毫秒的延迟响应推理任务。
  IBM将ModelMesh贡献给了KServe GitHub组织,该组织早在2019年就由IBM、Google、彭博社、英伟达和Seldon联合开发。
  您可以在下面提到的各种GitHub存储库中查看ModelMesh的运用与实现:
  模型服务控制器
  用于协调模型放置和路由的 ModelMesh 容器 运行时适配器
  ModelMesh运行时适配器 - 在每个模型服务 pod 中运行的容器,充当 ModelMesh 和第三方模型服务器容器之间的中介,它还包含了负责从存储中检索模型的"拉动器"逻辑。
  triton-inference-server - NVIDIA的Triton推理服务器
  seldon-mlserver - Python MLServer,是KFServing的一部分
  【来源:cnBeta.COM】

2小时1度电!NVIDIARTX3090Ti功耗高达480W今天,某厂商的旗舰型RTX3090Ti规格参数被泄露出来,可以看到满血的10752个流处理器,核心频率游戏静音模式下为1850MHz,极限模式下可达1900MHz,而显存是384b猫头鹰更新产品路线图纯白风扇下一代NHD15散热器将至据外媒TomsHardware消息,散热器厂商Noctua猫头鹰近日更新了产品路线图,公布了2022年即将推出的新产品。从图中可以看到,猫头鹰计划于第一季度发布新款120mm双塔散消息称英伟达要求厂商暂停RTX3090Ti显卡生产根据外媒TweakTown消息,英伟达决定要求板卡厂商暂停GeForceRTX3090Ti显卡的生产,此前有消息称产品计划于1月27日发售。值得注意的是,英伟达从未公布RTX309ROG发布新款WiFi6E万兆路由四频七网口在CES2022活动中,ROG发布两款万兆路由,分别是支持WiFi6E的RaptureGTAXE16000和支持WiFi6的RaptureGTAX11000Pro。GTAXE160英特尔至强处理器未来将支持浸入式液冷技术英特尔的至强服务器和数据中心处理器很快就能通过使用浸入式液体冷却技术进行冷却。该公司目前正与绿色革命冷却公司(GreenRevolutionCooling)密切合作,为不同的英特尔机械革命将推无界轻薄本搭载12代酷睿RTX2050据机械革命官方消息,机械革命宣布将在1月25日的新品发布会上发布全新的轻薄本系列mdashmdash无界。该系列将搭载英特尔12代酷睿处理器,并可选英伟达RTX2050显卡。据了解年度最佳游戏登陆PC开发者支持超宽屏难度巨大曾经获奖无数的超级大作战神4即将于1月15日正式登录PC平台,而今天,该游戏更是开启了正式预载,玩家们很快就可以在超高清画质下体验这款杰作。据悉,作为原游戏的PC增强版,战神4将支外媒通用汽车拟斥资65亿美元在密歇根州新建工厂据国外媒体报道,据州政府文件显示,通用汽车与LG能源解决方案的合资企业UltiumCells将于下周宣布在密歇根州投资超过65亿美元,建设新电动卡车和电池厂。密歇根州战略基金周五表分体式水冷散热!机械革命预热12代笔记本新品据机械革命官方消息,2022年新春发布会将于1月25日1600举行,届时将推出两款搭载12代处理器的游戏本及轻薄本新品。据悉,旷世系列游戏本将最高搭载14核的i912900H处理器联想2022款拯救者游戏本拥有独显直连混合输出纯集显三模式联想拯救者官方宣布2022款游戏本产品将拥有独显直连混合输出和纯集显三个模式。据介绍,在独显直连模式,独显将直接输出高屏幕,性能更强IGPU模式只启用核显,更加省电混合输出模式会根最薄外星人笔记本现身12代酷睿RTX3060仅14。5mm厚在今年的CES2022,外星人发布了全新X14系列游戏本,这是外星人旗下迄今为止最薄的游戏笔记本电脑,厚度为0。57英寸(约14。48毫米),重量为1。84kg。显示方面,这款笔记
升级M1XMiniLED!曝新MacBookPro将在几周后发布上周,苹果正式宣布将于北京时间9月15日凌晨1点(明晚)召开秋季新品发布会,大家期待已久的iPhone13系列也将正式亮相。按照此前消息,除了iPhone13之外,苹果还会在秋季带苹果太坑!M1MacBookPro屏幕破裂不免费维修之前有网友称,自己入手不久的苹果M1处理器MacBookAirPro等笔记本出现了屏幕裂缝的情况。许多用户声称,他们在没有施加任何不当压力的情况下打开他们的设备,但却发现MacBo产品经理vivoX70顶级影像旗舰该有的都有定价也许不会让所有人满意今天晚上1930,vivoX70系列将正式发布。本次发布会将会推出vivoX70vivoX70Pro和vivoX70Pro三款新品,该系列产品将影像作为重要卖点。今天下午,vivo台媒台积电计划为7纳米技术建造6家工厂,最快2023年启动据台湾经济日报,消息称台积电将在中国台湾高雄打造另一生产重镇,主要以7纳米切入,初步规划在当地建造6家工厂,业界评估总投资额将高达数千亿新台币,最快2023年启动。台积电表示,设厂强得很!iPhone13Pro官方宣传文案引热议网友接地气怎么样?是打算入手iPhone13系列,还是等等双11抢一波降价iPhone12?在制定购机计划前,不妨先来看看今年的iPhone13官方宣传文案。众所周知,苹果每次在自家新产品文腾讯共同富裕专项计划500亿元资金首期将开始落地9月9日消息今日上午,署名为ldquo腾讯总办rdquo的ldquo99公益日rdquo邮件发送至腾讯全体员工。腾讯在全员信中称,如果一个企业的发展和其对社会所作出的贡献之间,没有腾讯回应被约谈从严落实未成年人防沉迷的相关规范和要求今晚腾讯网易等多家游戏企业被约谈,刚刚腾讯方面发表回应称,将认真学习约谈精神,在相关主管部门的指导下,从严落实未成年人防沉迷的相关规范和要求,强化内容安全与合规,坚持正确的价值导向游戏业半年营收超1500亿中央宣传部约谈腾讯网易等游戏企业根据中国音数协游戏工委和中国游戏产业研究院联合发布的2021年16月中国游戏产业报告显示,2021年1月至6月,国内游戏市场实际销售收入1505亿元,同比增长7。89。游戏行业高营最强小屏机?iPhoneSE3外形曝光刘海全面屏后置单摄下周三凌晨1点,iPhone13系列就要跟大家正式见面了,此前消息称今年依旧推出四款机型,前代销量拉垮的mini机型还在,这也将是市面上唯一的小屏旗舰机型。遗憾的是,此前消息称由于史诗级更新新款Kindle支持TypeC沉寂三年后亚马逊终于发布新款6。8寸Kindle,终于弃用USBA改用USBC除面板由6寸升级为6。8寸外,还下放了色温可变技术,并重新布设了背光元件。面板像素依然为300PPI,彻底告别天使眼!新宝马3系车机性能暴增20倍宝马3系自改款之后,凭借着出色的表现在今年上半年累计销量就达到了10万辆,远超同级别的奔驰C级和奥迪A4。近日,有外媒曝光了一组新款宝马3系插混版谍照,该车有望于2022年夏季亮相