皇上,还记得我吗?我就是1999年那个Linux伊甸园啊-----24小时滚动更新开源资讯,全年无休!

IBM 开源 ModelMesh,使开发者能够大规模部署 AI 模型

IBM 近日宣布,已将其用于公司内部的 ModelMesh 模型服务开源,并贡献给 KServe 开源社区。ModelMesh 专为大规模、高密度和频繁变化的模型用例而设计,可以帮助开发者扩展 Kubernetes。

IBM 开源 ModelMesh,使开发者能够大规模部署 AI 模型

模型服务是人工智能领域的一个重要组成部分。它使用人工智能模型中提供的推理来响应用户的请求。那些接触过企业级机器学习应用的用户或开发者应该知道,它们通常不是由一个模型提供推理,实际上是由数百甚至数千个模型在串联运行。由于 AI 模型的计算成本很高,因为你不可能在每次要提供请求时都启动一个专用容器。

除此之外,因为存在一些限制,这对在 Kubernetes 集群上部署大量模型的开发者来说也是一个挑战:

  • 计算资源限制
  • 最大 pod 限制(Kubernetes 建议每个节点最多有 100 个 pods)
  • 最大 IP 地址限制(一个拥有 4096 个 IP 的集群可以部署大约 1000 到 4000 个模型)

IBM 通过其专有的 ModelMesh 模型服务管理层为 Watson 产品(如 Watson Assistant、Watson Natural Language Understanding 和 Watson Discovery)解决了这个难题。由于这些模型已经在生产环境中运行了多年时间,ModelMesh 已经针对各种场景进行了全面测试。现在,IBM 将这一管理层与控制器组件以及模型服务运行时一起贡献给了开源社区。

ModelMesh 使开发者能够在 Kubernetes 之上以 “极大规模” 部署 AI 模型。它具有缓存管理的功能,也充当一个平衡推理请求的路由。模型被智能地放置在 pods 中,并且能够适应临时中断。开发者无需任何外部协调机制就可以轻松升级部署的 ModelMesh。它可以自动确保一个模型在路由新的请求之前已经完全更新和加载。

IBM 用一些统计数据解释了 ModelMesh 的可扩展性:

一个部署在单个工作节点 8vCPU x 64G 集群上的 ModelMesh 实例能够打包 2 万个简单字符串模型。除了密度测试之外,我们还通过发送数千个并发推理请求来对 ModelMesh 服务进行负载测试,以模拟高流量的假日场景,所有加载的模型都以个位数毫秒的延迟做出响应。我们的实验表明,单个工作节点支持 2 万个模型,每秒最多 1000 个查询,并以个位数毫秒的延迟响应推理任务。

ModelMesh 与 KServe 相结合,还将为部署在生产中的模型增加可信的人工智能指标,如可解释性与公平性。目前该项目已托管至  GitHub 平台,可点击链接进一步了解该项目。

来源:开源中国  作者:Alias_Travis

相关推荐

  • 每日文章精选 2024 06 15
  • 作为基于 GTK4 的 Evince 分叉,GNOME Papers 文档查看器正在取得进展
  • 每日文章精选 2024 06 14
  • KDE Gear 24.05.1 改进了 Elisa、Spectacle、KCalc 和其他 KDE 应用程序
  • 每日文章精选 2024 06 13
  • Ubuntu 谈 RISC-V 八核笔记本电脑
  • FreeBSD 社区调查证实 ZFS 是他们最看重的服务器功能
  • 每日文章精选 2024 06 12

近期文章

最新评论

  • zhujun_sh 5天前说:
    中国逻辑也开始出口了,同时也要加大国内生态文明建设[鲜花]
  • 精神病患粉笔头_GNU 5天前说:
    能在不用快捷指令和第三方app的前提下让他只在工作日叫醒我吗?
  • 虫______子 1周前 (06-09)说:
    为什么你发的所有微博网页链接都打不开?内容只显示一点点,链接又打不开,那要看什么?看标题?
  • zhujun_sh 1周前 (06-06)说:
    牛皮往大里吹的一个典型表现是没有具体联系负责人和一般人都感受不到这种牛逼文字背后的逻辑!
  • zhujun_sh 2周前 (05-30)说:
    追求最先进的芯片制程工艺远远没有用好硬件,做扎实测试,建设完善的安全系统和构建有文化的软件工具链和生态来的重要!
  • zhujun_sh 2周前 (05-30)说:
    使用 HTTP/3 时,处理特制的 QUIC 会话时,可能会导致工作进程崩溃、工作进程内存泄露(在MTU大于4096字节的系统上 在 MTU 大于 4096 字节的系统上可能导致工作进程内存泄露,或造
  • 微博音频 3周前 (05-27)说:
    微博已支持音频服务,一起来#听见微博#发现你喜爱的音频作者吧~
  • 杜蕾斯这厮 4周前 (05-20)说:
    intel现在是蒸蒸日下

分类目录

  • Unix家族
  • 人物介绍
  • 企业应用
  • 企鹅看世界
  • 使用经验
  • 开源美图
  • 开源资讯
  • 技术前沿
  • 数据库类
  • 新手入门
  • 未分类
  • 极客漫画
  • 版本更新资讯
  • 系统安全
  • 系统管理
  • 编程开发
  • 网站头条
  • 观点评论
  • 软件更新资讯

深圳SEO优化公司达州网站设计报价潍坊外贸网站建设哪家好漯河网站建设迁安模板网站建设公司抚顺品牌网站设计价格诸城网站优化按天收费多少钱日照网站优化按天计费价格黄冈网站seo优化多少钱定西网站优化按天扣费推荐文山外贸网站制作价格茂名网站搭建黑河SEO按天收费公司抚顺网站优化推广公司郴州模板推广公司开封网站优化按天扣费哪家好河源网站搭建报价株洲至尊标王银川关键词按天扣费哪家好张掖网站关键词优化哪家好龙岗网站优化推广多少钱中山阿里店铺托管岳阳外贸网站建设多少钱晋中企业网站制作价格陇南营销网站价格永湖seo排名推荐永州网站优化排名哪家好濮阳seo网站推广推荐漳州阿里店铺运营价格龙岗SEO按天计费公司甘南建站公司歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发 春山在望成都发生巨响 当地回应60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账 现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌 家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅:唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子19岁小伙救下5人后溺亡 多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人?开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

深圳SEO优化公司 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化