腾讯混元AI大模型训练技术揭秘——太极AngelPTM

编者按:秉承“技术提效”理念,腾讯广告不断探索技术能力边界,全面升级广告系统,基于“一大平台、两大模型”持续精进创新研发,提升投放效率与投放效果,助力广告主实现高效的全域经营与生意增长。本篇文章是技术团队在大模型训练技术方向的新探索。


一、导言

最近,腾讯发布的混元AI万亿大模型登顶权威中文测评基准CLUE榜[1]并超越人类水平。混元AI大模型采用腾讯太极机器学习平台自研的训练框架AngelPTM,相比业届主流的解决方案,太极AngelPTM单机可容纳的模型可达55B,20个节点(A100-40Gx8)可容纳万亿规模模型,节省45%训练资源,并在此基础上训练速度提升1倍!

二、背景

Transformer模型凭借其出色的表达能力在多个人工智能领域均取得了巨大成功,如自然语言处理、计算机视觉和语音处理等。与此同时,随着训练数据量和模型容量的增加可以持续提高模型的泛化能力和通用能力,研究大模型成为了近两年的趋势。如下图所示,近几年NLP预训练模型规模的发展,模型已经从亿级发展到了万亿级参数规模。具体来说,2018年BERT[2]模型最大参数量为340M,2019年GPT-2[3]为十亿级参数的模型。2020年发布的百亿级规模有T5[4]和T-NLG[5],以及千亿参数规模的GPT-3[6]。在2021年末,Google发布了Switch Transformer[7],首次将模型规模提升至万亿。

然而GPU硬件发展的速度难以满足Transformer模型规模发展的需求。近四年中,模型参数量增长了十万倍,但GPU的显存仅增长了4倍。举例来说,万亿模型的模型训练仅参数和优化器状态便需要1.7TB以上的存储空间,至少需要425张A100(40G),这还不包括训练过程中产生的激活值所需的存储。在这样的背景下,大模型训练不仅受限于海量的算力, 更受限于巨大的存储需求。

为了以最小的成本训练大模型,太极AngelPTM基于ZERO策略,将模型的参数、梯度、优化器状态以模型并行的方式切分到所有GPU,并自研ZeRO-Cache框架把内存作为二级存储offload参数、梯度、优化器状态到CPU内存,同时也支持把SSD作为第三级存储。ZeRO-Cache为了最大化最优化的利用内存和显存进行模型状态的缓存,引入了显存内存统一存储视角,将存储容量的上界由内存扩容到内存+显存总和。同时将多流异步化做到了极致,在GPU计算的同时进行数据IO和NCCL通信,使用异构流水线均衡设备间的负载,最大化提升整个系统的吞吐。ZeRO-Cache将GPU显存、CPU内存统一视角管理,减少了冗余存储和内存碎片,增加了内存的利用率,将机器的存储空间压榨到了极致。

三、大模型训练优化遇到的挑战

3.1 多级存储访存带宽不一致

在大模型训练中,激活值、梯度位于GPU中,模型的FP16/FP32参数、优化器状态位于CPU中甚至位于SSD中,模型的前向和反向在GPU上进行运算,而参数更新在CPU做运算,这就需要频繁的进行内存显存以及SSD之间的访问,而GPU访问显存的带宽为1555GB/s,显存与内存数据互传的带宽为32GB/s,CPU访问内存、显存和SSD的带宽分别为200GB/s、32GB/s、3.5GB/s,多级存储访问带宽的不一致很容易导致硬件资源闲置,如何减少硬件资源的闲置时间是大模型训练优化的一大挑战。ZeRO-Cache通过多流异步以及PipelineOptimizer来提高硬件利用率。

博客
腾讯太极广告一站式机器学习平台的产品化之路
03-30 239
秉承“技术提效”理念,腾讯广告不断探索技术能力边界,全面升级广告系统,基于“一大平台、两大模型”持续精进创新研发,提升投放效率与投放效果,助力广告主实现高效的全域经营与生意增长。本篇文章来源于“腾讯技术工程”公众号,是腾讯技术团队在太极机器学习平台的产品化探索。结合对用户的习惯理解和功能沉淀,太极在产品层提供数据/特征工程,模型训练,模型服务三块。闭环了用户离线训练到在线服务的应用,包含了不同场景下的数据访问诉求,不同训练模型的诉求,在线服务可靠性的诉求。算法框架&组件层提供了机器学习、深度学习核心组件。
博客
腾讯自研万亿级NLP大模型,自动生成和衍生广告文案
03-03 1893
低成本可落地,混元AI大模型技术再现突破
博客
“太极”如何利用混部资源,助力腾讯广告降本增效
02-17 704
资源配置优化,大模型实现成本+效益双赢。
博客
2篇论文入选KDD 2022,腾讯广告持续探索效果提升新思路
08-15 250
腾讯广告共有2篇论文被KDD 2022收录,彰显了腾讯在数字广告领域的前沿视野与以技术探索效果边界的行动力。
博客
【岗位详情】腾讯广告后台开发工程师(北京)
11-26 256
年末大放送腾讯广告北京招聘专场高能来袭!在这里,你将收获广阔的发展平台飞速的自我成长与你并肩作战的伙伴优质贴心的福利......我们期待你的加入更期待与你一起在鹅厂奋斗、发光发热!...
博客
【岗位详情】腾讯广告策略产品经理(北京)
11-26 464
年末大放送腾讯广告北京招聘专场高能来袭!在这里,你将收获广阔的发展平台飞速的自我成长与你并肩作战的伙伴优质贴心的福利......我们期待你的加入更期待与你一起在鹅厂奋斗、发光发热!...
博客
【岗位详情】腾讯广告机制策略算法工程师(北京)
11-26 326
年末大放送腾讯广告北京招聘专场高能来袭!在这里,你将收获广阔的发展平台飞速的自我成长与你并肩作战的伙伴优质贴心的福利......我们期待你的加入更期待与你一起在鹅厂奋斗、发光发热!...
博客
【岗位详情】腾讯广告大数据开发工程师(北京)
11-26 1213
年末大放送腾讯广告北京招聘专场高能来袭!在这里,你将收获广阔的发展平台飞速的自我成长与你并肩作战的伙伴优质贴心的福利......我们期待你的加入更期待与你一起在鹅厂奋斗、发光发热!...
博客
腾讯广告北京招聘专场,offer等你解锁
11-26 204
年末大放送腾讯广告北京招聘专场来袭光速面试、极速offer等你来接“招”!点击查看本期其余4篇文章即可详细了解四大热招岗位心动不如行动快快投递吧!
博客
亲临ACM MM大会现场,围观各路技术高手参会心得
11-16 1515
腾讯广告算法大赛由腾讯广告主办,从2017年起每年举办一届,为选手提供来自真实业务的广告数据,兼顾难度和商业价值的赛题设计,以及丰厚的奖金奖励。2021腾讯广告算法大赛紧跟潮流,围绕当下火热的视频内容,把视频内容的深度理解设计为今年的比赛赛题。2021腾讯广告算法大赛还与计算机科学国际顶会、首屈一指的多媒体会议ACM MM(ACM Multimedia)合作,成为ACM MM 2021 Grand Challenge的竞赛内容,启发全世界的研究人员和机器学习实践者们关注这个命题以及探索方向。...
博客
腾讯广告的多媒体AI技术实战
11-03 736
01 引言网络广告是腾讯公司重要的商业模式之一,在广告收入持续提高的同时,对广告基础技术也提出了新的要求。面对复杂的广告商业生态,保障广告安全、完善广告形态、提升用户体验、提高广告收入,成为所有腾讯广告人必须要思考的问题。一条完整的广告链路包含的模块非常多,通常会有投放、定向、检索、粗排、精排、播放等等,每一个模块对于多媒体AI技术都有不同的需求。在此背景下,团队系统性地研发了广告多媒体AI技术平台,为整个广告链路提供完善的、精准的、高效的广告多媒体AI技术。当前,该平台已经成为腾讯广告的基础A
博客
腾讯广告“虚拟IP”赛题突出重围,入选第七届“互联网+”双创大赛产业命题
11-02 563
第七届中国国际“互联网+”大学生创新创业大赛已圆满落幕。本次大赛在原有四大赛道的基础上,首次开设产业命题赛道。与其他赛道相比,产业命题赛道更加突出赛题的真实性与可操作性,需要参赛团队将理论基础与真实赛题相结合,产出最佳方案。同时,该赛道的设立,也可以为当下企业面临的技术瓶颈和营销难题,寻求新的突破点。产业命题赛道吸引了众多互联网企业,腾讯作为具有代表性的互联网科技创新型企业,获得本次大赛“产业命题赛道优秀组织奖”;其中,腾讯广告提供的命题——《「虚拟IP」的“智”造创新》成功入围,揭榜命题的
博客
【附PPT下载】2021腾讯广告算法大赛 & ACM MM Grand Challenge录用论文揭晓
08-18 1371
​腾讯广告算法大赛由腾讯广告主办,从2017年起每年举办一届。来自真实业务的广告数据,兼顾难度和商业价值的赛题设计,以及丰厚的奖金奖励,是腾讯广告算法大赛的主要特点。2021腾讯广告算法大赛紧跟潮流,围绕当下火热的视频内容,把视频内容的深度理解设计为今年的比赛赛题。2021腾讯广告算法大赛还与计算机科学国际顶会、首屈一指的多媒体会议ACM MM(ACM Multimedia)合作,成为ACM MM 2021 Grand Challenge的竞赛内容,启发全世界的研究人员和机器学习实践者们关注...
博客
算法“视”界杯上演十强争锋,大赛终极一战圆满落幕
08-17 555
​8月16日,2021腾讯广告算法大赛“决赛十强答辩&获奖名单公布”于线上顺利举行,本场直播共有9600余位技术同学在“腾讯广告视频号、腾讯营销学院、腾讯视频、腾讯优图、腾讯云AI和云+社区”六大平台同步观看,这场精彩纷呈的算法竞技圆满落幕。打造算法“视”界杯,构创产学研交流平台2021腾讯广告算法大赛以“算法‘视’界杯”为主题,是算法界围绕视频广告前沿命题所打造的顶级赛事,自启动以来就引起了技术圈层的高度关注,最终吸引了上千家高校和企事业单位的4300余位选手报名。...
博客
【14:00开播】国际顶会强力加持,算法“视”界杯巅峰之战拉开帷幕!
08-16 214
​受疫情影响,2021腾讯广告算法大赛决赛答辩,将于今日14:00以网络直播形式举行,并由腾讯广告视频号、腾讯营销学院、腾讯视频、腾讯优图、腾讯云AI、云+社区六大平台同步直播。本届大赛由腾讯广告主办,腾讯云AI、腾讯大数据、腾讯招聘、腾讯高校合作以及英伟达联合举办。腾讯云智能钛机器学习平台(TI-ONE)与英伟达共同支持AI算法平台,同时与腾讯大数据Angel全栈机器学习平台共同提供算法资源支持。值得一提的是, 本届赛事的两大赛题“视频广告秒级语义解析”和“多模态视频广告标签”都成...
博客
双赛道20支战队解题思路大公开,线上Poster Session等你来
08-13 306
​2021腾讯广告算法大赛从4月启动,经过两个多月的激烈比赛,已经在7月7日分别得出了两个赛道的入围排行榜。8月16日 14:00,2021腾讯广告算法大赛将以网络直播形式举行决赛答辩。决赛当天,“视频广告秒级语义解析”赛道的十佳队伍将进行线上答辩,角逐赛道一的冠军之位,在此之后,大赛组委会将当场公布双赛道的获奖名单,揭晓获得百万奖金的最强战队。为了让大家共同见证最强战队的诞生感受算法比拼带来的震撼现开启线上直播预约通道PC端:扫描【海报中的二维码】移...
博客
最强战队实力交锋,算法“视”界杯终极一战即将上演
08-12 199
​8月16日 14:00,2021腾讯广告算法大赛即将迎来决赛答辩,一场精彩绝伦的算法巅峰对决即将上演。2021腾讯广告算法大赛由腾讯广告主办,腾讯云AI、腾讯大数据、腾讯招聘、腾讯高校合作以及英伟达联合举办,同时与计算机国际学术顶会ACM Multimedia强强联合,两大赛题双双入选“2021年ACM MM grand challenge”。经过两个多月的技术与实力的交锋,每支参赛队伍都展现出了非凡的算法实力,最终两大赛道共有20支队伍从激烈的竞争中脱颖而出,取得晋级决赛的资格。...
博客
敢闯会创,第七届中国国际“互联网+”双创大赛腾讯广告产业命题等你来战!
08-10 539
中国国际“互联网+”大学生创新创业大赛是覆盖全国所有高校、面向全体大学生、影响最大的高校双创盛会。第七届中国国际“互联网+”大学生创新创业大赛于2021年4月至10月举办,以“我敢闯,我会创”为主题,首次增设产业命题赛道。来自腾讯广告的《「虚拟IP」的“智”造创新》和《全真互联网的商业新生态探索》两大产业命题,经过大赛组委会的评审遴选后成功入围。命题详情如下:01「虚拟IP」的“智”造创新随着Z世代年轻人消费力的提升,以Z世代为目标人群的二次元文化,正在逐渐盘踞市场主体。在深度应用数
博客
揭秘 TI-ONE 大型赛事支撑能力是如何练就的
07-07 305
2021腾讯广告算法大赛初赛阶段已经结束,大赛共收到来自国内外上千家高校和企事业单位的4,335人报名参赛。作为大赛官方指定赛期唯一专用机器学习平台,腾讯云智能钛机器学习平台(以下简称 TI-ONE)不仅为所有参赛选手提供从数据预处理、模型构建、模型训练、模型评估的全流程训练能力,而且提供了多达1000张的GPU卡和500T的高性能存储,支持1500+选手顺利完成比赛。那么,连续四届作为腾讯广告算法大赛的支持平台,TI-ONE 究竟具备怎样的优势?基于此,小编邀请到了参与整个赛...
博客
腾讯专家献上技术干货,带你一览腾讯广告召回系统的演进
06-30 473
为拓宽选手们的技术视野,腾讯广告算法大赛官方邀请 NVIDIA 及腾讯的技术大咖,倾力打造了“技”高一筹系列专题直播。在6月24日的直播中,腾讯广告高级研发工程师陈帆,为大家详解了“腾讯广告召回系统的演进”,并对选手们的疑问进行了详细解答。这份来自腾讯专家的“干货”,请查收!直播FAQQ1:召回系统是什么意思?A:召回是整个推荐系统(或者说广告引擎)的第一阶段,主要根据用户和广告部分特征,从海量的广告库里,快速捞出一小部分与用户存在潜在兴趣匹配的广告队列,系统的后续环节都是针对这一队...

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
写文章

热门文章

  • 顶级评委“天团”亮相,强势围观算法大咖争夺战 34662
  • 冠军奖金50万,2020腾讯广告算法大赛广发“英雄帖” 17148
  • 官宣,重量级评委团强势加持腾讯广告算法大赛 16841
  • 腾讯广告算法大赛已启动,逆向算法,等你来战 12289
  • 算法“视”界杯来袭,2021腾讯广告算法大赛正式开启 5859

分类专栏

  • 腾讯算法大赛 121篇
  • 腾讯广告 73篇
  • 案例研究 10篇

最新评论

  • 【附PPT下载】2021腾讯广告算法大赛 & ACM MM Grand Challenge录用论文揭晓

    qq_25932543: 2021PPT

  • 腾讯专家献上技术干货,带你一览腾讯广告召回系统的演进

    大家一起学编程(python): 期待你更多好的作品

  • 今晚7点30,腾讯专家与你共探广告智能创意新可能

    大家一起学编程(python): 遇到好文章,我都会评论

  • SOLO参赛,赛道二周冠军“达尔文”分享上分秘诀

    大家一起学编程(python): 活到老,学到老

  • NVIDIA专家全面解析Merlin,GPU加速的推荐系统解决方案速速查收

    大家一起学编程(python): 6翻了

大家在看

  • Oracle完整截取汉字的方法
  • MATLAB基础应用精讲-【数模应用】正态性检验(附python、R语言和MATLAB代码实现) 34
  • 垂起固定翼+多旋翼无人机+集群组网:高低空域协同组网通信技术详解 390
  • 【C语言】解决不同场景字符串问题:巧妙运用字符串函数 1037
  • 一文搞懂Python循环小技巧 263

最新文章

  • 腾讯太极广告一站式机器学习平台的产品化之路
  • 腾讯自研万亿级NLP大模型,自动生成和衍生广告文案
  • “太极”如何利用混部资源,助力腾讯广告降本增效
2023年4篇
2022年1篇
2021年42篇
2020年73篇
2019年31篇

目录

目录

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

深圳SEO优化公司布吉网站优化软件价格红河百搜标王公司丹东网站设计多少钱黄冈设计网站报价吉祥SEO按天扣费哪家好宜昌网站排名优化报价信阳关键词按天收费哪家好黑河优秀网站设计多少钱河池网站改版多少钱鸡西网站搜索优化价格临猗网站优化软件多少钱沙井设计网站报价南京阿里店铺运营舟山关键词按天收费哪家好包头网络营销报价佛山网站优化推广烟台网络推广哪家好迪庆建网站价格新乡模板推广多少钱贺州网站排名优化周口百搜标王兴安盟关键词排名绵阳网站排名优化哪家好聊城阿里店铺托管多少钱吴忠英文网站建设报价石家庄营销型网站建设推荐上饶百度seo公司铜仁网站优化报价德宏优秀网站设计推荐晋城优化公司歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发 春山在望成都发生巨响 当地回应60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账 现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌 家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅:唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子19岁小伙救下5人后溺亡 多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人?开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

深圳SEO优化公司 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化