百度重磅打造飞桨文心大模型体系,提出支撑大模型产业落地三个关键路径

5 月 20 日,由深度学习技术与应用国家工程研究中心主办、飞桨承办的 WAVE SUMMIT 2022 深度学习开发者峰会线上举行。百度业界首发的文心·行业大模型成为峰会一大亮点。

联合国网、浦发首发行业大模型,开启大模型进化格局

文心·行业大模型的核心特色是「行业知识增强」,基于通用数据训练的文心大模型,加上挖掘行业应用场景中,大量存在的行业特色大数据和知识,进一步提升大模型对行业应用的适配性。在能源、金融领域,百度与国家电网、浦发银行联合研发了行业大模型。

能源电力行业,百度和国网研发了国网-百度·文心大模型。基于通用文心大模型,在海量数据中挖掘了电力行业数据,百度与国网专家们一起,引入电力业务积累的样本数据和特有知识,并且在训练中,结合双方在预训练算法和电力领域业务与算法的经验,设计电力领域实体判别、电力领域文档判别等算法作为预训练任务,让文心大模型深入学习电力专业知识,在国网场景任务应用效果提升。

国家电网有限公司数字化工作部人工智能工作负责人蒋炜博士表示,作为中央企业数字化转型的排头兵,国家电网联合百度共同打造行业级人工智能基础设施,探索研发电力人工智能联合大模型。不仅提升了传统电力专用模型的精度,而且大幅降低了研发门槛,实现了算力、数据、技术等资源的统筹优化。下一步,国家电网公司将继续深化双方技术合作,推动人工智能大模型在电力领域的技术攻关及应用探索,面向更典型的电力业务场景,构建更具电力特色的人工智能大模型。

相似的思路,在金融领域,百度和浦发研发了浦发-百度·文心大模型。基于通用文心大模型挖掘金融行业数据,结合浦发场景积累的行业数据与知识,双方技术和业务专家一起设计了针对性的财报领域判别、金融客服问答匹配等预训练任务,让文心大模型学习到金融行业的知识,在浦发典型任务应用效果显著提升。

上海浦东发展银行总行信息科技部副总经理万化提到,浦发银行与百度在 AI 的多个方面实现优势互补,联合研发了面向金融行业的大模型「浦发-百度·文心」,并且已在金融行业各类智能场景进行验证。未来,浦发银行将与百度继续深入合作,在现有金融行业大模型的基础上不断迭代,持续地降低金融 AI 应用落地的门槛。

国家电网和浦发银行是各自领域的头部力量,对所处行业的业务知识及技术理解十分深入,百度则在 AI 领域深耕十余年,不断探索人工智能的创新应用。行业大模型也并非是把 AI 技术和行业场景的简单叠加,而是需要强强联合研发,探索方法与机制,共推大模型在行业中深度应用。这不是百度第一次与外部联合研发大模型,此前,百度联合鹏城实验室打造了全球首个知识增强千亿大模型鹏城-百度·文心,参数规模达 2600 亿,在机器阅读理解、文本分类、语义相似度计算等 60 多项任务取得最好效果,并在 30 余项小样本和零样本任务上刷新基准。

百度首发行业大模型,探索出一套行之有效的大模型产业落地打法,让大模型「能用、可用」,规模化落地价值显现。

提出支撑大模型产业落地三个关键路径,飞桨全面支撑大模型规模化生产和产业级应用

百度引领大模型在行业的深度应用,这与文心大模型的整体构想和顶层设计密不可分。

峰会上,百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜指出,文心大模型的两大特色是「产业级」和「知识增强」。她表示,「今年是大模型产业落地的关键年,要做好落地,需解决的关键问题是,前沿的大模型技术如何与真实场景的方方面面要求相匹配。「

吴甜针对这个问题清晰地给出大模型产业落地三个关键路径:

一是要建设更适配应用场景的模型体系,包含学习了足够多数据与知识的基础大模型,面向常见 AI 任务专门学习的任务大模型,以及首发的、引入行业特色数据和知识的行业大模型。这次百度一口气发布了 10 个大模型,刷新文心全景图,模型体系格局显现。

二是提供更有效的工具和方法,充分考虑落地应用的全流程问题。发布大模型开发套件、API 和内置了文心大模型能力的 EasyDL 和 BML 开发平台,全方位降低应用门槛降低应用门槛,端到端、全方位发挥文心大模型效能。

三是打造开放的生态,以生态促创新。文心大模型不紧与飞桨共享生态,还新发布了基于文心大模型的创意社区——旸谷大模型创意与探索社区,让用户零距离感受文心大模型的魅力和应用创新潜力,并提供最新大模型 API 试用。

这三大关键路径并驾齐驱,剑指产业落地。可以说,文心大模型来源于产业实践,服务于产业实践,在实践中建设、发展、壮大。

文心大模型是深度学习平台飞桨产业级模型库中的重要一员,飞桨训练推理一体化技术,全面支撑着文心大模型规模化生产和产业级应用。

众所周知,训练大模型的挑战主要来自于「大」,模型参数规模巨大,且不同模型和算力平台特性的差异,都是大模型训练中的现实挑战。飞桨解决了大模型训练过程中的多个世界性难题,4D 并行混合训练技术以及端到端自适应分布式训练框架,为大模型的训练过程保驾护航,使大模型训练速度大幅提升,模型效果更优。

相比训练环节而言,大模型推理部署则面临更大的挑战,主要是解决算力消耗问题。对应用的企业和开发者来说,需采取蒸馏、裁剪等模型小型化的技术,最后使大模型以合适的体量进行部署使用。这也是实现大模型产业应用落地的关键所在。在大模型落地部署层面,飞桨推出了针对大模型的压缩、推理、服务化全流程部署方案,帮助大模型更好落地。

文心大模型正通过飞桨开源开放平台、百度智能云等赋能到工业、能源、金融、通信、媒体、教育等各行各业。大模型的规模化落地应用,飞桨平台的不断降低门槛,也印证着百度 CTO 王海峰所言:「人工智能越来越普惠,正在赋能千行百业,惠及千家万户。」

来源:华北网

百度

七日热门

深圳SEO优化公司哈尔滨企业网站建设公司阿坝百度爱采购多少钱扬州设计网站哪家好池州外贸网站建设价格梧州网站制作设计推荐河池营销网站推荐永州模板推广哪家好沈阳英文网站建设长沙优秀网站设计公司盘锦网络广告推广巢湖网络营销上饶SEO按天扣费公司固原网站优化推广推荐庆阳如何制作网站公司松原营销网站哪家好沙井外贸网站建设公司吉安百度网站优化排名多少钱南通SEO按天计费报价临夏SEO按天计费报价广东模板网站建设公司张掖优化哪家好大芬至尊标王多少钱眉山网站制作推荐大同网络推广推荐四平网站优化软件多少钱六安网站优化按天收费公司临夏网站优化推广报价濮阳营销网站公司合肥网站设计模板报价济源外贸网站建设价格歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发 春山在望成都发生巨响 当地回应60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账 现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌 家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅:唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子19岁小伙救下5人后溺亡 多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人?开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

深圳SEO优化公司 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化