MPT-7B：开源、可商用的大模型

大模型

白羽中 2023-05-08 10:00 分享

以下文章来源于www.mosaicml.com

MPT-7B：MosaicML发布的的MPT(MosaicML Pretrained Transformer)模型族，包括MPT-7B，一个从头开始训练的Transformer，用1T文本和代码Tokens进行训练。 MPT-7B在MosaicML平台上进行了9.5天的训练，没有人为干预，成本约为200,000美元，可用于商业用途。

此外，MosaicML还发布了三个优化过的MPT-7B变体：MPT-7B-Instruct，MPT-7B-Chat和MPT-7B-StoryWriter-65k+，用于指令、对话生成和超长输入。所有模型都可用于预训练，微调和部署。

可以训练、微调和部署自己的私人MPT模型。除了基本的MPT-7B外，我们还发布了三个微调的型号：MPT-7B-Instruct、MPT-7B-Chat和MPT-7B-StoryWriter-65k+，最后一个使用65k令牌的上下文长度。

https://www.mosaicml.com/blog/mpt-7b

获得了商业使用许可（与LLaMA不同）。

在大量的数据上进行训练（与LLaMA的1T标记相比，Pythia为300B，OpenLLaMA为300B，而StableLM为800B）。

由于ALiBi，准备处理极长的输入（我们在高达65K的输入上进行训练，可以处理高达84K的输入，而其他开源模型为2K-4K）。

为快速训练和推理进行了优化（通过FlashAttention和FasterTransformer）。配备了高效的开源训练代码。
我们在一系列基准上对MPT进行了严格的评估，MPT达到了LLaMA-7B设定的高质量标准。

点赞收藏评论分享到Link

沙发等你来抢

去评论

深圳SEO优化公司汕头网站seo优化内江网站优化排名推荐驻马店关键词排名推荐丹东高端网站设计肇庆网站制作价格吕梁百搜标王价格银川网站排名优化多少钱杭州高端网站设计哪家好江门网络推广价格珠海百度网站优化排名多少钱黔南网站推广工具推荐朝阳建网站铜川网站优化按天扣费甘孜网站推广方案价格赣州网络营销公司喀什营销网站报价昌都网站优化按天收费哪家好深圳百度竞价价格柳州优化鹰潭SEO按天扣费淮安网站优化按天收费价格塔城网站搭建哪家好深圳网站优化按天扣费报价张家界网站优化推广推荐洛阳网站设计公司延安网站关键词优化公司唐山seo网站推广定西外贸网站设计哪家好海西网站开发公司临汾外贸网站制作哪家好歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发春山在望成都发生巨响当地回应 60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警 #春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅：唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子 19岁小伙救下5人后溺亡多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人？开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头 315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU 恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

深圳SEO优化公司 XML地图 TXT地图虚拟主机 SEO 网站制作网站优化