从GLM-130B到ChatGLM：大模型预训练与微调

最新推荐文章于 2024-03-12 23:24:54 发布

Kun Li

最新推荐文章于 2024-03-12 23:24:54 发布

阅读量2.8k

收藏 11

点赞数 1

分类专栏：大语言模型文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接： https://blog.csdn.net/u012193416/article/details/131034265

版权

大语言模型专栏收录该内容

37 篇文章 1 订阅

订阅专栏

【报告】从GLM-130B到ChatGLM：大模型预训练与微调_哔哩哔哩_bilibili本报告为GLM技术团队成员在「NLG专委会真知论坛（GenTalk第7期）」的报告分享，报告中详细讲述了GLM-130B预训练过程，以及ChatGLM开发过程，并提出了几点大模型开发心得。本论坛另有复旦大学MOSS团队成员孙天祥的相关报告，可参考：https://www.bilibili.com/video/BV1is4y1i7cZ, 视频播放量 4201、弹幕量 7、点赞数 198、投硬币枚数 95、收藏人数 445、转发人数 79, 视频作者 ChatGLM, 作者简介让机器像人一样思考，相关视频：ChatGLM 部署完体验，这效果真牛逼！—— 斯坦福大学大模型中心评测，GLM-130B 是亚洲唯一入选的大模型👍🏻，【真GPT-4】直接访问，还没用过？，【原生GPT-4接口】直接使用，不限次数。还没用过4.0？，【官方教程】ChatGLM-6B 微调：P-Tuning，LoRA，Full parameter，从入门到精通：掌握 ChatGLM6B 模型的流式接口用法，Falcon40B荣登开源AI大模型排行榜首位，【官方教程】VisualGLM技术讲解，清华发布VisualGLM-6B多模态模型 ChatGLM-6B升级版，【官方教程】XrayGLM微调实践，演示ChatGLM-6B加载本地知识库精确回答财税问题https://www.bilibili.com/video/BV1iu4y1Z7bv/?spm_id_from=333.337.search-card.all.click&vd_source=4aed82e35f26bb600bc5b46e65e25c22

前面是类似bert的mask，后面自回归的预测mask的词

一个数据过四遍就效果不太好了。

130B，8台80G，24台40G。

1
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
从GLM-130B到ChatGLM：大模型预训练与微调

【原生GPT-4接口】直接使用，不限次数。，【官方教程】ChatGLM-6B 微调：P-Tuning，LoRA，Full parameter，从入门到精通：掌握 ChatGLM6B 模型的流式接口用法，Falcon40B荣登开源AI大模型排行榜首位，【官方教程】VisualGLM技术讲解，清华发布VisualGLM-6B多模态模型 ChatGLM-6B升级版，【官方教程】XrayGLM微调实践，演示ChatGLM-6B加载本地知识库精确回答财税问题。130B，8台80G，24台40G。
复制链接

扫一扫

CSDN认证博客专家 CSDN认证企业博客

729: 原创

1927: 周排名

677: 总排名

296万+: 访问

: 等级

2万+: 积分

1万+: 粉丝

1994: 获赞

420: 评论

5031: 收藏

写文章

热门文章

np.unique( )的用法 121382
opencv中颜色空间转换函数 cv2.cvtColor() 107510
np.argwhere（）的用法 103941
tf.reduce_sum( ) 函数用法 78082
pandas中的set_index( )函数 75371

分类专栏

图像视频生成大模型付费 160篇
多模态大语言模型 26篇
大语言模型 37篇
虚拟数字人技术 4篇
图像分类 48篇
目标检测 46篇
图像分割与抠图 43篇
应用算法 41篇
深度学习处理遥感影像 25篇
文本篡改检测识别与OCR 13篇
深度机器学习组件 47篇
Python学习 79篇
cpp语言 30篇
算法部署 25篇
函数用法 52篇
面试题集合 4篇
安装报错集合 45篇

最新评论

VisualGLM-6B微调（V100）
大数据2024: 这篇文章是优质之作，内容充实，结构明晰，语言流畅且通俗易懂，适合广大读者阅读。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
qwen-vl微调
2401_84519718: 干货满满，实用性强，博主的写作风格简洁明了，让人一目了然。文章涵盖了很多实用的知识点。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
主流抠图算法trimap-based/free
一杯白开水儿: 请问测试下来哪个效果更好？相比RVM和BGMV2怎么样
geneface++:Generalized and stable real-time audio-driven 3d talking face generation
星空真懒: 优质好文，支持支持。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
overall accuracy 总体精度的计算
G鲲鹏展翅Y: 我的oa为啥返回是0？

最新文章

controlnet的preprocessor类型
[SaaS]建筑领域的sd应用
swift微调多模态大语言模型

目录

目录

分类专栏

图像视频生成大模型付费 160篇

多模态大语言模型 26篇

大语言模型 37篇

虚拟数字人技术 4篇

图像分类 48篇

目标检测 46篇

图像分割与抠图 43篇

应用算法 41篇

深度学习处理遥感影像 25篇

文本篡改检测识别与OCR 13篇

深度机器学习组件 47篇

Python学习 79篇

cpp语言 30篇

算法部署 25篇

函数用法 52篇

面试题集合 4篇

安装报错集合 45篇

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

成就一亿技术人!

发出的红包

使用余额支付

点击重新获取

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。

深圳SEO优化公司重庆百度网站优化排名公司黄南网站开发多少钱泉州网站制作设计价格泰安百度seo多少钱玉树网站设计模板公司南阳网站建设设计价格新乡百度竞价包年推广报价丹东高端网站设计商丘网站优化按天扣费多少钱金华建网站哪家好岳阳优秀网站设计价格定西至尊标王石岩网站改版公司岳阳网站开发价格安庆品牌网站设计公司随州设计网站淄博品牌网站设计公司榆林网站设计报价黄冈网页设计多少钱马鞍山网站搭建报价铜川网站设计多少钱龙岩建站哪家好嘉兴关键词按天收费多少钱永州网站制作哪家好福州百度关键词包年推广报价宝鸡企业网站制作推荐光明百度网站优化推荐恩施网站搭建公司醴陵建设网站株洲英文网站建设哪家好歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发春山在望成都发生巨响当地回应 60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警 #春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅：唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子 19岁小伙救下5人后溺亡多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人？开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头 315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU 恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

深圳SEO优化公司 XML地图 TXT地图虚拟主机 SEO 网站制作网站优化