《VisualGLM-6B的原理与微调》资料学习分享

清华大学在发布chatGLM-6B后很快速的时间内就又发布了VisualGLM-6B模型,不可谓不强大,VisualGLM-6B官方项目地址在这里,如下所示:

 

VisualGLM-6B 是一个开源的,支持图像、中文和英文的多模态对话语言模型,语言模型基于  ChatGLM-6B,具有 62 亿参数;图像部分通过训练  BLIP2-Qformer 构建起视觉模型与语言模型的桥梁,整体模型共78亿参数。

VisualGLM-6B 依靠来自于  CogView 数据集的30M高质量中文图文对,与300M经过筛选的英文图文对进行预训练,中英文权重相同。该训练方式较好地将视觉信息对齐到ChatGLM的语义空间;之后的微调阶段,模型在长视觉问答数据上训练,以生成符合人类偏好的答案。

VisualGLM-6B 由  SwissArmyTransformer(简称sat) 库训练,这是一个支持Transformer灵活修改、训练的工具库,支持Lora、P-tuning等参数高效微调方法。本项目提供了符合用户习惯的huggingface接口,也提供了基于sat的接口。

结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4量化级别下最低只需8.7G显存)。

VisualGLM-6B 开源模型旨在与开源社区一起推动大模型技术发展,恳请开发者和大家遵守开源协议,勿将该开源模型和代码及基于该开源项目产生的衍生物用于任何可能给国家和社会带来危害的用途以及用于任何未经过安全评估和备案的服务。目前,本项目官方未基于 VisualGLM-6B 开发任何应用,包括网站、安卓App、苹果 iOS应用及 Windows App 等。

由于 VisualGLM-6B 仍处于v1版本,目前已知其具有相当多的 局限性,如图像描述事实性/模型幻觉问题,图像细节信息捕捉不足,以及一些来自语言模型的局限性。尽管模型在训练的各个阶段都尽力确保数据的合规性和准确性,但由于 VisualGLM-6B 模型规模较小,且模型受概率随机性因素影响,无法保证输出内容的准确性,且模型易被误导(详见局限性部分)。在VisualGLM之后的版本中,将会着力对此类问题进行优化。本项目不承担开源模型和代码导致的数据安全、舆情风险或发生任何模型被误导、滥用、传播、不当利用而产生的风险和责任。

这里本文主要是分享之前清华大学举行的分享汇报资料,感兴趣的话可以一起学习下:

 

Together_CZ
关注 关注
  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
清华大模型Chatglm2-6B微调方法和微调模型使用方式(非常仔细,值得借鉴)
01-22
清华大模型Chatglm2-6B微调方法和微调模型使用方式(非常仔细,值得借鉴)
VisualGLM-6B:支持图像、中英文的多模态对话模型解读与本地化部署
梦坠凡尘
07-03 2654
之后的微调阶段,模型在长视觉问答数据上训练,以生成符合人类偏好的答案。VisualGLM-6B 是一个开源的,支持图像、中文和英文的多模态对话语言模型,语言模型基于 ChatGLM-6B,具有 62 亿参数;以CogView为例,输入token既包含了文本token,也包含了Image token,所以Transformer既建模了文本也建模了图像,并且建模了文本到图像这种跨模态的过程。在生成图像长描述的时候,距离图像较远时,语言模型的将占主导,有一定可能根据上下文生成并不存在于图像的内容。
清华多模态大语言模型visualglm部署+微调踩坑记录
weixin_42179685的博客
01-10 1092
本以为微调visualglm能像chatglm3那样最多碰点版本问题,结果发现小坑不断,得不停查资料,而且大佬们大都去看cogvlm了。mp_rank_00_model_states.pt+latest+model_config.json,正是缺了这些web_demo.py跑不了。微调运行后在Linux中始终无法开启deepspeed,然后卡死,说torch_extensions/py310******文件占用之类的问题。因此请用web_demo_hf.py别用web_demo.py,原因后面会讲。
VisualGLM:推理+微调+sat的简单使用
最新发布
ResumeProject的博客
01-12 1809
本段落提供了一个简单且能独立运行的sat模型例子,感觉sat的BaseModel更多还是更关注注意力模型的微调,本段落提供的例子没有很强的逻辑含义,推荐看官方的。注:模型中有两个mixins,VIT的有参数,qformer的为空。
【原创】用 VisualGLM 进行AIGC多模识别和内容生成
heiyeluren的blog(黑夜路人的开源世界)
06-04 2413
通过本文快速了解类似于GPT-4一样的多模大语言模型VisualGLM的使用和基本工作原理
VisualGLM】大模型之 VisualGLM 部署
Talk is cheap. Show me the code
08-08 1304
大模型之 VisualGLM 部署 大模型之 VisualGLM 部署 大模型之 VisualGLM 部署 VisualGLM 主要做的是通过图像生成文字,而 Stable Diffusion 是通过文字生成图像。一种方法是将图像当作一种特殊的语言进行预训练,还有一种是将图像特征对齐到预训练语言模型,可充分利用语言模型,并且无缝衔接多轮对话能力,但提取图像语义特征会损失底层信息。
VisualGLM - 多模态中英双语对话语言模型
伊织看世界
10-03 453
关于 VisualGLM 背景: 多模态预训练 背景: ChatGLM-6B VisualGLM-6B 训练 微调 不同微调方案需要的资源 Lora merge
本地部署 VisualGLM-6B
engchina的专栏
05-20 3871
本地部署 VisualGLM-6B
构建自己的GPT-4:用 VisualGLM 进行多模AIGC使用及技术原理
AI炼丹师的专栏
07-04 131
【原创】构建自己的GPT-4:用 VisualGLM 进行多模AIGC使用及技术原理 - 掘金
Visualglm-6b
liguandong
06-06 1342
【官方教程】XrayGLM微调实践,(加强后的GPT-3.5)能力媲美4.0,无次数限制。
chatglm-6b项目
05-10
内容概要:这是一个chatglm-6b项目源代码,可以轻松在自己电脑部署大模型。请输入问题后点击提交,可以看到想要的答案 技术方案:后端python、前端html、用nginx部署前端 适合人群:无任何基础的小白,具备一定编程基础,学生、工作1-3年的研发人员、从事语音识别开发的工程师、科研人员 能学到什么:快速在本地体验大模型 阅读建议:源有任何问题可以联系作者 其他:需要相关资料,或者咨询,请联系作者 --------------------------------------------------------------------------- 适合人群:无任何基础的小白,具备一定编程基础,学生、工作1-3年的研发人员、从事语音识别开发的工程师、科研人员 能学到什么:快速在本地体验大模型 阅读建议:源有任何问题可以联系作者
ChatGLM-6B项目源码
05-27
ChatGLM-6B项目源码
ChatGLM2-6B(windows本地微调实践)
09-15
详细调试内容见文件内ReadMe文档 1、Chat GLM2模型下载 ...7、ChatGLM2-6B-main加载微调后模型验证 注:环境自己搭建,我的用anadconda创建的,先搭pytorch的GPU版,再添加相关模块,本地部署教程多自行部署
Chatglm2-6b-int4资源文件
10-12
Chatglm2-6b-int4资源文件
基于LoRA和 P-Tuning v2 的ChatGLM-6B高效参数微调python源码.zip
08-01
经过约 1T 标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术的加持,62 亿参数的 ChatGLM-6B 已经能生成相当符合人类偏好的回答。 本仓库实现了对于 ChatGLM-6B 模型基于 LoRA 和 P-Tuning ...
本地部署ChatGLM2-6B,chatglm2-6b-int4
11-15
chatglm2-6b-int4
《XrayGLM:基于VisualGLM-6B微调训练对X光胸片进行医学诊断》学习分享与本地项目微调部署实践
Together_CZ的博客
06-21 2879
《XrayGLM:基于VisualGLM-6B微调训练对X光胸片进行医学诊断》学习分享与本地项目微调部署实践
GLM大模型技术前沿与应用探索论坛成功举办 | WAIC 2023
AITIME_HY的博客
07-10 193
点击蓝字关注我们AI TIME欢迎每一位AI爱好者的加入!7月7日下午,GLM大模型技术前沿与应用探索论坛在2023世界人工智能大会成功举办。本次论坛由清华大学知识工程实验室主办,AI TIME承办,东浩兰生(集团)有限公司协办。来自清华大学KEG实验室团队的5位嘉宾聚焦GLM、CodeGeeX等具体大模型,分享了大模型的技术难点、关键技术、前沿研究成果、拓展方向,从技术、产品、应用场景多维度分析...
NLP大模型微调答疑
狮子座明仔知识集散场
05-17 8576
我理解ChatGLM-6B模型是走完 “预训练-SFT-RLHF” 过程训练后的模型,其SFT阶段已经有上千指令微调任务训练过,现在我们只是新增了一类指令数据,相对大模型而已,微调数据量少和微调任务类型单一,不会对其原有的能力造成大的影响,所以我认为是不会导致灾难性遗忘问题,我自己微调模型也没出现此问题。ChatGLM-6B, LLaMA-7B模型分别是60亿参数量和70亿参数量的大模型,基本可以处理所有NLP任务,效果好,但大模型部署成本高,需要大显存的GPU,并且预测速度慢,V100都需要1秒一条。
VisualGLM-6B大模型核心技术
11-15
VisualGLM-6B是一个支持图像、中文和英文的多模态对话语言模型,它基于ChatGLM-6B,具有62亿参数。VisualGLM-6B的核心技术是将视觉模型与语言模型相结合,通过训练BLIP2-Qformer构建起视觉模型与语言模型的桥梁,整体模型共78亿参数。VisualGLM-6B可以进行图像的描述及相关知识的问答,也能结合常识或提出有趣的观点。同时,VisualGLM-6B还支持中文和英文的多模态对话,可以进行自然语言生成和理解任务。总之,VisualGLM-6B的核心技术是将视觉模型和语言模型相结合,实现了多模态对话的功能。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
写文章

热门文章

  • windows下kafka环境完整搭建,Python调用kafka构建完整实例分析与应用 116259
  • python神奇函数之eval()学习 72634
  • 解决python错误提示“non-default argument follows default argument” 55184
  • 【剑指Offer学习】【所有面试题汇总】 51449
  • python四种方法实现去除列表中的重复元素 51191

分类专栏

  • 完整源码项目实战 付费 13篇
  • 目标检测实战 付费 42篇
  • 数据建模实战专栏 付费 31篇
  • CNN、LSTM建模实战专栏 付费 32篇
  • python实践 320篇
  • Linux基础 13篇
  • leetcode 3篇
  • 面试准备 17篇
  • web页面计算 8篇
  • 结构计算 8篇
  • 软件安装 34篇
  • 计算机并行处理 2篇
  • 算法 96篇
  • 编程技术 369篇
  • 机器学习 284篇
  • 杂谈 42篇
  • 面试工作 151篇
  • 软件工具使用 130篇
  • 数学 11篇
  • 社交网络 8篇
  • 页面更新识别 29篇
  • 深度学习 167篇
  • Linux 13篇
  • 读书笔记 12篇
  • java、scala 7篇
  • 数据库 11篇
  • 大数据 14篇

最新评论

  • 《XrayGLM:基于VisualGLM-6B微调训练对X光胸片进行医学诊断》学习分享与本地项目微调部署实践

    z3225167: 依赖python哪个版本?

  • Boosting Crowd Counting via Multifaceted Attention之人群密度估计实践

    weixin_57162192: 或者从哪里能下载呢

  • Boosting Crowd Counting via Multifaceted Attention之人群密度估计实践

    weixin_57162192: 为什么训练出来的没有model.pth这个模型呢

  • 基于轻量级YOLOv5s的手持目标检测识别分析系统

    ت花花酱咻咻咻: 同问,数据集可以分享吗,Thanks♪(・ω・)ノ

  • AI助力智慧农业,基于DETR【DEtection TRansformer】模型开发构建田间作物场景下庄稼作物、杂草检测识别系统

    Together_CZ: 可以参考官方的可视化模块

您愿意向朋友推荐“博客详情页”吗?

  • 强烈不推荐
  • 不推荐
  • 一般般
  • 推荐
  • 强烈推荐
提交

最新文章

  • 服务智能化公共生活场景人员检测计数,基于YOLOv8全系列【n/s/m/l/x】参数模型开发构建公共生活场景下人员检测计数识别系统
  • 服务智能化公共生活场景人员检测计数,基于YOLOv5全系列参数模型【n/s/m/l/x】开发构建公共生活场景下人员检测计数识别系统
  • 助力智慧果蔬自动疾病诊断,基于YOLOv9系列【gelan-c/gelan-e/yolov9/yolov9-c/yolov9-e】模型开发构建蔬果种植场景下番茄作物病虫害智能化检测识别系统
2024
05月 8篇
04月 33篇
03月 38篇
02月 32篇
01月 59篇
2023年359篇
2022年116篇
2021年106篇
2020年77篇
2019年170篇
2018年96篇
2017年536篇
2016年23篇

目录

目录

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Together_CZ

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或 充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

深圳SEO优化公司合肥网站优化按天计费哪家好济宁网站优化按天计费报价玉林网站排名优化价格铜陵关键词排名哪家好永新网站优化按天计费晋城网站优化按天计费报价随州网站推广系统报价雅安SEO按天收费临夏外贸网站设计报价武威SEO按效果付费公司南山网站制作设计达州营销型网站建设价格保定优秀网站设计多少钱临沂网站建设设计报价清远网站定制宜春网站优化按天收费报价商洛网站推广报价天津设计公司网站价格民治模板制作推荐新余企业网站改版价格南通百度关键词包年推广和田网络推广推荐黄山企业网站改版公司乐山网站优化推广推荐垦利网站排名优化多少钱同乐外贸网站制作多少钱厦门网站搜索优化哪家好渭南seo优化哪家好怀化百度网站优化多少钱玉树seo网站优化报价歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发 春山在望成都发生巨响 当地回应60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账 现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌 家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅:唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子19岁小伙救下5人后溺亡 多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人?开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

深圳SEO优化公司 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化