哈工大LTP的依存分析

14 篇文章 8 订阅
订阅专栏

# 可视化

    网址:http://ltp.ai/demo.html

LTP提供的模型有tiny、small和base。根据安装的LTP版本,模型的版本也需要匹配,否则可能会出现不兼容的情况

注:web demo运行的是base模型;在线的SDP解码是Graph和Tree混合解码,具体可以看一下4.0.X的源码

 

# 本地安装(Python版)

    1. pip install ltp

    2. 运行代码后报错

Microsoft Visual C++ Redistributable is not installed, this may lead to the DLL load failure.
                 It can be downloaded at https://aka.ms/vs/16/release/vc_redist.x64.exe

    3. 根据报错里提供的网址下载 vc_redist.x64.exe 安装即可

    4.1 报错

AttributeError: 'Version' object has no attribute 'major'

    解决:packaging 包版本太低了,用命令pip install --upgrade packaging 更新 packaging 

    4.2 报错

KeyError: 'transformer_config'

    解决:模型问题,参见 链接 。打开C:\Anaconda3\Lib\site-packages\ltp下的frontend.py文件(4.1.x版本,老版本文件为ltp.py),修改如下(先把模型下载下来,然后修改路径)

model_map = {
    'base': 'http://39.96.43.154/ltp/v2/base.tgz',
    'small': 'http://39.96.43.154/ltp/v2/small.tgz',
    # 'tiny': 'http://39.96.43.154/ltp/v2/tiny.tgz'
    'tiny': 'w:/ltp/tiny.tgz'
}

注意:LTP 4.1.X 与旧版本 v1,v2 模型不兼容[ 来源],LTP 4.0.X 与 v3 也不兼容

联网自动下载的模型缓存在 C:\Users\用户名\.cache\torch\ltp

    4.3 报错 

sdp = ltp.sdp(hidden,graph=False)
3)TypeError: sdp() got an unexpected keyword argument 'graph'

    解决:4.1.X 没有该参数了,只支持依存图

 

    ## 其他

      除了安装ltp,之前有个版本pyltp,调用接口参数似乎更方便 [ 链接] [ 链接] [ 链接] [ 链接]

      案例: 基于哈工大LTP句子主干提取

 

# LTP:依存句法分析与语义依存分析的区别

    虽然两者都借用了依存结构,但是依存句法分析与语义依存分析之间具有显著的区别。句法依存按照句法结构功能建立依存关系并为依存结构标注句法关系,更强调介词、助词等对句法结构划分的作用。而语义依存如前所说,注重实词之间语义事实上或逻辑上的关系。而句法的结构往往随着字面词语的变化而不同,相反语义则能够跨越句子表层的变化直达语义的本质 [ 来源]

    与句法依存分析相比,语义依存分析能表达更深刻的语义信息,对于中文这种意合的语言尤为适合 [ 来源] 在中文界,最有影响力的标注方案是BH-SDP,由北京语言大学和哈尔滨工业大学联合制定 [ 来源]

    区别于依存句法分析的树形结构,语义分析结果为一个有向无环图,称为语义依存图(Semantic Dependency Graph)[ 来源]

    ① 同一说法的不同表述

    虽然三个句子拥有不同的句子结构, 产生了不同的句法分析结果, 但是三个句子中语言单元之间的语义关系并没有发生变化, 从"吃"这个词来看, 它的主体, 客体...都没有发生变化 

对于表达同一意思的不同结构的句子来说,其依存句法分析的结果是不一样的,但是其语义依存分析的结果是一样的 [ 链接]

    ② 非实词在句子结构分析中的作用

    第一,句法依存某种程度上更重视非实词(如介词)在句子结构分析中的作用,而语义依存更倾向在具有直接语义关联的实词之间建立直接依存弧,非实词作为辅助标记存在。

    第二,两者依存弧上标记的语义关系完全不同,语义依存关系是由论元关系引申归纳而来,可以用于回答问题,如我在哪里喝汤,我在用什么喝汤。但是句法依存却没有这个能力(或者说句法分析树的结果是间接的,而语义依存图的结果是直接的。

 

# LTP:语义依存分析(依存树)和语义依存分析(依存图)的区别

    传统的基于转移的依存分析算法,其最终得到得是一个依存树,这对依存分析存在一定限制,因此,最近几年提出的基于转移的语义依存图的解析,对依存分析进行了扩展 [ 链接]

与语义依存树不同,在依存图中,每个词的父节点个数是不确定的。这种不确定性使得用基于图的方法解决该问题变得很困难,因此我们选择了基于转移的方法,通过修改现有转移系统中的转移动作来直接生成语义依存图 [ 来源]

    在语义依存树基础上做了突破,使得对连动、兼语、概念转位等汉语中常见的现象的分析更全面深入 [ 链接]

    在原来的语义依存树中,受限于树结构,只能刻画出“有”与“儿子”之间的属事(Belg)关系。而在语义依存图中,除了该关系之外,还刻画出了“儿子”与“上”之间的施事(Agt)关系。语义依存图对语义关系更完整的覆盖,为获取句中实词之间的语义关系提供了更方便的工具。例如在“他有个儿子才上小学。”这句话中,如果要回答“谁在上小学”这个问题,语义依存图能够直接提供答案,而语义依存树则不能。 

    语义依存树与语义依存图的主要区别在于,在依存树中,任何一个成分都不能依存于两个或两个以上的成分,而在依存图中则允许句中成分依存于两个或两个以上的成分。且在依存图中允许依存弧之间存在交叉,而依存树中不允许 [ 链接] 

    与语义依存树分析相比,语义依存图能更全面、灵活的表示句子中的语义关系 [ 来源] 

问题:为什么上面描述的和 LTP在线演示出来的效果不一致

 

# 嵌套关系

    用来标记一个事件降级充当了另一个事件的成分

如句子“爷爷看见小孙女在操作计算机”,划线部分为一个降级事件充当动词“看见”的“客事”角色dCont  [ 来源]

 

# 附录

    LTP 使用的是863词性标注集

    语义依存分析的标注方案是BH-SDP

     哈工大 LTP 标注文档介绍

 词性标注集pos/tag依存句法分析标注集dep语义依存分析标注集sdp
LTP 863词性标注集 BH-DEP BH-SDP
SpaCy基于 Google Universal POS Tag set扩展采用了 ClearNLP 的依存分析标签-
DDParser 百度构建的标注集 DuCTB-
HanLP CTB、 PKU、 863、 UD SD、 UD SemEval16、DM、PAS、PSD
stanford corenlpPenn Chinese Treebank Tag Set( CTB)没找到说明采用的标注集 [ 链接]-
jieba和 ictclas 兼容的标记法不支持不支持

 

# 工具学习系列

  • 哈工大LTP的依存分析
  • 百度DDParser的依存分析
  • HanLP的依存分析
  • Spacy的依存分析

 

# 参考资料

     中文语义依存分析语料库

    哈工大SCIR: 语言技术平台(LTP)发布新功能:中文语义依存图分析

    哈工大SCIR: 中文语义依存分析—通往中文语义理解的一条蹊径

    哈工大SCIR: 基于转移的语义依存图分析 (原理

pyltp依存句法分析_pyltp的简单使用
weixin_39902598的博客
03-01 727
上一篇我们搭建了pyltp的基本环境,现在我们用简单的示例来测试它的使用,因为还是新手,肯定会有很多不全面的地方,后面我慢慢补充。我们采用PyCharm作为编辑器,进行示例。0.检查pyltp首先先检查下python27/Lib/site-packages/目录下是否存在pyltp的相关文件夹:pyltp的安装位置1.创建项目1.1 创建一个新的python项目创建一个新的pyth...
cpp-LTP哈工大开源的一套中文语言处理系统
08-16
LTP哈工大开源的一套中文语言处理系统,涵盖了基本功能:分词、词性标注、命名实体识别、依存句法分析、语义角色标注、语义依存分析等。
知识图谱、命名实体识别(NER)、哈工大LTP解析.pdf
09-14
知识图谱、命名实体识别(NER
LTP 依存句法分析
热门推荐
追求卓越,做到专业
01-07 1万+
 依存句法 依存语法 (Dependency Parsing, DP) 通过分析语言单位内成分之间的依存关系揭示其句法结构。 直观来讲,依存句法分析识别句子中的“主谓宾”、“定状补”这些语法成分,并分析各成分之间的关系。 #依存句法分析模型 parser = Parser() parser.load(os.path.join(MODELDIR, "parser.model")) arcs...
基于统计方法的汉语依存句法分析研究--马金山博士(哈尔滨工业大学)
forever1dreamsxx--NLP
07-25 5235
原文下载地址:http://ir.hit.edu.cn/demo/ltp/SharingPackage/mjs-dissertation.pdf   下面是绪论中的一部分: 1.1 课题的背景和意义         自然语言处理的分析技术,可以大致分为两个层面,一个是浅层分析,如分词,词性标注。这些技术一般只需对句子的局部范围进行分析处理,目前已经基本成熟,其标志就是它们已经被成功地用于文
哈工大LTP依存句法解析结果解释
weixin_40440798的博客
06-15 2058
[[‘他’, ‘叫’, ‘汤姆’, ‘去’, ‘拿’, ‘外衣’, ‘。’]] [ [ (1, 2, ‘SBV’), (2, 0, ‘HED’), # 叫 --|HED|–> ROOT (3, 2, ‘DBL’), (4, 2, ‘VOB’), (5, 4, ‘COO’), (6, 5, ‘VOB’), (7, 2, ‘WP’) ] ]
利用好手头的资源解决海量语料资源收集以及利用哈工大LTP云平台解决依存句法和语义依存分析
smilejiasmile的博客
07-09 5934
一、利用好手头的资源解决海量语料资源基于语料做机器学习需要海量数据支撑,如何能不存一点数据获取海量数据呢?我们可以以互联网为强大的数据后盾,搜索引擎为我们提供了高效的数据获取来源,结构化的搜索结果展示为我们实现了天然的特征基础,唯一需要我们做的就是在海量结果中选出我们需要的数据,本节我们来探索如何利用互联网拿到我们所需的语料资源 请尊重原创,转载请注明来源网站www.shareditor.com以...
哈工大停用词表.doc
12-02
经过 哈工大社会计算与信息检索研究中心 11 年的持续研发和推广,LTP 已经成为国内外最具影响力的中文处理基础平台,曾获 CoNLL 2009七国语言句法语义分析评测 总成绩第一名,中文信息学会钱伟长一等奖等重要成绩和...
基于语义依存关系的汉语复句关系词自动识别.pdf
12-15
文章提出了一种新的方法,即利用哈工大开发的语言技术平台(LTP),分析句子的语义依存关系,以提取更具深度的语义特征。 语义依存关系是描述词语之间语义联系的一种方式,它能揭示句子中词汇之间的功能关系,比如...
NLP常用开源地址
10-18
除了上述独立的工具,还有一些综合性的NLP平台,如哈工大的语言技术平台(LTP),它提供了丰富的中文处理模块,包括词法分析、句法分析、语义角色标注等。FudanNLP是Java编写的NLP工具包,包含多种NLP任务的实现。...
哈工大 LTP java动态链接库 64位的可用
01-30
哈工大LTP java在Eclipse上编译所需要用到的动态链接库,(.lib和.dll、.exp)64位系统可用
语义依存分析
Just for fun的专栏
09-10 4040
https://www.ltp-cloud.com/intro/#srl_how 语义依存分析 (Semantic Dependency Parsing, SDP),分析句子各个语言单位之间的语义关联,并将语义关联以依存结构呈现。 使用语义依存刻画句子语义,好处在于不需要去抽象词汇本身,而是通过词汇所承受的语义框架来描述该词汇,而论元的数目相对词汇来说数量总是少了很多的。语义依存分析目标是跨越句...
基于pyltp依存句法分析
MilkLeong的博客
12-01 633
代码是两年多前网上找的,能运行。先记在这里,以防以后用到。
自然语言处理(三)——句法分析依存句法分析
南木的博客
05-24 1万+
更多内容请至博客主页查看哦 文章目录一、StanfordCoreNLP对英文进行处理二、StanfordCoreNLP对中文进行处理三、LTP对中文进行处理四、结论附录 · 本文所使用工具代码与中英文文本下载 一、StanfordCoreNLP对英文进行处理 在使用StanfordCoreNLP对文本句子进行分析时,需要先对句子进行分词 nlp.word_tokenize(sentence) 然...
LTP依存句法分析标注关系
卡布达
05-21 1605
如题,直接上图
自然语言处理(NLP)-第三方库(工具包):LTP(适合中文数据集)【命名实体识别、分词、词性标注、依存句法分析、语义角色标注】
u013250861的博客
01-02 3361
人工智能-深度学习-生成模型:GAN经典模型–>VAEGAN
十二、教你如何利用强大的中文语言技术平台做依存句法和语义依存分析
jiangjingxuan的博客
01-25 5671
句法分析是自然语言处理中非常重要的环节,没有句法分析是无法让计算机理解语言的含义的,依存句法分析由法国语言学家在1959年提出,影响深远,并且深受计算机行业青睐,依存句法分析也是做聊天机器人需要解决的最关键问题之一,语义依存更是对句子更深层次的分析,当然,有可用的工具我们就不重复造轮子,本节介绍如何利用国内领先的中文语言技术平台实现句法分析 请尊重原创,转载请注明来源网站www.sharedit
依存句法分析整理续
Hekena的博客
10-26 1041
依存语法理论认为词与词之间存在主从关系,这是一种二元不等价的关系。在句子中,如果一个词修饰另一个词,则称修饰词为。。语义依存分析分析句子各个语言单位之间的语义关联,并将语义关联以依存结构呈现。使用语义依存刻画句子语义,好处在于丌需要去抽象词汇本身,而是通过词汇所承受的语义框架来描述该词汇,而论元的数目相对词汇来说数量总是少了很多的。语义依存分析目标是跨越句子表层句法结构的束缚,直接获取深层的语义信息。
【白话NLP】——依存句法分析
黑白象
12-02 3268
Arc-Eager
哈工大LTP python 安装
最新发布
12-20
以下是哈工大LTP在Python中的安装步骤: 1. 首先,下载适用于你的操作系统和Python版本的wheel文件。根据引用中的描述,你可以从哈工大LTP的官方网站或其他可靠的资源下载wheel文件。 2. 打开命令行终端,并进入wheel文件所在的目录。 3. 执行以下命令来安装哈工大LTP: ```shell pip install pyltp-0.2.1-cp36-cp36m-win_amd64.whl ``` 请注意,上述命令中的wheel文件名可能会因你下载的文件而有所不同。确保使用正确的文件名。 4. 等待安装完成。安装过程可能需要一些时间,取决于你的系统和网络速度。 5. 安装完成后,你可以在Python脚本中导入pyltp模块,并使用哈工大LTP的功能了。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
写文章

热门文章

  • 规划云:GIS相关模块 78649
  • Neo4j:入门基础(二)之导入CSV文件 34620
  • leaflet:入门基础(一) 32666
  • Neo4j:入门基础(一)之安装与使用 24843
  • PostgreSQL安装 Error running icacls 22102

分类专栏

  • 知识图谱 付费 21篇
  • 自然语言处理 14篇
  • web3d教程文档
  • 文本数据挖掘 3篇
  • GIS 20篇
  • GeoServer 5篇
  • GIS软件 3篇
  • GIS资源 1篇
  • 问答框架 2篇
  • 数据库 1篇
  • 可视化 4篇
  • 大数据 1篇
  • Spark 1篇
  • 机器学习 1篇
  • Linux 1篇
  • 虚拟机
  • 书籍笔记
  • 前端 6篇
  • openlayers 3篇
  • Cesium 6篇
  • leaflet 6篇
  • 神经网络
  • Python 2篇
  • Django 1篇
  • 爬虫 2篇

最新评论

  • Cesium:入门教程(一)之 Hello World

    Owen-Solomon: 你好,我导入Token之后,下面的提示确实没了,但是还是显示不出地球,这个是否会和电脑的配置有关,比如我这个电脑没有GPU

  • PostgreSQL安装 Error running icacls

    随缘XD: 我这里发现不仅账户名称要英文,计算机的名称也要英文,我在系统里面重命名这台电脑解决的问题

  • Neo4j:入门基础(二)之导入CSV文件

    油炸小可爱er: 可以分享数据集吗

  • Neo4j:入门基础(一)之安装与使用

    油炸小可爱er: 可以使用桌面版的Neo4j吗,两者操作有区别吗

  • 爬虫练习案例:交通路况

    行吟成風: 您好,请问可以分享代码吗?13219103692@163.com,非常感谢!

您愿意向朋友推荐“博客详情页”吗?

  • 强烈不推荐
  • 不推荐
  • 一般般
  • 推荐
  • 强烈推荐
提交

最新文章

  • 知识图谱:信息抽取简易流程
  • 知识图谱:架构
  • 知识图谱:语义网络、语义网、链接数据、知识图谱
2023年1篇
2022年2篇
2021年24篇
2020年53篇
2019年3篇

目录

目录

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

深圳SEO优化公司惠州建设网站西乡百度网站优化排名龙华高端网站设计民治建站西乡网站seo优化光明网站优化按天收费爱联百搜词包木棉湾标王广州网络营销塘坑百度网站优化排名盐田网站优化按天计费荷坳SEO按天收费广州百姓网标王推广爱联SEO按天收费布吉至尊标王盐田网站优化按天收费横岗高端网站设计沙井百度爱采购南澳网站搭建塘坑企业网站建设永湖关键词按天收费深圳外贸网站制作布吉seo网站优化爱联网络营销吉祥网站推广横岗建站松岗百度网站优化排名坪地百度爱采购吉祥网站优化推广荷坳网站推广歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发 春山在望成都发生巨响 当地回应60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账 现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌 家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅:唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子19岁小伙救下5人后溺亡 多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人?开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

深圳SEO优化公司 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化