增强的依赖性

增强的依赖性

原文参见 https://universaldependencies.org/u/overview/syntax.html

受控/提升主语

  • 受控主语:表示主语由控制动词决定。
  • 提升主语:表示主语通过提升动词从嵌套句提升到主句。

基本树缺少受控动词其控制者之间的主语依存关系,也缺少嵌入动词与其升起主语之间的主语依存关系。在增强图中,嵌入动词和矩阵分句的主语之间有额外的从属关系。这种依存关系可以通过扩展名(子类型) :xsubj​ 来识别。

image

句子1:Mary wants to buy a book.

考虑句子:“Mary wants to buy a book.” 在这个句子中:

  • “wants” 是控制动词
  • “to buy” 是受控动词
  • 虽然“to buy”在表面上看没有主语,但从语义上讲,其主语应是“Mary”,这是通过控制关系隐含的。

在基本的依存图中,“to buy”可能只通过 xcomp​ 连接到“wants”。然而,在增强的依存图中,会有一个额外的 nsubj:xsubj​ 依存关系,直接将“to buy”与“Mary”连接,显示“Mary”是“to buy”动作的执行者,即使这在表面结构中并未明确表达出来。

image

句子2:She seems to be reading a book.

基本依存树(图25)

  • 主语:She(nsubj) -> seems
  • 控制动词:seems
  • 动词短语(受控) :to be reading(xcomp) -> seems
  • 动词:reading(aux) -> be
  • 宾语:a book(obj) -> reading

在基本依存树中,“reading”的主语(She)没有明确表示。

增强依存树(图26)

  • 主语:She(nsubj) -> seems
  • 控制动词:seems
  • 动词短语(受控) :to be reading(xcomp) -> seems
  • 动词:reading(aux) -> be
  • 宾语:a book(obj) -> reading
  • 增强关系:She(nsubj:xsubj) -> reading

在增强依存树中,增加了 nsubj:xsubj​ 依存关系,明确指出 “reading”的主语是 “She”。

image

句子3:Mary made me buy the house.

基本依存树(图27)

  • 主语:Mary(nsubj) -> made
  • 控制动词:made
  • 宾语:me(obj) -> made
  • 动词短语(受控) :buy(xcomp) -> made
  • 宾语:the house(obj) -> buy

在基本依存树中,“buy”的主语(me)没有明确表示。

增强依存树(图28)

  • 主语:Mary(nsubj) -> made
  • 控制动词:made
  • 宾语:me(obj) -> made
  • 动词短语(受控) :buy(xcomp) -> made
  • 宾语:the house(obj) -> buy
  • 增强关系:me(nsubj:xsubj) -> buy

在增强依存树中,增加了 nsubj:xsubj​ 依存关系,明确指出 “buy”的主语是 “me”。

image

句子4:Mary wants me to be promoted.

基本依存树(图29)

  • 主语:Mary(nsubj) -> wants
  • 控制动词:wants
  • 宾语:me(obj) -> wants
  • 动词短语(受控) :to be promoted(xcomp) -> wants
  • 动词:promoted(aux:pass) -> be

在基本依存树中,“promoted”的主语(me)没有明确表示。

增强依存树(图30)

  • 主语:Mary(nsubj) -> wants
  • 控制动词:wants
  • 宾语:me(obj) -> wants
  • 动词短语(受控) :to be promoted(xcomp) -> wants
  • 动词:promoted(aux:pass) -> be
  • 增强关系:me(nsubj:xsubj) -> promoted

在增强依存树中,增加了 nsubj:xsubj​ 依存关系,明确指出 “promoted”的主语是 “me”。

总结

通过在增强依存树中增加 nsubj:xsubj​ 关系,我们可以更加清晰地表示句子中的控制结构。这种方式确保了嵌入动词的主语明确显示,即使在基本依存树中这种关系是隐含的。这种增强的表示法对于处理复杂句子和自然语言处理应用非常有用,因为它提供了更精确的句法和语义信息。

关系从句(Relative Clauses)解释

obj宾语,nsubj主语

基本表示法

在基本依存树中,关系代词通常与主句的主谓语(谓词)相连,通常以 nsubj​ 或 obj​ 关系表示。

增强表示法

在增强的依存树中,关系代词通过 ref​ 关系连接到它的先行词(antecedent),而先行词则作为基本树中关系代词的父节点的从属节点连接。

image

副词相对修饰语也受到同样的对待。

介词短语和副词作定语 (详细参见 张道真的定语)

image

增强关系包括深层句法关系 (X)

因此,在案例标记语言中,增强的从属关系可能会将动词从属关系连接起来,而这些动词从属关系并不在表面句法所要求的预期形态情况下。

在下面的捷克语例句中,相对修饰短语 v němž "在其中 "必须使用定位格形式 ( Case=Loc​ )。如果这是一个主句,那么指代词 dům "房子 "也必须是定位格:v domě "房子里"。然而,这里是名词性从句( Case=Nom​ ),而且根据该语言的形态-句法规则,强化从句 obl​ 转为名词性从句是我们意想不到的。

image

相对要素并不总是直接取决于相对分句的谓语。它可以嵌入得更深,如下面的例子。

image

如果相对从句有一个名词性谓语,则相对代词可以占据从句的首部位置。

与大多数相对分句不同的是,在这里,基本树中相对代词的父代并不在相对分句中,它的前置词也不会有额外的增强关系将其连接到相对分句中的(不存在的)父代。取而代之的是,我们在相对分句的 nsubj​ 中从前者添加一个 nsubj​ 关系(并删除相对代词和主语之间相应的 nsubj​ 关系)。 acl:relcl​ 应与基本从句中的关系相同。

image

Case信息

image

image

在非核心隶属关系的关系名中添加介词(或大小写信息),往往可以明确其语义作用。因此,我们用修饰语的大小写信息来增强某些关系标签。被增强的关系是 nmod​ 、 acl​ 、 obl​ 和 advcl​ ;如果语言合理,一些核心关系也可能被增强: obj​ , iobj​ , ccomp​ 。情况信息可以用通过 case​ 关系附加的副词的词法来表示。对于分句,相应的信息可以用 mark​ 从属关系的词法来表示。大小写信息也可以用形态特征 Case 的值来表示。在某些语言中,既有状语情况,也有形态情况,它们的组合必须反映在增强关系中。

与此类似,增强型 UD 图也包含 conj​ 关系,这些关系用它们的协调连词进行了增强。这使得两个短语之间的协调类型更加明确,这对于有多个协调连词的短语尤其有用。

以下是适用的正式规则(摘自本页开头的摘要):

1.以 case​ 或 mark​ 或 cc​ 的形式出现在与父节点的关系被增强的节点上的附加词或连接词。请注意,这是增强关系标签中唯一允许使用非 ASCII 字母的部分。单词应规范化(小写,无错别字),也就是说,一般情况下,我们取其lemma。

原句: The house on the hill

图46:

  • thedet​)修饰 houseNOUN​)
  • house 是名词(NOUN​),作为句子的核心
  • oncase​)修饰 hillNOUN​)
  • the hill 是介词短语(nmod:on​),修饰 house

依存关系:

  • "the" -> det​ -> "house"
  • "on" -> case​ -> "hill"
  • "hill" -> nmod:on​ -> "house"

在这个例子中,介词 "on" 通过 case​ 依存关系连接到 "hill",表示 "hill" 是介词短语的核心。然后,整个介词短语 "on the hill" 作为名词 "house" 的修饰语,通过 nmod:on​ 依存关系连接到 "house"。

2.但是,如果大小写/标记相关联的是一个固定的多词表达式,则表达式的词法不一定由各个成员词的词法组成。例如,表示英语表达式 "As Opposed To "的字符串是 as_opposed_to​ 。

  • 规范化形式

    • 确保短语中的每个词都被小写化(除非有特殊规定)。
    • 短语中的各个词用下划线连接成一个整体。
  • 词法形式(lemma)

    • 对于固定多词表达中的每个词,保持其原有的词法形式,而不是将其转换为基本形式(lemma)。

因为这样将整个短语作为一个整体来看待的动作体现在以上几个方面

3.同样,语法化的非谓语连接词,如 "regard"("关于"),在某些语言中(如果特定语言的准则有要求),尽管被附加为大小写,但仍被标记为 VERB,因此其外延将是动词性的("regard");然而,相应的 deprel 外延应该是语法化的形式,即 "regard"("关于")。

这段话解释了如何处理语法化的非谓语连接词,特别是在某些语言中的处理方式。这些非谓语连接词虽然在某些上下文中表现为介词(或类似于介词),但它们的词性仍保持为动词,同时在依存关系标注中,它们的功能标签需要反映其语法化的用途

例子:regard

  1. 词汇背景

    • regard 原本是一个动词,意思是“考虑”或“看待”。
    • 在某些语境中,regard 演变成了介词或连接词,表示“关于”或“涉及”。
  2. 在句子中的应用

    • 原句:He spoke regarding the new policy.

      • 在这里,regarding 表现为介词,意思是“关于”。
      • 但是,其基本词性仍然是动词 regard
  3. 依存关系标注

    • 在依存关系标注中,regarding 尽管在句子中表现为介词,其词性标签仍标记为动词 VERB
    • 然而,依存关系标签(deprel)需要反映其作为语法化形式的功能。即 regarding 表现为介词,其依存关系标签可能会是 case:regarding​ 或 obl:regarding​。

处理步骤

  1. 保持基本词性

    • regard 作为动词 VERB,尽管在句子中表现为介词。
    • 这种处理方式确保了词性的一致性,反映了其原始动词的词性。
  2. 依存关系标签的语法化形式

    • regarding 用作介词时,其依存关系标签需要反映其实际功能。
    • 例如,case:regarding​ 表示 regarding 作为一个介词短语的标记;obl:regarding​ 表示 regarding 引导的介词短语作为句子的状语。

句子解析:He spoke regarding the new policy.

原句:He spoke regarding the new policy.

  • He(主语) -> nsubj​ -> spoke(动词谓语)
  • spoke(动词) -> obl:regarding​ -> regarding(动词表现为介词)
  • regarding(动词) -> case​ -> policy(名词)

依存关系标注

  • "He" -> nsubj​ -> "spoke"
  • "spoke" -> obl:regarding​ -> "regarding"
  • "regarding" -> case​ -> "policy"
  • "policy" -> det​ -> "the"

在这个句子中,regarding 保持了动词的词性标签,但其依存关系标签反映了其作为介词的功能,标记为 obl:regarding​。

4.特定语言指南还可能规定,某些同义词(如 "朝 "和 "向")尽管词性不同,但应映射到同一个增强标签上。我们使用下划线字符("_")来连接成员词。

这段话解释了在某些语言的自然语言处理(NLP)和依存关系解析中,如何处理同义词的映射问题。尽管这些同义词可能具有不同的词性或形态特征,为了保持一致性和准确性,特定语言的指南可能会规定将这些同义词映射到同一个增强标签上。

5.如果一个节点有多个情况标记,而这些情况标记没有注释为固定表达式,例如 "停业 "的 out_of​ ,也可以采用同样的方法。

增强依存树的特点在于,尽管 "out of" 是一个组合的情况标记短语,但每个部分("out" 和 "of")都会分别被标注和处理。这种表示法使得依存关系更加清晰和明确。

image

6.如果语言中的状语从现有的词形变化中选择一个子集,而且同一个状语在不同的词形变化中可能有不同的意义,那么这种方法就特别有用。可能会出现这样的情况:两个介词是协调的,每个介词都选择了不同的词形变化情况,而名词只能满足其中一种情况的要求。例如,[cs] Lidé se rozutekli před a během útoku。"人们在袭击前和袭击中逃跑了"。第一个介词需要动名词,第二个介词需要属格,名词用属格。然而,增强图中的关系应为 obl:před:ins​ 和 obl:během:gen​ 。尽管当前句子中名词的表面形式不是语气词,其形态特征是 Case=Gen​ ,但第一个关系应表示语气词。 obl:před:gen​ 在语言中不存在,也没有意义。(但是请注意,这个介词并不是只有工具型,指称型也是可能的,而且 obl:před:acc​ 和 obl:před:ins​ 的意思也不一样)。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1452541.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

【网络编程】多进程服务器端

并发服务器的实现 多进程服务器:通过创建多个进程提供服务多路复用服务器:通过捆绑并统一管理IO对象提供服务。多线程服务器:通过生成与客户端等量的线程提供服务。、 理解进程process 定义:占用内存空间的正在运行的程序。 CPU核和进程数:1个CPU 中…

搭建自己的AI模型应用网站:JavaScript + Flask-Python + ONNX

1. 前言 本文作者以一个前端新手视角,部署自己的神经网络模型作为后端,搭建自己的网站实现应用的实战经历。目前实现的网页应用有: AI 语音服务主页AI 语音识别AI 语音合成AI CP号码生成器 欢迎大家试用感受,本文将以博客基于G…

[DDR4] DDR1 ~ DDR4 发展史导论

依公知及经验整理,原创保护,禁止转载。 专栏 《深入理解DDR4》 内存和硬盘是电脑的左膀右臂, 挑起存储的大梁。因为内存的存取速度超凡地快, 但内存上的数据掉电又会丢失,一直其中缓存的作用,就像是我们的工…

15天系统化入门AI产品经理,打好入行基础,抢占时代红利!!

前言 随着算法、算力和数据条件的逐渐成熟,AI时代来临已成共识。 与此同时,行业巨头争先布局人工智能,产生大量人才需求,人工智能产品经理岗位缺口高达6.8万。 面对这样一个大热的朝阳行业,产品经理如何才能快速入行…

【C#】图形图像编程

实验目标和要求: 掌握C#图形绘制基本概念;掌握C#字体处理;能进行C#图形图像综合设计。 运行效果如下所示: 1.功能说明与核心代码 使用panel为画板,完成以下设计内容: 使用pen绘制基础图形;使…

《C++ Primer》导学系列:第 2 章 - 变量和基本类型

2.1 基本内置类型 概述 本小节介绍C中的基本内置类型。基本内置类型是构成C程序的基础,它们用于表示数据的不同形式,如整数、浮点数、字符等。理解和使用这些基本类型是编写C程序的起点。 2.1.1 算术类型 C的算术类型分为整型和浮点型。整型用于表示…

高考志愿填报,选什么专业四年后比较吃香?

曾经的理科男,我依旧看好以下专业: 1、计科 很多有刻板印象,认为计科的将来就是程序猿,其实并非如此,软件只是其中一个方向,而且计科是基础型的,拓展空间非常大,未来的发展方向包括…

【linux】认识“文件”的本质,理解“文件系统”的设计逻辑,体会linux优雅的设计理念

⭐⭐⭐个人主页⭐⭐⭐ ~~~~~~~~~~~~~~~~~~ C站最❤❤❤萌❤❤❤博主 ~~~~~~~~~~~~~~~~~~~ ​♥东洛的克莱斯韦克-CSDN博客♥ ~~~~~~~~~~~~~~~~~~~~ 嗷呜~ ✌✌✌✌ 萌妹统治世界~ 🎉🎉🎉🎉 ✈✈✈✈相关文章✈✈✈✈ &#x1f4a…

如何使用 AutoDL 云实例基于LangChain-Chatchat 和 ChatGLM 搭建本地知识库模型详细教程(更新中)

注册 AutoDL 算力云 AutoDL算力云是一个专注于提供人工智能(AI)和深度学习(DL)领域算力资源的云计算平台。它整合了高性能计算资源,如GPU和TPU等,为用户提供了弹性、高效且成本效益高的计算服务。通过Auto…

靠谱放心!康姿百德柔压磁性豪华枕质量大揭秘

康姿百德柔压磁性豪华枕,舒爽透气呵护青春期娇嫩肌肤 良好的睡眠对青少年的生长发育至关重要,想要获得高质量睡眠,除了选择合适的床垫之外,一款合适的枕头同样是打造优质睡眠环境的重要一环。康姿百德集团有限公司深耕睡眠领域已…

《Fundamentals of Power Electronics》——理想变压器基本公式推导

接下去推导理想变压器的基本公式。理想变压器满足以下三个条件: 1、无铜损。假设原副边线圈均无纯电阻,则不会因在铜导线中产生焦耳热引起能量损耗,另外也不考虑回路中的分布电容。 2、无铁损。忽略通过铁芯的磁通量变化引起的涡流损耗&…

实现一个渐进优化的 Linux cp 命令

1&#xff0c;第1版 copy 先写个轮廓 selfcp.c &#xff1a; #include <stdio.h>int main() {FILE *source, *destination;char ch;source fopen("H222.txt", "r");if (source NULL) {printf("Error opening source file!\n");retur…

[算法刷题—二分法]寻找插入位置

题目展示: 本道题本身并不是很难,主要是学习和分析二分查找插入位置的方法。 首先大体上分为两种情况: 一.target在待查找的数组之中,返回对应值的下标索引。 二.target不在待查找的数组之中&#xff0c;需要返回target插入位置的索引(原数组有序) 第一种情况不难&#xff…

秋招突击——第四弹——Java的SSN框架快速入门——Maven

文章目录 引言Maven分模块开发与设计分模块开发的过程 依赖管理可选依赖与排除依赖 继承与聚合聚合继承 属性和版本管理属性扩大集中管理的范围版本管理 多环境开发多环境开发 私服简介安装私服资源操作流程分析上传和下载 总结 引言 前一个部分花了太多时间&#xff0c;后续得…

DomoAI让你轻松变身视频达人!支持20s完整视频生成!

账号注册 官网&#xff1a;https://www.domoai.app/zh-Hant/library 功能 支持不同风格的视频类型&#xff0c;支持图片转视频&#xff0c;支持文字转图片&#xff0c;支持静态图片变为动态。 可以切换语言为中文 风格转换 选择不同风格的 支持生成20s&#xff0c;目前接触…

深度学习(PyTorch)批注理解,建议边学可以边看这个笔记

前言 动手学习深度学习&#xff0c;内容丰富&#xff0c;但是对于初学者有很多晦涩难懂的地方&#xff0c;我将日常更新这篇文章以截图的形式&#xff0c;每天高强度学习四五个小时&#xff0c;精力缺乏&#xff0c;我认为&#xff0c;如果想学习这个深度学习&#xff0c;你需…

【Arthas案例】某应用依赖两个GAV不同但包含两个相同全限定类名StaticLoggerBinder,引起log4j.Level类找不到异常

3分钟内解决问题 两个不同的GAV依赖冲突&#xff0c;包含相同全限定类名&#xff0c;引起ClassNotFoundException Maven依赖的三坐标体系GAV(G-groupId&#xff0c;A-artifactId&#xff0c;V-version) 【案例1】某应用依赖两个GAV不同的jar&#xff0c;但包含两个相同全限定类…

区间预测 | Matlab实现BP-ABKDE的BP神经网络自适应带宽核密度估计多变量回归区间预测

区间预测 | Matlab实现BP-ABKDE的BP神经网络自适应带宽核密度估计多变量回归区间预测 目录 区间预测 | Matlab实现BP-ABKDE的BP神经网络自适应带宽核密度估计多变量回归区间预测效果一览基本介绍程序设计参考资料 效果一览 基本介绍 1.Matlab实现BP-ABKDE的BP神经网络自适应带…

Camtasia2024破解永久激活码注册码分享最新

随着数字时代的到来&#xff0c;视频制作已成为许多人日常生活和工作中不可或缺的一部分。而在众多视频编辑软件中&#xff0c;Camtasia凭借其强大的功能和易用性&#xff0c;赢得了广泛的用户喜爱。近期&#xff0c;Camtasia 2024的破解版本在网络上引起了广泛关注。本文旨在为…

列表(list)(Python)

文章目录 一、定义二、列表常用操作 一、定义 list ["张三", "李四", "王五", "赵六"]二、列表常用操作 分类关键字/函数/方法说明增加列表.append(值)在列表末尾追加值列表.insert(索引&#xff0c; 值)在指定位置插入值&#xff…