当前位置: 首页 > news >正文

EventGraph:Event Extraction as Semantic Graph Parsing 论文解读

EventGraph: Event Extraction as Semantic Graph Parsing

论文:2022.case-1.2.pdf (aclanthology.org)

代码:huiling-y/EventGraph (github.com)

期刊/会议:CASE 2022

摘要

事件抽取涉及到事件触发词和相应事件论元的检测和抽取。现有系统经常将事件抽取分解为多个子任务,而不考虑它们之间可能的交互。在本文中,我们提出了EventGraph,这是一个用于事件抽取的联合框架,它将事件编码为图。我们将事件触发词和论元表示为语义图中的节点。事件抽取因此成为一个图解析问题,它具有以下优点:1)事件检测和论元抽取联合进行;2)从一段文本中检测和抽取多个事件;3)捕获事件论元和触发词之间的复杂交互。在ACE2005上的实验结果表明,我们的模型与现有的系统相比具有竞争力,并且在论元抽取方面有了很大的改进。此外,我们从ACE2005创建了两个新的数据集,其中保留了事件论元的整个文本跨度,而不仅仅是头部单词。

1、简介

事件抽取旨在根据预定义的事件本体,将非结构化文本中的事件相关信息抽取为结构化形式(即触发词和论元)(Ahn, 2006;Doddington et al, 2004)。在这些类型的本体中,事件由事件触发词来表示,并由一组预定义的论元类型组成。图1显示了一个包含两个事件的句子示例,一个由“friendly-fire”触发的Attack事件和一个由“died”触发的Die事件;这两个事件共享相同的论元,但每个事件在特定事件中扮演不同的角色。例如,U.S.是死亡事件中的Agent,但在Attack事件中扮演Attacker的角色。

与将事件抽取划分为独立的子任务相反,我们利用语义依赖分析的最新进展(Dozat和Manning, 2018;Samuel和Straka, 2020),并开发了一个端到端事件图解析器,称为EventGraph。我们采用直观的图形编码来表示单个事件图中某段文本的事件提及,并直接从原始文本生成这些事件图。我们在ACE2005 (LDC2006T06)上评估我们的EventGraph系统。我们的模型与最先进的模型取得了具有竞争力的结果,并大大提高了事件论元抽取的结果。这项工作的主要贡献是:

  1. 我们提出EventGraph,这是一个文本到事件的框架,它将事件抽取作为语义图解析来解决。该模型不依赖于任何特定于语言的特性或特定于事件的本体,因此可以很容易地应用于新的语言和新的数据集。
  2. 我们设计了一种直观的图编码方法来表示单个事件图中的事件结构。
  3. 我们的方法的通用性允许轻松解码完整的触发词和论元提及。我们从ACE2005中创建了两个新颖且更具挑战性的数据集,并提供了相应的基准测试结果。

2、相关工作

我们的工作与事件抽取和语义解析两个研究方向密切相关。

有监督事件抽取是自然语言处理中的一个研究领域。获取事件的结构化信息有不同的方法,主流的方法可以分为:1)基于分类的方法:将事件抽取作为几个分类子任务,或者以基于管道的方式分别求解(Ji and Grishman, 2008;Li等,2013;刘等,2020;Du和Cardie, 2020;Li等人,2020)或联合推断多个子任务(Yang和Mitchell, 2016;Nguyen等人,2016;刘等,2018;Wadden等人,2019;Lin et al, 2020);2)基于生成的方法:将事件抽取作为序列生成问题(Paolini等人,2021;Lu等,2021;Li等,2021;Hsu等,2022);3)提示提示方法:受自然语言理解任务的启发,这些方法利用了“离散提示(discrete prompts)”(Shin等人,2020;Gao等,2021;Li和Liang, 2021;Liu et al, 2022)。

语义表示解析近年来引起了人们的极大兴趣(openen等人,2014,2015,2020)。与语法依赖表示不同,这些语义表示关键不是树,而是一般的图,其特征是可能有多个入口点(根),并且不一定是连接的,因为不是每个标记都是图中的节点。在开发能够产生这种语义图的基于迁移和基于图的依赖解析器的变体方面,已经取得了相当大的进展(Hershcovich等人,2017;多扎特和曼宁,2018年;塞缪尔和斯特拉卡,2020年)。

在当前环境中,语义解析器在NLP任务中的应用已经超越了意义表示解析。这些方法依赖于将特定于任务的表示重新表述为语义依赖关系图。例如,Yu等人(2020)利用Dozat和Manning(2018)的解析器来预测命名实体的跨度,而Kurtz等人(2020)将否定解析任务(Morante和Daelemans, 2012)描述为具有良好结果的图解析任务。最近,Barnes et al.(2021)提出了一种依赖解析方法来从文本中抽取意见元组,称为结构化情感分析,最近致力于这项任务的共享任务证明了图解析方法对情感分析的有用性(Barnes et al, 2022)。与我们的工作最相似的是Samuel等人(2022)的工作,该工作采用PERIN解析器(Samuel和Straka, 2020)直接从原始文本解析为情感图。

3、事件图表示

我们采用一种有效的“标记边缘(label-edge)”表示,用于句子范围内的事件图编码。事件图中的每个节点都对应于一个事件触发词或一个论元,该论元锚定在句子中的唯一文本跨度上,除了顶部节点,它只是每个事件图的虚拟节点。边仅在顶部节点和事件触发词之间或事件触发词和论元之间受到约束,对应的边标签作为事件类型或论元角色。“标记边缘”编码具有以下能力:1)多个事件提及;2)嵌套结构(论元或触发词论元之间的重叠);3)单个论元的多个论元角色。以图2中的事件图为例,句子中包含两个事件提及,它们共享相同的论证“the hills above Chamchamal”,但角色不同,论元“coalition”嵌套在论元“coalition figher jets”中。
在这里插入图片描述

4、事件解析

EventGraph是PERIN (Samuel和Straka, 2020)的改编,PERIN是用于文本到图解析的通用排列不变框架。给定事件图的“标记边缘”编码,我们通过定制PERIN的模块来创建EventGraph,如图3所示,其中包含三个分类器,分别用于生成节点、锚点和边。每个输入序列由EventGraph的四个模块处理,生成最终的结构化表示。

编码器:我们使用large XLM-R (Conneau et al, 2020)作为编码器,以获得输入序列的上下文化表示;每个token通过在子词上学习的子词注意层获得上下文嵌入。

查询生成(query generator):我们使用线性转换层将每个嵌入的token映射到nnn个查询。

解码器:解码器是一个Transformer编码器层的堆叠(Vaswani等人,2017),没有位置编码,这是置换不变的(非自回归);解码器通过建模query之间的相互依赖关系来处理和增强每个token的query。

解码头:它由三个分类器组成:a)节点分类器是一个线性分类器,通过对每个token的增强查询进行分类来预测节点的存在;由于为每个token生成多个查询,单个token可以生成多个节点;b)anchor biaffine分类器(Dozat和Manning, 2017)在每个token的增强查询和上下文嵌入之间使用deep biaffine attention,将预测的节点映射到表面token;C)edge biaffine分类器使用两个deep biaffine attention模块来处理生成的节点,并预测一对节点与边缘标签之间的边缘是否存在。

给定一段文本,EventGraph生成相应的图,从节点和边中抽取事件提及的结构化信息并不费力。

5、实验

5.1 数据集

ACE 2005:ACE05-E、ACE05-E+、ACE05-E++、ACE05-E+++。

5.2 评估指标

Trigger classification (Trg-C)、Argument classification (Arg-C): precision、recall、F1。

5.3 对比模型

DYGIE++、ONEIE、TEXT2EVENT、GTEE-GYNPREF。

5.4 实施细节

我们的代码构建在PERIN解析器之上(Samuel和Straka, 2020)。关于我们的训练设置和超参数设置的细节在附录a中给出。对于每个数据集,我们用5个不同的随机种子训练5个模型,并报告相应结果的均值和标准差。

6、结果和讨论

7、总结

本文提出了一种新的事件抽取方法——语义图解析。我们所提出的EventGraph在事件触发词分类任务上已经在ACE2005上取得了具有竞争力的结果,在论元角色分类任务上获得了最好的结果。我们还提供了一个图形表示来更好地可视化事件提及,并提供了一个有效的工具来促进图转换。我们从ACE2005中创建了两个新的数据集,包括触发词和论元的全文跨度,并提供相应的基准测试结果。我们表明,尽管添加了更多更长的文本序列,EventGraph仍然优于之前在更有限的数据集上测试的模型。在未来的工作中,我们将尝试不同的预训练语言模型,并进行更详细的错误分析。

相关文章:

EventGraph:Event Extraction as Semantic Graph Parsing 论文解读

EventGraph: Event Extraction as Semantic Graph Parsing 论文:2022.case-1.2.pdf (aclanthology.org) 代码:huiling-y/EventGraph (github.com) 期刊/会议:CASE 2022 摘要 事件抽取涉及到事件触发词和相应事件论元的检测和抽取。现有系…...

【蓝桥杯集训·每日一题】AcWing 3696. 构造有向无环图

文章目录一、题目1、原题链接2、题目描述二、解题报告1、思路分析2、时间复杂度3、代码详解三、知识风暴拓扑排序一、题目 1、原题链接 3696. 构造有向无环图 2、题目描述 给定一个由 n 个点和 m 条边构成的图。 不保证给定的图是连通的。 图中的一部分边的方向已经确定&#…...

国内vs国外:外贸建站该如何选择?

外贸建站找国内还是国外? 答案是:国内。 随着互联网的发展,越来越多的企业开始意识到在网络上进行商业活动的重要性。 其中,建立一个专业的外贸网站是企业在国际市场上拓展业务的关键。 然而,对于选择国内还是国外…...

HLS协议有哪些特别优势

阿酷TONY / 2023-3-3 / 长沙 可以实现码率的动态自适应,清晰度动态成为可能;HLS是基于HTTP 协议的,更易于做各平台的适配与兼容;多终端跨平台的支持性: PC端, Android端, IOS 平台,微信之类的都支持&am…...

JavaScript里的回调函数属于闭包吗?

回调函数本身不一定属于闭包,但是在某些情况下,它们可能会涉及闭包。 回调函数通常是指在异步操作完成时执行的函数。它们在 JavaScript 中被广泛使用,例如在处理 AJAX 请求、定时器、事件处理程序等方面。 在使用回调函数时,如…...

编程基本概念

程序的构成 python程序由模块组成,一个模块对应一个python源文件,后缀为.py模块由语句组成,运行python程序时,按照模块中的语句顺序依次执行语句是python程序的构造单元,用于创建对象,变量赋值&#xff0c…...

Azure OpenAI 官方指南02|ChatGPT 的架构设计与应用实例

ChatGPT 作为即将在微软全球 Azure 公有云平台正式发布的服务,已经迅速成为了众多用户关心的服务之一。而由 OpenAI 发布的 ChatGPT 产品,仅仅上线两个月,就成为互联网历史上最快突破一亿月活的应用。本期从技术角度深度解析 ChatGPT 的架构设…...

RK3568核心板以太网大数据测试报告-万象奥科

1. 测试对象HD-RK3568-IOT 底板基于HD-RK3568-CORE工业级核心板设计(双网口、双CAN、5路串口),接口丰富,适用于工业现场应用需求,亦方便用户评估核心板及CPU的性能。适用于工业自动化控制、人机界面、中小型医疗分析器…...

来 CSDN 三年,我写了一本Python书

大家好,我是朱小五。转眼间已经来 CSDN 3年了,其中给大家一共分享了252篇Python文章。 但这三年,最大的收获还是写了一本Python书! 在这个自动化时代,我们有很多重复无聊的工作要做。想想这些你不再需要一次又一次地做…...

TIA博途中通过SCL语言实现快速排序的具体方法示例

TIA博途中通过SCL语言实现快速排序的具体方法示例 首先,了解一下快速排序的原理: 排序算法的思想非常简单,在待排序的数列中,我们首先要找一个数字作为基准数。为了方便,我们一般选择第 1 个数字作为基准数(其实选择第几个并没有关系)。接下来我们需要将这个待排序的数列…...

第 46 届世界技能大赛浙江省选拔赛“网络安全“项目B模块任务书

第46届世界技能大赛浙江省选拔赛"网络安全"项目B模块(网络安全事件响应、数字取证调查)第46届世界技能大赛浙江省选拔赛"网络安全"项目B模块2.1 第一部分 事件响应2.2 第二部分 数字取证调查2.3 第三部分 应用程序安全第46届世界技能…...

【C】字符串操作函数

初始化字符串 #include <string.h>void *memset(void *s, int c, size_t n); 返回值&#xff1a;s指向哪&#xff0c;返回的指针就指向哪memset函数把s所指的内存地址开始的n个字节都填充为c的值。通常c的值为0&#xff0c;把一块内存区清零。例如定义char buf[10];&…...

【python】 pytest自动化测试框架--selenium,requests,appium自动化工具

一、pytest简介 pytest是python的一种单元测试框架&#xff0c;与python自带的unittest测试框架类似&#xff0c;但是比unittest框架使用起来更简洁&#xff0c;效率更高 二、 pytest 单元测试框架 1、pytest 特点 pytest是python当中的一个单元框架&#xff0c;比unittest更灵…...

Spring boot 实战指南(三):配置事务,整合Elasticsearch、swagger、redis、rabbitMQ

文章目录一、配置事务依赖使用注解二、Elasticsearch创建项目配置maven完善依赖es连接配置实体映射repositoryservicecontroller三、swagger依赖启动类路径匹配配置配置类controller注解四、redis&#xff08;代码实现&#xff09;依赖yml配置配置类封装redisTamplate五、rabbi…...

九、Bean的循环依赖问题

1 什么是Bean的循环依赖 A对象中有B属性。B对象中有A属性。这就是循环依赖。我依赖你&#xff0c;你也依赖我。 比如&#xff1a;丈夫类Husband&#xff0c;妻子类Wife。Husband中有Wife的引用。Wife中有Husband的引用。 2 singleton下的set注入产生的循环依赖 丈夫类 pac…...

macOS关闭SIP后,仍无法修改/usr文件夹下文件

发现问题 MacOS 升级到Big Sur后&#xff0c;删除多余的python3文件&#xff0c;发现写不到磁盘&#xff0c;会报OSError: [Errno 30] Read-only file system的错误。经过了解&#xff0c;在Mac OS10.11 之后&#xff0c;苹果公司为了提高系统环境安全&#xff0c;引入了一个内…...

【编程基础之Python】8、Python复合数据类型

【编程基础之Python】8、Python复合数据类型Python复合数据类型列表&#xff08;List&#xff09;创建列表访问元素内置方法列表操作元组&#xff08;Tuple&#xff09;创建元组访问元素集合&#xff08;Set&#xff09;创建集合基本操作其他操作字典&#xff08;Dictionary&am…...

自动驾驶决策规划-控制方向学习资料总结(附相关资料的链接)

项目仓库 欢迎访问我的Github主页 项目名称说明chhCpp学习C仓库chhRobotics学习自动驾驶、控制理论相关仓库(python实现)chhRobotics_CPP学习自动驾驶、控制理论相关仓库(c实现)chhML 、chh-MachineLearning学习机器学习仓库chhRL学习强化学习仓库chhTricks存放一些有意思的t…...

网络安全岗位介绍——售前工程师

一、工作内容 1、独立完成并配合销售人员引导客户完成方案设计、产品选型、配置报价和能为客户提供安全咨询与方案优化等服务; 2、作为售前工程师&#xff0c;跟踪整个项目的进展&#xff0c;和销售进行配合&#xff0c;协调公司各种资源完成项目中标; 3、编写投标文件的技术…...

nodejs安装和卸载超详细步骤

安装程序①下载完成后&#xff0c;双击安装包&#xff0c;开始安装&#xff0c;使用默认配置安装一直点next即可&#xff0c;安装路径默认在C:\Program Files下&#xff0c;也可以自定义修改②安装路径默认在C:\Program Files下面&#xff0c;也能够自定义修改&#xff0c;而后…...

【Leetcode】移除链表元素 链表的中间节点 链表中倒数第k个节点

目录 一.【Leetcode203】移除链表元素 1.链接 2.题目再现 A.双指针法 B.类尾删法 C.哨兵位 二.【Leetcode876】链表的中间节点 1.链接&#xff1a;链表的中间节点 2.题目再现 3.解法&#xff1a;快慢指针 三.链表中倒数第k个节点 1.链接&#xff1a;链表中倒数第k个…...

快速上手配置firewalld

firewalld使用firewall-cmd命令配置策略。 查看当前firewalld当前服务运行状态 firewall-cmd --state firewalld防火墙状态还用使用如下命令查看状态 systemctl status firewalld 查看所有打开运行的端口 firewall-cmd --zonepublic --list-ports 查看区域信息情况 firewall…...

treap使用mt19937会导致问题原因分析

Treap 是一种使用随机数生成器来维护树形结构的数据结构&#xff0c;而 mt19937 是一种常用的伪随机数生成器。虽然 mt19937 可以生成高质量的随机数序列&#xff0c;但是在 Treap 中使用它可能会导致一些问题。 mt19937 返回的是一个 unsigned int 其中一个问题是&#xff0…...

tmux和vim

tmux 作用 分屏 允许断开Terminal连接后继续运行进程 结构 一个tmux可以开一堆session tmux: session 1, session 2, session 3 … Session: window 1, window 2, window 3… Window: pane 1, pane 2, pane 3… pane是最小单位&#xff0c;用shell语言编程 操作 输入…...

2023年全国最新保安员精选真题及答案12

百分百题库提供保安员考试试题、保安职业资格考试预测题、保安员考试真题、保安职业资格证考试题库等&#xff0c;提供在线做题刷题&#xff0c;在线模拟考试&#xff0c;助你考试轻松过关。 121.《保安员证》是经由设区的&#xff08;&#xff09;单位进行发放。 A:市级人民政…...

Hbase的基本概念与架构

一、Hbase的概念 HBase是Hadoop的生态系统&#xff0c;是建立在Hadoop文件系统&#xff08;HDFS&#xff09;之上的分布式、面向列的数据库&#xff0c;通过利用Hadoop的文件系统提供容错能力。如果你需要进行实时读写或者随机访问大规模的数据集的时候&#xff0c;请考虑使用H…...

颠覆你的认知,业务同事都能开发软件,我简直无地自容……

经常看到网络鼓吹业务人员也能搭建应用&#xff0c;本是嗤之以鼻、半信半疑&#xff0c;但当这件事真实发生在自己身上时&#xff0c;竟觉得此言不虚&#xff1f; 一、背景 最近公司为了集成系统、提升扩展能力&#xff0c;引进了低代码平台JNPF&#xff0c;说个题外话&#…...

01 | n2n虚拟局域网

1 n2n简介 为了满足两个不同局域网的机器进行通信&#xff0c;让不同网段的机器能够进行P2P( 点对点 peer-to-peer ) 通信。2 n2n源码 https://github.com/ntop/n2n.git3 n2n名词 3.1 SuperNode 超级节点 SuperNode 相当与注册中心, 它会记录边缘节点的连接信息&#xff0c;…...

MFC界面控件BCGControlBar v33.4 - 支持Win 11 Mica material主题

BCGControlBar库拥有500多个经过全面设计、测试和充分记录的MFC扩展类。 我们的组件可以轻松地集成到您的应用程序中&#xff0c;并为您节省数百个开发和调试时间。BCGControlBar专业版和BCGSuite for MFC v33.4已正式发布了&#xff0c;该版本包含了对Windows 11 Mica materia…...

手把手教你用js实现手机通讯录功能(附源码)

js实现手机通讯录效果图需求需求一&#xff1a;锚点通过#id配合a标签使用css中scroll-behavior属性的使用需求二需求三获取汉字拼音的首字母方法1&#xff1a;使用插件&#xff0c;这里推荐pinyin-pro方法2&#xff1a;使用unicode去重数组中冗余的对象法一&#xff1a;用Map去…...

做网站开发数据库怎么写/百度搜索量最大的关键词

最近学了图的遍历&#xff0c;关于其中的算法详情请见此处 关于深搜和广搜是非常重要的&#xff0c;对一些矩阵和图的遍历起到不错的作用。下面以一些题目来训练&#xff0c;其中每道题都尽量给出深搜和广搜的2种做法。 总结&#xff1a;深搜类似于递归&#xff08;毕竟需要回溯…...

河南网站建设详细流程/株洲疫情最新情况

1、使用edu邮箱进行注册&#xff1b; 2、AD软件的安装&#xff1b;...

外贸b2b选品/谷歌seo搜索引擎

IE问题解决办法文章由小编整理发出&#xff0c;内容真实有效&#xff0c;欢迎提出您的意见IE系列文章由小编在互联网中整理并且发出&#xff0c;内容保障真实健康.IE浏览器怎么将网页保存为pdf文档很多小伙伴们都不清楚&#xff0c;接下来小编带来将网页保存为pdf文档的方法说明…...

攻击网站常用方法/希爱力跟万艾可哪个猛

Java Swing教程 - Java Swing JSpinnerJSpinner组件组合来自JFormattedTextField和可编辑的JComboBox的函数。JSpinner可以有一个选择列表&#xff0c;同时&#xff0c;我们也可以应用一个格式到显示的值。它从选择列表中一次只显示一个值&#xff0c;它允许我们输入一个新值。…...

酒店做网站/网站优化内容

关联数组是描述一组键及其关联值时经常使用的一种数据类型&#xff0c;可以说它是所有编程语言的支柱&#xff0c;文章将介绍10个操作PHP关联数组的技巧&#xff0c;熟练运用能帮助你提高开发效率。 【51CTO译文】关联数组是描述一组键及其关联值时经常使用的一种数据类型&…...

网站如何做关键词优化/杭州网站优化推荐

remote-control 可以让用户通过外部接口控制应用程序音乐, 官方建议的做法是在View显示的时候接收remote-control事件 [c-sharp] view plaincopy - (void)viewDidAppear:(BOOL)animated { [super viewDidAppear:animated]; [[UIApplication sharedApplication…...