面向非结构化文本的信息抽取:从封闭到开放.pdf

摘要 : 本文介绍了面向非结构化文本的信息抽取技术,即从自然语言文本中抽取实体、关系等事实信息,并形成结构化三元组的技术。这项技术旨在让互联网上的海量信息机器可读,为知识图谱构建与填充、自动机器问答、信息检索、辅助决策等下游任务和应用提供基础。本文还介绍了关系抽取任务的形式,包括封闭信息抽取、开放信息抽取和联合抽取等,以及面向特定实体对的分类问题和噪声、误导模型带来的挑战。最后,本文提出了设计模型关注能决定目标实体对的语义关系的片段,并降低噪声的影响,来解决关系抽取任务的挑战。
在线阅读 下载报告 | 3.32 MB | 47页
阅读和下载会消耗积分;登录、注册、邀请好友、上传报告可获取积分。
成为VIP会员可免费阅读和下载报告
与最强人工智能Ai对话