欢迎来到大分享文库-在线教育资源分享平台 ! | 帮助中心 大分享文库-在线教育资源分享平台
大分享文库-在线教育资源分享平台
  • 简介:摘 要 I 摘 要 实体关系是描述实体之间语义关系的重要途径。实体关系抽取 是信息抽取任务 中的 重要 环节,也有着广泛的应用前景。随着 Web2.0 的迅猛发展,人们对实体关 系抽取提出了新的要求,以适应从快速增长的海量互联网文本中迅速准确地获取 对用户有价值的信息。 传统的实体关系抽取需要预先定义关系类型体系,然而定义一个全面的实体关 系类型体系是很困难的。开放式实体关系抽取技术 通过使用关系指示词描述关系 的方法 解决了预先定义关系类型体系的问题,但是在中文上的研究还比较少。 因 此,针对不同的应用场景,本文提出了两种不同的开放式实体关系抽取方法,并 且探索自动构建关系类型体
    下载积分: 8
    上传时间:2018-12-20
    页数: 71
    19人已阅读
    ( 4 星级)
  • 简介:哈尔滨工业大学工学硕士学位论文 摘要 下一代搜索引擎的一个突出特点是个 性化,个性化信息检索是以用户为 中心的信息检索技术,它获取以多种形式表达的用户需 求(包括显式的、隐 式的以及相关用户的需求) ,并综合利用这些用户信 息,提高信息检索系统 的性能。 作为个性化信息检索中的重要研究子 课题,用户兴趣模型研究通过对用 户检索和浏览历史的分析,建立用户短期与长期兴趣模 型,并随着用户信息 和检索领域的变化对用户兴趣模型进行更新。用户兴趣 模型研究面临的主要 问题是,缺乏合理的任务划分和标准评测集,无法对用 户兴趣模型进行公正 的评价。因此,本文通过对个性化检索进行合理的任务 划分,并利用开
    下载积分: 8
    上传时间:2018-12-20
    页数: 56
    13人已阅读
    ( 4 星级)
  • 简介:摘 要 I 摘 要 随着 计算机 与 互联网的 快速 发展, 通过 互联网所产生的数据 规模急剧增 加 , 如何 能够 从 海量数据中 精准 快捷获取 有价值 的信息 已经成为 了 国内外研 究 的 热点 之一。 信息抽取 正 是 在这种背景下产生的 。信息抽取 的主要目的 为 从自然语言 文本 之中 抽取 事实类信息 ,如 指定的实体、关系、时间等,即将 自然语言 文 本中蕴含的 无结构 信息转换成半结构化或结构化的信息。 实体关系抽取为 信 息抽取中的一个子任务 ,其中 传统 实体关系抽取 任务 需要 预先定义 关系类别 体系 , 然后 在 定义好的 关系类别体系 中 根据实体
    下载积分: 8
    上传时间:2018-12-20
    页数: 63
    16人已阅读
    ( 4 星级)
  • 简介:哈尔滨工业大学工学硕士学位论文 摘要 信息抽取任务随着互联网信息爆炸式的增长越来越凸显其重要性,而事件抽取又是信息抽取中至关重要的一个研究点。它旨在将无结构化文本中人们感兴趣的事件以及事件所涉及到的时间、地点、人物等元素准确地抽取出来并以结构化的形式存储下来,以供自动文摘、自动问答、信息检索、舆情监控、话题检测等自然语言处理上层技术的使用和用户方便的查看。 事件抽取一般都需要预先指定事件类型,然后或基于机器学习方法,或基于模式匹配方法识别事件类型和事件元素。并且在以往的研究中,很少有学者在多种不同源的语料下测试方法的鲁棒性。因此,以往的事件抽取系统在领域自适应方面表现欠佳。 本文在总
    下载积分: 8
    上传时间:2018-12-20
    页数: 81
    13人已阅读
    ( 4 星级)
  • 简介:哈尔滨工业大学工学硕士学位论文 - - I 摘要 所谓共指消解就是将对应同一实体的多个表述划分到一个等价类的过程。 共指消解是信息抽取中的一个重要子任务,在自然语言处理和信息检索的各个 领域有着重要的应用。 传统方法将共指消解分割成为两个步骤 1)分类的过程 2)合并的过程。 在本文,我们利用超图 分割巧妙 解决共指消解问题,避免了将共指消解分割成 为两个过程,而是从全局优化的角度,一步解决共指消解。我们利用超图表示 一篇文本,顶点代表表述,超边 多个 代表表述共同具备的特征,共指消解就是 从全局优化的角度,将超图分割成多个独立的子图,每个子图代表一条共指链。 本文重点研究了三部分
    下载积分: 8
    上传时间:2018-12-20
    页数: 63
    18人已阅读
    ( 4 星级)
  • 简介:哈尔滨工业大学工 学 硕士学位论文 - - I 摘 要 随着微博、微信等新媒介的迅速发展,中文短文本信息呈爆发式增长,如 何高效的组织与管理文本 信息,已成为亟需解决的问题。文本主题分类,能够 改善文本信息杂乱的状况, 可以减少 查询时间,提高搜索质量,快速有效地获 取文本信息。文本主题分类 的任务是依据主题分类体系, 判别 待分类文本 所属 分类体系中 的一个或多个类别。 传统基于机器学习的文本分类算法,需要人工 预定义分类类别, 标识 类别 语料,面对大规模文档,人工人本过高,领域移植 难 ,分类性 能 过度 依赖人工 。 本文着眼于构建一套 针对大 规模文档 的 文本主题自动分
    下载积分: 8
    上传时间:2018-12-20
    页数: 69
    19人已阅读
    ( 4 星级)
  • 简介:摘要 - I - 摘要 句法分析 的任务 是根据给定的语法,自动推导出句子的语法结构 。句法 分析性能的提高将对信息检索、信息抽取以及机器翻译等应用产生重要的推 动作用。 在句法分析的研究中,依存语法以其形式简洁、易于标注、便于 应 用 等优点,逐渐受到研究人员的重视。 本文 比较 全面地研究了依存句法分析 中的几项关键技术,包括 统计模型、搜索算法、树库建设等 。 为了深入的理解各种模型、算法在实际中的应用效果, 本文 选择了三个 具有代表性的方法,分别为马金山面向中文的依存分析算法, Nivre 的 基于 转移 的依存分析器 MaltParser 以及 McDonald 的 基于图
    下载积分: 8
    上传时间:2018-12-20
    页数: 57
    19人已阅读
    ( 4 星级)
  • 简介: 摘要 近年来,随着统计机器学习技术的不断发展,对句子进行语义分析逐渐受到重视起来。语义角色标注(Semantic Role Labeling, SRL)是浅层语义分析的一种可行方案,并具有广阔的应用前景,如问答、信息抽取。 本文的出发点是将词义信息与语义角色标注任务相融合。在CoNLL2009国际评测中,曾将谓词词义消歧作为语义角色标注的一个子任务。当时,我们的方法是将最好的词义消歧预测结果作为语义角色标注的输入,再进行语义角色标注处理。这种级联方式的处理无法得出全局最优解。我们的想法是通过马尔可夫逻辑网络(Markov Logic Networks, MLNs)这种融合模型将词义消
    下载积分: 8
    上传时间:2018-12-20
    页数: 59
    20人已阅读
    ( 4 星级)
  • 简介:哈尔滨工业大学工学硕士学位论文 摘要 句法分析是自然语言处理的核心问题,对信息抽取、信息检索、机器翻译 等应用有重要的支撑作用。依存句法以其形式简洁、易于标注、便于应用等优 点为人所重视。虽然目前依存句法分析算法研究取得了一定的进展,但是其准 确率仍然不能满足实际应用的需要。针对这一问题,本课题并没有将全部研究 重点放在提高依存句法分析的准确率上,而是提出了对依存句法分析结果进行 置信度分析这一新问题,通过对依存句法树中每条依存弧的置信度进行计算, 将置信度高的依存搭配用于特定应用系统,从而提高这些系统的准确率。 目前主要有两种主流的依存分析机制,一种是基于转移的依存分析,另一 种是基于图的
    下载积分: 8
    上传时间:2018-12-20
    页数: 61
    13人已阅读
    ( 4 星级)
  • 简介:哈尔滨工业大学工学硕士学位论文 - - I 摘 要 随着计算机的快速普及,互联网的迅 猛发展,各式各样的信息呈爆炸式增 加,如何从海量数据中准确、快速地获取 用户真正需要的信息成为人们关注的 话题。信息抽取的主要目的是将非结构化 的自然语言文本转化成半结构化或结 构化的数据,方便人们准确、快速地获取 关键信息。关系抽取作为信息抽取的 子任务和关键技术之一,已经逐渐发展成 为众多自然语言处理任务的重要支撑 技术。 传统的关系抽取方法需要预先定义关 系类型,依赖于大量人工标注的训练 语料库,难以满足互联网海量信息处理的 需求。本文提出了一种新的关系抽取 研究框架,探索最大程度地避免人工参与
    下载积分: 8
    上传时间:2018-12-20
    页数: 76
    25人已阅读
    ( 4 星级)
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服客服 - 联系我们

copyright@ 2008-2018 大分享文库网 版权所有
经营许可证编号:豫ICP备11013292号-2

客服QQ:1965775022

收起
展开