欢迎来到大分享文库-在线教育资源分享平台 ! | 帮助中心 大分享文库-在线教育资源分享平台
大分享文库-在线教育资源分享平台
  • 简介:哈尔滨工业大学工学硕士学位论文 - - I 摘 要 随着计算机的快速普及,互联网的迅 猛发展,各式各样的信息呈爆炸式增 加,如何从海量数据中准确、快速地获取 用户真正需要的信息成为人们关注的 话题。信息抽取的主要目的是将非结构化 的自然语言文本转化成半结构化或结 构化的数据,方便人们准确、快速地获取 关键信息。关系抽取作为信息抽取的 子任务和关键技术之一,已经逐渐发展成 为众多自然语言处理任务的重要支撑 技术。 传统的关系抽取方法需要预先定义关 系类型,依赖于大量人工标注的训练 语料库,难以满足互联网海量信息处理的 需求。本文提出了一种新的关系抽取 研究框架,探索最大程度地避免人工参与
    下载积分: 8
    上传时间:2018-12-20
    页数: 76
    58人已阅读
    ( 4 星级)
  • 简介:哈尔滨工业大学工学硕士学位论文 摘要 随着Web2.0技术的蓬勃发展,互联网上产生了海量的用户评论信息,如何从这些评论中挖掘出有价值的信息,越来越受到研究者们的关注。从产品评论中挖掘意见信息,一方面可以帮助用户在购买产品时作出决策,另一方面可以帮助商家即时了解用户对自己产品的意见。情感标签由评价对象和评价词组成,包含了用户评论的详细信息,能够有效地体现出用户评论的核心内容。为此,本文针对情感标签抽取中的三项任务评价词集构建、评价对象识别以及情感标签抽取进行了深入研究。 在评价词集构建中,为了构建准确且全面的评价词集合,本文采用了融合语义知识库和大规模语料库的方法来获取候选评价词集合,
    下载积分: 8
    上传时间:2018-12-20
    页数: 58
    18人已阅读
    ( 4 星级)
  • 简介:哈尔滨工业大学工学硕士学位论文 摘 要 共指消解是自然语言处理中的核心任务,它对于信息抽取、信息检索、篇章分析、自动文摘、信息过滤和机器翻译等都具有重要的意义。本文对基于实例动态泛化的共指消解方法中存在的若干问题进行了改进;开发了多种共指链生成方案用于合并二元分类结果,从而提升共指消解的性能指标;我们将基于实例动态泛化的共指消解方法应用在自然语言处理的其他任务上,帮助提升这些问题的处理效果。 本文重点研究了三部分内容基于实例动态泛化的共指消解方法中的相关问题;二元分类结果合并也即共指链生成方案的研究;以及基于实例动态泛化方法在自然语言处理其他任务中的应用。 基于实例动态泛化的共指
    下载积分: 8
    上传时间:2018-12-20
    页数: 58
    36人已阅读
    ( 4 星级)
  • 简介:哈尔滨工业大学工学 硕士学位论文 I 摘 要 语义依存是 中文 语义的深层分析,完善的语义表示体系对语义依存分析有重 要作用。但是, 目前公开且规范的 中文 语义依存标注语料还比较少。 HIT 语义依 存是第一个被用来组织公开语义评测的语料,具备良好的规范性和可用性,但是 目前来看, HIT 语义依存存在一些问题,比如标签过多且某些标签出现频率过低; 某些标签之间易混淆等。 因此,需要进一步修订和完善。 本文在 HIT 语义依存基础上, 结合 语言学理论, 提出一套理论基础更强、层 次更清晰、语义关系更规范的依存体系。 另一方面 ,该体系旨在更全面地表示 汉 语的语义, 而汉语中广泛
    下载积分: 8
    上传时间:2018-12-20
    页数: 59
    26人已阅读
    ( 4 星级)
  • 简介:哈尔滨工业大学工学硕士学位论文 - I - 摘要 命名实体Named Entity,NE识别的任务是识别出文本中特定的实体, 它是信息抽取、机器翻译、信息检索和自动问答等多种自然语言处理技术的 重要基础。本文研究的是音乐领域的命名实体识别,识别的实体包括音乐 名、艺术家名、专辑名和艺术家别名4类。 目前命名实体识别领域主要有规则和统计两类方法。规则方法简单直 观,但规则的建立过程费时费力,不易移植。统计方法的健壮性和灵活性更 好,可以方便地在不同领域之间移植,但统计模型的训练要求大规模高质量 的标准语料库,而语料的标注工作同样需要消耗大量的人力物力。 本文根据音乐命名实体的特点,在语料
    下载积分: 8
    上传时间:2018-12-20
    页数: 64
    30人已阅读
    ( 4 星级)
  • 简介:哈尔滨工业大学硕士学位论文 -I- 摘 要 目前,互联网上的数据呈爆炸式增长态势,海量的数据对数据存储和信息 获取带来了前所未有的挑战。语义网被认为是下一代互联网的存储方式。以语 义网形式描述的数据不仅可以被人们理解,而且可以被计算机所理解。数据在 语义网中是互相链接的,彼此之间被语义标签链接起来,形成一个巨大的语义 网络。现在,越来越多的数据以语义网的形式发布出来,但是对于普通用户而 言,从语义网中获取信息的难度远超过目前的搜索引擎。语义网目前仅支持形 式化查询,而且只有对语义网本体熟悉的专业人员才能够编写正确的形式化查 询。对于普通用户而言,自然语言形式的查询是最便捷、最易接受的查询方式
    下载积分: 8
    上传时间:2018-12-20
    页数: 70
    39人已阅读
    ( 4 星级)
  • 简介:哈尔滨工业大学工学硕士学位论文 摘要 互联网的飞速发展使得信息以前所未有的速度产生和传播,面对信息呈指 数式增长、垃圾信息泛滥成灾的困境,搜索引擎如何找到对用户真正有用的信 息遇到了很大的挑战。在传统的搜索引擎中,用户输入查询(query),搜索引 擎返回一个很长的网页列表。它不知道用户在问什么,不知道用户想找什么, 只是通过基于关键字匹配的检索方式,把包含有关键词的网页找到;再通过网 页排序的算法,将结果列表进行排序以后展示给用户,用户需要在很长的列表 中,自己筛选出真正想要的信息。Query语义依存分析技术首先可以改善传统 搜索引擎中的网页排序,它能够对query进行深层语义理解,从而更
    下载积分: 8
    上传时间:2018-12-20
    页数: 59
    23人已阅读
    ( 4 星级)
  • 简介:哈尔滨工业大学工程 硕士学位论文 - - I 摘 要 微博作为一种新型的社交媒体 ,已经 积聚了大量的用户和影响力。由于发布 微博简单方便,传播速度快,微博上的用户发布了大量的内容丰富的信息。这些 信息中有相当数量都表现了用户对某种商品的购买愿望,也就是消费意图。这些 具有消费意图的文本数据对科学研究和商业应用都有着极高的价值。另外,这些 文本也对 社交媒体中的预测任务有着重要的意义。 本文中,针对 基于基于微博的消费意图挖掘 进行了以下三方面的研究 ( 1) 消费意图语料获取 及分类。文中首先探讨了消费意图初始语料的获取 方法,并在一淘求购,京东和微博上获取了消费意图初始语料,
    下载积分: 8
    上传时间:2018-12-20
    页数: 58
    25人已阅读
    ( 4 星级)
  • 简介:哈尔滨工业大学工学硕士学位论文 摘要 篇章或对话中大量出现的指代,是自 然语言中常见的语言现象,它使得 句子更加简明,主题更加突出,这也给计算机理解自然 语言增加了难度。指 代消解一直是自然语言理解中的核心问题,在机器翻译 、信息抽取、自动文 摘以及自动问答等领域 中都有重要应用。 对于代词消解,包含代词与候选先行 词的句法分析树可以提供丰富的句 法信息,但其结构复杂,不易表示,传统的方法都是基 于语言学知识,人工 地、启发式地选择与构建特征集合,如候选先行语的句 法角色,候选先行语 与指代语之间的绑定约束特征等。这类方法的局限性在 于过于依赖研究者 的语言学背景;难以发现和有效利用句法
    下载积分: 8
    上传时间:2018-12-20
    页数: 54
    27人已阅读
    ( 4 星级)
  • 简介: 摘 要 情感分析,又称为评论挖掘,是指通过自动分析用户评论的文本内容,得到用户对事物的喜好、情感等。 根据情感分析粒度来分,主要分为词语级、句子级、篇章级等多粒度的研究。从目前的研究工作来看,词语级、句子级情感分析由于文本长度限制,往往导致抽取的情感信息不够完整;与此同时,篇章级情感分析多注重对篇章整体的情感分析算法研究,太宏观,很少涉及对篇章内部情感的细致分析。深入分析可以发现,这两个问题的本质在于目前的工作对评价对象的研究不够。前者是由于抽取的评价对象不够完整,后者是由于没有抽取评价对象。 为了解决这两个问题,本课题提出了评价对象抽取与评价对象补全问题,这样能够在不损失评价对
    下载积分: 8
    上传时间:2018-12-20
    页数: 56
    22人已阅读
    ( 4 星级)
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服客服 - 联系我们

copyright@ 2008-2018 大分享文库网 版权所有
经营许可证编号:豫ICP备11013292号-2

客服QQ:1965775022

收起
展开