欢迎来到大分享文库-在线教育资源分享平台 ! | 帮助中心 大分享文库-在线教育资源分享平台
大分享文库-在线教育资源分享平台
  • 简介:哈尔滨工业大学工学硕士学位论文 摘要 所谓共指消解就是将对应同一实体的多个表述划分到一个等价类的过程。共指消解是信息抽取中的一个重要子任务,在自然语言处理和信息检索的各个领域有着重要的应用。 传统方法将共指消解分割成为两个步骤1)分类的过程 2)合并的过程。在本文,我们利用超图分割巧妙解决共指消解问题,避免了将共指消解分割成为两个过程,而是从全局优化的角度,一步解决共指消解。我们利用超图表示一篇文本,顶点代表表述,超边多个代表表述共同具备的特征,共指消解就是从全局优化的角度,将超图分割成多个独立的子图,每个子图代表一条共指链。 本文重点研究了三部分的内容共指消解的超图建模;共指消
    下载积分: 8
    上传时间:2018-12-20
    页数: 63
    23人已阅读
    ( 4 星级)
  • 简介:哈尔滨工业大学硕士学位论文 摘 要 随着用户越来越倾向于输入自然语言作为查询,问句理解成为了问答系统等领域中的研究重点之一。然而现有问答系统技术对复合事实型问句的处理效果并不完美,不能很好地理解用户的需求。 如何有效地对复合事实型问句分解,以帮助问答系统理解用户提出的复合事实型问句,提高问答系统回答此类问句的能力,这是本文的主要研究内容。面向复合事实型问句的分解任务,本文主要有如下工作 首先,由于复合事实型问句的分解任务是自然语言处理和问答系统中的新兴研究领域,国内外学者在这方面的积累都很少。作为研究的第一步,本文制定了详尽、规范、可执行的标注规则,构建了高质量的复合事实型问句分
    下载积分: 8
    上传时间:2018-12-20
    页数: 64
    36人已阅读
    ( 4 星级)
  • 简介:摘 要 随着互联网的快速发展,微博(microblogging)逐渐兴起。近几年来,微博逐渐渗入到人们生活的方方面面,人们不仅在微博中接受到各种各样的信息,还会主动的发布各种各样的信息,甚至表达出购买某种产品的愿望,即对某种产品存在着消费意图。所以,微博在作为一种社会媒体与社交网络的同时,其中蕴含着巨大的商业价值。 本文就微博中具有消费意图的微博进行了一系列的研究,并且主要进行了以下几个方面的研究基于Bootstrapping的外部消费意图资源挖掘;基于图模型的消费意图微博挖掘;基于SVM分类器的微博消费意图分类。下面简要介绍一下各个研究点研究内容。 (1)基于Bootstrapp
    下载积分: 8
    上传时间:2018-12-20
    页数: 61
    31人已阅读
    ( 4 星级)
  • 简介:哈尔滨工业大学工程硕士学位论文 摘 要 自动作文评分(Automated Essay Scoring,AES)就是让计算机能够对作文进行评估和打分。随着自然语言处理技术的日益成熟,针对中文作文的自动评分成为可能。作文是各种汉语考试中必然要考的科目,国家的中考、高考考生数量巨大,而且近年来中国汉语水平考试(HSK)的考生数目也逐年增多。自动作文评分因其具有效率高、客观性好等特点,因此中文作文自动评分技术的深入研究很有必要,本文对高考作文自动评分进行了深入研究。 高考作文是针对本土学生进行的考试,而国外相对成熟的英文作文自动评分系统都是针对母语非英语的学生,还有中文与英文的写作习惯也存在
    下载积分: 8
    上传时间:2018-12-20
    页数: 52
    45人已阅读
    ( 4 星级)
  • 简介:哈尔滨工业大学工学硕士学位论文 摘 要 近年来,随着互联网的蓬勃发展,特别是伴随着社交网络的兴起,人们发现互联网上开始出现了信息过载的现象,过多的信息不会帮助人们更容易发现信息,而是变得更加困难,人们无法从大量信息中发现哪些是重要的,哪些是可选的,而社交网络是个自媒体的网络应用,任何人、任何时间都可以在上面发布信息,显然增加了信息过载的程度。 基于统计的个性化微博信息与用户推荐目的是利用统计机器学习的方法为用户建立个性化的模型,目的是帮助用户避免信息过载的问题,在社交网络中发现并找到适合用户的微博信息以及需要关注的微博好友,这种推荐技术对社交网络网站提升用户体验也是非常重要的,同时,
    下载积分: 8
    上传时间:2018-12-20
    页数: 62
    38人已阅读
    ( 4 星级)
  • 简介: 摘要 近年来,随着统计机器学习技术的不断发展,对句子进行语义分析逐渐受到重视起来。语义角色标注(Semantic Role Labeling, SRL)是浅层语义分析的一种可行方案,并具有广阔的应用前景,如问答、信息抽取。 本文的出发点是将词义信息与语义角色标注任务相融合。在CoNLL2009国际评测中,曾将谓词词义消歧作为语义角色标注的一个子任务。当时,我们的方法是将最好的词义消歧预测结果作为语义角色标注的输入,再进行语义角色标注处理。这种级联方式的处理无法得出全局最优解。我们的想法是通过马尔可夫逻辑网络(Markov Logic Networks, MLNs)这种融合模型将词
    下载积分: 8
    上传时间:2018-12-20
    页数: 59
    30人已阅读
    ( 4 星级)
  • 简介:哈尔滨工业大学工学硕士学位论文 - I - 摘 要 随着互联网的快速发展,社会媒体越来越被广泛使用,成为人们生活方式的 一部分。通过社会媒体积累的数据也因而正经历着爆发性的增长。通过挖掘社会 媒体文本获得信息,相比于社会学研究中传统的问卷调查方式,有着更真实、数 据量大、费用低等优点,因而越来越被广泛使用。 但在社会媒体文本挖掘中,传统的基于词表的方法存在准确率低的问题。针 对此问题,本文提出了基于依存句法分析的方法和基于机器学习的方法,除了分 词信息,还应用词性标注、句法分析等自然语言处理信息,并在饮食行为识别上 进行了实验。实验证明了基于依存句法分析的方法在准确率上相比基于词表的方 法
    下载积分: 8
    上传时间:2018-12-20
    页数: 56
    30人已阅读
    ( 4 星级)
  • 简介:哈尔滨工业大学工学硕士学位论文 摘 要 随着Web2.0的迅猛发展,用户在互联网上的行为发生了巨大的改变,越来越多的人们在互联网上表达个人观点,由被动的接受信息转为参与创建互联网资源,由此互联网信息量的爆炸式剧增使得单纯依靠人工的方法收集和整理信息已远不能满足越来越多的需求。因此,如何从海量的互联网信息中自动挖掘和整理主观性信息尤为重要,情感分析任务应运而生。 情感分析是自然语言处理领域的一个重要话题,旨在对无结构的主观性文本进行分析、处理和归纳,最终形成方便机器理解和用户使用的结构化数据。情感分析是一个多学科综合的研究领域,内容涉及多层语言分析技术,按照处理文本粒度的不同可以将情感分
    下载积分: 8
    上传时间:2018-12-20
    页数: 76
    34人已阅读
    ( 4 星级)
  • 简介: 摘要 随着网络信息的日益膨胀,信息泛滥的状况日趋严重,而作为人们获取信息的主要手段的搜索引擎却面临着诸多新问题,如何快速地帮助用户获取特定的知识、如何引导用户并推送给用户相关信息,已然成为各个搜索引擎面临的日趋紧迫的任务。检索结果聚类能够最大限度地解决搜索引擎这一问题,提供用户引导、数据分布,其应用不仅在展现形式上,对于搜索引擎相关性排序、相关搜索等问题上均有较大帮助,对于文本数据检索、数字化图书馆管理、实体关系挖掘等领域也有非常广阔的应用前景。 对于检索结果进行挖掘,生成恰当的引导性标签,辅助用户快速浏览网页内容,是检索结果聚类的主要目标。传统的聚类方法,一方面时间复杂度较高不能快
    下载积分: 8
    上传时间:2018-12-20
    页数: 55
    25人已阅读
    ( 4 星级)
  • 简介:哈尔滨工业大学工学硕士学位论文 摘 要 近年来,微博服务作为新型的互联网应用,受到了越来越多用户的关注。在自然语言处理、信息检索和社会计算等相关领域,针对微博的研究工作也在逐渐开展和积累中。微博用户标签,作为描述用户兴趣爱好、职业领域特征等的载体,在用户组织和搜索,挖掘用户兴趣、实现微博上的个性化等方面有着重要的作用。 本文着眼于基于微博内容的用户标签自动生成,借助对内容的分析,生成能够体现用户兴趣的标签。 本文通过新浪微博API随机获取了百万级规模的标签相关数据,用于分析用户标签在统计、语义等方面的特征。同时,我们对基于文本的标签源用户的原创、转发、评论和收藏微博的语义相似度和
    下载积分: 8
    上传时间:2018-12-20
    页数: 74
    29人已阅读
    ( 4 星级)
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服客服 - 联系我们

copyright@ 2008-2018 大分享文库网 版权所有
经营许可证编号:豫ICP备11013292号-2

客服QQ:1965775022

收起
展开