欢迎来到大分享文库-在线教育资源分享平台 ! | 帮助中心 大分享文库-在线教育资源分享平台
大分享文库-在线教育资源分享平台
  • 简介:哈尔滨工业大学工学硕士学位论文 摘要 篇章或对话中大量出现的指代,是自 然语言中常见的语言现象,它使得 句子更加简明,主题更加突出,这也给计算机理解自然 语言增加了难度。指 代消解一直是自然语言理解中的核心问题,在机器翻译 、信息抽取、自动文 摘以及自动问答等领域 中都有重要应用。 对于代词消解,包含代词与候选先行 词的句法分析树可以提供丰富的句 法信息,但其结构复杂,不易表示,传统的方法都是基 于语言学知识,人工 地、启发式地选择与构建特征集合,如候选先行语的句 法角色,候选先行语 与指代语之间的绑定约束特征等。这类方法的局限性在 于过于依赖研究者 的语言学背景;难以发现和有效利用句法
    下载积分: 8
    上传时间:2018-12-20
    页数: 54
    4人已阅读
    ( 4 星级)
  • 简介: 摘 要 情感分析,又称为评论挖掘,是指通过自动分析用户评论的文本内容,得到用户对事物的喜好、情感等。 根据情感分析粒度来分,主要分为词语级、句子级、篇章级等多粒度的研究。从目前的研究工作来看,词语级、句子级情感分析由于文本长度限制,往往导致抽取的情感信息不够完整;与此同时,篇章级情感分析多注重对篇章整体的情感分析算法研究,太宏观,很少涉及对篇章内部情感的细致分析。深入分析可以发现,这两个问题的本质在于目前的工作对评价对象的研究不够。前者是由于抽取的评价对象不够完整,后者是由于没有抽取评价对象。 为了解决这两个问题,本课题提出了评价对象抽取与评价对象补全问题,这样能够在不损失评价对
    下载积分: 8
    上传时间:2018-12-20
    页数: 56
    8人已阅读
    ( 4 星级)
  • 简介:摘 要 摘 要 随着web 2.0时代的到来,网络文本数据成爆炸式增长,使人们淹没在数据的海洋中。如何对海量数据进行处理、如何高效地为用户提供需要的信息成为亟待解决的问题。开放域事件抽取正是在这一背景下逐步兴起的。 本文中开放域事件定义与传统事件定义不同,主要以任意领域事件触发词为核心,并包括与其关联的时间,地点,人物,数量等多种元素构成的结构化数据,是不可预测的。本文的研究内容包括面向自由文本的开放域事件抽取、以及面向微博数据的事件检测、跟踪、表示。 对于开放域事件抽取,本文将其分成两阶段任务开放域事件触发词抽取与开放域事件元素抽取。 针对开放域事件触发词抽取,本文提出了两
    下载积分: 8
    上传时间:2018-12-20
    页数: 53
    5人已阅读
    ( 4 星级)
  • 简介:哈尔滨工业大学硕士学位论文 -I- 摘要大数据时代,海量的对话内容被录制并保存下来。如何利用这些数据,高效辅助并满足人们的生活生产需求是亟待解决的问题。主题分割(TopicSegmentation)是将一个文档(如新闻节目、演讲报告以及会议等)按照主题的转移或变化划分成若干个主题段落,使每个主题段落内表达的主题连贯一致,而与相邻的主题段落所描述的主题不同。其对于冗长的文本和语音内容内的导航,定位,信息抽取以及摘要等有着重要意义。在本文面向对话文本的主题分割技术研究中,主要包含以下两个方面的研究内容无监督的主题分割方法研究和有监督的主题分割方法研究。首先,本文提出了一种基于主题模型的主题分割
    下载积分: 8
    上传时间:2018-12-20
    页数: 65
    8人已阅读
    ( 4 星级)
  • 简介:哈尔滨工业大学硕士学位论文 -I- 摘 要 问 答 系 统 是 目 前 自 然 语 言 处 理 领 域 中 的 研 究 热 点 之 一 , 它 以 精 准 的 答 案 直 接 回 答 用 户 以 自 然 语 言 方 式 表 达 的 问 题 。 在 问 题 分 析 时 , 提取问题中的关键词 对 于 理 解 其 语 义 至 关 重 要 ; 在 问 题 检 索 时 , 关 键 词 的 提 取 的 效 果 直 接 影 响 到 信 息检索的结果 和 答 案 的 相 似 度 计 算 与 排 序 。 因此, 关 键 词 提 取 是 问 答 系 统 的 基 础, 面 向 问 答 的 问 句 关 键 词 提
    下载积分: 8
    上传时间:2018-12-20
    页数: 51
    6人已阅读
    ( 4 星级)
  • 简介:摘 要 互联网的快速发展和互联网软硬件的革新给人们的生活带来了巨大的变化,互联网已经进入千家万户。每个人的家中都会有一台个人电脑或者PAD,然后接入互联网,而每个人都会随身带着一个手机,通过电信运营商接入互联网。在互联网的发展阶段中,当前的一个主要发展点就是社交化,因此各个社交网站迅速发展且占领大量的用户。人们通过社交网络分享自己生活点滴和发表自己的观点,在这其中也包含大量的个人对某种产品的消费意图信息。因此,微博作为一种社会媒体与社交网络应用,其中包含着巨大的商业价值。 本文面向微博中的消费意图进行了一系列的研究。形成具有研究价值的尝试和具有工程价值的实施方法。本文主要通过以下一些方
    下载积分: 8
    上传时间:2018-12-20
    页数: 47
    4人已阅读
    ( 4 星级)
  • 简介:哈尔滨工业大学工学硕士学位论文 ““ 摘 要 评分在教学过程中有着重要的地位,他是考核学生学习效果的手段,也是 考查教师教学水平的必要方式,而评分最关注的是评分的公平性与客观性。随 着人工智能的快速发展,利用人工智能的机器自动评分逐渐走入人们的视野, 不难看出,机器自动评分技术具有人工评分不具备的客观性、中立性,同时高 效而省时省力,可以反复的完成评卷工作等,具有诸多优异的特性。 高考是全省乃至全国范围内的大型升学资格考试,每年愈百万人参加,它 决定了考生选择大学和进入大学的资格标准, 在我国有着不可替代的重要作用。 高考中文作文评分为评分的一个特殊应用场景,由于绝大部分考生受
    下载积分: 8
    上传时间:2018-12-20
    页数: 62
    6人已阅读
    ( 4 星级)
  • 简介:摘要 近些年来,随着FaceBook、twitter的兴起,社交网络对用户的影响力越来越大,吸引越来越多的学者从事社交网络、用户兴趣挖掘等研究。用户标签用于描述用户身份属性、兴趣属性,对于检索用户、用户推荐、理解用户行为、发现用户兴趣和建立用户模型都有很大的帮助。 本文从微博用户社交网络关系出发,借助于文本分析技术,生成可以描述微博用户身份属性和兴趣属性的标签,来进行社交网络的用户标签推荐研究。 本文的研究主要包括三方面,用户候选标签的提取,候选标签的个性化排序,多样性用户标签推荐。 本文利用用户关注好友自标签作为初始用户标签集,从标签相对于关注好友网络重要性角度、标签候选集合尽可能
    下载积分: 8
    上传时间:2018-12-20
    页数: 51
    4人已阅读
    ( 4 星级)
  • 简介: 摘 要 近年来,互联网信息的爆炸式增长给了统计机器翻译新的契机,众多研究团体和商业机构开始从互联网上获取大规模的双语语料。机器翻译模型的优劣与语料的规模和质量息息相关,从互联网上得到的数据规模也远大于使用传统的人工采集的途径,但如何确保语料的质量并建立机器翻译可用的语料库则成为首要考虑的问题。 在机器翻译领域,基于句子间多特征融合的句子对齐方法已臻成熟,可以运用在质量较好的语料上,得到较好的结果;对于机器翻译系统效果的评价,已有多种常用技术,其中BLEU自出现以来一直是学者们采用的主流评测技术,它通过判断人工给出的参考翻译与待评测翻译结果的相似程度得到评估得分;在文本分类领域,对特
    下载积分: 8
    上传时间:2018-12-20
    页数: 47
    17人已阅读
    ( 4 星级)
  • 简介:哈尔滨工业大学硕士学位论文 - I - 摘 要 本课题来源于国家 863 计划项目 语言类问题求解和答案生成关键技术 及系统。该项目具体目标是解决语言类问题,即高考语文题。其中,基础语言 类问题主要分为三种字级别,词级别以及句子级问题,字级别问题主要是判 断字音字形正误问题,词级别主要是字形字义相近的词语之间的甄别,句子级 主要是处理多种病句问题。 判断字音字形正误与高考语文选择题目中的“正确字音字形判 断题”对应。 本课题将判断字音字形正误建模为字音字形检索问题,设计并实现了一种多资 源融合的策略。对于字音问题,本课题使用的资源包括 1)字音词典; 2)大 规模文本。对于
    下载积分: 8
    上传时间:2018-12-20
    页数: 72
    14人已阅读
    ( 4 星级)
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服客服 - 联系我们

copyright@ 2008-2018 大分享文库网 版权所有
经营许可证编号:豫ICP备11013292号-2

客服QQ:1965775022

收起
展开