摘要:论文一本体论在自动问答系统中的应用骆正华基于本体来组织问句的方法,并探讨在基础上分析问句的方法,并利用本体向量来联系问句实例和领域知识,达到问题和答案的连接。领域具体事实知识的表示采用标记规范,主题操作事件或业务实体描述或属性。
论文 一、本体论在自动问答系统中的应用_骆正华
基于本体来组织问句的方法,并探讨在基础上分析问句的方法,并利用本体向量
来联系问句实例和领域知识,达到问题和答案的连接。
用户提交的问句
进行分词、 词性标注、 语块划分等浅层句法分析
在语块结构化的问句实例中找相似的问句
构造本体的目的都是为了实现某种程度的知识共享和重用。
领域知识可划分为三个层次,通用概念知识->领域概念知识->具体事实知识。
领域具体事实知识的表示
采用XML标记规范,主题、操作事件或业务实体、描述或属性。
问句语义的表示
主题、疑问块、问句语义表示
问句向量本质上有三种情况
主题+实体+属性
主题+事件+角色
向量是一组无序的关键字
二、一种基于加权语义相似度模型的自动问答系统_刘亚军利用语义树中词语间的距离和语义树的高度来计算词语间的语义相似度
利用词语间的语义相似度和词语的权重进一步计算用户问题与答案库中问题间的语义相似度。
关键词语(权重高的词语)
三、自动问答系统中的问题理解研究_曹志娟QA系统主要分为五个部分
问题理解、信息检索、信息处理、答案抽取、FAQ系统。
主要是三个主要部分
问题理解
信息检索
答案抽取
讲述问题理解的两个关键点:问题分类和问句扩展。
问题分类
词法分析:问句分词和标注
问题分类:基于答案对象的类型分类,增加疑问词短语分类、问题标准型、特征词分类
1. 识别问句中的疑问词,根据疑问词找到句型模式集合 - 人、地点、具体时间、持续事件、数量、原因、方法、其他 2. 与集合中的句型规则进行匹配,从而得到问题标准型 - 通过形式语言制定具体规则 - 通过概率分类的方法 3. 再根据特征词确定问题领域 - 特征词的扩充
问句扩展
问句重写-更改为定制的模板
关键词扩展
名词、动词的关键词
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。
转载请注明本文地址:https://www.ucloud.cn/yun/43286.html
摘要:考虑这样一个计算集合,它可以被允许在每一个节点和可能的图结构中,并定义了一个函数族。传统的前馈神经网络能够被看做拥有等于层数的深度比如对于输出层为隐层数加。理论结果证实那些事实上所需要的节点数随着输入的大小指数增长的函数族是存在的。 查看论文 Yoshua Bengio, Learning Deep Architectures for AI, Foundations and Trends i...
摘要:实验结果实验数据集数据集都是新闻类网页,从五个中文新闻网站中收集一百个页面这最多也就五类吧,而且也就五百个,好像有点少了吧结果与验证性能指标这这这比较文本长度就了那不是只要包含新闻正文不就好了。 《Web Content Extraction Using Clustering with Web Structure》引用 Huang X, Gao Y, Huang L, et al. ...
摘要:分块效果如图所示聚类由于不同网页之间设计和布局存在较大差异,作者选择了作为聚类算法来解决簇数目未知簇形状未知噪声等问题未给出距离函数。 《Web Content Extraction Through Machine Learning》 通过机器学习来提取网页内容 2014年,未见期刊会议上登载,作者 Ziyan Zhou @stanford.edu 简介 数据集 以新闻文章网站为主数...
摘要:后文将围绕做一些介绍。尽管如此,的使用对新手而言仍然充满了困难。本系列文章基本为个人见解,难免有错误与误解,如有客观错误欢迎提出。 前言 说到Android的污点分析框架,网上的搜索结果大多指向静态的FlowDroid与动态的TaintDroid。尽管由于加固、混淆等技术使得针对Android的静态分析越来越困难,但静态分析的无先验分析能力无法被动态分析取代,使得静态分析仍有发挥空间。...
阅读 1698·2021-10-28 09:32
阅读 604·2021-09-24 09:47
阅读 2919·2021-09-02 15:11
阅读 2731·2021-08-09 13:46
阅读 2883·2019-08-30 15:55
阅读 1070·2019-08-30 15:54
阅读 3299·2019-08-29 14:12
阅读 804·2019-08-26 13:40