首页 | 人工智能 | 数据挖掘知识 | 相关研究方向 | 编程技术 | 电脑常识 | 互联网资源 | 交流论坛 | 免费书籍资料下载 | 论文下载 | 文档资料 | 在线手册
人工智能: 信息检索 商业智能 搜索引擎技术与新闻 神经网络 生物信息学 模式识别 知识工程 本体理论与方法 机器学习 决策支持 自然语言理解 专家系统 >>更多
数据挖掘知识:
数据挖掘论文 数据挖掘其他 数据挖掘工具与应用 时序模式 相关研究人员主页 相关方向求职招聘信息 文本挖掘 学位论文 异类 预测 web数据挖掘 >>更多
相关研究方向: 联机分析 信息抽取 小波变换 数据仓库 access数据库 DB2数据库 Mysql数据库 Oracle数据库 SqlServer数据库 Sysbase数据库 统计分析 >>更多
主页>人工智能>本体理论与方法>

基于本体的语言模型研究

1  引言
语言模型是对自然语言的一种描述,构造语言模型是研究计算语言学、自然语言理解的核心内容之一, 好的语言模型将有助于自然语言相关内容处理的准确性。传统的基于规则和基于统计的语言模型能很好处理各种语言关系, 简化了对语言的描述,在语音处理、文字识别、信息检索、机器翻译等领域,都取得了较好的效果。之后有研究者相继提出了统计与规则并举的方法[4,5]、基于主题[2]和基于记忆[3]的两种自适应语言模型[1]。但在应用的过程中,上述模型本身也暴露出了一些问题,其中比较突出的是它不能很好地表达和处理语义层面信息,不能很好地适应主题多变的应用环境。
本体作为一种能在语义和知识层面上描述信息系统的概念模型建模工具,自90年代初被引入人工智能领域[6]后,与自然语言处理的研究有机结合在一起,在知识工程、数字图书馆、信息检索和Web上异构信息的处理、语义Web等许多领域得到了广泛的应用。从人类对知识的积累和学习过程看,人们对事物的认知与处理是理解其意义后才做出判断,而这种理解恰恰依赖于大脑中积累的已有知识,或者是对现象本身的长期经验总结及归纳。理想情况下,处理自然语言应该确立在计算机能够真正"理解语言"的基础上去实现,如果计算机可以像人类一样"不断学习和积累知识",处理自然语言问题时,计算机的"理解能力"及"准确性判断"将会极大提高。由于本体能够使人或机器间的交流建立在对所交流领域共识的基础上[7],因此比较适合我们构造这样的知识表示。 字串5
本文结合本体的特性,提出一种基于本体的语言模型,该模型与语言无关,可以完成跨语言信息处理。该模型首先通过一种类框架结构,构建特征信息的本体表示,然后采用特定的机器学习策略[8],通过语料学习,获得特征信息在语料中的语义、语用、句法等方面的用法,并抽象表示成特征信息的本体知识。处理实际文档时,将基于特征信息的本体表示,抽取并归并意义相近的特征信息,得到特征信息在实际文档中的用法,并与已经获取的本体知识做比较。本文在中文环境下,基于上述本体模型,从文本相似度计算、信息检索、特定信息识别等几个方面做了几组实验,初步的实验结果表明,在整体的准确率和召回率方面均有所提高。
本文余下的内容组织如下:第2部分介绍本体的概念以及特征信息的本体表示;第3部分详细描述本体知识的获取策略和过程;第4部分给出初步的实验结果及分析;第5部分为结论及下一步的工作。

资料全文下载 字串6

上一篇:中文信息检索引擎中的若干技术   下一篇:Tenth Asian Computing Science Conference Data management on
版权申明:本站信息收集自互联网,仅供学习参考使用。若有违法转摘您的作品请email我们及时删除!  
用户名: 新注册) 密码: 匿名评论 所有评论
评论内容:(不能超过250字,需审核后才会公布,请自觉遵守互联网相关政策法规。
Google
8 热门推荐
  • 本体库的建立与标注
  • 汉语诗的本体知识与语意检索
  • 軟體工程的知識本體
  • 顶层本体建模与中华文化
  • Bootstrapping Semantics on the Web:Meani
  • Position Paper: Ontology Construction fr
  • Towards the notion of gloss, and the ado
  • Bringing Communities to the Semantic Web
  • Organization Ontology
  • Beer Ontology (draft)
  • 8 阅读排行
     
    版权所有:数据挖掘研究院 2004-2006 未经授权禁止复制或建立镜像
    增值电信业务经营许可证编号:皖B2-20040042 文网文:[2005]027号