Ontology模型

2024-08-23

Ontology模型 篇1

本体为特定领域的人和应用系统的交流提供了一种通用的知识共享模式。本体的研究和应用已经延伸到知识工程、自然语言处理、信息检索系统、智能信息集成和知识管理、信息交换和软件工程等领域。在被称为下一代Web的语义网Semantic Web中, 本体是解决语义层次上Web信息共享和重用的基础。如何对不同领域内的知识进行抽取和描述, 并构建出合适的领域本体是研究热点之一。

1 本体建模

1.1 本体及其建模元语

ontological是一个个实体, 是现实世界中的某个领域的概念化的表示或显式说明, 其中包括概念和概念之间的关系。一般情况下, 它包括一个术语的词汇表以及词汇意义的一些相应说明。

在研究本体领域概念化模型时, 重点是研究本体构建及其形式表示方法。这是建立语义web的基础和核心。首先进行概念分类和识别 (基本概念、角色概念与角色拥有者等) ;然后, 研究不同语境下角色的性质, 及关于角色于扮演者的公理;第三, 研究角色概念间的关系。在这个过程中涉及到的Ontology元模型的基本要素如下:

1) 领域概念 (类) 是对象的集合, 指类似于工作描述、行为、功能以及推理过程的一切事务。这个集合包括对概念的解释以及概念间的关系。因此, 在定义领域概念时, 应该先对专业领域进行深层的认识, 使其更加贴近领域的客观实体及其之间的关系。

2) 领域概念的属性是指具体一类对象所具有包括数据属性和关系属性在内的特征。数据属性是非领域中概念, 它的属性值为基本类型值, 关系属性描述的是领域中两个概念间的关系, 其属性值为领域中的另一概念。

3) 基本概念、角色概念和角色拥有者角色概念[2]是一个概念在语境中所扮演的角色, 健全的Ontology的建立需要将其他概念与角色概念进行明显的区分。“基本概念”不需要别的概念来定义, 如“人”, “树”等;角色概念是一个事物在特定的语境下扮演的角色, 它表达了一个角色, 不过它要通过别的概念来定义。一个角色概念由角色持有者、类约束和语境3个元素构成。而角色持有者是扮演角色的概念实体, 例如丈夫作为角色持有者扮演了丈夫这一角色;类约束是对于类的约束, 语境是通过与一个概念间的关系辨明角色。例如在“学校”这个语境中有不同的角色, 例如“老师”和“学生”, 不同的人扮演着这些角色, 而扮演这些角色的人就成为了角色持有者。

考虑到角色概念是从基本概念中继承了一些属性作为它的类约束, 我们把基本概念的属性划分为两类:B1:不能由角色概念继承的属性;B2:可以由角色概念继承的属性。进而, 角色概念的属性也就可分为两类:R1:在角色概念内新增加的属性;R2:从基本概念上继承的属性。而新增加的属性又可分成两类:从基本概念那儿继承下来, 再在属性中增加约束;没有在基本概念中定义的新的属性。

角色拥有者由基本概念和角色概念的和构成, 由于B2和R2是等价的, 所以角色拥有者是R1、B1和R2 (B2) 的和构成。例如, 由基本概念“人”和角色概念“学生角色”构成了角色拥有者“学生”。“角色拥有者”不是基本概念的子概念, 是基本概念扮演的角色。

4) 领域概念间的关系主要有4类:1) 属性关系 (Attribute of) ;2) 概念继承关系 (Kind of) ;3) 整体和部分关系 (Part of) ;4) 类和实例关系 (Instance of) 。此外, 在实际建模过程中, 概念间的关系不限于上述4种, 还可根据领域的具体情况定义相应的关系。

如“is-a”描述的是“超-子”概念关系, 子类继承父类的全部属性[3]。对于〈李先生is-a人〉〈李先生is-a老师〉这两种is-a关系来说, 显然前者是符合is-a关系的特性的。而对于后者, 当李先生不再从事老师时, 也就不再具备老师的属性, 即老师不是李先生的固有属性, 因此, 将“李先生”作为基本概念“人”的实例, 而“人”扮演了角色概念“老师角色”并因此成为角色持有者“老师”。

“art-of”描述的是部分与整体之间概念的关系。整体概念是由部分概念组成的, 而通常角色概念为部分概念。因此当“整体概念”实例被创建后, 其所有的“部分概念”实例同时也被创建。例如〈汽车车轮“part-of”汽车〉表示汽车轮是组成汽车的一部分, 汽车轮扮演前轮的角色而成为角色持有者“前轮”, 此时可以看出“前轮”也是“车”的一部分。

“attribute-of”是指属性概念及其所对应的概念间关系的表示。例如某实体如“西瓜”具有“颜色”、“重量”等属性。

上述三种关系也是概念间的基本关系。

1.2 传统本体建模方法

目前, 由于本体工程仍然处于相对不成熟的阶段, 各工程都有自己独特的背景, 其使用的方法并没有普遍性。

1.2.1 IDEF5方法[4]

具体步骤:1) 确定本体建设项目的目标、观点和语境, 并为组员分配角色;2) 收集本体建设所需要的原始数据;3) 为抽取本体做准备, 进行数据分析;4) 从收集的数据当中建立一个初步的本体;5) 对本体的进行精炼与确认, 完成本体构建。

IDEF5方法是一种结构化的方法, 这个方法在于获取现实世界客观对象的定义, 以及它们的属性和它们之间的内在联系。利用该方法, 可以有效地开发和维护领域本体。

1.2.2 Mike Ushold&Micheal Gruninger的骨架法[5]

此方法是相关商业企业间术语和定义的集合, 因此它提供了开发本体的指导方针。它主要的步骤如下:1) 根据所研究的领域, 建立相应的领域本体, 即确定本体应用的范围和目的;2) 对本体内所有术语的意义及术语之间的关系进行分析与定义;3) 用语义模型表示本体;4) 根据清晰性、一致性、完善性、可扩展性这些建立本体的评价标准进行本体评价;5) 对符合上述检验要求的本体以文件形式存放, 对不符合要求的重新进行本体分析。反复循环, 直至所有检验结果达到标准。

2基于概念、关系和角色等基本点构建本体

每个不同的角色都是一个不同的个体;同时也都只有一个扮演者;而对于每个角色至少有一个语境。如果存在多个语境:所有这些语境都属于Relations、Process和Substance的其中之一;没有任何角色是另外角色的语境。对多语境, 基于角色聚合的思想来研究:根据其本质依赖, 组织多语境依赖的角色概念。角色聚合由基本概念和角色概念的层次结构来表示。这两种层次结构在角色聚合上有相同的语义信息。最后, 检查概念的一致性与修改。

Mi-zoguchi研究室 (日本大阪大学ISIR研究所) 开发了一种Ontology开发环境———Hozo系统[6]。它主要由三部分组成:Ontology Editor, Onto-Studio和Ontology Server。Ontology Editor为用户提供了图形化接口, 它管理“is-a”层面上的概念。用户可以在此进行Ontology的浏览和修改。用户可以在Onto-Studio的帮助下, 基于构建Ontology的方法-AFM进行Ontology设计和建立。最后借助Ontology Server来管理Ontology和模型。因此, 从Ontology和模型的定义、不断修改和选择, 以及实例化, 到连接实例概念最终建立Ontology, 这整个过程可以通过Hozo来实现。

在这个过程中概念关系的处理主要体现在Ontology Editor中。其中包括以下几个方面1) is-a关系层:利用is-a关系将领域Ontology类概念连接起来, 类似树状;2) 整体-部分关系层:用树或图的形式来显示part-concept中的part-of关系层次化概念;3) 概念定义:对领域中涉及到概念的相关术语进行定义和赋值, 如label、attribute、def、super和part-concept等。系统能够对整体概念与关系概念进行一致性处理。

在不同的整体、关系和任务或领域内, 存在着不同的角色概念, 而这些角色概念间具有相关性, 所以区分角色概念是非常重要的。因此, 根据给定的领域, 按照上述角色概念的处理模型, 可以建立不同的角色。

3 结束语

本文从Ontology基本理论出发, 分析了传统的建模方法。并基于基本概念、角色和关系, 得到Ontology元模型。可以借此元模型获取特定领域的知识结构。用户可以根据特定领域的知识结构建立给定领域的Ontology。

摘要:语义网是当前Web的扩展, 是WWW发展的核心技术之一。为了实现语义网, 需要有丰富的且及时更新的本体。本体作为语义网的知识表示模型很好地解决了语义层次上Web信息共享和交换的问题。而本体的构建及其形式表示方法, 是建立语义web的基础和核心。论文从Ontology的基本理论出发, 基于基本概念、角色和关系, 探讨了Ontology领域概念化模型的建立。

关键词:Ontology基本概念,角色概念,概念模型

参考文献

[1]Studer R, Benjamins V R, Fensel D.Knowledge Engineering, Principles and Methods[J].Data and Knowledge Engineering, 1998, 25 (1-2) :161-197.

[2]王晓东, 张小红, 王靖, 等.Ontology构建中概念与关系的获取和处理[J].计算机工程与应用, 2006, 42 (17) :46-48.

[3]Nicola G.Some Ontological Principles for Designing Upper Level Lexical Resources[C].In:Proc of the First International Conference on Lexical Resources and Evaluation, Granada, Spain, 1998:527-534.

[4]陈禹.IDEF建模分析与设计方法[M].北京:清华大学出版社, 1999.

[5]Uschold M..Ontologies Principles, Methods and Applications[J].Knowledge Engineering Review, 1996, 11 (2) .

Ontology模型 篇2

目前,构建有效的网络教学资源整合机制和满足个性化学习需求的网络教学平台已经成为网络教育应用重要课题。本文研究了基于角色概念的Ontology元模型,利用该模型构建了IT课程目标Ontology,设计并实现了基于Ontology的网络教学资源整合机制和满足个性化需求的网络教学平台。

1 Ontology元模型

1.1 类、实例和“is-a”关系

Ontology中,类是指具有共同性质的物体的一种范畴的划分,通常用概念表示类;实例是某一概念的具体化值,它具有原子性和不可再分性。is-a关系构建的概念层次是“超-子”概念关系,子概念的每一个实例都是其对应的父概念,反之不成立。Ontology中的is-a关系与OO中的is-a关系不同。Ontology中的is-a关系不允许人们去构建像<Mr.A instance-of teacher>和<teacher is-a human>这样的模型。因为没有任何人,他的固有属性是老师。如果建模<Mr.A instance-of teacher>和<teacher is-a human>,那么当Mr.A离开他的工作时,就会给管理实例带来困难。在Ontology构建时,由于缺乏is-a关系的语义理解,存在is-a使用不当的情况[1,2]。

is-a关系层中,整体概念一般有如下几项标注:label:概念的名称;super:超概念的名称;axiom:公理;def:非形式化描述;part-concept:组成该概念的部分概念,一般用槽定义;attribute:概念的属性。

1.2 整体概念与部分概念

整体概念与部分概念之间的关系由“part-of”关系表示。例如,<“IT基础”part-of“IT课程”>,表达了IT课程和IT基础之间的整体-部分关系,IT基础是IT课程的一个组成部分。“part-of”关系的主要语义是当“整体概念”实例被创建后,其所有的“部分概念”实例也被创建[3]。

在is-a关系树中包含了多个部分概念槽,对其中一个部分概念定义时,一般通过如下几项来定义:Role Name:该部分概念的角色名称;Class Constraint:类约束;Role Holder:角色拥有者名称;Def:定义的非形式化描述;axiom:公理;Slots:概念槽等。

1.3 基本概念、角色概念和角色拥有者

“基本概念”是不需要别的概念来定义的概念。角色概念表达了一个角色,即一个事物在特定的语境下扮演的角色,它要通过别的概念来定义。扮演一个角色的概念实体是角色的持有者。part-of关系中的部分概念有三个元素组成[3]:(1)角色概念:表达一个角色的概念,它依靠于整体概念;(2)类约束:概念类的约束,它的实例扮演角色;(3)角色拥有者:基本概念的实体。类约束依赖于在别处定义的基本概念,满足类约束的实例扮演角色而变成角色拥有者。例如,“学校”中的人扮演教师的角色或扮演员工的角色,因此,教师和员工被定义为角色概念,扮演这些角色的人分别为“教师”和“学校员工”,都是角色拥有者。注意:“角色拥有者”不是基本概念的子概念,是基本概念扮演的角色,因此,“角色拥有者”和“角色概念”之间的关系不是is-a关系。

2 IT课程目标Ontology构建

2.1 IT课程目标概念的抽取与分类

中学IT课程分为必修和选修两个部分。必修部分包括“信息技术基础”,选修部分包括“算法与程序设计”、“多媒体技术应用”、“网络技术应用”、“数据管理技术”和“人工智能初步”。根据布卢姆教学目标分类原理对每部分的目标进行分类,便可有效地获取领域概念。这里以信息基础为例进行说明。根据布卢姆教学目标分类原理,信息技术基础课程目标可以分为“信息处理与交流”和“信息技术与社会”。“信息处理与交流”又可分为“信息获取的能力”、“信息加工的能力”、“信息表达的能力”和“信息资源管理的能力”。“信息获取的能力”又可细分为“描述信息基本特征的能力”、“了解信息技术历史的能力”、“了解信息技术发展趋势的能力”、“列举信息技术应用的能力”、“知道信息来源的多样性的能力”、“学会确定信息需求和来源的能力”、“掌握信息判断的基本方法的能力”、“学会信息鉴别与评价信息的能力”、“选择适当的获取信息的方法的能力”、“掌握网络信息检索的主要策略与技巧的能力”和“能够合法地获取网上信息的能力”[4]。Ontology建模时,利用Classes描述这些概念。

2.2 IT课程目标概念间关系定义

概念之间层次关系通过“is-a”关系描述。定义“先修关系”来表示模块间的关系。各组成模块与IT课程间是“Part-of”的关系,可以通过给模块添加属性(attribute-of)表达“必修关系”和“选修关系”。

在利用类约束对各个模块进行详细地描述时,首先抽取了通用的行为动词(例如:描述、列举、设计等),并运用布卢姆教学目标分类原理对这些行为动词进行分类,将它们与相应的学习目标和掌握水平对应。利用“is-a”关系进行定义和描述,形成的行为动词及对应学习目标和掌握水平层次Ontology如图1所示。在构建教学目标Ontology时,利用这些事先定义行为动词对各个教学目标进行描述,达到了准确表达课程目标的目的。

2.3 IT课程目标Ontology构建

“信息技术课程”是整体概念,六个组成模块是部分概念,利用“Part-of”关系来组织这些概念:建立一个整个概念“信息技术课程”,为它添加六个槽,分别代表六个组成模块。这六个组成模块作为“信息技术课程”的部分概念,它们扮演着相应的角色,同时又是角色拥有者,它们的课程目标都通过课程目标类进行类约束。给这些模块添加属性以表示必修或选修关系。利用自定义的“先修关系”描述模块间的关系[4]。

这里以“信息技术基础”为例详细说明。“信息技术基础”作为“信息技术课程”的部分概念,扮演“信息技术基础”角色,是角色拥有者,受“信息技术基础课程目标类”的约束,即“信息技术课程目标”是它的约束类。部分概念“信息技术基础”的必修属性表达它是必修模块的语义。在对约束类——“信息技术课程目标类”的定义和描述时,利用了“is-a”关系、“part-of”关系和事先定义的行为动词。

3 基于IT课程目标Ontology的Web服务

本部分实现基于IT课程目标Ontology的语义Web服务——构建基于IT课程目标Ontology的网络教学平台,以统一教学资源标准,提高教学资源的重用性,满足个性化学习的需求。

3.1 Web服务体系架构

基于IT课程目标Ontology的网络教学平台主要实现两大目标:(1)提供一个IT课程教学资源整合平台,教学者可以根据已有的元数据标准及本体对教学资源进行语义标注,生成资源标注库,促进教学资源的重用和共享,方便教学者或学习者使用;(2)提供一个个性化的IT课程学习平台,可以根据学习者的认知特性、学习兴趣、掌握程度,学习进度等个性化属性,推荐、制定适当的学习策略,满足学习者个性化学习的需求[5,6]。系统体系架构如图2所示。

该系统有两类用户:教学者和学习者。教学者的职责主要是在IT课程目标Ontology的指导下制定或调整教学方案,上传教学资源,并根据Ontology对教学资源进行语义标注,生成标注文档,存放到资源标注库中。资源标注库与资源库是指向关系,即通过URI(Universal Resource Identifier)与具体的资源相关联。学习者通过该系统可以有两种学习方式:(1)基于教案的学习引擎根据教学者制定的教案组织教学资源,生成符合特定教学目标和要求的学习策略推荐学习者学习。(2)个性化学习引擎根据学习者打算学习的内容(一般以知识点表达),在IT课程目标Ontology的指导下组织资源,生成满足学习者特定认知特性、学习兴趣、学习方式等个性化需求的学习策略,指导学习过程[7]。

3.2 关键技术

3.2.1 Ontology的表示

本体的描述语言有Ontolingua、CycL、Loom、RDF、RDFs、DAML+OIL、OWL等等。OWL(Web Ontology Language)是语义表达能力最强的描述语言,内容比较丰富。使用owl:Class声明类,使用rdfs:subClassOf表示类之间的层次关系。OWL的简单属性有ObjectProperty和DatatypeProperty。通过rdfs:subPropertyOf表示属性的层次关系,通过rdfs:domain和rdfs:range对二元属性施加限定,通过TransitiveProperty声明传递属性,通过owl:inverseOf声明逆反属性。OWL属性的约束非常丰富,allValuesFrom指对于每一个有指定属性实例的类实例,该属性的值必须是由owl:allValuesFrom从句指定的类的成员;someValuesFrom指至少有一个是由owl:someValuesFrom从句指定的类的成员;owl:cardinality可以对一个关系中的元素数目进行精确的限制[8]。

3.2.2 Ontology的解析

Ontology的解析和推理是将以文件存储的Ontology和资源标注信息读取到特定的模型中处理,根据一定的语义规则基于Ontology进行语义推理,这是实现语义信息检索的关键步骤。Jena是惠普实验室语义Web研究项目的开放资源,为RDF、RDFS、OWL提供了一个强大的程序开发环境。包括RDF API、XML/RDF解析器、RDF模型的持续性存储方案、推理子系统、Ontology子系统、RDQL/SPARQL查询语言。Jena的这些组成部分在语义信息检索中各司其职,起着重要的作用。

Ontology子系统是实现Ontology解析的主要工具。Ontology Model是Ontology子系统处理的基本对象,用户可以通过Ontology Model解析以各种结构存储的Ontology数据,并可以对Ontology的Class、Property、Individual等元素进行操作、处理和一致性检查,是实现语义推理的基础。Ontology Model包括了大量功能强大的Ontology处理接口[9]:OntClass、OntModel、OntProperty等等。如:listDeclaredProperties()返回能够遍历OntClass实例所有属性的迭代算子;listSubClasses()返回能够遍历该类所有子类的迭代算子;getOntClass()将字符串表示的资源映射为模型中的表示该资源的类;getOntProperty()可以将字符串表示的资源映射为模型中表示该资源的属性。Ontology的解析过程如图3所示。

3.3 系统实现

根据前文设计,运用Ontology表示与解析的关键技术,实现了基于IT课程目标Ontology的网络教学平台。系统基于JDK1.5,开发工具Eclipse3.2+MyEclipse5.0+Tomcat5.5+Jena2.5,开发语言为Java,运行效果如图4所示。

4 结束语

本文研究了基于“角色概念”的Ontology元模型,构建了中学IT课程目标Ontology,设计并实现了基于Ontology的网络教学平台。研究表明,基于“角色概念”构建的Ontology语义功能大大提高,以此为基础的网络教学平台能够有效地完成资源的语义化整合,满足个性化学习的需求。但是,Ontology的构建任务繁重,需要熟悉领域知识的专业人员花费较长时间,并且很难考虑全面,今后将考虑使用分布式构建方法弥补该不足。

摘要:基于Ontology开发网络学习服务平台是网络教育应用的一个重要课题。基于基本概念、角色概念构建Ontology使表达语义更加精确。基于角色概念的Ontology元模型,构建了IT课程目标Ontology,实现了其语义W eb应用。实验表明,基于角色概念构建的Ontology语义精度明显提高,以此为基础的网络学习服务平台能够较好地满足个性化学习的需求。

关键词:角色概念,元模型,Ontology,课程目标

参考文献

[1]Kouji Kozaki,Yoshinobu Kitamura,Mitsuru Ikeda,Riichiro Mizoguchi.Development of an environment for building ontologies which is basedon a fundamental consideration of“relationship”and“role”[R],PKAW2000.

[2]王晓东,高宏卿.Ontology构建中概念与关系的获取与处理[J].计算机工程与应用,2006(17):46-48.

[3]Kouji Kozaki,Yoshinobu Kitamura,Mitsuru Ikeda,Riichiro Mizoguchi.Hozo:An Environment for Building/using Ontologies Based on a Fun-damental Consideration of“Role”and“Relationship”[R].EK-AW2002.

[4]Toshinobu Kasai,Haruhisa Yamaguchi.Building an ontology of ITedu-cation goals[J].Int.J.Cont.Engineering Education and LifelongLearning,2006,16(1/2).

[5]Kouji Kozaki,Yoshinobu Kitamura,Riichiro Mizoguchi.Developing On-tology-based Applications using Hozo[J].Proceeding(487)Computa-tional Intelligence,2005.

[6]张爱军.基于本体的智能答疑系统的研究与实现[J].计算机应用与软件,2006,23(5):69-71.

[7]李曼,王大治,杜小勇,等.基于领域本体的Web服务动态组合[J].计算机学报,2005,28(4):644-646.

[8]丁晟春,顾德访.Jena在实现基于的语义检索中的应用研究[J].现代图书情报技术,2005(10):5-8.

上一篇:新发高血压下一篇:安全网格技术