第9讲互联网智能要点课件.ppt

上传人:小飞机 文档编号:4095716 上传时间:2023-04-03 格式:PPT 页数:37 大小:1.11MB
返回 下载 相关 举报
第9讲互联网智能要点课件.ppt_第1页
第1页 / 共37页
第9讲互联网智能要点课件.ppt_第2页
第2页 / 共37页
第9讲互联网智能要点课件.ppt_第3页
第3页 / 共37页
第9讲互联网智能要点课件.ppt_第4页
第4页 / 共37页
第9讲互联网智能要点课件.ppt_第5页
第5页 / 共37页
点击查看更多>>
资源描述

《第9讲互联网智能要点课件.ppt》由会员分享,可在线阅读,更多相关《第9讲互联网智能要点课件.ppt(37页珍藏版)》请在三一办公上搜索。

1、2023/4/3,合肥工业大学人工智能与数据挖掘研究室,1/37,高级人工智能互联网智能王浩,2023/4/3,合肥工业大学人工智能与数据挖掘研究室,2/37,语义Web社会计算,2023/4/3,合肥工业大学人工智能与数据挖掘研究室,3/37,语义Web,语义Web产生与发展 互联网创始人Tim Berners-Lee2001年提出了下一代Web的构想语义Web。“语义Web是一个网,它包含了文档或文档的一些部分,描述了事物间的明显关系,且包含语义信息,以利于机器的自动处理。”其主旨是将Web内容的语法结构和含义以机器可理解的知识表示形式显式地表示出来,以便与其它信息源共享,并使得外部程序可

2、以在理解其内容的基础上做进一步地处理,从而实现在XML基础上更大程度的互操作性。,2023/4/3,合肥工业大学人工智能与数据挖掘研究室,4/37,语义Web,语义Web体系结构 语义Web是个多层次结构,功能逐层增强,2023/4/3,合肥工业大学人工智能与数据挖掘研究室,5/37,语义Web,语义Web体系结构 第一层是Unicode和URI,它是整个语义Web的基础,Unicode(统一编码)处理资源的编码,URI(统一资源定位器)负责标识资源;第二层是XML名空间XML模式,用于表示数据的内容和结构;第三层是RDFRDF模式,用于描述资源及其类型;第四层是本体词汇,用于描述各种资源之间

3、的联系;第五层是逻辑,在下面四层的基础上进行逻辑推理操作;第六层是验证,根据逻辑陈述进行验证以得出结论;第七层是信任,在用户间建立信任关系。,2023/4/3,合肥工业大学人工智能与数据挖掘研究室,6/37,语义Web,语义Web体系结构 第二、三、四层是语义Web的关键层,用于表示Web信息的语义。可扩展标记语言XML(eXtensible Markup Language)让每个人都能创建自己的标签,来对网页或页面的部分文字进行注释。XML允许用户在文档中加入任意的结构。资源描述框架RDF(Resource Description Framework)的基本结构是对象-属性-值三元组,这些三

4、元组可以用XML语法来表示。RDF模式是一个描述RDF资源属性(Property)和类(Class)的词汇表,提供了关于这些属性和类层次结构的语义。本体(Ontology)是一种明确的共享概念化的形式说明,它揭示了资源本身以及资源之间更为复杂和丰富的语义信息。,2023/4/3,合肥工业大学人工智能与数据挖掘研究室,7/37,语义Web,本体(Ontology)Ontology 的概念最初起源于哲学领域。哲学中的定义:对世界上客观存在物的系统地描述,即存在论。是对客观存在的一个系统的解释或说明,关心的是客观现实的抽象本质。人工智能界最早的定义(Neches等人):给出构成相关领域词汇的基本术语

5、和关系,以及利用这些术语和关系构成的规定这些词汇外延的规则的定义 Gruber的定义:本体是概念化的明确的规范说明。W.N.Borst的定义:本体是共享的概念模型的形式化的规范说明。,2023/4/3,合肥工业大学人工智能与数据挖掘研究室,8/37,语义Web,本体(Ontology)Swartout的定义:本体是一个为描述某个领域而按继承关系组织起来作为一个知识库的骨架的一系列术语。他的定义强调了本体中术语(terms)的重要性。Fensel的定义:本体是对一个特定领域中重要概念的共享的形式化的描述”。Noy F.N.的定义:本体是对某个领域中的概念的形式化的明确的表示,每个概念的特性描述了

6、概念的各个方面及其约束的特征和属性。,2023/4/3,合肥工业大学人工智能与数据挖掘研究室,9/37,语义Web,本体(Ontology)Ontology的概念包括四个主要方面:概念化(conceptualization):客观世界的现象的抽象模型;明确(explicit):概念及它们之间联系都被精确定义;形式化(formal):精确的数学描述;共享(share):本体中反映的知识是其使用者共同认可的。,2023/4/3,合肥工业大学人工智能与数据挖掘研究室,10/37,语义Web,本体(Ontology)Ontology的目标是捕获相关领域的知识,提供对该领域知识的共同理解,确定该领域内共

7、同认可的词汇,并从不同层次的形式化模式上给出这些词汇(术语)和词汇之间相互关系的明确定义。本体既包括一个领域内的知识也包括各种领域之间的知识。人类、数据库和应用软件使用本体来共享领域知识,2023/4/3,合肥工业大学人工智能与数据挖掘研究室,11/37,语义Web,本体的分类及构成 Guarino 提出以详细程度和领域依赖度两个方面对知识本体进行划分。描述或刻画建模对象的程度较高的称为引用本体(Reference Ontologies),程度较低的称为共享本体(Share Ontologies)。根据知识本体对领域的依赖程度由低到高分别分成了四个类别:领域本体:针对特定的应用领域抽象出领域知

8、识的结构和内容,包括各种领域知识的类型、术语和概念,并对领域知识的结构和内容加以约束,形成描述特定领域中具体知识的基础。通用或常识性的本体:主要描述客观世界一般性的知识,如时间、空间、状态和事件等,它们通常适用于几个领域。应用型的本体:针对特定应用领域知识建模的抽象定义。如方法本体和任务本体。它们是针对特定的任务和方法构建的本体。表示本体:通常不限制于一个特定的领域,仅仅提供了一种表示实体的方式,但是没有规定必须表示什么。,2023/4/3,合肥工业大学人工智能与数据挖掘研究室,12/37,语义Web,本体的分类及构成 Perez等人用分类法组织了Ontology,归纳出5个基本的本体建模元语

9、:类(classes)或概念(concepts)指任何事务,如工作描述、功能、行为、策略和推理过程。从语义上讲,它表示的是对象的集合,其定义一般采用框架(frame)结构,包括概念的名称,与其他概念之间的关系的集合,以及用自然语言对概念的描述。关系(relations)在领域中概念之间的交互作用,形式上定义为n维笛卡儿积的子集:R:C1C2Cn。如子类关系(subclass-of)。在语义上关系对应于对象元组的集合。,2023/4/3,合肥工业大学人工智能与数据挖掘研究室,13/37,语义Web,本体的分类及构成 函数(functions)一类特殊的关系。该关系的前n1个元素可以唯一决定第n个

10、元素。形式化的定义为 F:C1C2Cn-1Cn如Mother-of就是一个函数,mother-of(x,y)表示y是x的母亲。公理(axioms)代表永真断言,如概念乙属于概念甲的范围。实例(instances)代表元素。从语义上讲实例表示的就是对象。,2023/4/3,合肥工业大学人工智能与数据挖掘研究室,14/37,语义Web,本体的分类及构成 语义上讲,基本的关系共有4种:,2023/4/3,合肥工业大学人工智能与数据挖掘研究室,15/37,语义Web,本体的功能 信息交换(Communication)本体的核心概念是知识共享。通过减少概念和术语上的歧义,本体描述为某一组织或是工作小组提

11、供了一个统一框架或是规范模型,使得来自不同背景,持不同观点和目的的人员之间的理解和交流成为可能,并保持语义上的一致性。互操作(Inter-Operability)应用程序使用本体实现不同系统之间的互操作,即不同系统或是工具之间的数据传输。这种应用还可以细分为两类:轻量级(Lightweight)和重量级(Heavyweight)。轻量级应用是一种完全面向语法形式化和转换的本体使用,它只能保证人们使用相同的词汇,但不能保证他们对相同的词汇有相同的解释或是理解,比如xml语言中的DTD。而基于本体的重量级应用是一种对知识表示语言中的建构和约束作普通的语义解释的使用方式,目的是支持本体的不同使用者之

12、间的进行语义层面的信息共享和互操作。,2023/4/3,合肥工业大学人工智能与数据挖掘研究室,16/37,语义Web,本体的功能 系统工程(Systems Engineering)本体还可以应用到软件系统的设计和实现上。在软件开发的规格说明中,本体论通过对需要解决的问题和任务的理解描述,可以帮助我们在需求分析、信息获取中提高明确性,减小分析代价。同时,本体可以作为需求分析基础上软件设计时的基础,以自动或是半自动的方式检查它们之间的一致性,从而提高软件系统的可靠性。本体还可以通过对系统内部各个功能模块和它们之间的联系的详细描述达到软件的重用性。,2023/4/3,合肥工业大学人工智能与数据挖掘研

13、究室,17/37,语义Web,本体描述语言 本体语言使得用户为领域模型编写清晰的、形式化的概念描述,应该满足以下要求:良好定义的语法(a well-defined syntax)良好定义的语义(a well-defined semantics)有效的推理支持(efficient reasoning support)充分的表达能力(sufficient expressive power)表达的方便性(convenience of expression)本体描述语言:RDF和RDF-S、OIL、DAML、OWL、KIF、SHOE、XOL、OCML、Ontolingua、CycL、Loom、。与We

14、b相关的有:RDF和RDF-S、OIL、DAML、OWL、SHOE、XOL,2023/4/3,合肥工业大学人工智能与数据挖掘研究室,18/37,语义Web,本体描述语言 W3C推荐的与本体有关的标准有三个:它们分别是XML、RDF/RDFS、OWL,下图以栈的形式显示了Web本体语言之间的相关关系:,2023/4/3,合肥工业大学人工智能与数据挖掘研究室,19/37,语义Web,RDF、RDF-S 资源描述框架(RDF)用于表示任何的资源信息。RDF提出了一个简单的模型用来表示任意类型的数据。这个数据类型由节点和节点之间带有标记的连接弧所组成。节点用来表示Web上的资源,弧用来表示这些资源的属

15、性。因此,这个数据模型可以方便的描述对象(或者资源)以及它们之间关系。RDF的数据模型可以作为其他任何复杂关系模型的基础模型。,2023/4/3,合肥工业大学人工智能与数据挖掘研究室,20/37,语义Web,RDF、RDF-S RDF Schema 规范用RDF定义了建模原语。RDFS中主要的类、特性和约束所使用的描述原语如下:核心类 包括rdfs:Resource、rdf:Property以及rdfs:Class。核心特性 包括rdf:type、rdfs:subClassOf和rdfs:subPropertyOf。核心约束 包括rdfs:ConstraintResource、rdfs:Con

16、straintPropety、rdfs:range和rdfs:domain。W3C提出直接采用 RDFS来描述简单的知识本体。但从RDFS的原语上,可以看出RDFS的表达能力非常有限。RDFS在提供了简单的机器可理解语义模型的同时,为领域化的Ontology语言(OIL,OWL)提供了建模基础,,2023/4/3,合肥工业大学人工智能与数据挖掘研究室,21/37,语义Web,OIL语言 OIL(本体交换语言)是欧洲的OntoKnowledge联盟针对基于Web环境进行知识工程建模提出的一种本体语言。运用OIL可以定义面向应用的本体,同时定义的模型可以用XML的DTD、XML Schema或RD

17、F数据模型进行描述,这种模型的描述可以在Web环境中实现透明的交换和共享 OIL本身也采用分层的方法定义。其中上层在下一层基础上增加了功能和复杂性,这样当本体按任何一层的语义进行描述,即使只能处理和理解低层语义的主体(人或机器),也能够部分理解高层的本体描述,2023/4/3,合肥工业大学人工智能与数据挖掘研究室,22/37,语义Web,OIL语言 OIL的各层功能:核心OIL主要同RDF模式一致,除了RDF的具体化特性这就意味着即使简单的处理RDF模式的主体也能够处理OIL的本体描述并尽可能多理解OIL本体描述的语义标准OIL是用来定义必要的主流的建模原语,这些原语提供足够的表达能力,并且可

18、以被很好的理解,因此使得语义可以被精确定义,实现完整的推导可:实例OIL是具体的集成,因为前一层包括了建模构件,构件允许具体的填充器在术语定义中定义,所以实例OIL具有一种成熟的数据库能力;重量级OIL在将来进行扩展,可能会具有额外的表示和推理能力。,2023/4/3,合肥工业大学人工智能与数据挖掘研究室,23/37,语义Web,OWL语言 OWL(Web Ontology Language),是从DAML+OIL发展起来的,其中DAML来自美国的提案DAML-ONT,OIL来自欧洲的一种本体描述语言。在W3C提出的本体语言栈中,OWL处于最上层。OWL有三个子语言:子语言OWLLite是OW

19、L中相对容易实现部分的子集合,只提供了层次分类和简单的约束功能,用于提供给那些只需要一个分类层次和简单的属性约束的用户。,2023/4/3,合肥工业大学人工智能与数据挖掘研究室,24/37,语义Web,OWL语言 子语言OWLDL提供了大部分OWL词汇支持和RDFS支持,并在语义上等同于描述逻辑DL它支持那些需要在推理系统上进行最大程度表达的用户,这里的推理系统能够保证计算完全性和可决定性。它包括了OWL语言的所有约束,但是可以被仅仅置于特定的约束下。子语言OWLFull描述包括所有的OWL词汇和RDFS提供的原语,能够提供最大程度的知识描述能力,但是由于过于复杂,且还不成熟,因此还在不断的更

20、新中它支持那些需要在没有计算保证的语法自由的rdf上进行最大程度表达的用户。它允许一个ontology在预定义的(rdf、owl)词汇表上增加词汇,从而任何推理软件均不能支持OWLFull的所有特征。,2023/4/3,合肥工业大学人工智能与数据挖掘研究室,25/37,语义Web,OWL语言 这三种子语言之间的关系是:每个合法的OWL Lite都是一个合法的OWL DL;每个合法的OWL DL都是一个合法的OWL Full;每个有效的OWL Lite结论都是一个有效的OWL DL结论;每个有效的OWL DL结论都是一个有效的OWL Full结论。,2023/4/3,合肥工业大学人工智能与数据挖

21、掘研究室,26/37,语义Web,OWL语言 这三种子语言与RDF的关系是:OWL Full可以看成是RDF的扩展;OWL Lite和OWL Full可以看成是一个约束化的RDF的扩展;所有的OWL文档(Lite,DL,Full)都是一个RDF文档;所有的RDF文档都是一个OWL Full文档;只有一些RDF文档是一个合法的OWL Lite和OWL DL文档。,2023/4/3,合肥工业大学人工智能与数据挖掘研究室,27/37,语义Web,OWL语言 几种基于Web的本体语言间的关系:,2023/4/3,合肥工业大学人工智能与数据挖掘研究室,28/37,语义Web,本体建模实例 W3C的Guu

22、s Schrieber开发的关于制酒行业的更为精细的Ontology。(1)相关背景 对于制酒业而言,“产品地域”(production area)是一个非常重要的feature。根据生产地域(从一个国家到一个特定的葡萄园)、谷类的大小和酒的类型存在很大的变化,。我们可以给出四种不同的产品地域:国家(country),例如France,Italy 区域(region),例如Bordeaux,Medoc,Tuscany 城镇(town),例如Margaux,Montalcino,Montepulciano 葡萄园(vineyard),例如Chateau Margaux,Avignonesi,20

23、23/4/3,合肥工业大学人工智能与数据挖掘研究室,29/37,语义Web,本体建模实例 为不同产品地域之间的关系建模:区域是国家的一部分:Tuscany在Italy区域有子区域:Medoc是Bordeaux的子区域城镇在某区域中:Montalcino在Tuscany葡萄园在城镇中:Chateau Margaux在Margaux,Avignonesi在Montepulciano(2)建模决策 我们决定去掉“town”,将它们都看作region。这样做简化了模型,并且这符合实际中town作为一个产品地域在城镇周边,比城镇面积稍大或稍小的事实。,2023/4/3,合肥工业大学人工智能与数据挖掘研究

24、室,30/37,语义Web,本体建模实例(3)模型 Class,2023/4/3,合肥工业大学人工智能与数据挖掘研究室,31/37,语义Web,本体建模实例(3)模型 Property,2023/4/3,合肥工业大学人工智能与数据挖掘研究室,32/37,语义Web,本体建模实例(3)模型 Property 1,2023/4/3,合肥工业大学人工智能与数据挖掘研究室,33/37,语义Web,本体建模实例(3)模型 Property 1,2023/4/3,合肥工业大学人工智能与数据挖掘研究室,34/37,语义Web,本体建模实例(3)模型 Property 1,2023/4/3,合肥工业大学人工智

25、能与数据挖掘研究室,35/37,语义Web,本体建模实例(4)UML注释 对应上述本体的UML注释,2023/4/3,合肥工业大学人工智能与数据挖掘研究室,36/37,语义Web,本体开发工具(1)Protg Protg是由斯坦福大学医学院(Stanford University School of Medicine)的医学信息研究小组(Stanford Medical Informatics research group)开发出来的本体和知识库编辑器。Protg在上世纪90年代后期改用Java语言开发,并且开放源代码(http:/protege.stanford.edu),目前可运行在Win

26、dows、Linux、Solaris等多种平台上。在Protg编辑器中,本体结构以树形的层次目录结构显示,用户可以通过点击相应项来编辑或增加类、子类、属性、实例等本体元素,另外,用户可以不用考虑具体的本体描述语言,而在概念层次上设计领域本体模型。,2023/4/3,合肥工业大学人工智能与数据挖掘研究室,37/37,语义Web,本体开发工具(2)KAONKAON是Karlsruhe大学在欧共体的WonderWeb、SWAP、OntoWeb等项目共同资助下所得到的研究成果。KAON为语义万维网的各个功能模块提供了一个互操作、灵活配置和开放的框架。它由连接层、安全层、数据访问层、管理层、功能组件与外部服务层构成,可以将有关RDF、OWL、Ontology存储、推理、数据访问等有关的工具集成起来构造一个基于Ontology的门户应用。(3)JenaJena框架是惠普公司采用Java语言开发的语义万维网的应用开发框架。这个框架提供了有关RDF、RDFS、OWL的有关模型创建、存储、访问和推理的API。,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号