知识地图 笔记

图书情报工作 2012(10)

P30 知识地图的构建方法论研究 by  叶六奇 石晶

1.相关概念

布鲁克斯对知识地图的描述:

  • 知识地图是对某领域中的逻辑内容进行分析、将互相影响、相互关联及能够引起人们思考和创造的知识点连接起来的知识组织活动。

知识地图是:

  1. 基于情报学理论,对文献中的逻辑内容进行分析,寻找人们创作和思考之间的联系和结合点,以描绘出个结合点的层次与相互关系。
  2. 一种知识库管理系统技术与Internet技术相结合的新型知识管理技术
  3. 一种知识资源的总目录和揭示知识知识之间相互关系的知识导航系统
  4. 一种对知识的外化认识,明确指出了知识的存储地以及知识之间的联系

2.知识地图的类型

从构建方法看,可分为8类:

  1. 分布型的知识地图:
    主要展示知识及其存放位置之间的分布关系,主要功能是协助用户定位知识资源。如:文献资源分布地图、索引、资源目录。
  2. 流程型的知识地图:
    以某种固有的“流程”为基础,先画出“流程图”,再以在“流程图”上标注知识的方法构建知识地图。如:基于业务流程的企业知识地图
  3. 结构型的知识地图:
    以事物的内部“结构”为基础,先画出“结构图”,再用在“结构图”上标注知识的方法构建知识地图。
  4. 联系型的知识地图:
    利用知识之间的内在隐性联系,展示知识。如:基于社会网络分析的知识地图,人立方搜索(entity cube)、知识结构图(Knowledge structure map)
  5. 术语表型的知识地图:
    以术语表(主题词表、分类表、OWL、RDF等)为基础,用在术语表上标注知识的方法构建知识地图。一般用于计算机的理解和处理。如:借助本体的语义描述能力,构建学术知识地图。
  6. 生命期型的知识地图:
    以实物的生命期为基础,先画出事物生命周期曲线,在生命周期曲线上标注相关知识。其主要功能是以事物为单位,向用户集中展示相关知识。
  7. 导航型的知识地图:
    常用于网站信息构建中,为用户提供浏览网站内部知识的导航,展示网站所涉及的知识之间的连接关系。如:Site map
  8. 认识型的知识地图:
    以认识规律为基础,揭示知识之间的内在联系。如:V型知识地图。

3.4个层次:

第一层:领域知识层

包含:规则库、词表、术语库、主体、OWL、其他知识库。
以主题词表、分类法、后控词表、规范文档、本体、SKOS、Z39.19标准、主题图、OWL等为构建方法层中的要素识别和关联分析提供依据
以规则库、其他知识库为构建方法层中的结构化展示提供依据

第二层:方法论层

包含:三个基本办法:要素识别、关联分析、结构化展示
构建方法论必须建立在特定的领域知识的基础上

第三层:知识地图层

包含:分布型、流程型、结构型、联系型、生命期型、导航型、术语表型、认识型、其他

第四层:应用层

包含:知识管理、产品设计、流程设计、图书馆服务、课堂教学

4.知识地图的构建

要素识别:

  • 各种事物对象及其活动都可以通过要素来反映、总结和概括,要素活动的总和构成事物对象活动的整个过程
  • 构建知识地图时,首先要根据所要构建知识地图的类型和所掌握的领域知识,对某个领域内的关键人物、关键事务、关键流程、关键术语等要素进行识别、提取、分类和组织

关联分析:

  • 在识别出知识地图的所有构成要素之后,需要对这些要素之间的关联关系进行分析,寻找这些要素之间的联系,进行连接、实现知识地图的路标指引和导航目标

关联分析的两层因素:

  1. 是形成知识地图要素的连接
  2. 是某领域知识与人的思维间的连接

//识别不同知识节点之间的联系是知识地图构建者最重要的技能。

结构化展示:(知识地图的可视化)

  • 知识地图中,只是分布与构成所显示出的结构状况直接决定了人们的知识获取能力、知识生产能力、知识处理能力和知识管理效果
  • 不应满足于单一的结构化形式所展现的知识地图,还需要从结构的形式和状态维度进行多方考量和涉及,借助注入感受论等认知科学的研究成果以及信息可视化等信息技术工具为知识地图结构的完善和优化提供新的内容

面对复杂事物时,首先需要找寻其组成要素或只是单元,进行探寻要素间的关系和秩序,对各要素进行积极有效的结构化展示,形成可视化的知识地图,获得某领域事物对象的整体性认知,讲内外部的知识单元有效地建立起结构化的体系,并借助于认知科学和信息技术工具充实、完善和优化知识地图的结构,重视结构在知识地图效应之中发挥的突出作用,建立起面向用户的知识地图。

P17 面向开放关联数据的知识地图研究 by 朝乐门 张勇 邢春晓

Tim Berners Lee 提出的关联数据技术中的数据发布和数据关联的四项原则

  1. 采用URI技术统一标识事物
  2. 通过HTTP URI访问URI标识
  3. 当URI被访问时,采用RDF和SPARQL标准提供一些有用信息
  4. 提供信息时,也提供指向其他事物URI,以便发现更多事物

1.关联数据应用分类:

1.用户界面类应用

开发一个用户界面,以便用户浏览和检索关联数据。如:DBpedia Query Builder, DBpedia Navigator

此类应用有三种实现方法:

  1. SPARQL转换器
  2. 面向关联数据的专用用户界面系统
  3. 非管理数据系统的用户界面中嵌入式关联数据

2.语义标注类应用

以关联数据集为数据源,对其他数据资源进行语义标注,提高数据的语义处理能力和开放互连能力。如:DBPedia Mobile

3.数据挖掘类应用

需要对关联数据进行深入分析和挖掘,发现新的知识,而不仅仅停留在浏览和检索操作。如:DBPedia Relationship Finder

4.跨域共享与服务类应

采用了四项基本原则,实现了不同关联数据的统一访问。Revyu中可以对另一个关联数据DBPedia数据进行评论

2.体系结构

通过一个专用用户界面访问跨域关联数据集,对关联数据进行分析、挖掘、发现操作后,加以语义标注,动态形成计算机层次的知识地图,并以用户可以理解形式展现给最终用户,生成用户层次的知识地图

面向开放关联数据的知识地图需要遵循以下原则:

  1. “指向而不是包含原则”
    面向开放关联数据的知识地图指向知识所在的位置,而自己不包括知识内容。
  2. “跨域而不是本地原则”
    作为关联数据的知识地图,必须充分利用关联数据的跨域关联特征,不停留在对一个数据集的内容的访问。
  3. “动态而不是静态原则”
    面向关联数据的知识地图必须动态生成、知识地图的内容需要与关联数据保持同步。
  4. “按需服务而不是全部罗列原则”
    面向关联数据的知识地图必须对用户需要和数据资源进行语义分析并根据用户需求自动生成知识地图。

3.技术层次:

1关联数据(DBpedia、Freebase、WordNet、DBLP)

  • 关联数据层具有特性:跨域、异构、动态变化的特性
  • 跨域:关联数据集分布在不同的网络域之中
  • 异构:关联数据的建设虽然遵循关联数据的四项基本原则,但具体所采用的数据模式和数据结构可能不同
  • 动态变化:关联数据的内容可以不断发生变化

2语义计算(标注、映射、匹配、检索、推理)

  • 主要接受来自面向计算机的知识地图层转来的计算请求,并对关联数据层中的数据进行语义计算,把计算结果提交给面向计算机的知识地图层。
  • 检索:使用SPARQL语言完成
  • 标注:用于对面向计算机的知识地图中的知识元进行语义标注,从而提高知识地图的处理效率
  • 匹配和映射:对跨域关联数据之间的匹配和映射工作,包括概念相似度计算、语义距离计算等
  • 推理:采用语义Web推理技术和人工智能推理技术,在不同关联数据的基础上发现新知识的过程

3面向计算机的知识地图

  • 面向关联数据的知识地图建设中需要设计面向计算机的知识地图,在此础上可以进行可视化处理,得到最终的面向人的知识地图
  • 面向计算机的知识地图和面向人的知识地图的区别在于是否可视化处理

4面向人的知识地图

  • 同一个面向计算机的知识地图对应多个面向人的知识地图。保持面向计算机的知识地图和面向人的知识地图之间的同步是关键问题

4.关键技术:

URI:

URI技术的作用:

  1. 利用URI可以在知识地图和关联数据集之间建立连接,实现知识地图的指示作用
  2. 利用URI不会随着事物的其他属性变化而变化的特征,在相对稳定的界面地图中链接动态变化的关联数据,提高关联数据和知识地图的独立性,实现知识地图的动态性
  3. 利用URI的同一标识作用,识别分布在不同关联数据中的同一事物及其相关信息,实现知识地图的跨域性

URI起初的三种表现形式:

  1. URN  name 统一资源名
  2. URC  characteristics 统一资源属性
    逐渐被元数据代替。
  3. URL  locator 通用资源定位器

更适合语义网资源统一标识需要的URI:HashURI和303URI

  1. HashURI主要用于标识和定位到文档内部的特定元素,元素与文档资源之间用哈希符号#分割
  2. 303URI则采用HTTP协议的状态标记被访问的资源重定向关系

RDF(s):

RDF(s)是与以往知识表示的最基本模型。RDF(s)层建立在XML(s)层之上,具有领域独立性。RDF文档可通过所对应的RDF Schema(RDFS)文档定义所包含词汇的语义信息。RDF Schema则采用类或属性之间的关系,如继承、关联、包含、参见等,描述特定领域知识,支持基于XML的RDF文档的语义解释

RDF(s)的知识表达能力的局限性:

  1. 局限于二元谓词,如果表示对陈述的陈述,必须采用较复杂的具体化机制(Reification Mechanism)
  2. 仅限于表示类(或属性)之间的继承关系和属性的定义域和值域的限定,不能表达更复杂的语义关联信息

为此人们设计了OWL语言(Ontology Web Language):

为多个知识处理主体提供对特定领域概念术语的共识,消除不同主体对同一概念的不同解释,而且以继承的方式重新定义RDF(s)的部分元素,并新增诸多予以元素,加强语义网技术的语义表达能力

SPARQL:

SPARQL语言采用类似于RDF文档三元组的模式,采用三个变量来代替RDF中的”对象——属性——值”,采用类似于SQL语言的select-from-where结构对RDF进行查询

对OWL查询时使用OWL-QL效率更高

RuleML或SWRL(Rule Markup Language和Semantic Web rule Markup Language 规则标记语言和语义网规则标记语言):

RuleML是一种致力于在万维网上共享和发布规则的标记语言,内核是基于Horn逻辑的子集Datalog规则,采用XML Schema和Herbrand模型分别定义其语法和语义。

SWML是结合RuleML和OWL语言的语义网规则语言

Leave a Reply

Your email address will not be published. Required fields are marked *