RDF三元组、有向图以及应该避免的几点

1 RDF——数据模型中的“English”

RDF数据模型被设计成为在网络上发布结构化数据的模型。

RDF旨在成为网络上的一门通用语言,可以用来协调网络上依据其他数据模型发布的数据。

2 三元组的主谓宾式理解

RDF利用许多三元组来描述资源。

每一个三元组的三个部分被称作这个三元组的主语、谓语和宾语,就像一个简单的句子的基本结构。

  • 主语:标识了被描述资源的URI
  • 谓语:表明了主语和宾语之间存在的是怎样一种关系的词汇,并且这个词汇也是用URI来标识的。
    词汇(vocabularies)是与表现有关一个特定领域信息的URI的集合,例如DC、DDC、bibo等本体。
  • 宾语:一般可以意有两种类型:文字值(literal value)或者另一个资源的URI
    文字值,如出生日期,姓名等

根据宾语的不同,将RDF分为两个主要类型:

  1. 文字三元组
    用来描述资源的性质
    可以是纯文字(plain literal),也可以是类型文字(typed literal)
    纯文字值可以结合语言标记的字符串,例如:CN、EN、JP等
    类型文字值是包含了数据类型URI的字符串,例如:integer、float point等
  2. RDF链接
    用来描述两个资源之间的关系
    在谓语位置的URI定义了分处主、宾的两个资源之间关系的类型

3 外部RDF链接——网络上数据之间的胶水

RDF链接有内外之分:

  • 内部RDF链接
    连接了在同一个关联数据源中的资源
    主语URI和宾语URI处在同一个命名空间中
  • 外部RDF链接
    连接了在不同的关联数据源中的资源
    主语URI和谓语URI分别处于不同的命名空间中

外部RDF链接,对于数据网络而言是至关重要的,因为外部链接是连接数据岛屿成为一个全球互联的数据空间的胶水。

 4 有向图

RDF数据模型是带有标记的由节点和弧组成的有向图。

我们可以将一个RDF三元组集合看成一个RDF图。

以主语和谓语形式存在的URI是这个图中的节点,每一个三元组都是一个连接了主语和谓语的有向弧。

5 巨大的全球图

来源于不同数据源的信息,可以通过将两个三元组集合合并成一个图的方式结合起来。

RDF允许人们用一个单一的图来表现那些采用不同图式表达的信息,人们可以混合来源于不同词汇中的术语。

将全球的关联数据集中的三元组看成一个RDF图,那就是TBL构想的一个Giant Global Graph。

在这张巨大的全球图上,关联数据应用可以通过对一个个URI的解引来畅游其中。

6 应该避免的

下面这些特征应该在关联数据环境尽量避免:

  1. 避免RDF具体化(RDF reification)
    应该将包含了相关三元组的元信息附加在网络文档上。
  2. 避免RDF集合(RDF collections)和RDF容器(RDF containers)
    在一个集合中的单件的相对排序不显著时,应该对多个三元组使用同样的谓语
  3. 空节点(blank nodes)应该严格限制
    空姐点将导致资源之间互连可能性的减少,一个数据集中的所有资源都应该用URI引用来命名。

参考文献:

Graham Klyne and Jeremy J. Carroll. Resource Description Framework (RDF): Concepts and Abstract Syntax - W3C Recommendation, 2004. http://www.w3.org/TR/rdf-concepts/

Frank Manola and Eric Miller. RDF Primer. W3C, http://www.w3c.org/TR/rdf-primer/, February 2004.

Michael Bergman. Advantages and myths of rdf. http://www.mkbergman.com/wp-content/themes/ai3/files/2009Posts/Advantages_Myths_RDF_090422.pdf, 2009.

Tim Berners-Lee. Giant global graph. http://dig.csail.mit.edu/breadcrumbs/node/215, 2007.

Tom Heath and Christian Bizer (2011) Linked Data: Evolving the Web into a Global Data Space (1st edition). Synthesis Lectures on the Semantic Web: Theory and Technology, 1:1, 1-136. Morgan & Claypool.

Leave a Reply

Your email address will not be published. Required fields are marked *