关联数据的四项原则解读:URI、RDF链接和应用

1. 什么样的数据时关联数据?关联数据的四项原则:

Tim Berners-Lee在Linked Data一文中归纳了关联数据的四项准则:

  1. 使用URI作为任何事物的名称。
    Use URIs as names for things
  2. 使用HTTP URI,使得人们可以查看这些名称。
    Use HTTP URIs so that people can look up those names.
  3. 当人们查看URI的时候,按照一定的标准(例如RDF或SPARQL)提供有用的信息。
    When someone looks up a URI, provide useful information, using the standards (RDF*, SPARQL)
  4. 提供指向其他URI的链接,让人们可以发现更多事物。
    Include links to other URIs. so that they can discover more things.

只要数据满足了上面四个准则就是关联数据了。

2. 原则的简括:

2.1 一切事物的名称——URI

关联数据的第一个原则提倡使用URI引用(URI reference)来进行标识,不仅限于对网络文档和数字内容进行标识,也对现实世界的对象和抽象概念进行标识。

  • 包括有形的事物,例如:人、地点和汽车
  • 也包括更加抽象的事物,例如:“认识某人”这样的关系类型、“世界上所有的绿色汽车"的集合,或者“绿色”这个颜色本身。

这个原则可以被看成是对网络的范畴进行了扩展,使之从仅仅包括在线的资源发展成为包含世界上所有的对象和概念。

2.2 一切事物的名称都可以被查看

关联数据的第二个原则提倡使用HTTP URI来标识具体对象和抽象概念,使得这些URI可以通过HTTP协议被解引(dereference,例如:查看)为对标识了的对象或概念的描述。

  • HTTP协议是网络的通用存取机制。
  • 在传统的网络中,使用HTTP URI和一个简单且易懂的检索机制一同联合了全球唯一标识符。
  • 在数据网络中,所有事物也采用HTTP URI作为标识。

2.3 查看事物的名称时依据标准格式提供信息

关联数据的第三个原则提倡使用一个唯一的数据模型来在网络上发布结构化的数据,这个模型是资源描述框架(RDF)。

  • 为了使各种不同的应用能够处理网络内容,一个一致同意的内容格式标准是非常重要的。
  • 将HTML作为主导的文档格式是网域化(Web scale)的一个重要因素。
  • RDF是一个被设计成用于网络环境中的基于图的简单的数据模型。
  • RDF是数据网络上的数据模型。

2.4 查看事物的名称时提供更多指向其它事物的链接

关联数据的第四个原则提倡使用超链接不仅仅去连接网络文档,也用其连接任何类型的事物。

  • 在数据网络中,可以在一个人和一个地点之间设置超链接,也可以在一个地点和一个公司之间设置超链接。
  • 在传统的网络中,大量的超链接是无类型的,在数据网络中连接不同事物的超链接(叫RDF链接)具有类型,这些类型是对这些被连接事物之间的关系的描述。
    例如:一个类型为“friend of”的超链接,可以被设置在两个人之间;一个类型为“based near”的超链接,可以被设置在一个人和一个地点之间。
  • 数据网络上有许多服务器负责对不同命名空间(namespace)HTTP URI进行解引的请求进行响应,这些服务器将返回用这些URI标识的资源的RDF描述。
  • 在返回的RDF描述中,包含了指向其它网络服务器上数据的链接。

3 全球数据空间

3.1 用链接连接的全球数据空间

  • 如果一个RDF链接连接了不同命名空间的URI,这个链接本质上是连接了不同数据集中的不同资源。
  • 传统网络中的超链接连接全球的文档成为一个单一的全球化的信息空间,关联数据使用RDF超链接连接异构数据(disparate data)成为一个单一的全球数据空间(global data space)。

3.2 链接——全球数据空间这片汪洋中的航线

链接使得应用能够在数据空间中航行。

  • 例如,一个关联数据应用查看了一个URI,检索到的描述了一个人的RDF数据,这个数据中包含了指向其它网络服务器上数据的链接:这个人住的地点或者这个人的工作单位。

3.3 关联数据应用示例

数据网络基于标准的数据格式和通用的数据模型,这使得开发一个通用的运行在整个数据空间上的应用成为可能。

应用的例子包括:

  1. 关联数据浏览器:使得用户能够在查看一个数据源中的数据时,跟随数据中包含的指向其他数据源中数据的RDF链接,进而去查看另一个数据源中的数据。
  2. 关联数据搜索引擎:能够在数据网络上爬行并提供在整个数据空间上的复杂的查询能力。

4 结语

传统的文档网络和全球数据空间基于的是相同的架构原则,关联数据的原则将为扩展现有文档网络为全球数据空间奠定一个基础。

参考文献:

Berners-Lee, T. Linked Data[EB/OL]. http://www.w3.org/DesignIssues/LinkedData.html

Tom Heath and Christian Bizer (2011) Linked Data: Evolving the Web into a Global Data Space (1st edition). Synthesis Lectures on the Semantic Web: Theory and Technology, 1:1, 1-136. Morgan & Claypool.

One thought on “关联数据的四项原则解读:URI、RDF链接和应用

  1. Pingback: 怎样的URI才够酷,标识的对象、基本要求和设计原则 - The Ontology of Ryan

Leave a Reply

Your email address will not be published. Required fields are marked *