笔记 OPENHPI语义网技术 Week 1

公开课请见:https://openhpi.de/

1-1 网络的历程

  1. Agostino Ramelli: Le diverse et artificiose machine; composte in lingua Italiana et Francese 1588
  2. Denis Diderot & Jean-Baptiste le Rond d'Alembert : Encyclopedie 1700-1780
  3. Vannevar Bush:"As We May Think" MEMEX 1945
  4. J.C.R. Licklider, Robert Taylor: "The Computer as a Communication Device". Science and Technology 76, pp. 21-31 April 1968. APRA网
    "[...] we are entering a technological age in which we will be able to interact with the richness of living information - not merely in the passive way that we have been accustomed to using books and libraries, but as active participants in an ongoing process, bringing something to it through our interaction with it, and not simply receiving something from it by our connection to it."
  5. Tim Berners-Lee:WWW
Web1.0—Web2.0:信息消费——信息生产——互动参与

1-2 现有网络的局限

1-3 意义的重要性

  • Semantics:语义,如何理解意义,依赖语法、语境和语用。
  • Syntax:语法,从一组符号中创建一个正式表达时依据的一组规则,定义了数据的规范结构。
  • Context:语境,影响交流中语义理解的一切元素,时间、地点;信息发送者和接受者之间的关系。
  • Pragmatic:语用,在不同情形下应用语言、说话者的意图,研究语境是如何影响语义的。
  • Experience:正确理解语义所需要知道的相关信息。
成功的交流需要:
  • 信息被正确传输:语法
  • 被传输的语义被正确的解读
正确的解读依赖于
  • 信息发送者的语用是否正确
  • 信息发送者和信息接收者对语境的认识是否一致
  • 信息发送者和信息接收者的经验是否一致
符号三角(Semiotic Trangle)
  • 符号象征着概念
  • 概念指代的是对象
  • 符号代表着对象

1-4 网络的局限

  1. 信息检索
    搜索引擎的关键词检索面临:
    一词多义、不同语境语义不同——导致太多非相关结果
    同义词和比喻、缺乏语境定义——导致太少的合适结果
  2. 信息抽取
    面临:严重依赖人、数据的分布异构、信息的顺序
    现状:软件代理缺乏足够的语境知识、常识(世界知识)、经验
  3. 维护
    链接的语法错误、语义连续性、正确性、时效性
  4. 个性化

1-5 语义网愿景

Tim Berners-Lee, Semantic Web Roadmap, Sept 1998
“The Web was designed as an information space, with the goal that it should be useful not only for human-human communication, but also that machines would be able to participate and help… ”
前提是:内容可以被机器正确的阅读和理解
以前依赖的是:自然语言处理
语义网依赖的是:自然语言的网络内容将准确地用语义元数据进行标注;语义元数据将语义信息编码并且能够被机器阅读和正确理解。
如何理解网络上的内容?
1消除歧义(Disambiguation):建立字字符串和实体的映射
2理解知识表达(本体):实体和类的映射、类和其他类的关系
Tim Berners-Lee, James Hendler, Ora Lassila: The Semantic Web, Scientific American, 284(5), pp. 34-43(2001)
”What is the Semantic Web? The Semantic Web is an extension of the current web in which information is given well-defined meaning, better enabling computers and people to work in cooperation"
semantic_web_technology_stack
图片来源:http://bnode.org/blog/2009/07/08/the-semantic-web-not-a-piece-of-cake

1-6 关联数据各层,用DBpedia示例

1-7 关联数据用例:

数据整合
搜索引擎:文档检索、事实检索、探索式搜索
智能代理:静态网页——交互(动态)网页——虚拟(适应)网页

Leave a Reply

Your email address will not be published. Required fields are marked *