重点:
- 对象数据库系统ODBS:OODBS面向对象数据库系统、ORDBS对象关系数据库系统
- 企业资源计划信息系统ERP
- 决策支持系统DSS:DW数据仓库、OLAP联机事务分析、DM数据挖掘
1 对象数据库
面向对象的数据类型系统
- 基本类型:整型、浮点型、字符型、字符串、布尔、枚举
- 复合类型(统称汇集Collection,或批量Bulk):
行(不同类型、有序)
数组(同类型、有序)
列表(允许重复、排序)
包(可重复、无排序)
集合(无重复、无排序) - 引用类型:相当于指针
OODBS定义:
将面向对象的程序设计语言中所建立的对象自动保存在磁盘上的文件系统。
面向对象系统+数据库能力
OODB基本概念:
- 对象:一组变量、一组消息、一组方法
对象的定义提供了OO的特征——封装性Encapsulation,是一种信息隐蔽技术,使使用者和设计者分开
类似于ER模型中的实体 - 类:相似的对象进行分组成为类,类似ER模型中的实体集
类本身也是一个对象,类对象 - 继承性:子类可以继承超类的结构和特性,是:是一个(is a)联系
- 对象标识:用于标识对象,OODB中OID必须有永久的持久性,是指针一级的数据操纵原语
- 对象包含:是:是一部分(is a part of)联系
ODMG ODL(对象模型的语义结构)示例:
class Person
(extent persons key social_number)
{ attribute string social_number;
attribute string name;
attribute integer age;
attribute string sex;
};
class Faculty extends Person
(extent faculties key fno)
{ attribute string fno;
attribute integer salary;
relationship University works_for inverse University::staff;
relationship Set<Coursetext> teach inverse Coursetext::teacher;
integer num_teach() raise (noTeach);
};
Faculty是Person的子类
ODMG OQL(为ODMG对象模型制定的查询语言)示例:
SQL风格
SELECT DISTINCT C.name
FROM universities U, U.staff F,F.teach C
WHERE U.city = 'shanghai';
OQL风格
SELECT DISTINCT C.name
FROM (SELECT U FROM universities U WHERE U.city = 'shanghai') D1,
(SELECT F FROM D1.staff F) D2,
D2.teach C;
对象关系数据库系统ORDBS:
在传统的关系数据模型基础上,提供元组、数组、集合一类丰富的数据类型以及处理欣的数据类型的操作的能力,并且具有继承性和对象标识等面向对象特点,这样的数据模型称为”对象关系数据模型“。
数据类型定义:
- 行:(v1,v2,...,vn)
- 数组:array[v1,v2,...,vn
- 列表:list(v1,v2,...,vn
- 多集:multiset(v1,v2,...,vn) (即包bag)
- 集合:set(v1,v2,..,vn)
继承性:类型级继承性和表级继承性
- 类型级继承性:
CREATE TYPE Person ( name varchar(10), social_number char(18));
CREATE TYPE Student UNDER Person (degree varchar(10), department varchar(20));
Student类将继承超类的name和social_number两个属性
- 表级继承性:
CREATE TABLE people OF Person
CREATE TABLE students OF Student UNDER people
people为超表,students为子表,子表继承了超表的全部属性 引用类型的定义:
创建类型时定义
- 定义方式: 属性名 ref (类型名)
- 或者: 属性名 setof (ref (类型名))
CREATE TYPE Faculty UNDER Person
(fno char(10),
salary integer,
works_for ref (University),
teach setof (ref(Courses)));
创建表时定义:
- 引用类型的属性名 WITH OPTIONS SCOPE 表名
CREATE TABLE universities OF University
(president WITH OPTIONS SCOPE faculities,
staff WITH OPTIONS SCOPE faculties);
两种方式:
- 用表的主键实现对表中元组的引用
- 表中元组有一个元组标识符作为隐含属性,对元组的引用就是引用这个元组标识符
ORDB的查询语句:对SQL语句进行扩展
2 ERP
定义:建立在信息技术的基础上,以系统化的管理思想,为企业决策层及员工提供决策运行手段的管理平台
发展过程:基本MRP,闭环MRP,MRPII,ERP
ERP系统中,数据库结构好坏直接影响系统的运行效率
3 DW
传统数据库用于事务处理,操作型处理
数据仓库用于决策分析,分析型处理
DW的特点:
- 面向主题的:面向主题进行组织的
- 数据是集成的:根据决策分析的要求,将分散各处的原数据进行抽取、筛选、清理及综合等集成工作
- 数据是相对稳定的:涉及的数据操作主要是数据查询,一般情况下并不进行修改操作
- 数据是反映历史变化的:进行分析处理时不进行数据更新操作
- 数据量大
- 对软、硬件要求高
DW体系结构:
- 企业数据仓库
- 操作型数据存储区
- 数据集市
DW的数据组织结构
- 当前基本数据层
- 历史基本数据层
- 轻度综合数据层
- 高度综合数据层
DW的结构由元数据来组织,主要有管理元数据和用户元数据
粒度与分割:
保存数据的详细程度和级别称为粒度,越详细则粒度越小级别越低
DW的多维数据模型:数据有维和事实构成
- 模型有:
- 星型:一个大量而无冗余的表加若干含较少数据的维表,每个维表有一个一维标识符与事实发生联系
- 雪花型:在星型的基础上,对维表进行细分称若干个更小的事实表
- 事实星座模型:多个事实表,之间共享维表
DW的设计原则:面向主题、数据驱动、原型法
2 数据仓库的数据模式:
具有为数据分析而设计的模式,使用OLAP工具进行联机分析处理。
数据通常是多维数据,包括多维属性和量度属性。
包含多维数据的表称为事实表,通常很大。
维属性通常是一些短的标识,作为参照其他表的外码。
更复杂的数据仓库设计可能含有多级维表。这种模式被称为雪花模式。
复杂的数据仓库设计可能含有不止一个事实表。
3 数据仓库的体系结构:
- 底层为数据仓库服务器:通常为一个关系数据库系统
- 中间层为OLAP服务器:关系型OLAP,或多维OLAP服务器
- 顶层为前端工具:查询、报表工具、分析工具和数据挖掘工具等
3 数据挖掘
数据挖掘:从大量的、不完全的、有噪声的、模糊哦以及随机的实际数据中提取隐含在其中的、人们不知道的、但又潜在有用的信息和知识的过程。
数据挖掘的分类:
按所挖掘的数据库种类分为:
- 关系型数据库的数据挖掘
- 数据仓库的数据挖掘
- 面向对象数据库的挖掘
- 空间数据库的挖掘
- 正文数据库和多媒体数据库的数据挖掘
按所发现知识类别分为:
- 关联规则
- 特征描述
- 分类分析
- 聚类分析
- 趋势分析
- 偏差分析
按所发现的知识抽象层次分为:
- 一般化知识
- 初级知识
- 多层次知识
常用技术:
- 人工神经网络
- 决策树
- 遗传算法
- 近邻算法
- 规则推导
数据挖掘技术的应用过程:
- 确定挖掘对象
- 准备数据
- 建立模型
- 数据挖掘
- 结果分析
- 知识应用