课件3下载——关系理论 - 数据库系统原理课件 - 课外天地李树青

Flash课件浏览为：

http://www.njmars.net/UploadFile/DB/三）关系理论_.swf

美国IBM公司的E.F.Codd于1970年提出关系数据模型，当时的论文是“A Relational Model of Data for Large Shared Data Banks”，《Communication of the ACM》，1970 之后，Codd提出关系代数和关系演算的概念 1972年提出了关系的第一、第二、第三范式 1974年提出了关系的BC范式

关系数据库应用数学方法来处理数据库中的数据 80年代后，关系数据库系统成为最重要、最流行的数据库系统

1 关系数据结构关系模型建立在集合代数的基础上关系数据结构的基本概念关系关系模式

1.1 关系域（Domain）笛卡尔积（Cartesian Product）关系（Relation）

1.1.1 域（Domain）域是一组相同数据类型的值的集合，如：整数、实数、介于某个取值范围的整数、长度指定长度的字符串集合、枚举值（如{‘男’，‘女’}）、介于某个取值范围的日期

1.1.2 笛卡尔积（Cartesian Product）给定一组域D1，D2，…，Dn ，这些域中可以有相同的域。 D1，D2，…，Dn的笛卡尔积为： D1×D2×…×Dn＝｛（d1，d2，…，dn）｜diDi，i＝1，2，…，n｝所有域的所有取值的一个组合不能重复

D1=SUPERVISOR ={张清玫，刘逸} D2=SPECIALITY={计算机专业，信息专业} D3=POSTGRADUATE={李勇，刘晨，王敏} 则D1，D2，D3的笛卡尔积为： D1×D2×D3＝｛(张清玫，计算机专业，李勇)，(张清玫，计算机专业，刘晨)， (张清玫，计算机专业，王敏)，(张清玫，信息专业，李勇)， (张清玫，信息专业，刘晨)，(张清玫，信息专业，王敏)， (刘逸，计算机专业，李勇)，(刘逸，计算机专业，刘晨)， (刘逸，计算机专业，王敏)，(刘逸，信息专业，李勇)， (刘逸，信息专业，刘晨)，(刘逸，信息专业，王敏) ｝

1.1.2.1 笛卡尔积的几个基本概念元组（Tuple）：笛卡尔积中每一个元素（d1，d2，…，dn）叫作一个n元组（n-tuple）或简称元组分量（Component）：笛卡尔积元素（d1，d2，…，dn）中的每一个值di叫作一个分量基数（Cardinal number）：若Di（i＝1，2，…，n）为有限集，其基数为mi（i＝1，2，…，n），则D1×D2×…×Dn的基数M为：在上例中，基数：2×2×3＝12，即D1×D2×D3共有2×2×3＝12个元组

1.1.2.2 笛卡尔积的表示方法笛卡尔积可表示为一个二维表表中的每行对应一个元组表中的每列对应一个域在上例中，12个元组可列成一张二维表

1.1.3 关系（Relation） D1×D2×…×Dn的子集叫作在域D1，D2，…，Dn上的关系表示为R（D1，D2，…，Dn） R：关系名 D1，D2，…，Dn：属性 n：关系的目或度（Degree）

关系是笛卡尔积的有限子集，无限关系在数据库系统中是无意义的由于笛卡尔积不满足交换律，即 (d1，d2，…，dn )≠(d2，d1，…，dn )，但关系满足交换律，即(d1，d2 ，…，di ，dj ，…，dn）=（d1，d2 ，…，dj，di ，…，dn）（i，j=1，2，…，n）解决方法：为关系的每个列附加一个属性名以取消关系元组的无序性

如在笛卡尔积中取出有意义的元组来构造关系关系：SAP(SUPERVISOR，SPECIALITY，POSTGRADUATE) 假设导师与专业为1：1，导师与研究生1：n，于是SAP关系可以包含三个元组 {(张清玫，信息专业，李勇)， (张清玫，信息专业，刘晨)， (刘逸，信息专业，王敏)}

1.1.3.1关系的几个基本概念元组：关系中的每个元素是关系中的元组，通常用t表示。关系的表示也是一个二维表，表的每行对应一个元组，表的每列对应一个域属性：关系中不同列可以对应相同的域，为了加以区分，必须对每列起一个名字，称为属性（Attribute）。n目关系必有n个属性码——候选码（Candidate key）：若关系中的某一属性组的值能唯一地标识一个元组，则称该属性组为候选码全码：在最极端的情况下，关系模式的所有属性组是这个关系模式的候选码，称为全码（All-key）码——主码：若一个关系有多个候选码，则选定其中一个为主码（Primary key）。主码的诸属性称为主属性（Prime attribute）非码属性：不包含在任何侯选码中的属性称为非码属性（Non-key attribute）

1.1.3.2 三类关系的具体实现基本关系（基本表或基表）实际存在的表，是实际存储数据的逻辑表示查询表查询结果对应的表视图表由基本表或其他视图表导出的表，是虚表，不对应实际存储的数据

1.1.3.3 关系的性质列是同质的（Homogeneous）：每一列中的分量是同一类型的数据，来自同一个域

不同的列可出自同一个域：其中的每一列称为一个属性，不同的属性要给予不同的属性名

列的顺序无所谓：列的次序可以任意交换，遵循这一性质的数据库产品（如ORACLE），增加新属性时，永远是插至最后一列。但也有许多关系数据库产品没有遵循这一性质，例如FoxPro仍然区分了属性顺序

任意两个元组不能完全相同：由笛卡尔积的性质决定。但许多关系数据库产品没有遵循这一性质，如Oracle、FoxPro等都允许关系表中存在两个完全相同的元组，除非用户特别定义了相应的约束条件；SQL Server区分

行的顺序无所谓：行的次序可以任意交换。遵循这一性质的数据库产品（如ORACLE）插入一个元组时永远插至最后一行，但也有许多关系数据库产品没有遵循这一性质，例如FoxPro仍然区分了元组的顺序

分量必须取原子值：每一个分量都必须是不可分的数据项，这是规范条件中最基本的一条

1.2 关系模式什么是关系模式定义关系模式关系模式与关系

1.2.1 什么是关系模式关系模式（Relation Schema）是型，关系是值关系模式是对关系的描述元组集合的结构属性构成属性来自的域属性与域之间的映象关系元组语义以及完整性约束条件属性间的数据依赖关系集合

1.2.2 定义关系模式关系模式可以形式化地表示为： R（U，D，dom，F） R：关系名 U：组成该关系的属性名集合 D：属性组U中属性所来自的域 Dom：属性向域的映象集合 F：属性间的数据依赖关系集合定义关系模式关系模式通常可以简记为R（U）或R（A1，A2，…，An） R：关系名 A1，A2，…，An：属性名域名及属性向域的映象常常直接说明为属性的类型、长度

1.2.3 关系模式与关系关系模式对关系的描述静态的、稳定的关系关系模式在某一时刻的状态或内容动态的、随时间不断变化的关系模式和关系往往统称为关系，通过上下文加以区别

2 关系代数概述传统的集合运算专门的关系运算

2.1 概述关系代数是一种抽象的查询语言，用对关系的运算来表达查询

关系代数运算的三个要素运算对象：关系运算结果：关系运算符：四类集合运算符将关系看成元组的集合运算是从关系的“水平”方向即行的角度来进行专门的关系运算符不仅涉及行而且涉及列算术比较符逻辑运算符上述两种皆为辅助专门的关系运算符进行操作

关系代数运算的分类：传统的集合运算（并、差、交、广义笛卡尔积）专门的关系运算（选择、投影、连接、除）

2.2 传统的集合运算并差交广义笛卡尔积

2.2.1 并（Union） R和S：具有相同的目n（即两个关系都有n个属性）相应的属性取自同一个域 R∪S 仍为n目关系，由属于R或属于S的元组组成 R∪S={t|tR∨tS }

2.2.2 差（Difference） R和S：具有相同的目n 相应的属性取自同一个域 R-S 仍为n目关系，由属于R而不属于S的所有元组组成 R-S={t|tR∧tS}

2.2.3 交（Intersection） R和S：具有相同的目n 相应的属性取自同一个域 R∩S 仍为n目关系，由既属于R又属于S的元组组成 R∩S={t|tR∧tS} R∩S=R–(R-S)

2.2.4 广义笛卡尔积 Extended Cartesian Product R：n目关系，k1个元组 S：m目关系，k2个元组 R×S：列：（n+m）列的元组的集合元组的前n列是关系R的一个元组后m列是关系S的一个元组行：k1×k2个元组 R×S={tr ts|trR∧tsS}

2.3 专门的关系运算选择投影连接除

2.3.1 选择（Selection）选择又称为限制（Restriction）选择运算符的含义：在关系R中选择满足给定条件的诸元组 σF(R)={t|tR∧F(t)=‘真’} F：选择条件，是一个逻辑表达式选择运算是从行的角度进行的运算

2.3.2 投影（Projection）投影运算符的含义从R中选择出若干属性列组成新的关系 πA(R)={t[A]|tR} A：R中的属性列投影操作主要是从列的角度进行运算投影之后不仅取消了原关系中的某些列，而且还可能取消某些元组（避免重复行）

2.3.3 连接（Join）连接也称为θ连接连接运算的含义：从两个关系的笛卡尔积中选取属性间满足一定条件的元组，其中属性分别为两关系上度数相等且可比的属性组连接运算从R和S的广义笛卡尔积R×S中选取（R关系）在A属性组上的值与（S关系）在B属性组上值满足比较关系的元组

两类常用连接运算等值连接（equijoin） θ为“＝”的连接运算称为等值连接关系R与S的广义笛卡尔积中选取A、B属性值相等的那些元组自然连接（Natural join）自然连接是一种特殊的等值连接两个关系中进行比较的分量必须是相同的属性组在结果中把重复的属性列去掉，一般的连接操作是从行的角度进行运算，自然连接需要取消重复列，所以是同时从行和列的角度进行运算自然连接的要求：R和S具有相同的属性组B

2.3.4 除（Division）给定关系R（X，Y）和S（Y，Z），其中X，Y，Z为属性组 R中的Y与S中的Y可以有不同的属性名，但必须出自相同的域集 R与S的除运算得到一个新的关系P（X），P是R中满足下列条件的元组在X属性列上的投影：元组在X上分量值x的象集Yx包含S在Y上投影的集合除操作是同时从行和列角度进行运算

分析在关系R中，A可以取四个值{a1，a2，a3，a4} a1的象集为{(b1，c2)，(b2，c3)，(b2，c1)} a2的象集为{(b3，c7)，(b2，c3)} a3的象集为 {(b4，c6)} a4的象集为 {(b6，c6)} S在(B，C)上的投影为{(b1，c2)，(b2，c1)，(b2，c3) } 只有a1的象集包含了S在(B，C)属性组上的投影，所以R÷S={a1}

3 关系的完整性关系模型完整性规则是对关系的某种约束条件关系模型中三类完整性约束：实体完整性参照完整性用户定义的完整性实体完整性和参照完整性是关系模型必须满足的完整性约束条件，被称作是关系的两个不变性，应该由关系系统自动支持

3.1 实体完整性 Entity Integrity 若属性A是基本关系R的主属性，则属性A不能取空值注意实体完整性规则规定基本关系的所有主属性都不能取空值

3.2 参照完整性 Reference Integrity 例子1：学生（学号，姓名，性别，专业号，年龄）课程（课程号，课程名，学分）选修（学号，课程号，成绩）例子2：学生（学号，姓名，性别，专业号，年龄）专业（专业号，专业名）也有同一关系中的参照完整性学生实体及其内部的领导联系学生（学号，姓名，性别，专业号，年龄，班长号）参照完整性规则又称为外键约束若属性（或属性组）F是基本关系R的外码，它与基本关系S的主码Ks相对应（基本关系R和S不一定是不同的关系），则对于R中每个元组在F上的值必须为：或者取空值（F的每个属性值均为空值）或者等于S中某个元组的主码值外码（Foreign Key）设F是基本关系R的一个或一组属性，但不是关系R的码。如果F与基本关系S的主码Ks相对应，则称F是基本关系R的外码基本关系R称为参照关系（Referencing Relation）基本关系S称为被参照关系（Referenced Relation）或目标关系（Target Relation）说明：关系R和S不一定是不同的关系目标关系S的主码Ks 和参照关系的外码F必须定义在同一个（或一组）域上外码并不一定要与相应的主码同名当外码与相应的主码属于不同关系时，往往取相同的名字，以便于识别外码不一定是主码

3.3 用户定义的完整性用户定义的完整性是针对某一具体关系数据库的约束条件，反映某一具体应用所涉及的数据必须满足的语义要求关系模型应提供定义和检验这类完整性的机制，以便用统一的系统的方法处理它们，而不要由应用程序承担这一功能例子：课程（课程号，课程名，学分） “课程名”属性必须取唯一值非主属性“课程名”也不能取空值 “学分”属性只能取值{1，2，3，4}

SQL Server中的自定义完整性约束主键约束：确保在特定的列中不会输入重复的值，并且在这些列中也不允许输入null值唯一约束：对于一个表中非主键列的指定列，唯一约束确保不会输入重复的值 Check约束：指定由表中一列或多列接受的数据值或格式默认约束：每当用户没有在某一列中输入值时，则将所定义的值提供给这一列外键约束：外键约束与主键约束或唯一约束一起在指定表中强制引用完整性

[此贴子已经被作者于2006-9-26 22:58:39编辑过]

主题：课件3下载——关系理论