宣传

  • 西电本科找校内导师实习,导师选择请参考:研控—导师评价网
  • 学长亲踩雷坑,祝没有后来不幸者。

前言

博主是21级计科院的,数据库系统97分,这是期末复习期间整理的笔记,基本全部涵盖期末考试重点范围,有需要的学弟学妹可以作为参考

第一讲 数据库系统概述

数据库基本概念

{% message color:info title:数据库(DataBase,DB) %}

  • 概念: 长期存储在计算机内、有组织、可共享的数据集合
  • 特点: 永久存储、有组织、可共享
    {% endmessage %}

{% message color:info title:数据库管理系统(DataBaseManagementSystem,DBMS) %}

  • 概念: 专门用于管理数据库的软件
  • 组成: 相互关联的数据集合、访问数据的程序
    {% endmessage %}

{% message color:info title:数据库系统(DataBaseSystem,DBS) %}

  • 概念: 引入数据库之后的计算机系统
  • 特点: DBS = DB + OS + DBMS + App + DBA +Users
    {% endmessage %}

数据库发展阶段

  • 人工管理阶段
    • 数据不保存
    • 用户/应用程序管理数据
    • 数据不共享,不独立
    • 数据无结构
  • 文件系统阶段
    • 数据可以长期保存
    • 文件系统管理数据
    • 数据共享性差,冗余度大
    • 物理独立性好,逻辑独立性差
    • 记录内有结构,整体无结构
  • 数据库系统阶段
    • 数据可以永久保存
    • 数据由DBMS管理
    • 数据共享性高,冗余度小
    • 具有高度的物理独立性,较好的逻辑独立性
    • 统一数据模型,整体结构化

数据库管理系统采用外模式-模式-内模式三级模式,外模式/模式模式/内模式两级映像结构来实现的。

数据模型

  • 是数据及其联系在计算机中的表示和组织形式的描述
  • 组成三要素: 数据结构、数据操纵、数据完整性约束
  • 数据库模型
    • 概念模型

      • E-R图
    • 逻辑模型

      • 层次模型
        • 树状结构: 每个节点是基本单位称为记录,记录之间的联系以树形结构存储
        • 特点: 只能处理一对多联系,无法处理多对多联系
      • 网状模型
        • 网状结构(有向图): 记录之间的联系用连线表达,联系必须标注名称
        • 特点: 将多对多联系转换为多个一对多联系
      • 关系模型
        • 实体和联系都作为数据文件存储
    • 物理模型

数据库系统结构

  • 数据逻辑独立性:由外模式/模式映像保证(当模式改变,仅修改映像,即可保证外模式不变)
  • 数据物理独立性:由模式/内模式映像保证(当内模式改变,仅修改映像,即可保证模式不变)

第二讲 关系模型

关系数据结构

关系模式: R ( U , D , D o m ( ) , F ) R(U, D, Dom(), F) R(U,D,Dom(),F) (简称: R ( U ) R(U) R(U))
其中, R R R 表示关系名, U U U 表示属性集, D D D 表示关系的域, D o m Dom Dom 表示属性到域上的映射关系, F F F 表示数据依赖

关系代数

  • 关系代数(Relational Algebra)是过程化的查询语言,是以集合为基础的运算表达式
传统集合运算
  • 并(Union): From the row angle
$R \cup S$={$t|t\in R\vee t\in S$}
  • 差(Difference): From the row angle
$R - S$={$t|t\in R\wedge t\notin S$}
  • 交(Intersection): From the row angle
$R \cap S$ = {$t|t\in R\wedge t\in S$}=$R-(R-S)$
  • 广义笛卡尔积(Cartesian Product): From the row angle
$R \times S$ = {$\widehat{t_rt_s}|t_r\in R\wedge t_s\in S$}

注: R: ( k 1 , n ) (k_1, n) (k1,n), S: ( k 2 , m ) ⟹ (k_2,m)\Longrightarrow (k2,m)R × \times ×S: ( k 1 + k 2 , n + m ) (k_1+k_2, n+m) (k1+k2,n+m)

专门关系运算
  • 选择(Selection): From the row angle
$\sigma_F(R)$ ={$t|t\in R\wedge F(t)=True$}
  • 投影(Projection): From the column angle
$\pi_A(R)$ = {$t[A]|t\in R$}
注: 选择出原关系中某些属性列,为避免重复,还可能会取消某些元组
  • 连接(Join): From the cross angle
$R\underset{A\theta B}{\bowtie} S$ = {$t_r\cup t_s|t_r\in R\wedge t_s\in S\wedge t_r[A]\theta t_s[B]$}
  • Solution Steps For θ \theta θ Join:
    • Step 1: 确定结果中的属性列
    • Step 2: 确定参与比较的属性列
    • Step 3: 逐一取R中的元组分别和S中与其符合条件的元组进行拼接
  • 等值连接(Equi-Join): θ \theta θ is “=”
$R\underset{A=B}{\bowtie} S$ = {$t_r\cup t_s|t_r\in R\wedge t_s\in S\wedge t_r[A]=t_s[B]$}
  • 自然连接(Natural Join): θ \theta θ is “=” and A s = B s As = Bs As=Bs which combines As and Bs columns avoiding repeated attributes(As, Bs means a column or multiple columns)
$R\bowtie S$ = {$t_r\cup t_s - t_s[B]|t_r\in R\wedge t_s\in S\wedge t_r[B]=t_s[B]$}
Practices
  • Used Tables

    • S Table = S(Sno, Sname, Ssex, Sage, Sdept)
      SnoSnameSsexSageSdept
      95001李勇20CS
      95002刘晨18IS
      95003王敏18MA
      95004张立19IS
    • SC Table = SC(Sno, Cno, Grade)
      SnoCnoGrade
      95001c192
      95001c265
      95001c488
      95002c290
      95002c573
  • SC × \times ×SC Table

    SC1.SnoSC1.CnoSC1.GradeSC2.SnoSC2.CnoSC2.Grade
  • Problems

    • 查询选修了 C 2 C_2 C2 C 4 C_4 C4 课程的学生学号

    p i 1 ( σ 1 = 4 ∧ 2 = ′ c 2 ′ ∧ 5 = ′ c 4 ′ ( S C × S C ) ) pi_1(\sigma_{1=4\wedge 2='c2'\wedge 5='c4'}(SC\times SC)) pi1(σ1=42=c25=c4(SC×SC))

    • 查询不学 C 2 C_2 C2 课程的学生学号

    p i s n o ( S ) − π c n o ( σ c n o = ′ c 2 ′ ( S C ) ) pi_{sno}(S)-\pi_{cno}(\sigma_{cno='c2'}(SC)) pisno(S)πcno(σcno=c2(SC))

  1. 关系模型由关系数据结构关系操作集合关系完整性约束组成
  2. 关系数据结构:单一的结构类型即关系,表示现实世界的实体以及实体间的联系
  3. 关系操作集合:查询、插入、删除、修改操作
  4. 关系完整性约束:实体完整性、参照完整性、用户定义完整性约束
  5. 关系数据库语言的共同特点:非过程化的集合操作语言
  6. 关系数据语言:关系代数语言、关系演算语言、SQL

第三讲 数据库完整性

数据库完整性包括实体完整性、参照完整性和用户定义完整性。

实体完整性

  • CREATE TABLE 中用 PRIMARY KEY 定义关系模型的实体完整性
  • 单属性构成的码: 定义为列级约束条件/定义为表级约束条件
  • 多个属性构成的码: 定义为表级约束条件

References

第三讲 SQL概述

第六讲 关系数据理论之规范化

存在的问题

关系模式中属性间存在某些依赖关系导致插入异常、删除异常、更新异常以及数据冗余的问题

数据依赖

定义: 关系属性与属性之间的一种约束关系,即两个列或列组之间的约束,主要包含函数依赖与多值依赖。

函数依赖 (Functional Dependency, FD)

定义: 对于任意关系 r ∈ R ( U ) r\in R(U) rR(U), r r r 中不可能存在两个元组在 X X X 上的属性值相等,而在 Y Y Y 上的属性值不等。

  • X → Y X\rightarrow Y XY: X X X 函数确定 Y Y Y Y Y Y 函数依赖于 X X X
  • Notes
    • 函数依赖指 R R R 的所有关系实例均要满足的约束条件
    • 函数依赖属于语义范畴概念,只能根据数据的语义来确定函数依赖
  • 特殊函数依赖
    • 非平凡的函数依赖: X → Y X\rightarrow Y XY Y ⊈ X Y\nsubseteq X YX
    • 平凡的函数依赖: X → Y X\rightarrow Y XY Y ⊆ X Y\subseteq X YX
    • 相互决定: X → Y X\rightarrow Y XY Y → X Y\rightarrow X YX, denotes X ↔ Y X\leftrightarrow Y XY
    • Y Y Y 不函数依赖于 X X X: X ↛ Y X \nrightarrow Y XY
    • 完全函数依赖: X → Y X\rightarrow Y XY 且 $ \forall X’ \subset X, X’ \nrightarrow Y$, denotes X ⟶ F Y X\mathop{\longrightarrow}\limits^F Y XFY
    • 部分函数依赖: X → Y X\rightarrow Y XY Y Y Y 不完全函数依赖于 X X X, denotes X ⟶ P Y X\mathop{\longrightarrow}\limits^P Y XPY
    • 传递函数依赖: X → Y , Y → Z X\rightarrow Y, Y\rightarrow Z XY,YZ with conditions Y ⊈ X , Y ↛ X Y\nsubseteq X, Y\nrightarrow X YX,YX,则 X → Z X\rightarrow Z XZ, denotes X ⟶ T Y X\mathop{\longrightarrow}\limits^T Y XTY
      • 如果 Y → X Y\rightarrow X YX X ↔ Y X\leftrightarrow Y XY,则 Z Z Z 直接依赖于 X X X
      • 如果 Y ⊆ X Y\subseteq X YX, 则 X ⟶ P Z X\mathop{\longrightarrow}\limits^P Z XPZ
  • 候选码(Candidate Key)
    • For K K K in R < U , F > R<U, F> R<U,F>, satisfy K ⟶ F U K\mathop{\longrightarrow}\limits^F U KFU
    • 主码(Primary Key) 为选定的一个候选码
    • 性质
      • 决定性: K → U K\rightarrow U KU
      • 最小性: ∄ K ′ ⊂ K \nexists K'\subset K KK let K ′ → U K'\rightarrow U KU
    • 主属性(Prime Attribute): 所有候选码中出现的属性
    • 非主属性(Nonprime Attribute): 不出现在任何候选码中的属性
    • 全码(All Key): 由关系模式的所有属性构成码
    • 外码(Foreign Key): X X X 并非是 R R R 的码,而是另外一个关系模式的码

规范化

规范化设计

关系表的规范化设计就是要尽可能地减少关系表中列或者列组之间的依赖关系,即函数依赖

范式(Normal Form, NF)
  • Defination 1: 表示关系表的规范程度状态
  • Defination 2: 表示符合某一种级别的关系模式的集合
第一范式(First Normal Form, 1NF)
  • Defination: 关系模式 R R R 的所有属性都是不可分的基本数据项,denotes R ∈ 1 N F R\in 1NF R1NF
  • 不满足第一范式的数据库模式不是关系数据库
第二范式(Second Normal Form, 2NF)
  • Defination: R ∈ 1 N F R\in 1NF R1NF 并且每一个非主属性都完全函数依赖于 R R R 的任一候选码, denotes R ∈ 2 N F R\in 2NF R2NF
  • Notes
    • 不存在非主属性对码的部分依赖
    • 不属于 2 N F 2NF 2NF 关系模式问题:插入异常、删除异常、数据冗余大、修改异常
第三范式(Third Normal Form, 3NF)
  • Defination: R < U , F > R<U, F> R<U,F> 中不存在码 X X X、属性组 Y Y Y 及非主属性 Z ( Z ⊈ Y ) Z(Z\nsubseteq Y) Z(ZY) 使得 X → Y ( Y ↛ X ) , Y → Z X\rightarrow Y(Y\nrightarrow X), Y\rightarrow Z XY(YX),YZ, denotes R ∈ 3 N F R\in 3NF R3NF
  • Notes
    • If Z ⊆ Y Z\subseteq Y ZY, then when X → Y X\rightarrow Y XY, get X → Z X\rightarrow Z XZ
    • 不存在非主属性对码的传递依赖
    • 不属于 3 N F 3NF 3NF 关系模式问题:插入异常、删除异常、数据冗余大、修改异常
修正第三范式(Boyce Codd Normal Form, BCNF)
  • Defination: R ∈ 1 N F R\in 1NF R1NF, for any X → Y ( Y ⊈ X ) X\rightarrow Y(Y\nsubseteq X) XY(YX) and X X X 必包含码, denotes R ∈ B C N F R\in BCNF RBCNF
  • Notes
    • 每一个函数依赖的决定因素都包含码

Contributors

Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐