数据库系统

《数据库系统》学习文档大纲

5.1 数据库基础概念与体系结构

链接:数据库基础概念与体系结构 - 软考备战(二十九)-CSDN博客

5.1.1 核心概念辨析

概念范围递增:数据 → 数据库 (DB) → 数据库管理系统 (DBMS) → 数据库系统 (DBS)

数据库系统的核心特点(对比文件系统):数据结构化、共享性高/冗余度低、数据独立性高、DBMS统一管理控制(安全性、完整性、并发控制、恢复)

5.1.2 数据管理技术的演进

第一代:非关系型(层次模型、网状模型)

第二代:关系模型 (RDBMS,当前主流)

第三代:对象-关系模型 (ORDBMS)

5.1.3 数据库系统三级模式与两级映像

三级模式结构

外模式(用户视图层):一个数据库可有多个

模式(全局逻辑层):一个数据库仅一个

内模式(物理存储层):一个数据库仅一个

两级映像与数据独立性

外模式/模式映像:保证逻辑独立性

模式/内模式映像:保证物理独立性

5.2 数据模型与关系理论

链接:数据模型与关系理论 - 软考备战(三十)-CSDN博客

5.2.1 数据模型的层次

概念数据模型(面向现实,如 E-R 模型:实体、属性、联系)

逻辑数据模型(面向系统,如关系模型)

物理数据模型(面向机器底层)

5.2.2 关系模型的基本概念

基本术语:域、笛卡尔积、关系、元组、属性、分量

“码(键)”的深度辨析:超码 → 候选码 → 主码 / 外码

主属性 vs 非主属性

关系模式(型/表头) vs 关系(值/表体)

5.2.3 关系代数

传统集合运算(并、差、交、笛卡尔积,需并相容)

专门的关系运算:选择(行过滤)、投影(列过滤)、等值连接、自然连接、外连接、除(全部包含查询)

5.2.4 关系规范化理论

存储异常剖析(数据冗余、更新异常、插入异常、删除异常)

函数依赖:完全依赖、部分依赖、传递依赖

范式升级路径与拆表准则:

1NF:属性不可再分

2NF:消除非主属性的部分函数依赖

3NF:消除非主属性的传递函数依赖

BCNF:所有属性(含主属性)均不产生部分与传递依赖

模式分解的黄金准则:无损连接性、保持函数依赖

5.3 关系数据库标准语言(SQL)

链接:关系数据库标准语言(SQL)- 软考备战(三十一)-CSDN博客

1. 数据定义 (DDL):CREATE, ALTER, DROP, TRUNCATE

表约束:PRIMARY KEY, FOREIGN KEY, UNIQUE, NOT NULL, CHECK

索引:底层原理(B+树)、优缺点权衡(以空间换时间、降低更新速度)

2. 数据查询 (DQL)

完整语法与执行顺序:FROM → WHERE → GROUP BY → HAVING → SELECT → ORDER BY

基础查询:DISTINCT, AS 别名

条件查询:AND/OR, BETWEEN, IN, LIKE, IS NULL

分组聚合:GROUP BY, 聚合函数(COUNT/SUM/AVG/MAX/MIN), HAVING

排序与分页:ORDER BY (ASC/DESC), LIMIT/OFFSET/ROWNUM 等不同数据库语法

连接查询:内连接(INNER JOIN)、左外连接(LEFT JOIN)、右外连接(RIGHT JOIN)

嵌套查询:标量子查询、列子查询(IN)、表子查询、EXISTS 及其与 IN 的效率对比

3. 数据操纵 (DML):INSERT, UPDATE, DELETE

DELETE vs TRUNCATE 的本质区别(DML vs DDL、回滚、触发器、自增计数器)

4. 视图

虚拟表的本质、作用(安全、简化查询)、不可更新的视图限制条件

5. 数据控制 (DCL):GRANT, REVOKE

权限转授:WITH GRANT OPTION

级联收回:REVOKE ... CASCADE

5.4 数据库事务与并发控制

链接:数据库事务与并发控制 - 软考备战(三十二)-CSDN博客

1. 事务的 ACID 特性

原子性 (靠 Undo Log)、一致性 (目的)、隔离性 (靠锁)、持久性 (靠 Redo Log)

2. 并发操作带来的问题

丢失修改、脏读、不可重复读、幻读

3. 封锁技术

共享锁(S锁/读锁)、排他锁(X锁/写锁) 及其相容性

4. 封锁协议

一级(防丢失修改)、二级(防脏读)、三级(防不可重复读)、两段锁协议(2PL,保证可串行化但可能死锁)

5. SQL 标准隔离级别

Read Uncommitted → Read Committed → Repeatable Read → Serializable

6. 死锁与封锁粒度

死锁预防、诊断(超时法、等待图法)与解除(撤销代价最小的事务)

封锁粒度权衡:表级锁(开销小/并发低) vs 行级锁(开销大/并发高)

5.5 数据库安全性与完整性

链接:数据库安全性与完整性 - 软考备战(三十三)-CSDN博客

1. 完整性(防止不合语义的脏数据)

实体完整性(主码非空唯一)

参照完整性(外码规则及违约处理:拒绝、级联CASCADE、设为空SET NULL)

用户定义完整性(CHECK、NOT NULL等)

触发器:超越CHECK约束的复杂完整性“终极武器”(BEFORE/AFTER)

2. 安全性(防止非法访问与越权)

五层防御体系:用户标识与鉴别 → 存取控制(DAC自主/MAC强制) → 视图机制(物理隔离) → 审计(专抓内鬼) → 数据加密(物理兜底)

5.6 数据库恢复技术

链接:数据库恢复技术 - 软考备战(三十四)-CSDN博客

1. 故障类型

事务内部故障、系统故障(软故障)、介质故障(硬故障)

2. 恢复策略底层支撑

日志文件:日志先写原则、记录内容(旧值Undo/新值Redo)

转储(备份):静态转储 vs 动态转储

3. 恢复机制:Undo 与 Redo

Undo(撤销未提交的事务,保原子性)

Redo(重做已提交未落盘的事务,保持久性)

4. 检查点技术

原理:周期性强制刷盘并记录活跃事务列表(类似游戏存档)

基于检查点的恢复策略:大幅缩短日志扫描范围

5.7 数据仓库与数据挖掘

链接:数据仓库与数据挖掘 - 软考备战(三十五)-CSDN博客

1. 数据仓库 (DW) 四大基本特征

面向主题、集成、相对稳定(非易失)、随时间变化

OLTP(传统事务库) vs OLAP(分析型数仓)的本质对比

2. 数据挖掘 (DM) 核心功能

关联分析(如 Apriori 购物篮分析)

分类与预测(有监督学习:离散标签 vs 连续数值)

聚类(无监督学习:物以类聚)

偏差检测(找异类/欺诈检测)

标准流程:CRISP-DM(理数建模评展)

5.8 分布式数据库

链接:分布式数据库 - 软考备战(三十六)-CSDN博客

1. 定义与核心特征

物理分散存储,逻辑统一整体

对比辨析:DDBS vs 多机集群 vs 联邦数据库

2. 数据分片(切)

水平分片(按行)、垂直分片(按列,必须保留主码)、导出分片(跨表)

分片完备性条件:完备性、可重构性、不相交性

3. 数据分配(放)

集中式、分割式(非冗余)、全复制式(完全冗余)、混合式(部分冗余,工程首选)

4. 分布透明性分层(由高到低)

分片透明性(最高级,当单表用)→ 位置透明性 → 局部映像透明性(最低级)

5. 分布式数据库体系结构

六层映射图解:全局外模式 → 全局概念模式 → 分片模式 → 分配模式 → 局部概念模式 → 局部内模式

6. 核心技术问题

分布式事务管理:两阶段提交协议 (2PC) 及其同步阻塞致命缺陷

分布并发控制:全局死锁检测(集中式等待图、超时机制)

分布式查询优化:选择下推、半连接技术(极致压缩网络传输量)

Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐