数据库系统 - 汇总篇
本文档是一份关于“数据库系统”的系统性学习资料,内容涵盖了从基础概念、关系理论、SQL语言,到高级的事务并发、安全恢复,以及数据仓库与分布式数据库等核心知识领域。
数据库系统
《数据库系统》学习文档大纲

5.1 数据库基础概念与体系结构
链接:数据库基础概念与体系结构 - 软考备战(二十九)-CSDN博客

5.1.1 核心概念辨析
概念范围递增:数据 → 数据库 (DB) → 数据库管理系统 (DBMS) → 数据库系统 (DBS)
数据库系统的核心特点(对比文件系统):数据结构化、共享性高/冗余度低、数据独立性高、DBMS统一管理控制(安全性、完整性、并发控制、恢复)
5.1.2 数据管理技术的演进
第一代:非关系型(层次模型、网状模型)
第二代:关系模型 (RDBMS,当前主流)
第三代:对象-关系模型 (ORDBMS)
5.1.3 数据库系统三级模式与两级映像
三级模式结构
外模式(用户视图层):一个数据库可有多个
模式(全局逻辑层):一个数据库仅一个
内模式(物理存储层):一个数据库仅一个
两级映像与数据独立性
外模式/模式映像:保证逻辑独立性
模式/内模式映像:保证物理独立性
5.2 数据模型与关系理论
链接:数据模型与关系理论 - 软考备战(三十)-CSDN博客

5.2.1 数据模型的层次
概念数据模型(面向现实,如 E-R 模型:实体、属性、联系)
逻辑数据模型(面向系统,如关系模型)
物理数据模型(面向机器底层)
5.2.2 关系模型的基本概念
基本术语:域、笛卡尔积、关系、元组、属性、分量
“码(键)”的深度辨析:超码 → 候选码 → 主码 / 外码
主属性 vs 非主属性
关系模式(型/表头) vs 关系(值/表体)
5.2.3 关系代数
传统集合运算(并、差、交、笛卡尔积,需并相容)
专门的关系运算:选择(行过滤)、投影(列过滤)、等值连接、自然连接、外连接、除(全部包含查询)
5.2.4 关系规范化理论
存储异常剖析(数据冗余、更新异常、插入异常、删除异常)
函数依赖:完全依赖、部分依赖、传递依赖
范式升级路径与拆表准则:
1NF:属性不可再分
2NF:消除非主属性的部分函数依赖
3NF:消除非主属性的传递函数依赖
BCNF:所有属性(含主属性)均不产生部分与传递依赖
模式分解的黄金准则:无损连接性、保持函数依赖
5.3 关系数据库标准语言(SQL)
链接:关系数据库标准语言(SQL)- 软考备战(三十一)-CSDN博客

1. 数据定义 (DDL):CREATE, ALTER, DROP, TRUNCATE
表约束:PRIMARY KEY, FOREIGN KEY, UNIQUE, NOT NULL, CHECK
索引:底层原理(B+树)、优缺点权衡(以空间换时间、降低更新速度)
2. 数据查询 (DQL)
完整语法与执行顺序:FROM → WHERE → GROUP BY → HAVING → SELECT → ORDER BY
基础查询:DISTINCT, AS 别名
条件查询:AND/OR, BETWEEN, IN, LIKE, IS NULL
分组聚合:GROUP BY, 聚合函数(COUNT/SUM/AVG/MAX/MIN), HAVING
排序与分页:ORDER BY (ASC/DESC), LIMIT/OFFSET/ROWNUM 等不同数据库语法
连接查询:内连接(INNER JOIN)、左外连接(LEFT JOIN)、右外连接(RIGHT JOIN)
嵌套查询:标量子查询、列子查询(IN)、表子查询、EXISTS 及其与 IN 的效率对比
3. 数据操纵 (DML):INSERT, UPDATE, DELETE
DELETE vs TRUNCATE 的本质区别(DML vs DDL、回滚、触发器、自增计数器)
4. 视图
虚拟表的本质、作用(安全、简化查询)、不可更新的视图限制条件
5. 数据控制 (DCL):GRANT, REVOKE
权限转授:WITH GRANT OPTION
级联收回:REVOKE ... CASCADE
5.4 数据库事务与并发控制
链接:数据库事务与并发控制 - 软考备战(三十二)-CSDN博客

1. 事务的 ACID 特性
原子性 (靠 Undo Log)、一致性 (目的)、隔离性 (靠锁)、持久性 (靠 Redo Log)
2. 并发操作带来的问题
丢失修改、脏读、不可重复读、幻读
3. 封锁技术
共享锁(S锁/读锁)、排他锁(X锁/写锁) 及其相容性
4. 封锁协议
一级(防丢失修改)、二级(防脏读)、三级(防不可重复读)、两段锁协议(2PL,保证可串行化但可能死锁)
5. SQL 标准隔离级别
Read Uncommitted → Read Committed → Repeatable Read → Serializable
6. 死锁与封锁粒度
死锁预防、诊断(超时法、等待图法)与解除(撤销代价最小的事务)
封锁粒度权衡:表级锁(开销小/并发低) vs 行级锁(开销大/并发高)
5.5 数据库安全性与完整性
链接:数据库安全性与完整性 - 软考备战(三十三)-CSDN博客

1. 完整性(防止不合语义的脏数据)
实体完整性(主码非空唯一)
参照完整性(外码规则及违约处理:拒绝、级联CASCADE、设为空SET NULL)
用户定义完整性(CHECK、NOT NULL等)
触发器:超越CHECK约束的复杂完整性“终极武器”(BEFORE/AFTER)
2. 安全性(防止非法访问与越权)
五层防御体系:用户标识与鉴别 → 存取控制(DAC自主/MAC强制) → 视图机制(物理隔离) → 审计(专抓内鬼) → 数据加密(物理兜底)
5.6 数据库恢复技术

1. 故障类型
事务内部故障、系统故障(软故障)、介质故障(硬故障)
2. 恢复策略底层支撑
日志文件:日志先写原则、记录内容(旧值Undo/新值Redo)
转储(备份):静态转储 vs 动态转储
3. 恢复机制:Undo 与 Redo
Undo(撤销未提交的事务,保原子性)
Redo(重做已提交未落盘的事务,保持久性)
4. 检查点技术
原理:周期性强制刷盘并记录活跃事务列表(类似游戏存档)
基于检查点的恢复策略:大幅缩短日志扫描范围
5.7 数据仓库与数据挖掘
链接:数据仓库与数据挖掘 - 软考备战(三十五)-CSDN博客

1. 数据仓库 (DW) 四大基本特征
面向主题、集成、相对稳定(非易失)、随时间变化
OLTP(传统事务库) vs OLAP(分析型数仓)的本质对比
2. 数据挖掘 (DM) 核心功能
关联分析(如 Apriori 购物篮分析)
分类与预测(有监督学习:离散标签 vs 连续数值)
聚类(无监督学习:物以类聚)
偏差检测(找异类/欺诈检测)
标准流程:CRISP-DM(理数建模评展)
5.8 分布式数据库

1. 定义与核心特征
物理分散存储,逻辑统一整体
对比辨析:DDBS vs 多机集群 vs 联邦数据库
2. 数据分片(切)
水平分片(按行)、垂直分片(按列,必须保留主码)、导出分片(跨表)
分片完备性条件:完备性、可重构性、不相交性
3. 数据分配(放)
集中式、分割式(非冗余)、全复制式(完全冗余)、混合式(部分冗余,工程首选)
4. 分布透明性分层(由高到低)
分片透明性(最高级,当单表用)→ 位置透明性 → 局部映像透明性(最低级)
5. 分布式数据库体系结构
六层映射图解:全局外模式 → 全局概念模式 → 分片模式 → 分配模式 → 局部概念模式 → 局部内模式
6. 核心技术问题
分布式事务管理:两阶段提交协议 (2PC) 及其同步阻塞致命缺陷
分布并发控制:全局死锁检测(集中式等待图、超时机制)
分布式查询优化:选择下推、半连接技术(极致压缩网络传输量)
更多推荐
所有评论(0)