【Linux】mdadm创建一个软raid阵列

本文介绍了如何在Linux中使用mdadm工具创建软RAID阵列。主要内容包括：mdadm的核心功能（RAID管理、状态监控、故障处理等）、关键概念（RAID级别、md设备、热备盘等）以及常用命令（创建RAID、查看状态、维护操作）。通过具体步骤演示了创建RAID0和RAID1的过程，包括分区准备、阵列创建、状态查看、格式化挂载等操作。文章还提供了性能测试方法和注意事项，适合需要在无硬件RAID卡

FixPng

3541人浏览 · 2023-06-08 11:29:55

FixPng · 2023-06-08 11:29:55 发布

Linux创建一个软raid阵列

一、Mdadm 介绍

1. mdadm 核心功能

RAID 阵列管理：创建、装配、停止、删除软件 RAID 阵列（标识为 /dev/mdX，X 为数字）。
状态监控：查看阵列健康状态、磁盘成员状态（正常/故障）、同步进度。
故障处理：替换故障磁盘、重建阵列数据，确保冗余级别下的数据不丢失。
配置维护：保存/加载 RAID 配置，避免系统重启后阵列失效。

2. 关键概念

RAID 级别：常用级别包括 RAID 1（镜像，双盘互备）、RAID 5（分布式奇偶校验，至少3盘）、RAID 10（1+0，镜像+条带，至少4盘）。
md 设备：软件 RAID 阵列的逻辑设备文件，如 /dev/md0，可直接格式化挂载使用。
成员磁盘：组成 RAID 的物理磁盘（如 /dev/sdb、/dev/sdc）或分区，故障时可替换。
热备盘（Spare）：闲置磁盘，阵列中磁盘故障时自动替换并重建数据。

3. 常用命令（按场景分类）

创建 RAID 阵列

# 示例1：创建 RAID 1（2块磁盘，镜像模式）
mdadm --create /dev/md0 --level=1 --raid-devices=2 /dev/sdb /dev/sdc

# 示例2：创建 RAID 5（3块数据盘 + 1块热备盘，共4盘）
mdadm --create /dev/md0 --level=5 --raid-devices=3 --spare-devices=1 /dev/sdb /dev/sdc /dev/sdd /dev/sde

# 关键参数说明
--create：创建新阵列
--level（-l）：指定 RAID 级别（0/1/5/6/10）
--raid-devices（-n）：数据磁盘数量
--spare-devices（-x）：热备盘数量

查看阵列状态

# 查看所有阵列概要信息
mdadm --detail --scan

# 查看指定阵列详细状态（含成员磁盘、同步进度、健康状态）
mdadm --detail /dev/md0

# 查看阵列同步进度（重建/同步时用）
cat /proc/mdstat

阵列维护操作

# 停止阵列（仅维护时使用，停止后无法访问）
mdadm --stop /dev/md0

# 装配阵列（系统重启后或停止后重新激活）
mdadm --assemble /dev/md0 /dev/sdb /dev/sdc

# 自动装配所有阵列（推荐开机自启用）
mdadm --assemble --scan

# 替换故障磁盘（假设 /dev/sdb 故障，替换为 /dev/sdf）
mdadm /dev/md0 --fail /dev/sdb  # 标记故障磁盘
mdadm /dev/md0 --remove /dev/sdb  # 移除故障磁盘
mdadm /dev/md0 --add /dev/sdf  # 添加新磁盘（自动开始重建）

保存配置（开机自启关键）

# 保存 RAID 配置到默认文件（/etc/mdadm/mdadm.conf）
mdadm --detail --scan > /etc/mdadm/mdadm.conf

# 确保系统启动时自动装配阵列（更新 initramfs）
dracut -f  # CentOS/RHEL 系
update-initramfs -u  # Ubuntu/Debian 系

四、适用场景与注意事项

适用场景

数据库服务器：用 RAID 1/10 确保数据冗余（如 MySQL 数据目录挂载在 RAID 1 上）。
应用服务器：用 RAID 0 提升读写性能（非关键数据），或 RAID 5 平衡性能与冗余。
无专用硬件 RAID 卡的服务器：通过软件层面实现存储高可用。

注意事项

避免用系统盘（/dev/sda）组建阵列，防止系统启动失败。
RAID 5 不建议用于 SSD 磁盘（奇偶校验写入会缩短 SSD 寿命），优先选 RAID 10。
阵列重建期间性能下降，需避开业务高峰期操作。
定期通过 mdadm --detail /dev/md0 检查阵列状态，及时替换故障磁盘。

二、环境准备

添加一个20G的虚拟硬盘，分成10个2G的分区

三、创建raid0

系统中如果没有mdadm命令请安装相关工具：

[root@node01 ~]# which mdadm
/usr/sbin/mdadm
[root@node01 ~]# rpm -qf /usr/sbin/mdadm 
mdadm-4.1-4.el8.x86_64
[root@node01 ~]# dnf install -y mdadm

创建raid0：

[root@node01 ~]# mdadm --create /dev/md0 --raid-devices=2 /dev/sdb1 /dev/sdb2 --level=0
mdadm: Defaulting to version 1.2 metadata
mdadm: array /dev/md0 started.

或者

[root@node01 ~]# mdadm -C /dev/md0 -l 0 -n 2 /dev/sdb1 /dev/sdb2
-C:创建软raid
-l：指定raid级别
-n：指定raid中设备个数

查看RAID信息：
/proc/mdstat文件记录了所有raid信息

[root@node01 ~]# cat /proc/mdstat 
Personalities : [raid0] 
md0 : active raid0 sdb2[1] sdb1[0]
#md0为raid0，两个成员sdb2（第二个成员），sdb1（第一个成员）
      41905152 blocks super 1.2 512k chunks
#一共有多少个块（每块1K）	数据段的大小是512K
#chunk决定了阵列中每个成员盘写入的数据量，大于这个值才会到下一个盘读写
unused devices: <none>

查看指定的RAID信息：

[root@node01 ~]# mdadm -D/--detail /dev/md0
[root@node01 ~]# mdadm  --detail /dev/md0
/dev/md0:	#名称
         Version : 1.2	#工具版本
   Creation Time : Wed Dec 11 03:05:31 2019	#建立时间
   Raid Level : raid0	#类型
   Array Size : 41905152 (39.96 GiB 42.91 GB)#容量
   Raid Devices : 2	#组成RAID的硬盘数量
   Total Devices : 2#成员总数，包含备用磁盘
   Persistence : Superblock is persistent

   Update Time : Wed Dec 11 03:05:31 2019
   State : clean 	#raid的状态
   Active Devices : 2	#活跃的设备数量
   Working Devices : 2	#工作的设备数量
   Failed Devices : 0	#故障的数量
   Spare Devices : 0	#备用设备数量

   Chunk Size : 512K	

	 Consistency Policy : none

   Name : localhost.localdomain:0  (local to host localhost.localdomain)
   UUID : 06b2d3b2:3ace3ddf:b5b65dd7:eb40b040
   Events : 0

Number Major Minor RaidDevice State
 0     8     17    0      	active sync   /dev/sdb1
 1     8     33    1      	active sync   /dev/sdb2

格式化挂载使用：

[root@node01 ~]# mkfs.ext4 /dev/md0
[root@node01 ~]# mkdir /md0
[root@node01 ~]# mount /dev/md0 /md0/

查看空间使用情况：

[root@node01 ~]# df -h
文件系统             容量  已用  可用 已用% 挂载点
/dev/md0           3.9G  16M  3.7G    1% /md0
#可用空间100%

测试：

[root@node01 ~]# iostat -m -d /dev/sdb1 /dev/sdb2 2
[root@node01 ~]# dd if=/dev/zero of=/md0/file bs=1Mcount=1024

四、创建RAID1

创建raid1：

[root@node01 ~]# mdadm -C /dev/md1 -l 1 -n 2 /dev/sdb3 /dev/sdb4

查看状态信息：

[root@node01 ~]# watch -n1 "cat /proc/mdstat" 
#watch命令监控该文件变化情况,1秒钟显示一次
#或者直接查看
[root@node01 ~]# cat /proc/mdstat 
Personalities : [raid0] [raid1] 
md1 : active raid1 sdb4[1] sdb3[0]
      20953024 blocks super 1.2 [2/2] [UU]
      #两个UU说明状态ok，一个盘故障则显示_U
      [==============>......]  resync = 73.5% (15404032/20953024) finish=0.4min speed=205582K/sec
unused devices: <none>
      #以上信息说明两块盘在进行同步，100%说明同步完成

查看raid1详细信息

[root@node01 ~]# mdadm -D /dev/md1

格式化挂载使用：

[root@node01 ~]# mkfs.ext4 /dev/md1
[root@node01 ~]# mount /dev/md1 /md1

查看空间使用情况：

[root@node01 ~]# df -h
文件系统             容量  已用  可用 已用% 挂载点
/dev/md1            2.0G  6.0M  1.9G    1% /md1
#可用空间50%

测试验证热插拔：

模拟一块盘故障（将磁盘标记为失效）

[root@node01 ~]# mdadm /dev/md1 -f /dev/sdb3
mdadm: set /dev/sdb1 faulty in /dev/md1
#-f or --fail  表示失效

查看raid1状态

[root@node01 ~]# cat /proc/mdstat 
Personalities : [raid0] [raid1] 
md1 : active raid1 sdb4[1] sdb3[0](F)	F表示失效失败
      20953024 blocks super 1.2 [2/1] [_U]
      #_表示有一块盘失效
unused devices: <none>

[root@node01 ~]# mdadm -D /dev/md1
...
Number Major Minor RaidDevice State
-      0     0     0      		removed
1      8     33    1          active sync  /dev/sdb4
0      8     17    -          faulty       /dev/sdb3
 #失效盘等待移除

移除故障或者失效硬盘（热拔）

[root@node01 ~]# mdadm /dev/md1 -r /dev/sdb3
mdadm: hot removed /dev/sdb3 from /dev/md1

#-r or --remove 表示移除

[root@node01 ~]# mdadm -D /dev/md1
...
  Number   Major   Minor   RaidDevice State
       -       0        0        0      removed
       1       8       33        1      active sync   /dev/sdb4

加入新的磁盘到raid1中（热插）

[root@node01 ~]# mdadm  /dev/md1 -a /dev/sdb5
mdadm: added /dev/sdd5

#-a or --add 表示增加

[root@node01 ~]# cat /proc/mdstat

五、创建RAID5

创建raid5:

[root@node01 ~]# mdadm -C /dev/md5 -l 5 -n 3 -x 1 /dev/sdb{6,7,8,9}
#-x, --spare-devices=  表示指定热备盘

[root@node01 ~]# cat /proc/mdstat 
Personalities : [raid0] [raid1] [raid6] [raid5] [raid4] 
md5 : active raid5 sdb8[4] sdb9[3](S) sdb7[1] sdb6[0]	#S备用盘
      4188160 blocks super 1.2 level 5, 512k chunk, algorithm 2 [3/3] [UUU]
      
unused devices: <none>

说明：热备盘表示当其中一块盘故障后，热备盘会立马顶上去，而不需要人为手动干预。

[root@node01 ~]# mdadm -D /dev/md5 		查看详细信息
。。。
    Number   Major   Minor   RaidDevice State
       0       8       22        0      active sync   /dev/sdb6
       1       8       23        1      active sync   /dev/sdb7
       4       8       24        2      active sync   /dev/sdb8

       3       8       25        -      spare   /dev/sdb9

格式化挂载使用：

[root@node01 ~]# mkfs.ext4 /dev/md5
[root@node01 ~]# mkdir /md5
[root@node01 ~]# mount /dev/md5 /md5/

查看空间使用情况：

[root@node01 ~]# df -h
文件系统             容量  已用  可用 已用% 挂载点
/dev/md5             3.9G   16M  3.7G    1% /md5
#可用空间 （磁盘数量-1）x 单一磁盘容量

测试热备磁盘作用：

标记一块活动盘失效

[root@node01 /]# mdadm /dev/md5 -f /dev/sdb6
mdadm: set /dev/sdb6 faulty in /dev/md5

#立即查看状态：
[root@node01 /]# cat /proc/mdstat 
Personalities : [raid0] [raid1] [raid6] [raid5] [raid4] 
md5 : active raid5 sdb8[4] sdb9[3] sdb7[1] sdb6[0](F)
说明：
sdb6(F)失效后，原来的sdb9(S)热备盘立马顶上去同步数据
      4188160 blocks super 1.2 level 5, 512k chunk, algorithm 2 [3/2] [_UU]
      [==>..................]  recovery = 13.0% ..          
unused devices: <none>

[root@node01 /]# mdadm -D /dev/md5
...
      Number   Major   Minor   RaidDevice State
       3       8       25        0      active sync   /dev/sdb9
       1       8       23        1      active sync   /dev/sdb7
       4       8       24        2      active sync   /dev/sdb8

       0       8       22        -      faulty   /dev/sdb6

移除失效的盘

[root@node01 /]# mdadm  /dev/md5 -r /dev/sdb6 
mdadm: hot removed /dev/sdb6 from /dev/md5

为了日后考虑，再次添加一个热备盘到raid5中

[root@node01 /]# mdadm /dev/md5 -a /dev/sdb6
mdadm: added /dev/sdb6

六、保存RAID信息

为什么要保存raid信息？
如果不做信息的保存，在CentOS6中，重启系统后raid不能自动被识别到，7,8系统中不会出现这种状况。

创建配置文件

[root@node01 ~]# mdadm -D --scan >> /etc/mdadm.conf 
[root@node01 ~]# cat /etc/mdadm.conf 
ARRAY /dev/md/1 metadata=1.2 name=localhost.localdomain:1 UUID=170d690d:4f7ccd02:646c3ce0:8f6012be
ARRAY /dev/md/0 metadata=1.2 name=localhost.localdomain:0 UUID=a845702e:9251cae9:25d1bc8b:9a337df2
ARRAY /dev/md/5 metadata=1.2 spares=1 name=localhost.localdomain:5 UUID=d49e6cca:5312271b:7e8e83d5:adac4ed5

raid停止与启动

以RAID5为例说明：
停止raid:

卸载raid

[root@node01 ~]# umount /md5

使用命令停止raid

[root@node01 ~]# mdadm --stop /dev/md5
mdadm: stopped /dev/md5

启动raid：

配置文件(/etc/mdadm.conf)存在如下启动

[root@node01 ~]# mdadm -A /dev/md5
mdadm: /dev/md5 has been started with 3 drives and 1 spare.

#-A：Assemble a pre-existing array  表示装载一个已存在的raid

配置文件(/etc/mdadm.conf)不存在如下启动

[root@node01 ~]# mdadm -A /dev/md5 /dev/sdb[6789]
mdadm: /dev/md5 has been started with 3 drives and 1 spare.

如果设备名不知道，可以去查看每个设备的raid信息，使用uuid把raid设备重新组合

[root@node01 ~]# mdadm -E /dev/sdb6 | grep UUID
     Array UUID : d49e6cca:5312271b:7e8e83d5:adac4ed5
    Device UUID : b933b8d5:04a6e003:90e9b230:d13cacf5

#说明：同一个raid里每个磁盘查看的UUID都是这个值
...
[root@node01 ~]# mdadm -E /dev/sdb7 | grep UUID
     Array UUID : d49e6cca:5312271b:7e8e83d5:adac4ed5
    Device UUID : b8ca85bd:7809faa4:48882a21:98ef9349

#通过以上方法找到后进行重新组合，如下：
[root@node01 ~]# mdadm -A --uuid=d49e6cca:5312271b:7e8e83d5:adac4ed5 /dev/md5
mdadm: /dev/md5 has been started with 3 drives and 1 spare.

raid的删除

卸载设备

[root@node01 ~]# umount /md5/

移除所有磁盘

[root@node01 ~]# mdadm /dev/md5 -f /dev/sdb[6789]
mdadm: set /dev/sdb6 faulty in /dev/md5
mdadm: set /dev/sdb7 faulty in /dev/md5
mdadm: set /dev/sdb8 faulty in /dev/md5
mdadm: set /dev/sdb9 faulty in /dev/md5
[root@node01 ~]# mdadm /dev/md5 -r /dev/sdb[6789]
mdadm: hot removed /dev/sdb6 from /dev/md5
mdadm: hot removed /dev/sdb7 from /dev/md5
mdadm: hot removed /dev/sdb8 from /dev/md5
mdadm: hot removed /dev/sdb9 from /dev/md5

停止raid

[root@node01 ~]# mdadm --stop /dev/md5
mdadm: stopped /dev/md5

擦出超级块（superblock）清除相关信息

[root@node01 ~]# mdadm --zero-superblock /dev/sdb[6789]

腾讯云开发者社区

腾讯云面向开发者汇聚海量精品云计算使用和开发经验，营造开放的云计算技术生态圈。

更多推荐

终极指南：Flink SQL连接器版本管理从混乱到有序的升级之路

Apache Flink作为流处理领域的佼佼者，其SQL连接器的版本管理一直是开发者面临的核心挑战。本文将系统讲解Flink SQL连接器版本管理的最佳实践，帮助你轻松应对版本兼容性问题，实现从混乱到有序的升级之旅。## 连接器版本管理的常见痛点 😫在Flink应用开发中，连接器版本管理常常让开发者头疼不已。不同版本的连接器可能导致各种兼容性问题，例如API变更、功能差异甚至运行时错误。

腾讯云开发者社区

Elasticsearch复杂数据类型终极指南：从入门到精通

Elasticsearch作为功能强大的搜索引擎，支持多种复杂数据类型，让开发者能够灵活处理各种结构化和非结构化数据。本文将带你全面了解Elasticsearch中的复杂数据类型，从基础概念到实际应用，助你轻松掌握数据建模的核心技巧。## 内部对象：构建层级化数据结构在Elasticsearch中，对象类型（Object）是最基础的复杂数据类型之一，用于表示具有嵌套关系的数据。例如，我们可

腾讯云开发者社区

如何快速搭建Neon无服务器PostgreSQL：面向初学者的完整指南

Neon是一款革命性的无服务器PostgreSQL解决方案，它通过分离存储和计算层，实现了自动扩缩容、类代码式数据库分支以及零级扩展能力。本指南将帮助你从零开始搭建Neon开发环境，体验这款创新数据库的强大功能。## 准备工作：环境要求与依赖项在开始搭建Neon环境前，请确保你的系统满足以下要求：- Linux操作系统（推荐Ubuntu 20.04+或Debian 11+）- Git