由于最近遇到一台服务器硬盘坏了,经查看该服务器数据单盘做raid0盘,接下来更换步骤

  1. 先系统查看日志或者BMC查看时哪块坏了:

cat /var/log/messages    #系统日志
ipmitool sel list    #查看 BMC 事件日志
ipmitool sel elist    #显示所有系统事件日志
  1. 找到对应坏盘分区挂载点,然后进去/etc/fstab注释故障盘分区(没有修复好,重启系统容易进救援模式)

  1. 把新硬盘替换重启服务器进去阵列卡重组新单盘raid0,在进系统对其操作

(1)查看当前可用挂载磁盘

lsbilk

(2)新硬盘12T的,由于硬盘的默认分区格式是MBR,这种格式的硬盘支持的最大挂载容量为2T,为了满足我们的要求,需要将硬盘格式转化为 gpt,代码如下:(可以不用这个)


parted -s /dev/sdf  mklabel gpt     #/dev/sdf是gpt 格式
parted -s /dev/sdf mkpart primary 0% 100% #全部划分一个主分区
mkfs.xfs /dev/sdf1     #格式化为xfs格式

3、重点是把硬盘利用parted分区格式挂载就可以了

作为sdf,磁盘分区是常用命令,其中fdisk和parted命令最为常用。但是当磁盘大于2T时,fdisk只能分到2T。

比如4T的磁盘,fdisk只能分2T的主分区出来,parted可以直接分成4T

fdisk和parted的主要区别:

1.执行风险不同,parted风险更高

fdisk在分区时,在写入命令w之前都是“未执行”的

parted在分区时,每个命令都是实际执行的,比如mklabel gpt标签,mkpart分区

2.分区大小限制

fdisk只能分2T的磁盘,最大主分区只有2T,parted没有这个限制

3.fdisk不兼容parted

parted分出来的区fdisk看不到

fdisk分区示例

fdisk /dev/sdf

n --新建分区

p --主分区

1

回车

回车

l

t --选择分区类型

8e --linux lvm

w --保存

mkfs.xfs /dev/sdf1

sdf1直接挂在到一个目录就可以使用了

parted分区示例

parted /dev/sdi

print --打印,等于fdisk里的p

mklabel gpt --gpt标签

mkpart primary 0 -1 --分区整个磁盘

quit

这时用fdisk -l是看不到sdi1的,可以ls /dev/sdi*来查看分区是否建好

由于parted内建的mkfs还不够完善,所以完成以后我们可以使用quit命令退出parted并使用 系统的mkfs命令对分区进行格式化了,此时如果使用fdisk -l命令打印分区表会出现警告信息,这是正常

5、格式化分区

mkfs.xfs /dev/sdf1
  1. 最后直接在/etc/fstab取消注释故障盘分区 ,重新mount -a 挂载看看有没有报错。

  1. 在可以通过系统日志cat /var/log/messages 或者ipmitool sel list 查看BMC事件日志有没有报错。

特殊情况,硬盘指示灯没有告警,BMC看到硬盘正常状态,系统日志IO报错。

A、通过smartctl命令验证sdai盘是否存在问题,# smartctl -H  /dev/sdN   

(SMART overall-health self-assessment test result:如果该字段的值为“PASSED”,则磁盘没有发现健康问题。如果该字段的值为“FAILED”或“UNKNOWN”,则磁盘存在健康问题)

B、获取故障盘SN,smartctl -a /dev/sdai|grep Serial

C、将定位到的故障盘进行点亮,# storcli64 /c0/e8/s11 start locate  

或者通过lsscsi 命令查看故障盘槽位

D、更换完后将硬盘灯灭掉,# storcli64 /c0/e8/s11 stop locate

Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐