华为云Stack故障处理

故障处理通用处理原则

HCS故障处理

故障处理整体思路

(1)信息处理:采集系统出现的相关的问题,告警、包括但不限于故障现象,故障时间频率,影响范围,日志(故障前的动作),故障处理进度

  • 云平台信息采集主要是通过ManageOne实现,底层网络故障是通过AutoOps实现的。CloudNetDebug可以收集网络设备的保障信息

(2)故障处理思路:先定位全局错误,再定位局部错误。先解决整体故障,再解决细节故障。先解决管理故障,后解决业务故障

  • 故障定位主要依靠于告警(警告、一般、严重、紧急)、日志(确定是否有误操作情况)、设备配置(是否出现了配置变更或硬件故障)

恢复思路

①先解决报警,根据告警代码解决相关问题

②性能报障需要通过资源扩展或者是降低资源使用率进行实现

③操作错误就通过反向配置恢复解决

④数据配置错误可以重新进行配置

⑤硬件设备异常根据实际硬件错误解决

根据IDC统计,在数据中心系统故障中,一般情况下,系统的问题70%左右都是由于硬件故障导致的,17%是由于配置故障出现的,只有不到3%是由于软件bug导致的,其余大部分故障原因都是由于人为因素造成

业务上云迁移

Rainbow迁移工具介绍

Rainbow迁移原理介绍

Rainbow数据迁移

(1)安装Rainbow

  • 注意事项:必选选择一个第三方的站点安装,windows10以上或winserver

(2)添加代理

  • 配置服务IP,在Rainbow有多个网卡的时候,必选

  • 服务IP的选择一定要是可以同时连接到源端和目的端的地址

  • 写代理端的用户名和密码,一定要是安装的用户,一般情况下,用户安装Rainbow用的是Administrator,那么使用就要用Administrator,如果用户选择其他具有管理员权限的用户安装,但是在web界面添加用户的时候写的是Administrator,就会导致系统镜像挂载时报错

  • 关防火墙

  • 把需要使用的系统镜像上传到Rainbow的指定目录中

(3)添加源端

  • 配置源端IP

  • 配置源端用户名和密码

  • 获取源端系统信息(自动)

  • 隐藏步骤,在源端安装迁移Agent客户端

(4)添加目的端

  • 添加目标平台(FC或HCS)

  • 创建目标虚拟机,目标虚拟机的配置要大于等于源端

  • 资源校验

(5)开始迁移

  • 给目的端虚拟机配置临时IP

  • 给目的端虚拟机挂载临时镜像

  • 格式化目的端虚拟机的存储

  • 将数据迁移到目的端虚拟机

  • 同步源端配置到目的端

  • 重启虚拟机,完成迁移

云原生介绍

云原生

(1)微服务

  • 应用间通过RESTful API通信

  • 可以被独立的部署、更新、scale和重启

(2)DevOps

  • 自动化发布管道、CI工具

  • 快速部署到生产环境

  • 开发、运维协同合作

(3)持续交付

  • 频繁发布、快速交付、快速反馈、降低发布风险

(4)容器化

  • 微服务的最佳载体

容器详解

容器是什么

Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐