【kubernetes】关于HPA的behavior的说明

项目中在使用hpa来弹性扩缩pod，使用到了hpa的behavior字段，去查询了该字段的用法，在使用中发现与预期的结果不一致，这里记录一下问题及理解。官方的linkPod 水平自动扩缩 | KubernetesPod 水平自动扩缩（Horizontal Pod Autoscaler）可以基于 CPU 利用率自动扩缩 ReplicationController、Deployment、

秦拿希

10000人浏览 · 2021-10-12 13:29:59

秦拿希 · 2021-10-12 13:29:59 发布

项目中在使用hpa来弹性扩缩pod，使用到了hpa的behavior字段，去查询了该字段的用法，在使用中发现与预期的结果不一致，这里记录一下问题及理解。

官方的link

Pod 水平自动扩缩 | KubernetesPod 水平自动扩缩（Horizontal Pod Autoscaler）可以基于 CPU 利用率自动扩缩 ReplicationController、Deployment、ReplicaSet 和 StatefulSet 中的 Pod 数量。除了 CPU 利用率，也可以基于其他应程序提供的自定义度量指标来执行自动扩缩。 Pod 自动扩缩不适用于无法扩缩的对象，比如 DaemonSet。Pod 水平自动扩缩特性由 Kubernetes API 资源和控制器实现。资源决定了控制器的行为。控制器会周期性地调整副本控制器或 Deployment 中的副本数量，以使得类似 Pod 平均 CPU 利用率、平均内存利用率这类观测到的度量值与用户所设定的目标值匹配。Pod 水平自动扩缩工作机制 Pod 水平自动扩缩器的实现是一个控制回路，由控制器管理器的 --horizontal-pod-autoscaler-sync-period 参数指定周期（默认值为 15 秒）。每个周期内，控制器管理器根据每个 HorizontalPodAutoscaler 定义中指定的指标查询资源利用率。控制器管理器可以从资源度量指标 API（按 Pod 统计的资源用量）和自定义度量指标 API（其他指标）获取度量值。对于按 Pod 统计的资源指标（如 CPU），控制器从资源指标 API 中获取每一个 HorizontalPodAutoscaler 指定的 Pod 的度量值，如果设置了目标使用率，控制器获取每个 Pod 中的容器资源使用情况，并计算资源使用率。如果设置了 target 值，将直接使用原始数据（不再计算百分比）。接下来，控制器根据平均的资源使用率或原始值计算出扩缩的比例，进而计算出目标副本数。需要注意的是，如果 Pod 某些容器不支持资源采集，那么控制器将不会使用该 Pod 的 CPU 使用率。下面的算法细节章节将会介绍详细的算法。https://kubernetes.io/zh/docs/tasks/run-application/horizontal-pod-autoscale/

默认行为

behavior:
  scaleDown:
    stabilizationWindowSeconds: 300
    policies:
    - type: Percent
      value: 100
      periodSeconds: 15
  scaleUp:
    stabilizationWindowSeconds: 0
    policies:
    - type: Percent
      value: 100
      periodSeconds: 15
    - type: Pods
      value: 4
      periodSeconds: 15
    selectPolicy: Max

这里主要有几个字段，

stabilizationWindowSeconds：当指标显示目标应该缩容时，自动扩缩算法查看之前计算的期望状态，并使用指定时间间隔内的最大值。就是说会在过去5分钟内选择期望值最高的一个值，是为了防止副本数抖动的过于频繁。

periodSeconds：在该时间内，副本数变化最多不会超过Percent或pods定义的数量。这个字段我之前的理解是两次扩缩容之间的间隔，其实并不是，你在实际操作的时候会发现不管该值设置大小，扩缩容的时间间隔不会是你设置的这个值。这个值是限制单位时间内副本可变化的数量的。比如如下配置：

behavior:
    scaleDown:
      policies:
      - type: Pods
        value: 1
        periodSeconds: 180
      stabilizationWindowSeconds: 0
      #selectPolicy: Disabled
    scaleUp:
      policies:
      - type: Pods
        value: 2
        periodSeconds: 300
      #- type: Pods
        #alue: 4
        #eriodSeconds: 15
      selectPolicy: Max
      stabilizationWindowSeconds: 0

上面脚本定义了扩容时5分钟内最多扩2个，缩容时3分钟内最多缩一个，用kubectl describe hpa看下结果