Locust单机多核压测，以及主从节点的数据通信处理！

一个小小的测试人

1069人浏览 · 2025-01-14 19:27:23

一个小小的测试人 · 2025-01-14 19:27:23 发布

一、背景

这还是2个月前做的一次接口性能测试，关于locust脚本的单机多核运行，以及主从节点之间的数据通信。

先简单交代下背景，在APP上线之前，需要对登录接口进行性能测试。经过评估，我还是优先选择了locust来进行脚本开发，本次用到了locust的单机多核运行能力，只不过这里还涉及到主从节点之间数据通信。现成的可参考的有效文档甚少，所以还是自己摸着官方文档过河比较靠谱。

顺带提一下，学习框架这种东西最好的教程其实还得是官方文档以及框架源码了，这里贴上locust官方文档链接，需要的可以自行学习：https://docs.locust.io/en/stable/what-is-locust.html

二、代码编写

其实脚本代码的编写一大重点就是如何处理测试数据，不同的测试需求对于测试数据的处理是不同的。比如这次的需求，手机号不能重复。另外考虑到长时间的负载压力，数据量还得足够。

最后测试数据还需要处理，那么我使用的测试号段是非真实号码段，测试结束后可以查询对应号段内的手机号，进行相关业务数据的清理。

1. 代码概览

还是老样子，先附上全部代码，然后对其结构进行拆分讲解。

import random
import time
from collections import deque
from locust import HttpUser, task, run_single_user, TaskSet, events
from locust.runners import WorkerRunner, MasterRunner
CURRENT_TIMESTAMP = str(round(time.time() * 1000))
RANDOM = str(random.randint(10000000, 99999999))
MOBILE_HEADER = {
"skip-request-expired": "true",
"skip-auth": "true",
"skip-sign": "true",
"os": "IOS",
"device-id": "198EA6A4677649018708B400F3DF69FB",
"nonce": RANDOM,
"sign": "12333",
"version": "1.2.0",
"timestamp": CURRENT_TIMESTAMP,
"Content-Type": "application/json"
}
last_mobile = ""
worker_mobile_deque = deque()
# 13300120000, 13300160000 新用户注册号段
@events.test_start.add_listener
def on_test_start(environment, **_kwargs):
if not isinstance(environment.runner, WorkerRunner):
mobile_list = []
for i in range(13300120000, 13300160000):
mobile_list.append(i)
mobile_list_length = len(mobile_list)
print("列表已生成，总计数量：", mobile_list_length)
worker_count = environment.runner.worker_count
chunk_size = int(mobile_list_length / worker_count)
print(f"平均每个worker分得的手机号数量：{chunk_size}")
for i, worker in enumerate(environment.runner.clients):
start_index = i * chunk_size
if i + 1 < worker_count:
end_index = start_index + chunk_size
else:
end_index = len(mobile_list)
data = mobile_list[start_index:end_index]
environment.runner.send_message("mobile_list", data, worker)
def setup_mobile_list(environment, msg, **kwargs):
len_msg_data = len(msg.data)
print(f"worker收到的master传来的数据号段：{msg.data[0]} ~ {msg.data[len_msg_data-1]}")
global worker_mobile_deque
worker_mobile_deque = deque(msg.data)
@events.init.add_listener
def on_locust_init(environment, **_kwargs):
if not isinstance(environment.runner, MasterRunner):
environment.runner.register_message('mobile_list', setup_mobile_list)
class VcodeLoginUser(TaskSet):
# wait_time = between(5, 5)
@task
def vcode_login(self):
test_mobile = worker_mobile_deque.popleft()
print("当前获取的手机号：", test_mobile)
# print("当前队列大小：", len(worker_mobile_deque))
global last_mobile
last_mobile = test_mobile
with self.client.post("/g/sendMobileVcode",
headers=MOBILE_HEADER,
json={"busiType": "login", "mobile": str(test_mobile)}) as send_response:
try:
send_response_json = send_response.json()
if send_response_json["message"] == "success":
params = {"mobile": str(test_mobile), "vcode": "111111"}
# print(test_mobile, "登录请求参数：", params)
with self.client.post("/g/vcodeLogin",
json=params,
headers=MOBILE_HEADER,
catch_response=True) as login_response:
# print(login_response.json)
login_response_json = login_response.json()
if login_response_json["message"] != "success":
login_response.failure("message not equal success")
elif login_response_json["code"] != 0:
login_response.failure("code not equal 0")
elif login_response_json["data"]["rId"] == "":
login_response.failure("rid is null")
elif login_response_json["data"]["mobile"] != str(test_mobile):
login_response.failure("mobile is error,入参手机号{},返回的手机号{}"
.format(test_mobile, login_response.json()["data"]["mobile"]))
# print(test_mobile, "请求结果：", login_response.json())
else:
send_response.failure("{} send code fail".format(test_mobile))
except Exception as e:
send_response.failure("send code fail {}".format(e))
@events.test_stop.add_listener
def on_test_stop(environment, **kwargs):
print("脚本结束")
print("当前队列大小：", len(worker_mobile_deque))
print("最后的手机号：", last_mobile)
class LocustLogin(HttpUser):
tasks = [VcodeLoginUser]
host = "https://qa.test.com"
if __name__ == '__main__':
run_single_user(LocustLogin)

2. 代码拆解-要加必要的断言

首先是基于locust开发的http请求的脚本大结构是不变的，依旧是两大块：HttpUser、TaskSet，这里不再对其讲解了，大伙看下官方文档就明白了。

接下来就是类VcodeLoginUser，可以看到在这里面是定义了单个用户的详细动作。注意这里要加上必要的断言。否则仅靠框架的非200外的错误断言还是不够的。

比如我这里关注登录成功后的几个必要字段：code、rId、mobile，这些一定是要符合断言的才可以。

果不其然，压测过程中就发现了并发情况下会出现的问题：入参手机号是a，接口返回的手机号是b。并发量越大错误越多。如果我只断言code=0，那么这个问题就不容易发现了，虽然接口返回的code都是成功的，但是业务上已经存在错误了。

...
with self.client.post("/g/sendMobileVcode",
headers=MOBILE_HEADER,
json={"busiType": "login", "mobile": str(test_mobile)}) as send_response:
try:
send_response_json = send_response.json()
if send_response_json["message"] == "success":
params = {"mobile": str(test_mobile), "vcode": "111111"}
# print(test_mobile, "登录请求参数：", params)
with self.client.post("/g/vcodeLogin",
json=params,
headers=MOBILE_HEADER,
catch_response=True) as login_response:
# print(login_response.json)
login_response_json = login_response.json()
if login_response_json["message"] != "success":
login_response.failure("message not equal success")
elif login_response_json["code"] != 0:
login_response.failure("code not equal 0")
elif login_response_json["data"]["rId"] == "":
login_response.failure("rid is null")
elif login_response_json["data"]["mobile"] != str(test_mobile):
login_response.failure("mobile is error,入参手机号{},返回的手机号{}"
.format(test_mobile, login_response.json()["data"]["mobile"]))
# print(test_mobile, "请求结果：", login_response.json())
else:
send_response.failure("{} send code fail".format(test_mobile))
except Exception as e:
send_response.failure("send code fail {}".format(e))
...

3. 代码拆解-单机多核处理

接下来就是重点了，如何在单台机器上用到多cpu。最开始的时候我忽略了这点，后来发现负载上不去，一打开资源监视器才发现只有1个cpu在满负载运行。

这里示意图仅供参考，我的win笔记本是12c的。

因为Locust是单进程的，不能充分利用多核CPU，于是需要我们压力机上开启一个master进程，然后再开启多个slave进程，组成一个单机分布式系统即可。

开启的方式也很简单：

# 开启 master
locust -f locustfile.py --master
# 开启 slave
locust -f locustfile.py --slave

这里我们开启 slave 节点的时候可以开启对应多个命令行窗口，当时没截图，借用网上的图片示意一下:

开启后，你的web界面就可以实时看到当前启动的节点数了。

4. 代码拆解-处理主从节点数据通信

开启主从节点倒是很容易，测试数据就需要针对性进行处理了。

因为我的测试登录用的手机号不可以重复，所以要保证不同 slave 节点上同时运行的代码产生的手机号都不可以重复。

继续扒了下官方文档，发现可以通过增加事件监听器来实现我的需求。

这里我加了三个监听器分别来处理不同的事情：

@events.init.add_listener：在locust运行初始化的时候执行
@events.test_start.add_listener: 在测试代码开始运行的时候执行
@events.test_stop.add_listener：在测试代码结束运行的时候执行

@events.test_start.add_listener 首先，在@events.test_start.add_listener里，我主要处理全量数据的生成，以及把这些手机号平均分配给生成的 slave 节点。

@events.test_start.add_listener
def on_test_start(environment, **_kwargs):
if not isinstance(environment.runner, WorkerRunner):
mobile_list = []
for i in range(13300120000, 13300160000):
mobile_list.append(i)
mobile_list_length = len(mobile_list)
print("列表已生成，总计数量：", mobile_list_length)
worker_count = environment.runner.worker_count
chunk_size = int(mobile_list_length / worker_count)
print(f"平均每个worker分得的手机号数量：{chunk_size}")
for i, worker in enumerate(environment.runner.clients):
start_index = i * chunk_size
if i + 1 < worker_count:
end_index = start_index + chunk_size
else:
end_index = len(mobile_list)
data = mobile_list[start_index:end_index]
environment.runner.send_message("mobile_list", data, worker)

def setup_mobile_list(environment, msg, **kwargs):
len_msg_data = len(msg.data)
print(f"worker收到的master传来的数据号段：{msg.data[0]} ~ {msg.data[len_msg_data-1]}")
global worker_mobile_deque
worker_mobile_deque = deque(msg.data)

这样，不同的 slave 节点脚步分配到的手机号段就是不同的了，解决测试数据重复的问题。

另外，我定义另一个全局变量worker_mobile_deque，这样不同的 slave 节点接收的数据就可以放到队列里，运行的时候从队列里面取，用一个少一个，直到队列里的数据用完。

@events.init.add_listener 接着就是在@events.init.add_listener里要注册上面定义的数据字段和处理函数。

@events.init.add_listener
def on_locust_init(environment, **_kwargs):
if not isinstance(environment.runner, MasterRunner):
environment.runner.register_message('mobile_list', setup_mobile_list)

@events.test_stop.add_listener 最后，在@events.test_stop.add_listener这里可以做一些后置处理，我是简单起见，只是记录输出了本次测试用到了哪个号码段，这样我下次运行脚本的时候可以从后面的数据开始，最大化测试数据的使用，不浪费。

@events.test_stop.add_listener
def on_test_stop(environment, **kwargs):
print("脚本结束")
print("当前队列大小：", len(worker_mobile_deque))
print("最后的手机号：", last_mobile)

三、小结

脚本调试完后可以稳定运行，接下来就是测试的过程了，进行了服务器单节点、多节点负载能力的测试，水平拓展能力的测试，以及服务动态扩容、长时间高负载测试。测试的角度观察测试报告，服务各项指标的情况。只不过涉及到开发端，调优分析的工作并未能参与很多。不过大概还是那些常见问题，后续有机会可以再单独分享了。

从使用角度来看，locust深得我爱，比起 jemter真的太轻便了，代码灵活度也非常高，单机负载能力也是响当当的，这点比jemeter强太多了。我这个项目不需要非常高的量，所以单机只用了8c就够了。如果有小伙伴需要非常高的并发，locust 也支持多机器分布式，进一步扩大并发能力。

如果我的博客对你有帮助、如果你喜欢我的博客内容，请 “点赞” “评论” “收藏” 一键三连哦！

最后： 下方这份完整的软件测试视频教程已经整理上传完成，需要的朋友们可以自行领取【保证100%免费】

腾讯云开发者社区

腾讯云面向开发者汇聚海量精品云计算使用和开发经验，营造开放的云计算技术生态圈。

更多推荐

Elasticsearch复杂数据类型终极指南：从入门到精通

Elasticsearch作为功能强大的搜索引擎，支持多种复杂数据类型，让开发者能够灵活处理各种结构化和非结构化数据。本文将带你全面了解Elasticsearch中的复杂数据类型，从基础概念到实际应用，助你轻松掌握数据建模的核心技巧。## 内部对象：构建层级化数据结构在Elasticsearch中，对象类型（Object）是最基础的复杂数据类型之一，用于表示具有嵌套关系的数据。例如，我们可

腾讯云开发者社区

终极指南：Flink SQL连接器版本管理从混乱到有序的升级之路

Apache Flink作为流处理领域的佼佼者，其SQL连接器的版本管理一直是开发者面临的核心挑战。本文将系统讲解Flink SQL连接器版本管理的最佳实践，帮助你轻松应对版本兼容性问题，实现从混乱到有序的升级之旅。## 连接器版本管理的常见痛点 😫在Flink应用开发中，连接器版本管理常常让开发者头疼不已。不同版本的连接器可能导致各种兼容性问题，例如API变更、功能差异甚至运行时错误。

腾讯云开发者社区

如何快速搭建Neon无服务器PostgreSQL：面向初学者的完整指南

Neon是一款革命性的无服务器PostgreSQL解决方案，它通过分离存储和计算层，实现了自动扩缩容、类代码式数据库分支以及零级扩展能力。本指南将帮助你从零开始搭建Neon开发环境，体验这款创新数据库的强大功能。## 准备工作：环境要求与依赖项在开始搭建Neon环境前，请确保你的系统满足以下要求：- Linux操作系统（推荐Ubuntu 20.04+或Debian 11+）- Git