需求描述:统计数据时,需要按条件计数的情况

问题描述:有一所学校有50个班级,一共有10000名学生。现在举办活动,把50个班级按照1-50编号,想要知道1-25号、26-50号班级各有多少学生。数据库结构如下:

id

学生的学号

class_id

学生所在的班级号

方法1:使用GROUP BY

SELECT COUNT(*) FROM `students` GROUP BY `class_id` > 25;

100000条数据执行结果

count(*)

50127

49873

这种GROUP BY方法的最大问题在于:无法区分所得到的结果。不知道这两个数字哪一个是1-25班级的学生数,哪一个是26-50班级的学生数

所以为了统计结果,需要把条件class_id>25作为一个字段在结果集中显示:

SELECT COUNT(*) AS `number`, `class_id` > 25 AS `type` FROM `students` GROUP BY `class_id` > 25;

100000条数据执行结果

number type

50127 0

49873 1

优缺点

由于使用了条件表达式作为分组依据,它只能做二元的划分,比如要分别统计1~10号、11~24号,25号~50号班级学生数,就无法实现了。另外,由于使用了GROUP BY,因此涉及到排序,执行时间上要更长

方法2:使用嵌套的SELECT

在每个SELECT子句中统计一个条件下的数据,然后用一个主SELECT把这些统计数据整合起来。

SQL Query

SELECT

( SELECT COUNT( * ) FROM `students` WHERE `class_id` >25 ) AS `test1`,

( SELECT COUNT( * ) FROM `students` WHERE `class_id` <=25 ) AS `test2`

执行结果

test1 test2

49873 50127

在100,000行数据上的运行时间:0.02 秒

分析

这种嵌套SELECT的方法非常直观,就是分别统计各个条件下的数值,最后进行汇总,通俗易懂,跟自然语言没啥区别了。

优缺点

优点就是直观,而且速度也比GROUP BY要快。虽然是3条SELECT语句,看起来比GROUP BY的方案多了2条语句,但是它不涉及到排序,这就节省了很多时间。

缺点可能就是语句多,稍显复杂。

方法3:使用CASE WHEN

CASE WHEN语句的功能很强大,可以定义灵活的查询条件,很适合进行分类统计。

SQL Query

SELECT

COUNT( CASE WHEN `class_id` >25 THEN 1 ELSE NULL END ) AS `test1`,

COUNT( CASE WHEN `class_id` <=25 THEN 1 ELSE NULL END ) AS `test2`

FROM students

执行结果

test1 test2

49873 50127

在100,000行数据上的运行时间:0.02 秒

分析

此方法的关键在于

COUNT( CASE WHEN `class_id` >25 THEN 1 ELSE NULL END )

这里的COUNT和CASE WHEN联合使用,做到了分类计数。先使用CASE WHEN,当满足条件时,将字段值设置为 1, 不满足条件时,将字段值设置为NULL,接着COUNT函数仅对非NULL字段进行计数,于是,问题解决。

优缺点

此方法也不涉及到排序,因此运行时间上与方法2相当,SELECT语句减少到了 1 条。

缺点就是语句比较长,对语句长度有洁癖的同学可能会比较不舒服。

总结

对于确定分类的按条件计数,可以尽量不用GROUP BY,从而避免排序动作,加速Query的执行。

如果需要根据某个字段的值进行分类,而该字段的值是可变的,比如要统计每一个班级学生数,这种情况下,还是使用一个GROUP BY来得简单便捷。

Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐