百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT技术 > 正文

MySQL分组查询后如何获取每组的前N条数据,你会吗?

wptr33 2024-12-10 21:18 22 浏览

“分组查询”可以说是相当常见的SQL查询语句,对于MySQL数据库而言,其实现分组查询的关键字为GROUP BY,而在使用GROUP BY期间一般还会有其他的聚合函数配合使用,比如计数用的COUNT(*),统计数值和用的SUM(*),而本文要介绍的是另一种类型的“分组查询”,即分组查询出来后再查询出每一组的前N条数据。

为了方便诸位理解,还是直接举一个实际的案例吧:存在两个数据库表,一个叫课程表course,另一个叫课程类型表course_type,这两个数据库表的DDL(数据库表字段定义)如下所示:

(1)课程类型表:

CREATE TABLE `course_type` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `name` varchar(255) CHARACTER SET utf8mb4 NOT NULL COMMENT '类型名',
  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='课程类型';

(2)课程信息表:

CREATE TABLE `course` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `type_id` int(11) NOT NULL COMMENT '类型id',
  `name` varchar(255) CHARACTER SET utf8mb4 DEFAULT NULL COMMENT '课程名称',
  `scan_total` int(255) DEFAULT NULL COMMENT '课程浏览量',
  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='课程信息表';

现在的需求为:找出每种课程类型中课程浏览量排名前3的课程记录 ,而这种场景经常可以在一些在线教育平台中见到,如下图所示为某个在线教育平台中“后端开发”这一大类型里面每种小分类的课程销量排行榜:

接下来,我们将找寻各种方式去实现这一功能需求!

(1)传统的实现方式一般是采用Java代码的方式先查询出每种课程类型数据,然后再遍历每一种课程类型,在课程表中根据课程类型匹配查询出浏览量前3的课程数据,即 type_id=xx order by scan_total desclimit 3;

其代码实现方式在这里就不贴出来了,感兴趣的小伙伴可以自己动手撸一撸!

此种实现方式最终固然可以实现功能需求,但是,有一个不好的地方在于需要在遍历每一种课程类型时不断发出查询课程数据列表的SQL,如果课程类型有10几种,而每一种需要取几十、甚至几百条数据,那将耗费很大的资源(建立数据库链接是需要耗资源的:内存、CPU、网络、磁盘…)

(2)因此,我们转而求其次,采用SQL查询一次性来搞定!在进行实操之前,debug建议诸位先打开Navicat尝试撸一撸,然后再回过头来看看debug提供的实现方式.

为了实现这种功能,我们需要转换下思考的角度:仔细阅读需求,可以得知它是需要我们查找出每种课程类型下课程浏览量前3的课程列表,其实就是找出每个课程在同种课程类型下的浏览量排名,最后再找出每种课程类型下排名前3的课程!

如下图所示为课程信息表,其中,最后一列为debug自己计算出的每个课程在同种课程类型下课程列表中的排名,即top值:

朝着上图这个方向努力了,我们撸出了相应的SQL,如下所示:

SELECT
  a.id,
  a.type_id,
  c.`name` AS typeName,
  a.scan_total,
  a.`name`,
  (
    SELECT
      COUNT(b.id) 
    FROM
      course AS b
    WHERE
      b.type_id = a.type_id
    AND b.scan_total > a.scan_total
  ) AS top
FROM
  course AS a
LEFT JOIN course_type AS c ON c.id = a.type_id
ORDER BY
  a.type_id ASC,
  a.scan_total DESC;

执行上述SQL后得到的结果如下图所示:

(3)到这里我们已经将每种类型下每个课程的排名top计算出来了,需要注意的是,在上图得到的结果中,因为Count(b.id) 得到的值可能为 0 ,因此0代表的就是第 1 名;

可能有些小伙伴还有些疑惑,为什么加个子查询就可以得到上图中的结果呢?其执行过程是怎么样的呢?OK,一图以蔽之,直接看下图相信就可以解答你心中的疑惑了:

(4)最后是直接在外层嵌一个大的查询,然后取排名值 top < 3 的数据列表,即可以得到实现功能需求,其完整的SQL如下所示:

SELECT
  t.*
FROM
  (
    SELECT
      a.id,
      a.type_id,
      c.`name` AS typeName,
      a.scan_total,
      a.`name`,
      (
        SELECT
          COUNT(b.id)
        FROM
          course AS b
        WHERE
          b.type_id = a.type_id
        AND b.scan_total > a.scan_total
      ) AS top
    FROM
      course AS a
    LEFT JOIN course_type AS c ON c.id = a.type_id
    ORDER BY
      a.type_id ASC,
      a.scan_total DESC
  ) AS t
WHERE
  t.top < 3

执行上述SQL后即可以得到相应的结果,如下图所示:

至此,我们已经完成了本文开头提出来的功能需求;那……还有没有其他的实现方式呢?当然有,只不过其实现起来虽然不同,但是其本质思想跟本文开头debug提到的那样“计算出排名top值”是差不多的;

诺,这就是另外的实现方式,从SQL语句就可以看出来,它是上述第一种实现方式的变形:

SELECT
  t.*
FROM
  course AS t
WHERE
  (
    SELECT
      COUNT(*)
    FROM
      course AS c
    WHERE
      c.type_id = t.type_id
    AND c.scan_total > t.scan_total
  ) < 3
ORDER BY
  t.type_id ASC,
  t.scan_total DESC

OK,本文讲解到此介绍,打完收工,咱们下期再见!


总结

代码/数据库下载:本文涉及到的数据库建表语句DDL以及对应的测试数据案例 可私信暗号:1001


我是debug,一个相信技术改变生活、技术成就梦想 的攻城狮;如果本文对你有帮助,请三连哟~

相关推荐

每天一个编程技巧!掌握这7个神技,代码效率飙升200%

“同事6点下班,你却为改BUG加班到凌晨?不是你不努力,而是没掌握‘偷懒’的艺术!本文揭秘谷歌工程师私藏的7个编程神技,每天1分钟,让你的代码从‘能用’变‘逆天’。文末附《Python高效代码模板》,...

Git重置到某个历史节点(Sourcetree工具)

前言Sourcetree回滚提交和重置当前分支到此次提交的区别?回滚提交是指将改动的代码提交到本地仓库,但未推送到远端仓库的时候。...

git工作区、暂存区、本地仓库、远程仓库的区别和联系

很多程序员天天写代码,提交代码,拉取代码,对git操作非常熟练,但是对git的原理并不甚了解,借助豆包AI,写个文章总结一下。Git的四个核心区域(工作区、暂存区、本地仓库、远程仓库)是版本控制的核...

解锁人生新剧本的密钥:学会让往事退场

开篇:敦煌莫高窟的千年启示在莫高窟321窟的《降魔变》壁画前,讲解员指着斑驳色彩说:"画师刻意保留了历代修补痕迹,因为真正的传承不是定格,而是流动。"就像我们的人生剧本,精彩章节永远...

Reset local repository branch to be just like remote repository HEAD

技术背景在使用Git进行版本控制时,有时会遇到本地分支与远程分支不一致的情况。可能是因为误操作、多人协作时远程分支被更新等原因。这时就需要将本地分支重置为与远程分支的...

Git恢复至之前版本(git恢复到pull之前的版本)

让程序回到提交前的样子:两种解决方法:回退(reset)、反做(revert)方法一:gitreset...

如何将文件重置或回退到特定版本(怎么让文件回到初始状态)

技术背景在使用Git进行版本控制时,经常会遇到需要将文件回退到特定版本的情况。可能是因为当前版本出现了错误,或者想要恢复到之前某个稳定的版本。Git提供了多种方式来实现这一需求。...

git如何正确回滚代码(git命令回滚代码)

方法一,删除远程分支再提交①首先两步保证当前工作区是干净的,并且和远程分支代码一致$gitcocurrentBranch$gitpullorigincurrentBranch$gi...

[git]撤销的相关命令:reset、revert、checkout

基本概念如果不清晰上面的四个概念,请查看廖老师的git教程这里我多说几句:最开始我使用git的时候,我并不明白我为什么写完代码要用git的一些列指令把我的修改存起来。后来用多了,也就明白了为什么。gi...

利用shell脚本将Mysql错误日志保存到数据库中

说明:利用shell脚本将MYSQL的错误日志提取并保存到数据库中步骤:1)创建数据库,创建表CreatedatabaseMysqlCenter;UseMysqlCenter;CREATET...

MySQL 9.3 引入增强的JavaScript支持

MySQL,这一广泛采用的开源关系型数据库管理系统(RDBMS),发布了其9.x系列的第三个更新版本——9.3版,带来了多项新功能。...

python 连接 mysql 数据库(python连接MySQL数据库案例)

用PyMySQL包来连接Python和MySQL。在使用前需要先通过pip来安装PyMySQL包:在windows系统中打开cmd,输入pipinstallPyMySQL ...

mysql导入导出命令(mysql 导入命令)

mysql导入导出命令mysqldump命令的输入是在bin目录下.1.导出整个数据库  mysqldump-u用户名-p数据库名>导出的文件名  mysqldump-uw...

MySQL-SQL介绍(mysql sqlyog)

介绍结构化查询语言是高级的非过程化编程语言,允许用户在高层数据结构上工作。它不要求用户指定对数据的存放方法,也不需要用户了解具体的数据存放方式,所以具有完全不同底层结构的不同数据库系统,可以使用相同...

MySQL 误删除数据恢复全攻略:基于 Binlog 的实战指南

在MySQL的世界里,二进制日志(Binlog)就是我们的"时光机"。它默默记录着数据库的每一个重要变更,就像一位忠实的史官,为我们在数据灾难中提供最后的救命稻草。本文将带您深入掌握如...