百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT技术 > 正文

mysql窗口函数(mysql窗口函数lag)

wptr33 2025-04-07 20:06 21 浏览

MySQL 窗口函数是一种高级的 SQL 函数,它可以进行一些比较复杂的数据分析和处理。与传统的聚合函数不同,窗口函数不会合并行,而是根据特定的条件为每行分配一个值。

MySQL 窗口函数可以用来计算每个行的聚合值,而不需要合并行,因此可以保留原始数据的所有细节。常见的 MySQL 窗口函数包括:

  • ROW_NUMBER:给每行分配一个唯一的数字,可以用来计算排名。
  • RANK:计算每行的排名,如果有相同值,则排名相同,下一个排名会跳过重复的行。
  • DENSE_RANK:计算每行的排名,如果有相同值,则排名相同,下一个排名不会跳过重复的行。
  • LEAD:获取当前行之后的指定偏移量的值。
  • LAG:获取当前行之前的指定偏移量的值。
  • FIRST_VALUE:获取分组中第一行的值。
  • LAST_VALUE:获取分组中最后一行的值。
  • SUM、AVG、COUNT、MAX、MIN 等聚合函数。

使用 MySQL 窗口函数需要用到 OVER 子句,它用来定义窗口的边界,包括窗口大小、排序规则、分区等。以下是一个例子:

SELECT department, name, salary, ROW_NUMBER() OVER (PARTITION BY department ORDER BY salary DESC) AS rank FROM employee;

这个查询使用 ROW_NUMBER 窗口函数计算每个部门员工的工资排名,PARTITION BY 子句指定了分区列,ORDER BY 子句指定了排序规则。

以下是一些 MySQL 窗口函数以及它们在处理复杂场景数据时的示例:

  1. ROW_NUMBER

ROW_NUMBER() 函数用于为每一行分配一个唯一的数字,通常用于排序或排名。例如,假设我们有一个表格 employees,其中包含每个部门的员工,我们可以使用 ROW_NUMBER() 函数为每个部门的员工计算排名:

SELECT department, name, salary, ROW_NUMBER() OVER (PARTITION BY department ORDER BY salary DESC) AS rank FROM employees;

这将为每个部门内的员工按工资降序排名,并在每个部门内为每个员工分配一个排名。

  1. RANK

RANK() 函数用于计算每行的排名,如果有相同的值,则排名相同,下一个排名会跳过重复的行。例如,假设我们有一个表格 sales,其中包含每个销售员的销售额,我们可以使用 RANK() 函数为每个销售员计算排名:

SELECT salesman, sales, RANK() OVER (ORDER BY sales DESC) AS rank FROM sales;

这将按销售额降序排列销售员,并为每个销售员分配一个排名。如果两个销售员的销售额相同,则它们将获得相同的排名,而下一个排名将跳过这两个销售员。

  1. DENSE_RANK

DENSE_RANK() 函数与 RANK() 函数类似,但是它不会跳过重复的排名。例如,假设我们有一个表格 sales,其中包含每个销售员的销售额,我们可以使用 DENSE_RANK() 函数为每个销售员计算排名:

SELECT salesman, sales, DENSE_RANK() OVER (ORDER BY sales DESC) AS rank FROM sales;

这将按销售额降序排列销售员,并为每个销售员分配一个排名。如果两个销售员的销售额相同,则它们将获得相同的排名,下一个排名将不会跳过这两个销售员。

  1. LEAD

LEAD() 函数用于获取当前行之后的指定偏移量的值。例如,假设我们有一个表格 orders,其中包含每个客户的订单和订单日期,我们可以使用 LEAD() 函数获取每个客户的下一个订单日期:

SELECT customer, order_date, LEAD(order_date, 1) OVER (PARTITION BY customer ORDER BY order_date) AS next_order_date FROM orders;

这将按客户和订单日期对订单进行分区,并为每个订单获取下一个订单日期。

  1. LAG

LAG() 函数用于获取窗口中指定列的前一行的值。例如,假设我们有一个表格 sales,其中包含每个销售员的销售额和日期,我们可以使用 LAG() 函数计算每个销售员的销售额与前一天相比的增长率:

SELECT salesman, sale_date, sales, LAG(sales) OVER (PARTITION BY salesman ORDER BY sale_date) AS previous_sales, (sales - LAG(sales) OVER (PARTITION BY salesman ORDER BY sale_date)) / LAG(sales) OVER (PARTITION BY salesman ORDER BY sale_date) AS growth_rate FROM sales;

这将按销售员和日期对销售进行分区,并使用 LAG() 函数获取前一天的销售额,然后计算增长率。

  1. FIRST_VALUE

FIRST_VALUE() 函数用于获取窗口中指定列的第一行的值。例如,假设我们有一个表格 employees,其中包含每个部门的员工和薪资,我们可以使用 FIRST_VALUE() 函数计算每个部门的最高薪资员工:

SELECT department, name, salary, FIRST_VALUE(name) OVER (PARTITION BY department ORDER BY salary DESC) AS highest_salary_employee FROM employees;

这将按部门对员工进行分区,并使用 FIRST_VALUE() 函数获取薪资最高的员工的名称。

  1. LAST_VALUE

LAST_VALUE() 函数用于获取窗口中指定列的最后一行的值。例如,假设我们有一个表格 logs,其中包含每个用户的登录时间和日期,我们可以使用 LAST_VALUE() 函数计算每个用户最后一次登录的时间:

SELECT user, login_time, LAST_VALUE(login_time) OVER (PARTITION BY user ORDER BY login_time) AS last_login_time FROM logs;

这将按用户和登录时间对日志进行分区,并使用 LAST_VALUE() 函数获取每个用户最后一次登录的时间。

  1. SUM

SUM() 函数用于计算窗口中指定列的总和。例如,假设我们有一个表格 sales,其中包含每个销售员的销售额和日期,我们可以使用 SUM() 函数计算每个销售员的累计销售额:

SELECT salesman, sale_date, sales, SUM(sales) OVER (PARTITION BY salesman ORDER BY sale_date) AS cumulative_sales FROM sales;

这将按销售员和日期对销售进行分区,并为每个销售员计算累计销售额。

  1. AVG

AVG() 函数用于计算窗口中指定列的平均值。例如,假设我们有一个表格 employees,其中包含每个部门的员工和薪资,我们可以使用 AVG() 函数计算每个部门的平均工资:

SELECT department, name, salary, AVG(salary) OVER (PARTITION BY department) AS avg_salary FROM employees;

这将按部门对员工进行分区,并为每个部门计算平均工资。

  1. MAX

MAX() 函数用于计算窗口中指定列的最大值。例如,假设我们有一个表格 products,其中包含每个产品的价格和制造商,我们可以使用 MAX() 函数计算每个制造商的最高价格产品:

SELECT manufacturer, product, price, MAX(price) OVER (PARTITION BY manufacturer) AS max_price FROM products;

这将按制造商对产品进行分区,并为每个制造商计算最高价格。

  1. MIN

MIN() 函数用于计算窗口中指定列的最小值。例如,假设我们有一个表格 orders,其中包含每个客户的订单和订单日期,我们可以使用 MIN() 函数计算每个客户的最早订单日期:

SELECT customer, order_date, MIN(order_date) OVER (PARTITION BY customer) AS first_order_date FROM orders;

这将按客户对订单进行分区,并为每个客户计算最早订单日期。

  1. COUNT

COUNT() 函数用于计算窗口中指定列的行数。例如,假设我们有一个表格 logs,其中包含每个用户的登录时间和日期,我们可以使用 COUNT() 函数计算每个用户在过去一小时内的登录次数:

SELECT user, login_time, COUNT(*) OVER (PARTITION BY user ORDER BY login_time RANGE BETWEEN INTERVAL 1 HOUR PRECEDING AND CURRENT ROW) AS login_count_last_hour FROM logs;

这将按用户和登录时间对日志进行分区,并为每个用户计算过去一小时内的登录次数。注意,在此示例中,我们使用 RANGE 子句指定窗口的范围。这将计算从当前行开始向前一个小时内的所有行的计数。

综上所述,MySQL 窗口函数可以进行一些比较复杂的数据分析和处理,常见的窗口函数包括 ROW_NUMBER、RANK、DENSE_RANK、LEAD、LAG、FIRST_VALUE、LAST_VALUE 和聚合函数等。使用 MySQL 窗口函数需要用到 OVER 子句来定义窗口的边界,包括窗口大小、排序规则、分区等。

相关推荐

MySQL进阶五之自动读写分离mysql-proxy

自动读写分离目前,大量现网用户的业务场景中存在读多写少、业务负载无法预测等情况,在有大量读请求的应用场景下,单个实例可能无法承受读取压力,甚至会对业务产生影响。为了实现读取能力的弹性扩展,分担数据库压...

Postgres vs MySQL_vs2022连接mysql数据库

...

3分钟短文 | Laravel SQL筛选两个日期之间的记录,怎么写?

引言今天说一个细分的需求,在模型中,或者使用laravel提供的EloquentORM功能,构造查询语句时,返回位于两个指定的日期之间的条目。应该怎么写?本文通过几个例子,为大家梳理一下。学习时...

一文由浅入深带你完全掌握MySQL的锁机制原理与应用

本文将跟大家聊聊InnoDB的锁。本文比较长,包括一条SQL是如何加锁的,一些加锁规则、如何分析和解决死锁问题等内容,建议耐心读完,肯定对大家有帮助的。为什么需要加锁呢?...

验证Mysql中联合索引的最左匹配原则

后端面试中一定是必问mysql的,在以往的面试中好几个面试官都反馈我Mysql基础不行,今天来着重复习一下自己的弱点知识。在Mysql调优中索引优化又是非常重要的方法,不管公司的大小只要后端项目中用到...

MySQL索引解析(联合索引/最左前缀/覆盖索引/索引下推)

目录1.索引基础...

你会看 MySQL 的执行计划(EXPLAIN)吗?

SQL执行太慢怎么办?我们通常会使用EXPLAIN命令来查看SQL的执行计划,然后根据执行计划找出问题所在并进行优化。用法简介...

MySQL 从入门到精通(四)之索引结构

索引概述索引(index),是帮助MySQL高效获取数据的数据结构(有序),在数据之外,数据库系统还维护者满足特定查询算法的数据结构,这些数据结构以某种方式引用(指向)数据,这样就可以在这些数据结构...

mysql总结——面试中最常问到的知识点

mysql作为开源数据库中的榜一大哥,一直是面试官们考察的重中之重。今天,我们来总结一下mysql的知识点,供大家复习参照,看完这些知识点,再加上一些边角细节,基本上能够应付大多mysql相关面试了(...

mysql总结——面试中最常问到的知识点(2)

首先我们回顾一下上篇内容,主要复习了索引,事务,锁,以及SQL优化的工具。本篇文章接着写后面的内容。性能优化索引优化,SQL中索引的相关优化主要有以下几个方面:最好是全匹配。如果是联合索引的话,遵循最...

MySQL基础全知全解!超详细无废话!轻松上手~

本期内容提醒:全篇2300+字,篇幅较长,可搭配饭菜一同“食”用,全篇无废话(除了这句),干货满满,可收藏供后期反复观看。注:MySQL中语法不区分大小写,本篇中...

深入剖析 MySQL 中的锁机制原理_mysql 锁详解

在互联网软件开发领域,MySQL作为一款广泛应用的关系型数据库管理系统,其锁机制在保障数据一致性和实现并发控制方面扮演着举足轻重的角色。对于互联网软件开发人员而言,深入理解MySQL的锁机制原理...

Java 与 MySQL 性能优化:MySQL分区表设计与性能优化全解析

引言在数据库管理领域,随着数据量的不断增长,如何高效地管理和操作数据成为了一个关键问题。MySQL分区表作为一种有效的数据管理技术,能够将大型表划分为多个更小、更易管理的分区,从而提升数据库的性能和可...

MySQL基础篇:DQL数据查询操作_mysql 查

一、基础查询DQL基础查询语法SELECT字段列表FROM表名列表WHERE条件列表GROUPBY分组字段列表HAVING分组后条件列表ORDERBY排序字段列表LIMIT...

MySql:索引的基本使用_mysql索引的使用和原理

一、索引基础概念1.什么是索引?索引是数据库表的特殊数据结构(通常是B+树),用于...