mysql窗口函数(mysql窗口函数rank)
itomcoil 2025-07-02 21:21 2 浏览
MySQL 窗口函数是一种高级的 SQL 函数,它可以进行一些比较复杂的数据分析和处理。与传统的聚合函数不同,窗口函数不会合并行,而是根据特定的条件为每行分配一个值。
MySQL 窗口函数可以用来计算每个行的聚合值,而不需要合并行,因此可以保留原始数据的所有细节。常见的 MySQL 窗口函数包括:
- ROW_NUMBER:给每行分配一个唯一的数字,可以用来计算排名。
- RANK:计算每行的排名,如果有相同值,则排名相同,下一个排名会跳过重复的行。
- DENSE_RANK:计算每行的排名,如果有相同值,则排名相同,下一个排名不会跳过重复的行。
- LEAD:获取当前行之后的指定偏移量的值。
- LAG:获取当前行之前的指定偏移量的值。
- FIRST_VALUE:获取分组中第一行的值。
- LAST_VALUE:获取分组中最后一行的值。
- SUM、AVG、COUNT、MAX、MIN 等聚合函数。
使用 MySQL 窗口函数需要用到 OVER 子句,它用来定义窗口的边界,包括窗口大小、排序规则、分区等。以下是一个例子:
SELECT department, name, salary, ROW_NUMBER() OVER (PARTITION BY department ORDER BY salary DESC) AS rank FROM employee;
这个查询使用 ROW_NUMBER 窗口函数计算每个部门员工的工资排名,PARTITION BY 子句指定了分区列,ORDER BY 子句指定了排序规则。
以下是一些 MySQL 窗口函数以及它们在处理复杂场景数据时的示例:
- ROW_NUMBER
ROW_NUMBER() 函数用于为每一行分配一个唯一的数字,通常用于排序或排名。例如,假设我们有一个表格 employees,其中包含每个部门的员工,我们可以使用 ROW_NUMBER() 函数为每个部门的员工计算排名:
SELECT department, name, salary, ROW_NUMBER() OVER (PARTITION BY department ORDER BY salary DESC) AS rank FROM employees;
这将为每个部门内的员工按工资降序排名,并在每个部门内为每个员工分配一个排名。
- RANK
RANK() 函数用于计算每行的排名,如果有相同的值,则排名相同,下一个排名会跳过重复的行。例如,假设我们有一个表格 sales,其中包含每个销售员的销售额,我们可以使用 RANK() 函数为每个销售员计算排名:
SELECT salesman, sales, RANK() OVER (ORDER BY sales DESC) AS rank FROM sales;
这将按销售额降序排列销售员,并为每个销售员分配一个排名。如果两个销售员的销售额相同,则它们将获得相同的排名,而下一个排名将跳过这两个销售员。
- DENSE_RANK
DENSE_RANK() 函数与 RANK() 函数类似,但是它不会跳过重复的排名。例如,假设我们有一个表格 sales,其中包含每个销售员的销售额,我们可以使用 DENSE_RANK() 函数为每个销售员计算排名:
SELECT salesman, sales, DENSE_RANK() OVER (ORDER BY sales DESC) AS rank FROM sales;
这将按销售额降序排列销售员,并为每个销售员分配一个排名。如果两个销售员的销售额相同,则它们将获得相同的排名,下一个排名将不会跳过这两个销售员。
- LEAD
LEAD() 函数用于获取当前行之后的指定偏移量的值。例如,假设我们有一个表格 orders,其中包含每个客户的订单和订单日期,我们可以使用 LEAD() 函数获取每个客户的下一个订单日期:
SELECT customer, order_date, LEAD(order_date, 1) OVER (PARTITION BY customer ORDER BY order_date) AS next_order_date FROM orders;
这将按客户和订单日期对订单进行分区,并为每个订单获取下一个订单日期。
- LAG
LAG() 函数用于获取窗口中指定列的前一行的值。例如,假设我们有一个表格 sales,其中包含每个销售员的销售额和日期,我们可以使用 LAG() 函数计算每个销售员的销售额与前一天相比的增长率:
SELECT salesman, sale_date, sales, LAG(sales) OVER (PARTITION BY salesman ORDER BY sale_date) AS previous_sales, (sales - LAG(sales) OVER (PARTITION BY salesman ORDER BY sale_date)) / LAG(sales) OVER (PARTITION BY salesman ORDER BY sale_date) AS growth_rate FROM sales;
这将按销售员和日期对销售进行分区,并使用 LAG() 函数获取前一天的销售额,然后计算增长率。
- FIRST_VALUE
FIRST_VALUE() 函数用于获取窗口中指定列的第一行的值。例如,假设我们有一个表格 employees,其中包含每个部门的员工和薪资,我们可以使用 FIRST_VALUE() 函数计算每个部门的最高薪资员工:
SELECT department, name, salary, FIRST_VALUE(name) OVER (PARTITION BY department ORDER BY salary DESC) AS highest_salary_employee FROM employees;
这将按部门对员工进行分区,并使用 FIRST_VALUE() 函数获取薪资最高的员工的名称。
- LAST_VALUE
LAST_VALUE() 函数用于获取窗口中指定列的最后一行的值。例如,假设我们有一个表格 logs,其中包含每个用户的登录时间和日期,我们可以使用 LAST_VALUE() 函数计算每个用户最后一次登录的时间:
SELECT user, login_time, LAST_VALUE(login_time) OVER (PARTITION BY user ORDER BY login_time) AS last_login_time FROM logs;
这将按用户和登录时间对日志进行分区,并使用 LAST_VALUE() 函数获取每个用户最后一次登录的时间。
- SUM
SUM() 函数用于计算窗口中指定列的总和。例如,假设我们有一个表格 sales,其中包含每个销售员的销售额和日期,我们可以使用 SUM() 函数计算每个销售员的累计销售额:
SELECT salesman, sale_date, sales, SUM(sales) OVER (PARTITION BY salesman ORDER BY sale_date) AS cumulative_sales FROM sales;
这将按销售员和日期对销售进行分区,并为每个销售员计算累计销售额。
- AVG
AVG() 函数用于计算窗口中指定列的平均值。例如,假设我们有一个表格 employees,其中包含每个部门的员工和薪资,我们可以使用 AVG() 函数计算每个部门的平均工资:
SELECT department, name, salary, AVG(salary) OVER (PARTITION BY department) AS avg_salary FROM employees;
这将按部门对员工进行分区,并为每个部门计算平均工资。
- MAX
MAX() 函数用于计算窗口中指定列的最大值。例如,假设我们有一个表格 products,其中包含每个产品的价格和制造商,我们可以使用 MAX() 函数计算每个制造商的最高价格产品:
SELECT manufacturer, product, price, MAX(price) OVER (PARTITION BY manufacturer) AS max_price FROM products;
这将按制造商对产品进行分区,并为每个制造商计算最高价格。
- MIN
MIN() 函数用于计算窗口中指定列的最小值。例如,假设我们有一个表格 orders,其中包含每个客户的订单和订单日期,我们可以使用 MIN() 函数计算每个客户的最早订单日期:
SELECT customer, order_date, MIN(order_date) OVER (PARTITION BY customer) AS first_order_date FROM orders;
这将按客户对订单进行分区,并为每个客户计算最早订单日期。
- COUNT
COUNT() 函数用于计算窗口中指定列的行数。例如,假设我们有一个表格 logs,其中包含每个用户的登录时间和日期,我们可以使用 COUNT() 函数计算每个用户在过去一小时内的登录次数:
SELECT user, login_time, COUNT(*) OVER (PARTITION BY user ORDER BY login_time RANGE BETWEEN INTERVAL 1 HOUR PRECEDING AND CURRENT ROW) AS login_count_last_hour FROM logs;
这将按用户和登录时间对日志进行分区,并为每个用户计算过去一小时内的登录次数。注意,在此示例中,我们使用 RANGE 子句指定窗口的范围。这将计算从当前行开始向前一个小时内的所有行的计数。
综上所述,MySQL 窗口函数可以进行一些比较复杂的数据分析和处理,常见的窗口函数包括 ROW_NUMBER、RANK、DENSE_RANK、LEAD、LAG、FIRST_VALUE、LAST_VALUE 和聚合函数等。使用 MySQL 窗口函数需要用到 OVER 子句来定义窗口的边界,包括窗口大小、排序规则、分区等。
相关推荐
- MariaDB开窗函数(开窗函数max)
-
在使用GROUPBY子句时,总是需要将筛选的所有数据进行分组操作,它的分组作用域是整张表。分组以后,为每个组只返回一行。而使用基于窗口的操作,类似于分组,但却可以对这些"组"(即窗口...
- 你还不知道什么是MySQL窗口函数?(mysql5.7窗口函数)
-
MySQL中的窗口函数是一类用来在某一部分查询结果上进行计算的函数,这些函数的用法与普通的聚合函数如SUM、AVG、COUNT类似,但是与聚合函数不同的是,窗口函数不会讲多行数据合并成一行结果,而是...
- 精通88道题包你面试通过BAT-精简版-不得不收藏!
-
J2SE基础1.九种基本数据类型的大小,以及他们的封装类。2.Switch能否用string做参数?3.equals与==的区别。4.Object有哪些公用方法?5.Java的四种引用,强弱...
- Transact-SQL学习笔记21——排名窗口函数
-
将OVER()子句和排名函数连用,就是排名窗口函数,它们只能用在SELECT子句或ORDERBY子句之后。如果放在SELECT之后,它运行的逻顺序在DISTINCT之前。逻辑处理顺序如下:SE...
- MySQL8 窗口函数是真的省事!(mysql中的窗口函数)
-
@[toc]MySQL9已经出来了,MySQL8相信也慢慢走进各位小伙伴的工作中了。MySQL8还是有很多重量级变化的,一些底层优化大家在使用中有时候不易察觉,但是有一些用法,还是带给我们耳目一...
- Lodash 这 20 个方法,既高级又超级实用!
-
一、安全操作篇1._.get:防御性取值2._.set:智能路径赋值3._.invoke:安全方法调用二、集合处理篇4._.keyBy:快速对象映射5._.orderBy:多条件排序6._...
- Oracle有哪些常见的函数?(oracle常用函数有哪些)
-
恢复删除的数据insertinto'表名'select*from'表名'asofTIMESTAMPTO_TIMESTAMP("当前时间...
- excel的高级用法——宏,原来如此实用
-
使用excel时,直接手动计算或者输入公式,你会感到很苦恼或者操作很繁琐,如果使用vba直接输出结果,虽然效率很高,但是不够直观。excel宏最方便的用法是作为公式里的函数使用,打开宏编辑器,编写一个...
- 7 RDD常用算子(2)(rd算法)
-
filter()deffilter(f:T=>Boolean):RDD[T]函数说明将数据根据指定的规则进行筛选过滤,符合规则的数据保留,不符合规则的数据丢弃。当数据进行筛选过滤后,分...
- 从零开始学SQL进阶,数据分析师必备SQL取数技巧,建议收藏
-
上一节给大家讲到SQL取数的一些基本内容,包含SQL简单查询与高级查询,需要复习相关知识的同学可以跳转至上一节,本节给大家讲解SQL的进阶应用,在实际过程中用途比较多的子查询与窗口函数,下面一起学习。...
- SQL窗口函数知多少?(sql窗口怎么执行)
-
我们在日常工作中是否经常会遇到需要排名的情况,比如:每个部门按业绩来排名,每人按绩效排名,对部门销售业绩前N名的进行奖励等。面对这类需求,我们就需要使用sql的高级功能——窗口函数。一、什么是窗口函数...
- SQL开窗函数讲解,让查询统计更简单
-
用了这么多关系型数据库产品,开源的商业的,如:Oracle、MySql(注意5.7以上版本才可以使用)、SqlServer、postgreSQL。如果从应用角度来看,谁都逃离不了增删改查;而查又是难点...
- mysql窗口函数(mysql窗口函数rank)
-
MySQL窗口函数是一种高级的SQL函数,它可以进行一些比较复杂的数据分析和处理。与传统的聚合函数不同,窗口函数不会合并行,而是根据特定的条件为每行分配一个值。MySQL窗口函数可以用来计算每...
- 一文讲懂SQL窗口函数 大厂必考知识点
-
大家好,我是宁一。今天是我们的第24课:窗口函数。窗口函数,也叫OLAP(OnlineAnallyticalProcessing,联机分析处理),可以对数据库数据进行实时分析处理。窗口函数是数据分...
- C++20 四大特性之一:Module 特性详解
-
C++20最大的特性是什么?最大的特性是迄今为止没有哪一款编译器完全实现了所有特性。文章来源:网易云信有人认为C++20是C++11以来最大的一次改动,甚至比C++11还要大。本文仅介绍...
- 一周热门
- 最近发表
- 标签列表
-
- ps图案在哪里 (33)
- super().__init__ (33)
- python 获取日期 (34)
- 0xa (36)
- super().__init__()详解 (33)
- python安装包在哪里找 (33)
- linux查看python版本信息 (35)
- python怎么改成中文 (35)
- php文件怎么在浏览器运行 (33)
- eval在python中的意思 (33)
- python安装opencv库 (35)
- python div (34)
- sticky css (33)
- python中random.randint()函数 (34)
- python去掉字符串中的指定字符 (33)
- python入门经典100题 (34)
- anaconda安装路径 (34)
- yield和return的区别 (33)
- 1到10的阶乘之和是多少 (35)
- python安装sklearn库 (33)
- dom和bom区别 (33)
- js 替换指定位置的字符 (33)
- python判断元素是否存在 (33)
- sorted key (33)
- shutil.copy() (33)