SQL查询中笛卡尔积的巧妙使用
wptr33 2024-12-03 18:47 23 浏览
本文通过两个小例子学习一下笛卡尔积的巧妙使用。后台回复“笛卡尔积”可以获取本文pdf版本,便于阅读保存。
笛卡尔积,又叫cross join,是SQL中两表连接的一种方式。
假如A表中的数据为m行,B表中的数据有n行,那么A和B做笛卡尔积,结果为m*n行。
笛卡尔积的写法为:
select *
from A,B
或者
select *
from A
cross join B
通常我们都要在实际SQL中避免直接使用笛卡尔积,因为它会使“数据爆炸”,尤其是数据量很大的时候。但某些时候,巧妙的使用笛卡尔积,反而能快速帮助我们解决实际问题。下面看几个例子。
with as的用法
在此之前,我们先看一下with as 的用法。
with tmp as
(
select * from class
)
select * from tmp
上面的写法先执行select * from class定义(生成)了一个中间表tmp,然后使用了tmp这个中间表。通常可以用来将固定的查询抽取出来,只查一次,多次使用,从而提高效率。也可以和union all结合起来构造数据供测试使用,在本文接下来的部分会看到后面场景的这种用法。关于with as的一些要点和注意事项可以参考下面的链接:
https://blog.csdn.net/baidu_30527569/article/details/48680745
例子1-产生顺序值:查询当日每小时的收入数据,未产生收入的置为0
假设有一张收入表,每过一个小时,就自动更新上一小时的收入数据。但我们希望对于未更新的时间收入值显示为0。这样能更好的体现完整性,也便于进行多天数据的对比。如下图所示:
对于收入非0的小时,我们可以从收入表中直接查询出当小时的收入数据。收入表结构如下(假设当前收入数据只更新到16点):
查询的SQL为:
select dt, hour, income
from t_h_income
where day = '2020-04-19'
显然,得到的结果不会包含17点及以后的时间。我们可以采用笛卡尔积构造一个小时序列,如下面代码所示:
with t_hour as (
select '00' as dhour
union all
select '01' as dhour
union all
select '02' as dhour
union all
select '03' as dhour
union all
select '04' as dhour
union all
select '05' as dhour
union all
select '06' as dhour
union all
select '07' as dhour
union all
select '08' as dhour
union all
select '09' as dhour
union all
select '10' as dhour
union all
select '11' as dhour
union all
select '12' as dhour
union all
select '13' as dhour
union all
select '14' as dhour
union all
select '15' as dhour
union all
select '16' as dhour
union all
select '17' as dhour
union all
select '18' as dhour
union all
select '19' as dhour
union all
select '20' as dhour
union all
select '21' as dhour
union all
select '22' as dhour
union all
select '23' as dhour
),t_day as
(
select '2020-04-19' as dt
)
select *
from t_day, t_hour
得到的结果如下,生成了这一天每个小时的结构。
将上面的结果与原来的数据左关联,关联不上的置为0,即可得到想要的结果。代码如下:
with t_hour as (
select '00' as dhour
union all
select '01' as dhour
union all
select '02' as dhour
union all
select '03' as dhour
union all
select '04' as dhour
union all
select '05' as dhour
union all
select '06' as dhour
union all
select '07' as dhour
union all
select '08' as dhour
union all
select '09' as dhour
union all
select '10' as dhour
union all
select '11' as dhour
union all
select '12' as dhour
union all
select '13' as dhour
union all
select '14' as dhour
union all
select '15' as dhour
union all
select '16' as dhour
union all
select '17' as dhour
union all
select '18' as dhour
union all
select '19' as dhour
union all
select '20' as dhour
union all
select '21' as dhour
union all
select '22' as dhour
union all
select '23' as dhour
),t_day as
(
select '2020-04-19' as dt
)
select *
from t_day, t_hour
select a.dt, a.dhour, case when b.income is null then 0 else b.income end as income
from
(
select dt, dhour
from t_day, t_hour
) a
left join
t_h_income b
on a.dt = b.dt and a.dhour = b.hour
通过手动构造dt和dhour,用笛卡尔积产生了一个“序列”。而对于dhour的构造,也可以采用笛卡尔积的方式,但需要注意限制范围不大于23,代码如下:
with t_hour as
(
select '0' as id
union all
select '1' as id
union all
select '2' as id
),
f_hour as (
select '0' as id
union all
select '1' as id
union all
select '2' as id
union all
select '3' as id
union all
select '4' as id
union all
select '5' as id
union all
select '6' as id
union all
select '7' as id
union all
select '8' as id
union all
select '9' as id
)
select concat(a.id, b.id) hour
from t_hour a, f_hour b
where concat(a.id, b.id) <= '23'
order by hour
以上我们都主要使用了笛卡尔积产生顺序值的场景,类似的可以构造从00~99的数字,构造之后也可以根据实际需要加入新的限制条件。
例子2-模拟循环:遍历字符串,每行按顺序输出一个字符
注:例子来源于《SQL Cookbook》第6章,经过自己的修改。
问题:考虑用SQL实现:将表emp中name为KING的字符串显示为4行,每行包含其中一个字符。
这里需要笛卡尔积配合字符串截取函数来实现。要实现逐一访问字符串,需要有一个中间表,存储序列值,类似于前面提到的序列。我们看下下面的代码:
with t5 as
(
select 1 as pos
union all
select 2 as pos
union all
select 3 as pos
union all
select 4 as pos
union all
select 5 as pos
),
emp as
(
select 'KING' as name
)
select *
from emp, t5
得到的结果如下图所示:
考虑到字符串截取函数能够按位置截取。正好可以用上生成的pos。代码如下:
with t5 as
(
select 1 as pos
union all
select 2 as pos
union all
select 3 as pos
union all
select 4 as pos
union all
select 5 as pos
),
emp as
(
select 'KING' as name
)
select substr(name, pos, 1)
from emp, t5
where t5.pos <= length(emp.name)
可以看到使用了pos,就能够“循环”地截取字符串了。需要注意where里加上了循环跳出的条件,这也比较好理解:不能截取超过字符串长度的字符。
还可以按照需要调整遍历时输出的格式,如下面代码和结果所示:
select
substr(name, pos) char_name1,
substr(name, length(name)-pos+1) char_name1
from emp, t5
where t5.pos <= length(emp.name)
这个例子中我们利用笛卡尔积模拟循环,对字符串进行了遍历。
小结
本文首先学习了with as的用法,然后通过例子总结了两个巧妙使用笛卡尔积的场景:生成序列和模拟循环。虽然在实际中可能用的不是很多,但也体现出了SQL的灵活性。生成序列可以更广义的理解为:需要产生两个表中字段的任意组合,这两个字段可能是没有实际联系的。可以参考下面链接中关于每个班级血型的例子,核心思想也是这个。
https://blog.csdn.net/xiaolinyouni/article/details/6943337
实际中应该有很多类似的场景。
而模拟循环是笛卡尔积结合了字符串截取函数实现的,本质上还是“组合”。下次再遇到类似场景的时候,可以考虑下笛卡尔积能否实现。
除此以外《SQL Cookbook》中也提到了笛卡尔积可以用于结果转置~有机会我们以后再来学习。本文代码不是很复杂,后台回复“笛卡尔积”可以获取本文pdf版本,便于阅读保存。
相关推荐
- MySQL进阶五之自动读写分离mysql-proxy
-
自动读写分离目前,大量现网用户的业务场景中存在读多写少、业务负载无法预测等情况,在有大量读请求的应用场景下,单个实例可能无法承受读取压力,甚至会对业务产生影响。为了实现读取能力的弹性扩展,分担数据库压...
- 3分钟短文 | Laravel SQL筛选两个日期之间的记录,怎么写?
-
引言今天说一个细分的需求,在模型中,或者使用laravel提供的EloquentORM功能,构造查询语句时,返回位于两个指定的日期之间的条目。应该怎么写?本文通过几个例子,为大家梳理一下。学习时...
- 一文由浅入深带你完全掌握MySQL的锁机制原理与应用
-
本文将跟大家聊聊InnoDB的锁。本文比较长,包括一条SQL是如何加锁的,一些加锁规则、如何分析和解决死锁问题等内容,建议耐心读完,肯定对大家有帮助的。为什么需要加锁呢?...
- 验证Mysql中联合索引的最左匹配原则
-
后端面试中一定是必问mysql的,在以往的面试中好几个面试官都反馈我Mysql基础不行,今天来着重复习一下自己的弱点知识。在Mysql调优中索引优化又是非常重要的方法,不管公司的大小只要后端项目中用到...
- MySQL索引解析(联合索引/最左前缀/覆盖索引/索引下推)
-
目录1.索引基础...
- 你会看 MySQL 的执行计划(EXPLAIN)吗?
-
SQL执行太慢怎么办?我们通常会使用EXPLAIN命令来查看SQL的执行计划,然后根据执行计划找出问题所在并进行优化。用法简介...
- MySQL 从入门到精通(四)之索引结构
-
索引概述索引(index),是帮助MySQL高效获取数据的数据结构(有序),在数据之外,数据库系统还维护者满足特定查询算法的数据结构,这些数据结构以某种方式引用(指向)数据,这样就可以在这些数据结构...
- mysql总结——面试中最常问到的知识点
-
mysql作为开源数据库中的榜一大哥,一直是面试官们考察的重中之重。今天,我们来总结一下mysql的知识点,供大家复习参照,看完这些知识点,再加上一些边角细节,基本上能够应付大多mysql相关面试了(...
- mysql总结——面试中最常问到的知识点(2)
-
首先我们回顾一下上篇内容,主要复习了索引,事务,锁,以及SQL优化的工具。本篇文章接着写后面的内容。性能优化索引优化,SQL中索引的相关优化主要有以下几个方面:最好是全匹配。如果是联合索引的话,遵循最...
- MySQL基础全知全解!超详细无废话!轻松上手~
-
本期内容提醒:全篇2300+字,篇幅较长,可搭配饭菜一同“食”用,全篇无废话(除了这句),干货满满,可收藏供后期反复观看。注:MySQL中语法不区分大小写,本篇中...
- 深入剖析 MySQL 中的锁机制原理_mysql 锁详解
-
在互联网软件开发领域,MySQL作为一款广泛应用的关系型数据库管理系统,其锁机制在保障数据一致性和实现并发控制方面扮演着举足轻重的角色。对于互联网软件开发人员而言,深入理解MySQL的锁机制原理...
- Java 与 MySQL 性能优化:MySQL分区表设计与性能优化全解析
-
引言在数据库管理领域,随着数据量的不断增长,如何高效地管理和操作数据成为了一个关键问题。MySQL分区表作为一种有效的数据管理技术,能够将大型表划分为多个更小、更易管理的分区,从而提升数据库的性能和可...
- MySQL基础篇:DQL数据查询操作_mysql 查
-
一、基础查询DQL基础查询语法SELECT字段列表FROM表名列表WHERE条件列表GROUPBY分组字段列表HAVING分组后条件列表ORDERBY排序字段列表LIMIT...
- MySql:索引的基本使用_mysql索引的使用和原理
-
一、索引基础概念1.什么是索引?索引是数据库表的特殊数据结构(通常是B+树),用于...
- 一周热门
-
-
C# 13 和 .NET 9 全知道 :13 使用 ASP.NET Core 构建网站 (1)
-
程序员的开源月刊《HelloGitHub》第 71 期
-
详细介绍一下Redis的Watch机制,可以利用Watch机制来做什么?
-
假如有100W个用户抢一张票,除了负载均衡办法,怎么支持高并发?
-
Java面试必考问题:什么是乐观锁与悲观锁
-
如何将AI助手接入微信(打开ai手机助手)
-
redission YYDS spring boot redission 使用
-
SparkSQL——DataFrame的创建与使用
-
一文带你了解Redis与Memcached? redis与memcached的区别
-
如何利用Redis进行事务处理呢? 如何利用redis进行事务处理呢英文
-
- 最近发表
- 标签列表
-
- git pull (33)
- git fetch (35)
- mysql insert (35)
- mysql distinct (37)
- concat_ws (36)
- java continue (36)
- jenkins官网 (37)
- mysql 子查询 (37)
- python元组 (33)
- mybatis 分页 (35)
- vba split (37)
- redis watch (34)
- python list sort (37)
- nvarchar2 (34)
- mysql not null (36)
- hmset (35)
- python telnet (35)
- python readlines() 方法 (36)
- munmap (35)
- docker network create (35)
- redis 集合 (37)
- python sftp (37)
- setpriority (34)
- c语言 switch (34)
- git commit (34)