百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT技术 > 正文

SQL查询中笛卡尔积的巧妙使用

wptr33 2024-12-03 18:47 12 浏览

本文通过两个小例子学习一下笛卡尔积的巧妙使用。后台回复“笛卡尔积”可以获取本文pdf版本,便于阅读保存。

笛卡尔积,又叫cross join,是SQL中两表连接的一种方式。

假如A表中的数据为m行,B表中的数据有n行,那么A和B做笛卡尔积,结果为m*n行。

笛卡尔积的写法为:

select *
from A,B

或者

select * 
from A 
cross join B

通常我们都要在实际SQL中避免直接使用笛卡尔积,因为它会使“数据爆炸”,尤其是数据量很大的时候。但某些时候,巧妙的使用笛卡尔积,反而能快速帮助我们解决实际问题。下面看几个例子。

with as的用法

在此之前,我们先看一下with as 的用法。

with tmp as
(
    select * from class
)

select * from tmp

上面的写法先执行select * from class定义(生成)了一个中间表tmp,然后使用了tmp这个中间表。通常可以用来将固定的查询抽取出来,只查一次,多次使用,从而提高效率。也可以和union all结合起来构造数据供测试使用,在本文接下来的部分会看到后面场景的这种用法。关于with as的一些要点和注意事项可以参考下面的链接:

https://blog.csdn.net/baidu_30527569/article/details/48680745

例子1-产生顺序值:查询当日每小时的收入数据,未产生收入的置为0

假设有一张收入表,每过一个小时,就自动更新上一小时的收入数据。但我们希望对于未更新的时间收入值显示为0。这样能更好的体现完整性,也便于进行多天数据的对比。如下图所示:

对于收入非0的小时,我们可以从收入表中直接查询出当小时的收入数据。收入表结构如下(假设当前收入数据只更新到16点):

查询的SQL为:

select dt, hour, income
from t_h_income
where day = '2020-04-19'

显然,得到的结果不会包含17点及以后的时间。我们可以采用笛卡尔积构造一个小时序列,如下面代码所示:

with t_hour as (
select '00' as dhour
union all 
select '01' as dhour
union all 
select '02' as dhour
union all 
select '03' as dhour
union all 
select '04' as dhour
union all 
select '05' as dhour
union all 
select '06' as dhour
union all 
select '07' as dhour
union all 
select '08' as dhour
union all 
select '09' as dhour
union all 
select '10' as dhour
union all 
select '11' as dhour
union all 
select '12' as dhour
union all 
select '13' as dhour
union all 
select '14' as dhour
union all 
select '15' as dhour
union all 
select '16' as dhour
union all 
select '17' as dhour
union all 
select '18' as dhour
union all 
select '19' as dhour
union all 
select '20' as dhour
union all 
select '21' as dhour
union all 
select '22' as dhour
union all 
select '23' as dhour
),t_day as 
(
select '2020-04-19' as dt
)
select * 
from t_day, t_hour

得到的结果如下,生成了这一天每个小时的结构。

将上面的结果与原来的数据左关联,关联不上的置为0,即可得到想要的结果。代码如下:

with t_hour as (
select '00' as dhour
union all 
select '01' as dhour
union all 
select '02' as dhour
union all 
select '03' as dhour
union all 
select '04' as dhour
union all 
select '05' as dhour
union all 
select '06' as dhour
union all 
select '07' as dhour
union all 
select '08' as dhour
union all 
select '09' as dhour
union all 
select '10' as dhour
union all 
select '11' as dhour
union all 
select '12' as dhour
union all 
select '13' as dhour
union all 
select '14' as dhour
union all 
select '15' as dhour
union all 
select '16' as dhour
union all 
select '17' as dhour
union all 
select '18' as dhour
union all 
select '19' as dhour
union all 
select '20' as dhour
union all 
select '21' as dhour
union all 
select '22' as dhour
union all 
select '23' as dhour
),t_day as 
(
select '2020-04-19' as dt
)

select * 
from t_day, t_hour

select a.dt, a.dhour, case when b.income is null then 0 else b.income end as income
from
(
select dt, dhour
from t_day, t_hour
) a 
left join 
t_h_income b
on a.dt = b.dt and a.dhour = b.hour

通过手动构造dt和dhour,用笛卡尔积产生了一个“序列”。而对于dhour的构造,也可以采用笛卡尔积的方式,但需要注意限制范围不大于23,代码如下:

with t_hour as 
(
select '0' as id
union all 
select '1' as id
union all 
select '2' as id 
),
f_hour as (
select '0' as id
union all 
select '1' as id
union all 
select '2' as id
union all 
select '3' as id
union all 
select '4' as id
union all 
select '5' as id
union all 
select '6' as id
union all 
select '7' as id
union all 
select '8' as id
union all 
select '9' as id
)

select concat(a.id, b.id) hour
from t_hour a, f_hour b
where concat(a.id, b.id) <= '23'
order by hour

以上我们都主要使用了笛卡尔积产生顺序值的场景,类似的可以构造从00~99的数字,构造之后也可以根据实际需要加入新的限制条件。

例子2-模拟循环:遍历字符串,每行按顺序输出一个字符

注:例子来源于《SQL Cookbook》第6章,经过自己的修改。

问题:考虑用SQL实现:将表emp中name为KING的字符串显示为4行,每行包含其中一个字符。

这里需要笛卡尔积配合字符串截取函数来实现。要实现逐一访问字符串,需要有一个中间表,存储序列值,类似于前面提到的序列。我们看下下面的代码:

with t5 as 
(
select 1 as pos
union all 
select 2 as pos 
union all
select 3 as pos 
union all
select 4 as pos 
union all
select 5 as pos 
),
emp as 
(
select 'KING' as name
)

select *
from emp, t5

得到的结果如下图所示:

考虑到字符串截取函数能够按位置截取。正好可以用上生成的pos。代码如下:

with t5 as 
(
select 1 as pos
union all 
select 2 as pos 
union all
select 3 as pos 
union all
select 4 as pos 
union all
select 5 as pos 
),
emp as 
(
select 'KING' as name
)

select substr(name, pos, 1)
from emp, t5
where t5.pos <= length(emp.name)

可以看到使用了pos,就能够“循环”地截取字符串了。需要注意where里加上了循环跳出的条件,这也比较好理解:不能截取超过字符串长度的字符。

还可以按照需要调整遍历时输出的格式,如下面代码和结果所示:

select 
substr(name, pos) char_name1,
substr(name, length(name)-pos+1) char_name1
from emp, t5
where t5.pos <= length(emp.name)

这个例子中我们利用笛卡尔积模拟循环,对字符串进行了遍历。

小结

本文首先学习了with as的用法,然后通过例子总结了两个巧妙使用笛卡尔积的场景:生成序列和模拟循环。虽然在实际中可能用的不是很多,但也体现出了SQL的灵活性。生成序列可以更广义的理解为:需要产生两个表中字段的任意组合,这两个字段可能是没有实际联系的。可以参考下面链接中关于每个班级血型的例子,核心思想也是这个。

https://blog.csdn.net/xiaolinyouni/article/details/6943337

实际中应该有很多类似的场景。

而模拟循环是笛卡尔积结合了字符串截取函数实现的,本质上还是“组合”。下次再遇到类似场景的时候,可以考虑下笛卡尔积能否实现。

除此以外《SQL Cookbook》中也提到了笛卡尔积可以用于结果转置~有机会我们以后再来学习。本文代码不是很复杂,后台回复“笛卡尔积”可以获取本文pdf版本,便于阅读保存。

相关推荐

删库不跑路!我含泪写下了 MySQL 数据恢复大法…

1前言数据恢复的前提的做好备份,且开启...

mysqldump备份操作大全及相关参数详解

mysqldump简介mysqldump是用于转储MySQL数据库的实用程序,通常我们用来迁移和备份数据库;它自带的功能参数非常多,文中列举出几乎所有常用的导出操作方法,在文章末尾将所有的参数详细说明...

MySQL表中没有主键,怎么找到重复的数据

在没有主键的MySQL表中查找重复数据可能会有点复杂,但通过使用下述方法中的任何一种,你都应该能够识别并处理这些重复项。在MySQL中,没有主键的表可能会存在重复的数据行。为了找到这些重复的数据,你可...

MySql 大数据 批量删除 Hint 操作

业务中有会碰到数据库中大量冗余数据的情况。比如压测场景,这个时候就需要我们去清理这些数据。怎么操作呢?这个时候mysql的hint就可以派上用场了,直接上语句:DELETE/*+QU...

Linux卸载MySQL教程(linux 卸载数据库)

在Linux系统中,卸载MySQL需要执行以下步骤:停止MySQL服务在卸载MySQL之前,需要先停止MySQL服务,可以使用以下命令停止MySQL服务:sudosystemctlstopmys...

用SQL语句删除数据库重复数据,只保留一条有效数据

原文链接http://t.zoukankan.com/c-Ajing-p-13448349.html在实际开发中,可能会遇到数据库多条数据重复了,此时我们需要删除重复数据,只保留一条有效数据,用SQ...

Mybatis 如何批量删除数据(mybatis删除多条数据)

Mybatis如何批量删除数据本期以最常用的根据id批量删除数据为例:接口设计1:List类型单参数IntegerdeleteByIds(List<Integer>ids);...

MySQL常用命令汇总(mysql数据库常用命令总结)

以下是一份MySQL常用命令汇总,涵盖数据库、表、数据操作及管理功能,方便快速查阅:一、数据库操作1.连接数据库```bash...

「删库跑路」使用Binlog日志恢复误删的MySQL数据

前言“删库跑路”是程序员经常谈起的话题,今天,我就要教大家如何删!库!跑!路!开个玩笑,今天文章的主题是如何使用Mysql内置的Binlog日志对误删的数据进行恢复,读完本文,你能够了解到:MySQL...

MySQL查询是否安装&amp;删除(判断mysql是否安装)

1、查找以前是否装有mysql命令:rpm-qa|grep-imysql可以看到如下图的所示:...

windows版MySQL软件的安装与卸载(windows卸载mysql5.7)

一、卸载1、软件的卸载方式一:通过控制面板方式二:通过电脑管家等软件卸载方式三:通过安装包中提供的卸载功能卸载...

使用 SQL 语句将 Excel VBA 中的表格修改为 MySQL 数据库

在ExcelVBA中与MySQL数据库进行交互时,通常需要使用ADODB连接来执行SQL语句。以下是一个完整的示例,展示了如何将Excel表格中的数据插入到MySQL数据库的...

MySql数据库Innodb引擎删除一行数据会在内存上留下空洞吗

当使用InnoDB引擎删除一行数据时,实际上并不会在内存上留下空洞。InnoDB存储引擎采用了多版本并发控制(MVCC)机制来实现事务的隔离性,每行记录都会保存两个隐藏列,一个保存行的创建版本,另一个...

MySQL批量生成建表语句(mysql 批量新增)

摘要:MySQL批量生成建表语句关键词:MySQL、大批量、挑选、建表语句整体说明在使用MySQL的时候,遇到需要在大批量的表中,挑选一部分表,权限又只有只读权限,工具又没有合适的,最终使用了My...

MySQL数据库之死锁与解决方案(mysql解决死锁的三种方法)

一、表的死锁产生原因:...