MySQL:left join 避坑指南
wptr33 2024-11-21 22:04 39 浏览
现象
left join在我们使用mysql查询的过程中可谓非常常见,比如博客里一篇文章有多少条评论、商城里一个货物有多少评论、一条评论有多少个赞等等。但是由于对join、on、where等关键字的不熟悉,有时候会导致查询结果与预期不符,所以今天我就来总结一下,一起避坑。
这里我先给出一个场景,并抛出两个问题,如果你都能答对那这篇文章就不用看了。
假设有一个班级管理应用,有一个表classes,存了所有的班级;有一个表students,存了所有的学生,具体数据如下(感谢廖雪峰的在线SQL):
SELECT * FROM classes;
SELECT * FROM students;
那么现在有两个需求:
找出每个班级的名称及其对应的女同学数量
找出一班的同学总数
对于需求1,大多数人不假思索就能想出如下两种sql写法,请问哪种是对的?
SELECT c.name, count(s.name) as num FROM classes c left join students s on s.class_id = c.id and s.gender = 'F' group by c.name
或者
SELECT c.name, count(s.name) as num FROM classes c left join students s on s.class_id = c.id where s.gender = 'F' group by c.name
对于需求2,大多数人也可以不假思索的想出如下两种sql写法,请问哪种是对的?
SELECT c.name, count(s.name) as num FROM classes c left join students s on s.class_id = c.id where c.name = '一班' group by c.name
或者
SELECT c.name, count(s.name) as num FROM classes c left join students s on s.class_id = c.id and c.name = '一班' group by c.name
请不要继续往下翻 !!先给出你自己的答案,正确答案就在下面。
~
~
~
~
~
~
~
~
~
~
~
~
~
~
~
~
答案是两个需求都是第一条语句是正确的,要搞清楚这个问题,就得明白mysql对于left join的执行原理,下节进行展开。
根源
mysql 对于left join的采用类似嵌套循环的方式来进行从处理,以下面的语句为例:
SELECT * FROM LT LEFT JOIN RT ON P1(LT,RT)) WHERE P2(LT,RT)
其中P1是on过滤条件,缺失则认为是TRUE,P2是where过滤条件,缺失也认为是TRUE,该语句的执行逻辑可以描述为:
FOR each row lt in LT {// 遍历左表的每一行
 BOOL b = FALSE;
 FOR each row rt in RT such that P1(lt, rt) {// 遍历右表每一行,找到满足join条件的行
 IF P2(lt, rt) {//满足 where 过滤条件
 t:=lt||rt;//合并行,输出该行
 }
 b=TRUE;// lt在RT中有对应的行
 }
 IF (!b) { // 遍历完RT,发现lt在RT中没有有对应的行,则尝试用null补一行
 IF P2(lt,NULL) {// 补上null后满足 where 过滤条件
 t:=lt||NULL; // 输出lt和null补上的行
 } 
 }
}
当然,实际情况中MySQL会使用buffer的方式进行优化,减少行比较次数,不过这不影响关键的执行流程,不在本文讨论范围之内。
从这个伪代码中,我们可以看出两点:
如果想对右表进行限制,则一定要在on条件中进行,若在where中进行则可能导致数据缺失,导致左表在右表中无匹配行的行在最终结果中不出现,违背了我们对left join的理解。因为对左表无右表匹配行的行而言,遍历右表后b=FALSE,所以会尝试用NULL补齐右表,但是此时我们的P2对右表行进行了限制,NULL若不满足P2(NULL一般都不会满足限制条件,除非IS NULL这种),则不会加入最终的结果中,导致结果缺失。
如果没有where条件,无论on条件对左表进行怎样的限制,左表的每一行都至少会有一行的合成结果,对左表行而言,若右表若没有对应的行,则右表遍历结束后b=FALSE,会用一行NULL来生成数据,而这个数据是多余的。所以对左表进行过滤必须用where。
下面展开两个需求的错误语句的执行结果和错误原因:
需求1
需求2
需求1由于在where条件中对右表限制,导致数据缺失(四班应该有个为0的结果)
需求2由于在on条件中对左表限制,导致数据多余(其他班的结果也出来了,还是错的)
总结
通过上面的问题现象和分析,可以得出了结论:在left join语句中,左表过滤必须放where条件中,右表过滤必须放on条件中,这样结果才能不多不少,刚刚好。
SQL 看似简单,其实也有很多细节原理在里面,一个小小的混淆就会造成结果与预期不符,所以平时要注意这些细节原理,避免关键时候出错。
相关推荐
- oracle数据导入导出_oracle数据导入导出工具
- 
                        关于oracle的数据导入导出,这个功能的使用场景,一般是换服务环境,把原先的oracle数据导入到另外一台oracle数据库,或者导出备份使用。只不过oracle的导入导出命令不好记忆,稍稍有点复杂... 
- 继续学习Python中的while true/break语句
- 
                        上次讲到if语句的用法,大家在微信公众号问了小编很多问题,那么小编在这几种解决一下,1.else和elif是子模块,不能单独使用2.一个if语句中可以包括很多个elif语句,但结尾只能有一个... 
- python continue和break的区别_python中break语句和continue语句的区别
- 
                        python中循环语句经常会使用continue和break,那么这2者的区别是?continue是跳出本次循环,进行下一次循环;break是跳出整个循环;例如:... 
- 简单学Python——关键字6——break和continue
- 
                        Python退出循环,有break语句和continue语句两种实现方式。break语句和continue语句的区别:break语句作用是终止循环。continue语句作用是跳出本轮循环,继续下一次循... 
- 2-1,0基础学Python之 break退出循环、 continue继续循环 多重循
- 
                        用for循环或者while循环时,如果要在循环体内直接退出循环,可以使用break语句。比如计算1至100的整数和,我们用while来实现:sum=0x=1whileTrue... 
- Python 中 break 和 continue 傻傻分不清
- 
                        大家好啊,我是大田。... 
- python中的流程控制语句:continue、break 和 return使用方法
- 
                        Python中,continue、break和return是控制流程的关键语句,用于在循环或函数中提前退出或跳过某些操作。它们的用途和区别如下:1.continue(跳过当前循环的剩余部分,进... 
- L017:continue和break - 教程文案
- 
                        continue和break在Python中,continue和break是用于控制循环(如for和while)执行流程的关键字,它们的作用如下:1.continue:跳过当前迭代,... 
- 作为前端开发者,你都经历过怎样的面试?
- 
                        已经裸辞1个月了,最近开始投简历找工作,遇到各种各样的面试,今天分享一下。其实在职的时候也做过面试官,面试官时,感觉自己问的问题很难区分候选人的能力,最好的办法就是看看候选人的github上的代码仓库... 
- 面试被问 const 是否不可变?这样回答才显功底
- 
                        作为前端开发者,我在学习ES6特性时,总被const的"善变"搞得一头雾水——为什么用const声明的数组还能push元素?为什么基本类型赋值就会报错?直到翻遍MDN文档、对着内存图反... 
- 2023金九银十必看前端面试题!2w字精品!
- 
                        导文2023金九银十必看前端面试题!金九银十黄金期来了想要跳槽的小伙伴快来看啊CSS1.请解释CSS的盒模型是什么,并描述其组成部分。... 
- 前端面试总结_前端面试题整理
- 
                        记得当时大二的时候,看到实验室的学长学姐忙于各种春招,有些收获了大厂offer,有些还在苦苦面试,其实那时候的心里还蛮忐忑的,不知道自己大三的时候会是什么样的一个水平,所以从19年的寒假放完,大二下学... 
- 由浅入深,66条JavaScript面试知识点(七)
- 
                        作者:JakeZhang转发链接:https://juejin.im/post/5ef8377f6fb9a07e693a6061目录... 
- 2024前端面试真题之—VUE篇_前端面试题vue2020及答案
- 
                        添加图片注释,不超过140字(可选)... 
- 今年最常见的前端面试题,你会做几道?
- 
                        在面试或招聘前端开发人员时,期望、现实和需求之间总是存在着巨大差距。面试其实是一个交流想法的地方,挑战人们的思考方式,并客观地分析给定的问题。可以通过面试了解人们如何做出决策,了解一个人对技术和解决问... 
- 一周热门
- 最近发表
- 
- oracle数据导入导出_oracle数据导入导出工具
- 继续学习Python中的while true/break语句
- python continue和break的区别_python中break语句和continue语句的区别
- 简单学Python——关键字6——break和continue
- 2-1,0基础学Python之 break退出循环、 continue继续循环 多重循
- Python 中 break 和 continue 傻傻分不清
- python中的流程控制语句:continue、break 和 return使用方法
- L017:continue和break - 教程文案
- 作为前端开发者,你都经历过怎样的面试?
- 面试被问 const 是否不可变?这样回答才显功底
 
- 标签列表
- 
- git pull (33)
- git fetch (35)
- mysql insert (35)
- mysql distinct (37)
- concat_ws (36)
- java continue (36)
- jenkins官网 (37)
- mysql 子查询 (37)
- python元组 (33)
- mybatis 分页 (35)
- vba split (37)
- redis watch (34)
- python list sort (37)
- nvarchar2 (34)
- mysql not null (36)
- hmset (35)
- python telnet (35)
- python readlines() 方法 (36)
- munmap (35)
- docker network create (35)
- redis 集合 (37)
- python sftp (37)
- setpriority (34)
- c语言 switch (34)
- git commit (34)
 
