百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT技术 > 正文

MySQL如何查询连号

wptr33 2024-11-17 16:44 24 浏览


在前面的文章【MySQL如何查询断号】中,已经介绍了如何查询断号,接下来,让我们了解一下如何查询连号。

大致的思路和前面是差不多的,我们依然使用以下表做解释:


现在有如下表:

CREATE TABLE `g` (

`id` int NOT NULL AUTO_INCREMENT,

PRIMARY KEY (`id`)

)


表中总数据行为:21318


下面我们列出前10 行:


select id from g order by id limit 10;


返回数据如下:


+----+

| id |

+----+

| 1 |

| 2 |

| 3 |

| 7 |

| 8 |

| 10 |

| 11 |

| 12 |

| 16 |

| 19 |

+----+

10 rows in set (0.00 sec)


让我们观察一下上面的数据,不难发现,针对于每一个id的连号的数据范围如下:


Start_id

End_id

1

3

2

3

3

3

7

8

8

8

10

12

11

12

12

12

16

16

19

...

...

...


(表一)


我们再总结一下范围,又可以得出,我们要的最终数据应该是以下这样的:


Start_id

End_id

1

3

7

8

10

12

16

16

19

...

...

...


(表二)


解决方法一:


基于以上对数据的分析,对于(表一)的数据,就是想办法再增加一列,此列的值就是针对每一个id所对应的缺失的值减1。讲到这里,是否大家就有点明白了呢?

要新增的此列的值,不就是如何查找缺失的数据的开始值(start_id - 1)吗?


如果一下子没想明白,请查阅前一篇文章【MySQL如何查询断号】。


完整解决SQL如下:

select id

, ( select min(id) as id

from g c

where not exists (

select 1

from g b

where c.id + 1 = b.id )

and c.id>=a.id) as end_id

from g a;


则可以获取(表一)的数据,那么接下来,只要对end_id列进行分组,再获取最小的那个id列,就可以获取(表二)的数据了。


则最后的完整解决SQL如下所示:


select min(id) as start_id

, d.end_id

from ( select id

, ( select min(id) as id

from g c

where not exists ( select 1

from g b

where c.id + 1 = b.id )

and c.id>=a.id ) as end_id

from g a ) as d

group by d.end_id;


解决方法二:


让我们再重新观察一下(表一)的数据,针对于连续号段{1,2,3}而言,期望结果的开始值(start_id)为1,期望结果的结束值(end_id)为3,也就是说,一个是连续号段的最小值,而另一个则是连续号段的最大值。

再结合解决方法一的最后那个分组思路,是否可以想办法构建一个新列,让此新列的值,针对与每一个连续号段都具有相同的值呢?

让我们继续从连续性上思考,既然,原始数据是连续的,那么数据间的差也是固定的,那么当一个连续性数据减另一个连续性数据的差是否也是固定的呢?

例如:针对连续号段{1,2,3} ,我们有另一个连续号段{1,2,3},对应的每一个id相减差都是0。

再针对连续号段{7,8},我们的另一个连续号段为{4,5},对应的每一个id相减差都是-3。

单纯这样描述,可能不那么直观,那么就让我们看看如下(表三)的数据,可能会更加清晰,且容易理解。



原始id列

新增id列

1

1

0

2

2

0

3

3

0

7

4

-3

8

5

-3

10

6

-4

11

7

-4

12

8

-4

16

9

-7

19

10

-9

...

...

...


(表三)


看到这里,这个新列是什么?我想大家已经都已经知道答案了,对滴,别犹豫,别怀疑,就是排序行号。


那么就不多解释了,直接给出SQL如下:


select min(id) as start_id

, max(id) as end_id

from ( select g.id

, @rid:=@rid+1 as row_id

from g, ( select @rid:=0) td ) tmp

group by (tmp.id - row_id);





解决方法三:


我们在解决方法二中使用到了排序行号,那么既然MySQL已经提供了窗口函数,

那么便又可以进一步改写为如下:


select min(id) as start_id

, max(id) as end_id

from ( select id

, row_number() over (order by id) as row_id

from g ) tmp

group by (tmp.id - row_id);




这里,我仅仅提供解题思路,对于以上三种方法的性能,我这里未作对比,感兴趣的读者可以自行测试。


本文如有不足,不妥之处,也恳请大家批评指出。

相关推荐

Linux高性能服务器设计

C10K和C10M计算机领域的很多技术都是需求推动的,上世纪90年代,由于互联网的飞速发展,网络服务器无法支撑快速增长的用户规模。1999年,DanKegel提出了著名的C10问题:一台服务器上同时...

独立游戏开发者常犯的十大错误

...

学C了一头雾水该咋办?

学C了一头雾水该怎么办?最简单的方法就是你再学一遍呗。俗话说熟能生巧,铁杵也能磨成针。但是一味的为学而学,这个好像没什么卵用。为什么学了还是一头雾水,重点就在这,找出为什么会这个样子?1、概念理解不深...

C++基础语法梳理:inline 内联函数!虚函数可以是内联函数吗?

上节我们分析了C++基础语法的const,static以及this指针,那么这节内容我们来看一下inline内联函数吧!inline内联函数...

C语言实战小游戏:井字棋(三子棋)大战!文内含有源码

井字棋是黑白棋的一种。井字棋是一种民间传统游戏,又叫九宫棋、圈圈叉叉、一条龙、三子旗等。将正方形对角线连起来,相对两边依次摆上三个双方棋子,只要将自己的三个棋子走成一条线,对方就算输了。但是,有很多时...

C++语言到底是不是C语言的超集之一

C与C++两个关系亲密的编程语言,它们本质上是两中语言,只是C++语言设计时要求尽可能的兼容C语言特性,因此C语言中99%以上的功能都可以使用C++完成。本文探讨那些存在于C语言中的特性,但是在C++...

在C++中,如何避免出现Bug?

C++中的主要问题之一是存在大量行为未定义或对程序员来说意外的构造。我们在使用静态分析器检查各种项目时经常会遇到这些问题。但正如我们所知,最佳做法是在编译阶段尽早检测错误。让我们来看看现代C++中的一...

ESL-通过事件控制FreeSWITCH

通过事件提供的最底层控制机制,允许我们有效地利用工具箱,适时选择使用其中的单个工具。FreeSWITCH是一个核心交换与混合矩阵,它周围有几十个模块提供各种功能特性。我们完全控制了所有的即时信息,这些...

物理老师教你学C++语言(中篇)

一、条件语句与实验判断...

C语言入门指南

当然!以下是关于C语言入门编程的基础介绍和入门建议,希望能帮你顺利起步:C语言入门指南...

C++选择结构,让程序自动进行决策

什么是选择结构?正常的程序都是从上至下顺序执行,这就是顺序结构...

C++特性使用建议

1.引用参数使用引用替代指针且所有不变的引用参数必须加上const。在C语言中,如果函数需要修改变量的值,参数必须为指针,如...

C++程序员学习Zig指南(中篇)

1.复合数据类型结构体与方法的对比C++类:...

研一自学C++啃得动吗?

研一自学C++啃得动吗?在开始前我有一些资料,是我根据网友给的问题精心整理了一份「C++的资料从专业入门到高级教程」,点个关注在评论区回复“888”之后私信回复“888”,全部无偿共享给大家!!!个人...

C++关键字介绍

下表列出了C++中的常用关键字,这些关键字不能作为变量名或其他标识符名称。1、autoC++11的auto用于表示变量的自动类型推断。即在声明变量的时候,根据变量初始值的类型自动为此变量选择匹配的...