百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT技术 > 正文

为什么删除记录表文件不会减小?(记录插入与删除在磁盘的变化)

wptr33 2025-05-03 16:58 6 浏览

如果你熟悉 MySQL 缓冲池(不熟悉可以查看 一条 sql 的执行过程详解),可能会觉得是因为删除操作只更新到缓冲池和 redo log,并没有进行 flush 落盘,但如果关闭数据库,触发 flush ,会发现表文件大小还是不会改变,这是为什么?

原因

首先要了解数据的存储方式,存储方式共有两种,是由参数 innodb_file_per_table 来控制的。

off:共享表结构,表示所有的文件数据存储在同一个文件中,这样在删除整张表后空间也不会被回收,只是被位置被标记为可重用,下次创建表可能就在该位置创建。

on:表示每张表的数据各用一个文件来存储,在删除整张表后该文件也会被回收,减小总占用空间。这也是默认的使用方式。如果存储引擎是 InnoDB ,那么数据文件就是.ibd 格式的,如果是 MyISAM,那么文件就是 .MYD 格式的。


虽然执行 drop 删除表时会减小表文件大小,但在删除记录时还是不能减小结构,这个原因与上面的 off 共享表结构很像,因为 数据页是 InnoDB 管理数据的最小的磁盘单位,数据页就相当于上面的 "一张表的数据",因为一张表的数据页都是存在同一个文件中的,所以在执行 delete 删除数据后只会将将改位置标记可重用,并不会回收,而如果删除整个页,那么也只能将该页标记为可重用而不会回收。这种删除了但是没有被回收的位置就称为 "数据空洞"。

页合并与页分裂

页合并:既然产生了数据空洞,那么数据文件将会变得越来越大,这样是很不利的,所以 MySQL 会在数据空洞达到一定比例后出触发 "页合并",触发的页会找最靠近的可以合并的页进行合并来优化空间(只会将数据页使用权腾出来,并不会减小表文件大小),防止后续的数据插入使用更多的数据页造成文件更大。

页分裂:页分裂是在插入操作时操作的记录主键 ID 在原本的记录之间产生的,因为记录存储在数据页中,如果该数据页没有合适的位置来存储这条记录,那么就会将该条记录以及后面的记录另开要一个数据页来存储。

优化:因为页合并和页分裂都需要消耗额外的性能。所以我们在插入数据时应当按主键递增顺序插入(主键可以使用自增ID 或 雪花算法,但如果业务字段有唯一字段且没有其他索引,那么可以使用其作为主键来避免每次查询都需要回表),删除数据时按主键顺序删除。

如何减小表文件

1、自动触发的页合并。

2、手动触发清理大部分的数据空洞(5.6 的 Online DDL 可能会存一些写操作,可能会产生一些数据空洞),具体做法就是执行 "Alter table 表名 engine = InnoDB",因为 Alter 语句是修改表结构,而执行一个空修改操作就可以在不修改结构的情况下将数据空洞清除。具体原理是会先创建一个临时表,将当前表中的所有记录依次添加到临时表中,最后再将临时表替换原表的表。但是重建表并一定就是最紧凑的,因为在重建时每个数据页会留 1/16 用于更新,同时 5.6 后可能还会在向临时表迁移数据时积累一些写操作造成页分裂。而在这过程中不能有其他操作干扰,比如修改数据、读数据,所以在执行此操作时会添加 MDL 写锁,而在执行读写操作时会添加 MDL 读,两者互斥。

作者:萌新J

原文链接:
https://www.cnblogs.com/mengxinJ/p/14184458.html

相关推荐

Java中JDK里用到了哪些设计模式?让面试官眼前一亮!

大家好,欢迎来到程序视点!我是小二哥。Java中JDK里用到了哪些设计模式?...

当问到组件实现原理时,面试官是在刁难你吗?

今天我想跟你探讨的话题是:当面试官问你某某组件的实现原理是什么时,他究竟想了解什么?你又需要了解到什么层面上呢?...

京东大佬问我,在SpringBoot中怎么使用时间轮?要考虑哪些方面?

京东大佬问我,什么是时间轮?为什么要用时间轮?在SpringBoot中怎么使用时间轮?要考虑哪些方面的问题呢?嗯,用户问到了时间轮,还有在SpringBoot中怎么用,需要考虑哪些问题。首先,我得先...

Redis和Memcached区别详解(5大核心区别)

Redis和Memcached都是常见的内存缓存系统,但也有区别,以下是5大Redis和Memcached的区别@mikechen本篇已收于mikechen原创超30万字《阿里架构师进阶专题合集》里面...

工作中用Redis最多的10种场景(redis实际应用场景)

前言Redis作为一种优秀的基于key/value的缓存,有非常不错的性能和稳定性,无论是在工作中,还是面试中,都经常会出现。今天这篇文章就跟大家一起聊聊,我在实际工作中使用Redis的10种场景,希...

Redis面试攻防战:如何赢得技术博弈的胜利

今天,我面试了某大厂的java开发岗位,迎面走来一位风尘仆仆的中年男子,手里拿着屏幕还亮着的mac,他冲着我礼貌的笑了笑,然后说了句“不好意思,让你久等了”,然后示意我坐下,说:“我们开始吧。看了你的...

深入浅出聊聊 Redis 高级特性(redis如何实现高性能)

Redis数据结构Redis常用的数据类型主要有以下五种:StringHashListSetSortedsetRedis内部使用一个redisObject对象来表示所有的key和va...

Redis在Java项目中的典型应用场景

Redis在Java项目中的典型应用场景在Java项目的世界里,Redis作为一种高性能的内存数据库,其应用已经变得极为广泛。它不仅具备缓存功能,还能胜任分布式锁、消息队列等多种角色。今天,我们就来聊...

Redis与Java集成的最佳实践:打造高效缓存系统

Redis与Java集成的最佳实践:打造高效缓存系统在当今高并发的时代,Redis作为一款高效的内存数据库,已经成为Java开发者不可或缺的工具之一。它不仅能显著提升系统的响应速度,还能有效减轻数据库...

Redis 慢查询:从青铜到王者的进阶之路

各位程序员老铁们,欢迎来到Redis吐槽大会!今天咱们要吐槽的「摸鱼选手」叫慢查询——这货表面上是条普通命令,背地里却能让你的Redis分分钟变成「龟速数据库」。想知道它是怎么搞破坏的?跟...

订单超时自动取消的7种方案,我用这种!

前言在电商、外卖、票务等系统中,订单超时未支付自动取消是一个常见的需求。...

Redis在Java项目中的奇妙应用(redis在java项目中的使用)

Redis在Java项目中的奇妙应用在Java的世界里,Redis就像是那位低调却实力非凡的幕后英雄。它虽不像Spring那样被频繁提及,但它的身影却无处不在。今天,我们就来聊聊Redis这位“存储大...

2015年在Twitter上刷屏的那些事儿

我们将盘点在今年12个月里Twitter上最有影响力的大V跟那些轰动整个网络的新闻事件。今年,我们看到了巴黎恐怖袭击、成千上万难民们试图远离战争等许多重大的事件。本周,Twitter公布了整整12个月...

Swift 语言指南-Issue 43(swift语句)

本期特别推荐1.项目:Filterpedia(完整、强大的图片滤镜类库)、ElasticTransition(畅快、无违和感的皮筋式动画转场)以及VWInstantRun(Xcode高效调试插件...

1小时入门Swift语法(swift语法 简书)

简介Swift语言由苹果公司在2014年推出,用来撰写OSX和iOS应用程序2014年,在AppleWWDC发布特点从它的语法中能看到Objective-C、JavaScrip...