百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT技术 > 正文

为什么删除记录表文件不会减小?(记录插入与删除在磁盘的变化)

wptr33 2025-05-03 16:58 15 浏览

如果你熟悉 MySQL 缓冲池(不熟悉可以查看 一条 sql 的执行过程详解),可能会觉得是因为删除操作只更新到缓冲池和 redo log,并没有进行 flush 落盘,但如果关闭数据库,触发 flush ,会发现表文件大小还是不会改变,这是为什么?

原因

首先要了解数据的存储方式,存储方式共有两种,是由参数 innodb_file_per_table 来控制的。

off:共享表结构,表示所有的文件数据存储在同一个文件中,这样在删除整张表后空间也不会被回收,只是被位置被标记为可重用,下次创建表可能就在该位置创建。

on:表示每张表的数据各用一个文件来存储,在删除整张表后该文件也会被回收,减小总占用空间。这也是默认的使用方式。如果存储引擎是 InnoDB ,那么数据文件就是.ibd 格式的,如果是 MyISAM,那么文件就是 .MYD 格式的。


虽然执行 drop 删除表时会减小表文件大小,但在删除记录时还是不能减小结构,这个原因与上面的 off 共享表结构很像,因为 数据页是 InnoDB 管理数据的最小的磁盘单位,数据页就相当于上面的 "一张表的数据",因为一张表的数据页都是存在同一个文件中的,所以在执行 delete 删除数据后只会将将改位置标记可重用,并不会回收,而如果删除整个页,那么也只能将该页标记为可重用而不会回收。这种删除了但是没有被回收的位置就称为 "数据空洞"。

页合并与页分裂

页合并:既然产生了数据空洞,那么数据文件将会变得越来越大,这样是很不利的,所以 MySQL 会在数据空洞达到一定比例后出触发 "页合并",触发的页会找最靠近的可以合并的页进行合并来优化空间(只会将数据页使用权腾出来,并不会减小表文件大小),防止后续的数据插入使用更多的数据页造成文件更大。

页分裂:页分裂是在插入操作时操作的记录主键 ID 在原本的记录之间产生的,因为记录存储在数据页中,如果该数据页没有合适的位置来存储这条记录,那么就会将该条记录以及后面的记录另开要一个数据页来存储。

优化:因为页合并和页分裂都需要消耗额外的性能。所以我们在插入数据时应当按主键递增顺序插入(主键可以使用自增ID 或 雪花算法,但如果业务字段有唯一字段且没有其他索引,那么可以使用其作为主键来避免每次查询都需要回表),删除数据时按主键顺序删除。

如何减小表文件

1、自动触发的页合并。

2、手动触发清理大部分的数据空洞(5.6 的 Online DDL 可能会存一些写操作,可能会产生一些数据空洞),具体做法就是执行 "Alter table 表名 engine = InnoDB",因为 Alter 语句是修改表结构,而执行一个空修改操作就可以在不修改结构的情况下将数据空洞清除。具体原理是会先创建一个临时表,将当前表中的所有记录依次添加到临时表中,最后再将临时表替换原表的表。但是重建表并一定就是最紧凑的,因为在重建时每个数据页会留 1/16 用于更新,同时 5.6 后可能还会在向临时表迁移数据时积累一些写操作造成页分裂。而在这过程中不能有其他操作干扰,比如修改数据、读数据,所以在执行此操作时会添加 MDL 写锁,而在执行读写操作时会添加 MDL 读,两者互斥。

作者:萌新J

原文链接:
https://www.cnblogs.com/mengxinJ/p/14184458.html

相关推荐

SpringBoot 3 + Flutter3 实战低代码运营管理-10章

获课》aixuetang.xyz/5075/三天构建运营管理系统:SpringBoot3+Flutter3高效开发方法论...

SpringBoot探针实现:从零构建应用健康监控利器

SpringBoot探针实现:从零构建应用健康监控利器声明本文中的所有案例代码、配置仅供参考,如需使用请严格做好相关测试及评估,对于因参照本文内容进行操作而导致的任何直接或间接损失,作者概不负责。本文...

Spring Batch中的JobRepository:批处理的“记忆大师”是如何工作

一、JobRepository是谁?——批处理的“档案馆”JobRepository是SpringBatch的“记忆中枢”,负责记录所有Job和Step的执行状态。它像一位严谨的档案管理员,把任务执...

Github霸榜的SpringBoot全套学习教程,从入门到实战,内容超详细

前言...

还在为 Spring Boot3 技术整合发愁?一文解锁大厂都在用的实用方案

你在使用SpringBoot3开发后端项目时,是不是常常陷入这样的困境?想提升项目性能和功能,却不知道该整合哪些技术;好不容易选定技术,又在配置和使用上频频踩坑。其实,这是很多互联网大厂后端开发...

一文吃透!Spring Boot 项目请求日志记录,这几招你绝对不能错过!

在互联网应用开发的高速赛道上,系统的稳定性、可维护性以及安全性是每一位开发者都必须关注的核心要素。而请求日志记录,就如同系统的“黑匣子”,能够为我们提供排查故障、分析用户行为、优化系统性能等关键信息...

spring-boot-starter-actuator简单介绍

SpringBootActuator是SpringBoot的一个功能强大的子项目,它提供了一些有用的监控和管理SpringBoot应用程序的端点。SpringBootActuat...

使用SpringBoot钩子或Actuator实现优雅停机

服务如何响应停机信号在java中我们可以直接利用通过Runtime...

28-自定义Spring Boot Actuator指标

上篇我们学习了《27-自定义SpringBootActuator健康指示器》,本篇我们学习自定义SpringBootActuator指标(Metric)。...

如何在Spring Boot中整合Spring Boot Actuator进行服务应用监控?

监控是确保系统稳定性和性能的关键组成部分,而在SpringBoot中就提供了默认的应用监控方案SpringBootActuator,通过SpringBootActuator提供了开箱即用的应...

「Spring Boot」 Actuator Endpoint

Actuator官网地址:https://docs.spring.io/spring-boot/docs/2.5.6/reference/html/actuator.html目的监控并管理应用程序...

Spring Boot Actuator监控功能全面剖析

SpringBootActuator监控功能全面剖析在现代企业级Java开发中,SpringBoot以其轻量化、高效率的特性深受开发者青睐。而作为SpringBoot生态系统的重要组成部分,S...

1000字彻底搞懂SpringBootActuator组件!

SpringBootActuator组件SpringBootActuator通过HTTPendpoints或者JMX来管理和监控SpringBoot应用,如服务的审计、健康检查、指标统计和...

JavaScript数据类型(javascript数据类型介绍)

基本数据类型BooleanNullNumberStringSymbolUndefined对象数据类型ObjectArray定义:JavaScript数组是内置的对象之一,它可以用一个变量来存储多个同种...

能运行,不代表它是对的:5 个潜伏在正常功能下的 JavaScript 错误

JavaScript的动态性和复杂性意味着,代码虽然表面上正常运行,但一些深层次、隐蔽的陷阱往往让人意想不到,梳理了几个JavaScript开发中难以发现的隐蔽错误,旨在帮助我们写出更健壮、更可...