百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT技术 > 正文

MySQL统计总行数:听说count(*)性能更好,是真的吗

wptr33 2025-03-01 15:45 10 浏览

在日常的开发工作中,统计一张表的总行数是一个很常见的需求。通常我们会使用这样一条sql查询数据:select count(*) from table t。但是,随着表中的数据越来越多,这条sql的执行速度也会越来越慢。

今天我们就来聊一聊,count(*)是如何统计一张表中的总行数的,以及count(*)、count(1)、count(id)、count(字段)这几种方式的性能差异。

count(*)的执行方式

首先,根据官方的描述,使用不同的执行引擎,count(*)的实现方式是有区别的。

在MyISAM引擎中,表的总行数是直接存在磁盘上,所以查询的时候可以直接返回,效率很高。

但是对于InnoDB引擎来说,情况就不一样了。由于多版本并发控制MVCC的存在,InnoDB在执行count(*)时,无法确定表中到底有多少行,只好把数据一行一行的从引擎中读出来,然后累加计数。

那InnoDB为什么要这么麻烦呢?为什么不像MyISAM那样,把总行数存在磁盘上呢?

这是因为在同一时刻,可能存在多个事务查询,因为MVCC的原因,不同事务是相互隔离的,InnoDB需要在当前事务中,一行一行的读取数据,然后判断哪些数据对自己是可见的,哪些数据对自己是不可见的。

所以随着表中数据越来越多,我们会发现count(*)的速度也会越来越慢了。

不同count用法的差异

首先我们要清楚,count是一个聚合函数,对查到的结果集,会一行一行的判断,如果不为NULL,累计值就加1,最终得到一个值。

1,对于count(主键id)来说,InnoDB引擎遍历表中的每一行,将主键id获取到以后返回给Server层,Server层判断id不为null,然后进行累加。(ps.主键id肯定是不为空的,正常来说是不需要判断的,但是官方源码中确实有这个判断)

2,对于count(1)来说,InnoDB依然遍历表中的每一行,但是并不获取值(返回一行,不取字段),Server对于返回的数据,直接放一个“1”进去,然后判断不为null,进行累加。

3,对于count(字段)来说,遍历表中的每一行,读出这个字段,Server层判断是否为null,如果不为null,则进行累加,如果为null,就忽略这一行。

4,对于count(*)来说,MySQL专门做了优化,就像count(1)那样,并不取值,count(*)肯定不是null,直接按行累加。

由于count(*)并不需要对获取的值进行null判断,所以性能理论上会比count(1)更好一点。但是一般认为这点影响微乎其微,并没有什么实际性差异。

这一点在MySQL官方文档上也有说明:

InnoDB handles SELECT COUNT(*) and SELECT COUNT(1) operations in the same way. There is no performance difference。

总结

按照执行效率来说:count(字段)

一般情况下,count(*)是更好的选择。


写文不易,朋友们点赞关注支持一下吧。

相关推荐

用Java实现RAG的3大核心模块与7个必知细节

一、真实场景驱动:某制造企业的知识管理之痛某汽车零部件企业有超过20万份技术文档(PDF/HTML/Word),工程师每天平均花费2小时查找资料。我们为其构建的Java版RAG系统,将查询耗时缩短至1...

在 C# .NET 中从 PDF 中提取表数据

概述:...

【分享】教你如何使用 Java 读取 Excel、docx、pdf 和 txt 文件

在Java开发中,我们经常需要读取不同类型的文件,包括Excel表格文件、"doc"和"docx"文档文件、PDF文件以及纯文本文件。其中最常用的是A...

Spring AI 模块架构与功能解析

SpringAI是Spring生态系统中的一个新兴模块,专注于简化人工智能和机器学习技术在Spring应用程序中的集成。本文将详细介绍SpringAI的核心组件、功能模块及其之间的关...

告别付费!一站式服务,PDF多功能工具!

大家好,我是Java陈序员。今天,给大家介绍一个PDF多功能在线操作工具,完全免费开源!...

本地PDF操作神器:永久告别盗版和破解,再也不用担心安全问题

前言PDF(便携式文档格式)目前已经成为了文档交换和存储的标准。然而,找到一个功能全面、安全可靠、且完全本地化的PDF处理工具并不容易。...

Python rembg 库去除图片背景

rembg是一个强大的Python库,用于自动去除图片背景。它基于深度学习模型(如U^2-Net),能够高效地将前景物体从背景中分离,生成透明背景的PNG图像。本教程将带你从安装到实际应用...

31个必备的python字符串方法,建议收藏

字符串是Python中基本的数据类型,几乎在每个Python程序中都会使用到它。...

python学习day1——输出格式化

print一般在控制台中我们用print进行输出,默认情况下,使用格式为:print(*objects,sep='',end='\n')第一个参数是我们要在控制台...

一张图认识Python(附基本语法总结)

一张图认识Python(附基本语法总结)一张图带你了解Python,更快入门,一张图认识Python(附基本语法总结)Python基础语法总结:1.Python标识符在Python里,标识符有字...

学习编程第188天 python编程 字典格式化

今天学习的是刘金玉老师零基础Python教程第84期,主要内容是python字典格式化。...

Python基础数据类型转换

Python中的基础数据类型转换可以分为隐式转换和显示转换。隐式转换是python解释器自动转换,显示转换是通过内置函数实现。无论哪种方式进行的转换,均为转换为对应类型的数据,而非改变原数据的类型。...

python之json基本操作

1.概述JSON(JavaScriptObjectNotation)是一种轻量级的数据交换格式,它具有简洁、清晰的层次结构,易于阅读和编写,还可以有效的提升网络传输效率。Python标准库的...

Python之迭代器及其用法

前面章节中,已经对列表(list)、元组(tuple)、字典(dict)、集合(set)这些序列式容器做了详细的介绍。值得一提的是,这些序列式容器有一个共同的特性,它们都支持使用for循环遍历存储...

从初始化一个现代 python项目学习到的东西

uv我准备用uv初始化一个python项目环境我用的是苹果笔记本MacBookPro,具体的操作系统及硬件参数如下:...