百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT技术 > 正文

MySQL索引、关联子查询与SQL语句的优化技巧

wptr33 2024-11-17 16:44 36 浏览


CDA数据分析师 出品

大家好,欢迎来到小编的MySQL课堂。今天我们一起来看一下MySQL中的索引、关联子查询以及语句的优化技巧。

一、MySQL的索引

数据库索引,是数据库管理系统中一个排序的数据结构,以协助快速查询数据库表中数据。

1、索引的意义

索引用于快速找出在某个字段中有特定值的行。如果不使用索引,MySQL必须从第一条记录开始检索表中的每一条记录,直到找出相关的行,那么表越大,查询数据所花费的时间就越多。如果在表中查询的字段有索引,MySQL能够快速到达一个位置去检索数据文件,而不需要再去查看所有数据,那么将会节省很大一部分查询时间。比如说emp表中1W个员工的记录,要查询salesman的员工信息,如果没有索引,服务器会从表中第一条记录开始,一条条往下遍历,直到找到职位为salesman的员工信息。如果有了索引,它会把job这个字段,通过一定的方法进行存储,在查询这个字段上的信息时,能够快速找到对应的数据,而不需要再遍历1W条记录了。

2、索引的优缺点

所有MySQL的字段类型都可以添加索引,但是索引也不是越多越好,而是要根据业务数据合理的使用。

优点

· 通过索引对数据进行检索,大大提高了数据的查询效率。

缺点

· 创建索引和维护索引要耗费时间,并且随着数据量的增加所耗费的时间也会增加。

· 索引也需要占空间的,创建的索引太多,索引文件也会占用数据库的存储空间。

· 当对表中的数据进行增加、删除、修改时,索引也需要动态的维护,降低了数据的维护速度。

3、创建索引的原则

1)需要创建索引的情况:

· 主外键和唯一约束的字段自动创建索引

· 频繁作为查询条件的字段应该创建索引

· 查询中排序的字段应该创建索引

· 查询中分组或统计的字段应该创建索引

2)不需要创建索引的情况:

· 表中记录太少不需要创建索引

· 需要频繁增删改的字段不适合创建索引

· where子句中用不到的字段不需要创建索引

· 重复值较多的字段不需要创建索引

4、索引的结构

索引是在存储引擎中实现的,使用不同的存储引擎,所支持的索引也是不同的。在mysql中常用两种索引结构BTree和Hash,两种算法检索方式不一样,对查询的作用也不一样。MyISAM和InnoDB存储引擎只支持BTREE索引,MEMORY/HEAP存储引擎支持HASH和BTREE索引。

MySQL的InnoDB存储引擎是支持hash索引的,不过我们必须启用,hash索引的创建由InnoDB存储引擎自动优化创建,我们干预不了。

5、索引的类型

索引的类型可以分类以下几种:

· 普通索引:最基本的索引,没有任何限制

· 唯一索引:索引字段的取值不能重复,可以有空值,但空值也只能出现一次。

· 主键索引:索引字段的取值不能为空,也不能重复。

· 组合索引:一个索引包含多个字段,只有在查询条件中使用了创建索引时的第一个字段,索引才会被使用。

· 全文索引:通过关键字符,就能找到该字段所属的记录行。仅限MyISAM引擎,且只能在CHAR,VARCHAR,TEXT类型的字段上使用。

· 空间索引:对空间数据类型(GEOMETRY、POINT、LINESTRING、POLYGON)的字段建立的索引,仅限MyISAM引擎,且要求索引字段的取值不能为空。

6、索引的操作

实际上索引也是一张表,创建索引时,数据库管理系统会在本地磁盘建立索引文件,里面保存了索引字段,并指向实体表的记录。

1)创建索引

创建表的同时须指定索引名、表名和字段名。

语法

create index <索引名> on <表名>(<字段名>);

自动创建索引

· 在表中定义了主键约束时,会自动创建一个对应的主键索引。

· 在表中定义了外键约束时,会自动创建一个对应的普通索引。

· 在表中定义了唯一约束时,会自动创建一个对应的唯一索引。

示例:emp表中的job添加普通索引

mysql> create index job_index on emp(job);

2)查看索引

语法

show index from <表名>;

示例:查看emp表中的索引

mysql> show index from emp;+-------+------------+-----------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+---------+------------+| Table | Non_unique | Key_name | Seq_in_index | Column_name | Collation | Cardinality | Sub_part | Packed | Null | Index_type | Comment | Index_comment | Visible | Expression |+-------+------------+-----------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+---------+------------+| emp | 0 | PRIMARY | 1 | empno | A | 14 | NULL | NULL | | BTREE | | | YES | NULL || emp | 0 | ename | 1 | ename | A | 14 | NULL | NULL | YES | BTREE | | | YES | NULL || emp | 1 | deptno | 1 | deptno | A | 3 | NULL | NULL | YES | BTREE | | | YES | NULL || emp | 1 | job_index | 1 | job | A | 5 | NULL | NULL | | BTREE | | | YES | NULL |+-------+------------+-----------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+---------+------------+

3)使用索引

在查询语句中使用索引会大大提升数据的检索速度。示例

mysql> select ename,job,deptno from emp where job='salesman';+--------+----------+--------+| ename | job | deptno |+--------+----------+--------+| allen | salesman | 30 || ward | salesman | 30 || martin | salesman | 30 || turner | salesman | 30 |+--------+----------+--------+

4)删除索引

删除索引只是删除了表中的索引对象,表中的数据不会被删除。语法

drop index <索引名> on <表名>;

示例

mysql> drop index job_index on emp;mysql> select ename,job,deptno from emp where job='salesman';+--------+----------+--------+| ename | job | deptno |+--------+----------+--------+| allen | salesman | 30 || ward | salesman | 30 || martin | salesman | 30 || turner | salesman | 30 |+--------+----------+--------+

二、SQL关联子查询

执行逻辑

对于外部查询返回的每条数据,内部查询都要执行一次。在关联子查询中是信息流是双向的。外部查询的每条记录传递给子查询,然后子查询按照条件执行并返回它的记录。然后,外部查询根据返回的记录做出决策。

例题精讲

成绩表主要信息如下:

要解决的问题是:查询各科成绩前三名的记录。使用关联子查询解决,代码如下:

select * from sc twhere (select sum(score>t.score) from sc where c_id=t.c_id)<3order by c_id,score desc;

第一步:先执行外层查询

select * from sc t;

查询结果也就是该表的全部记录

第二步:因为子查询中连接了这个表本身(where cid=t.cid),所以将第一条记录转到子查询。子查询是sum(score>t.score)即01课程中score>80的人数,所以先判断score>t.score,满足为1,不满足为0,用sum求和即查询出01课程中score>80的有几个人。

相当于执行了:

select sum(score>80) from sc where c_id='01';

查询结果如下:

01课程中score>80的人数为0,即80为第一名。第三步:子查询的结果进入外部查询where子句中和3比较,0<3,条件成立,最终输出t表中的第一条记录。循环执行:t表中第二、三条记录转到子查询,执行判断,输出第二、三条记录。t表中第四条记录转到子查询,01课程中score>70的人数有3人,3<3条件不成立,所以不输出t表中第四条记录。

继续循环直到t表中最后一条记录,最终输出结果按照课程编号和成绩进行排序。

三、SQL语句的优化技巧

应用程序慢如牛,原因多多,可能是网络的原因、可能是系统架构的问题,还有可能是数据库的原因。那么如何提高数据库SQL语句执行速度呢?

程序中嵌入的SQL语句,如果使用了一些优化小技巧,定能达到事半功倍的效果。

1、where子句中不使用 != ,否则放弃索引全表扫描

比较运算符能用 "="就不用"!=","="增加了索引的使用几率。

2、尽量避免 NULL 值判断,否则放弃索引全表扫描优化前 :

select number from t1 where number is null;

优化后 :在number列上设置默认值0,确保number列无NULL值

select number from t1 where number=0;

3、尽量避免 or 连接条件,否则放弃索引全表扫描优化前 :

select id from t1 where id=10 or id=20 or id=30;

优化后:

select id from t1 where id=10union allselect id from t1 where id=20union allselect id from t1 where id=30;

4、模糊查询尽量避免使用前置 % ,否则全表扫描

select name from t1 where name like "%c%";

5、尽量避免使用 in 和 not in,否则全表扫描

select id from t1 where id in(1,2,3,4);select id from t1 where id between 1 and 4;

6、尽量避免使用 select * ...;用具体字段代替 * ,不要返回用不到的字段

SQL调优方法有很多种,同样的查询结果可以有很多种不同的查询方式。其实最好的方法就是在开发环境中用最贴近真实的数据集和硬件环境进行测试,然后再发布到生产环境中。


更多优质内容及精彩资讯,可点击【了解更多】迅速进入!

相关推荐

Python自动化脚本应用与示例(python办公自动化脚本)

Python是编写自动化脚本的绝佳选择,因其语法简洁、库丰富且跨平台兼容性强。以下是Python自动化脚本的常见应用场景及示例,帮助你快速上手:一、常见自动化场景文件与目录操作...

Python文件操作常用库高级应用教程

本文是在前面《Python文件操作常用库使用教程》的基础上,进一步学习Python文件操作库的高级应用。一、高级文件系统监控1.1watchdog库-实时文件系统监控安装与基本使用:...

Python办公自动化系列篇之六:文件系统与操作系统任务

作为高效办公自动化领域的主流编程语言,Python凭借其优雅的语法结构、完善的技术生态及成熟的第三方工具库集合,已成为企业数字化转型过程中提升运营效率的理想选择。该语言在结构化数据处理、自动化文档生成...

14《Python 办公自动化教程》os 模块操作文件与文件夹

在日常工作中,我们经常会和文件、文件夹打交道,比如将服务器上指定目录下文件进行归档,或将爬虫爬取的数据根据时间创建对应的文件夹/文件,如果这些还依靠手动来进行操作,无疑是费时费力的,这时候Pyt...

python中os模块详解(python os.path模块)

os模块是Python标准库中的一个模块,它提供了与操作系统交互的方法。使用os模块可以方便地执行许多常见的系统任务,如文件和目录操作、进程管理、环境变量管理等。下面是os模块中一些常用的函数和方法:...

21-Python-文件操作(python文件的操作步骤)

在Python中,文件操作是非常重要的一部分,它允许我们读取、写入和修改文件。下面将详细讲解Python文件操作的各个方面,并给出相应的示例。1-打开文件...

轻松玩转Python文件操作:移动、删除

哈喽,大家好,我是木头左!Python文件操作基础在处理计算机文件时,经常需要执行如移动和删除等基本操作。Python提供了一些内置的库来帮助完成这些任务,其中最常用的就是os模块和shutil模块。...

Python 初学者练习:删除文件和文件夹

在本教程中,你将学习如何在Python中删除文件和文件夹。使用os.remove()函数删除文件...

引人遐想,用 Python 获取你想要的“某个人”摄像头照片

仅用来学习,希望给你们有提供到学习上的作用。1.安装库需要安装python3.5以上版本,在官网下载即可。然后安装库opencv-python,安装方式为打开终端输入命令行。...

Python如何使用临时文件和目录(python目录下文件)

在某些项目中,有时候会有大量的临时数据,比如各种日志,这时候我们要做数据分析,并把最后的结果储存起来,这些大量的临时数据如果常驻内存,将消耗大量内存资源,我们可以使用临时文件,存储这些临时数据。使用标...

Linux 下海量文件删除方法效率对比,最慢的竟然是 rm

Linux下海量文件删除方法效率对比,本次参赛选手一共6位,分别是:rm、find、findwithdelete、rsync、Python、Perl.首先建立50万个文件$testfor...

Python 开发工程师必会的 5 个系统命令操作库

当我们需要编写自动化脚本、部署工具、监控程序时,熟练操作系统命令几乎是必备技能。今天就来聊聊我在实际项目中高频使用的5个系统命令操作库,这些可都是能让你效率翻倍的"瑞士军刀"。一...

Python常用文件操作库使用详解(python文件操作选项)

Python生态系统提供了丰富的文件操作库,可以处理各种复杂的文件操作需求。本教程将介绍Python中最常用的文件操作库及其实际应用。一、标准库核心模块1.1os模块-操作系统接口主要功能...

11. 文件与IO操作(文件io和网络io)

本章深入探讨Go语言文件处理与IO操作的核心技术,结合高性能实践与安全规范,提供企业级解决方案。11.1文件读写11.1.1基础操作...

Python os模块的20个应用实例(python中 import os模块用法)

在Python中,...