orderBy 排序优化-猿圈-程序猿的知识社区

在日常的业务开发中，order by 排序是少不了的。但要写出高效的排序SQL，需要先花点精力和时间来了解排序的底层原理，这样才能找到优化排序的好策略。

orderBy排序优化.png

排序的方式

index（索引排序，性能最佳）

尽可能使用索引字段来排序

filesort（文件排序）

2.1 双路排序

MySQL4.1 之前的版本，通过两次扫描磁盘，最终得到数据
先从磁盘中读取行指针和 order by 列，并对它们进行排序，然后扫描已经排好序的列表，按照列表中的值重新从列表中读出（再一次从磁盘中读），要对磁盘进行两次扫描，I\O是很耗时的。

2.2 单路排序

MySQL4.1 之后，增加的更优排序算法
从磁盘读取查询需要的所有列，按照order by列在buffer（缓冲区）对它们进行排序，然后扫描排序后的列表进行输出
它的效率要更快一些，避免了第二次读取数据（从磁盘读）并且把随机I\O变成了顺序I\O
但是它会使用过多空间，因为它把每一行都保存在内存中了

不足：
在sort_buffer中，单路算法比双路算法要多占用很多空间
因为单路算法是把所有字段都取出，所以有可能取出的数据总大小超出了 sort_buffer（MySQL会给每个线程分配一块内存用于排序） 的容量，导致每次只能取 sort_buffer 容量大小的数据，进行排序（创建tmp文件，多路合并），排完再取出
sort_buffer容量太小，再排......从而多次I\O操作
本想着省一次I\O操作，反而导致了大量的I\O操作，反而得不偿失。

使用单路排序满足的条件：
1. 查询语句所取出的字段类型大小总和要小于 max_length_for_sort_data
2. 排序字段中不包含text和blob类型

优化策略

order by时，只query需要的字段

1. 当query的字段大小总和小于max_length_for_sort_data，而且排序字段不是TEXT｜BLOB类型，会使用单路排序算法，否则使用多路排序算法
2. 两种算法的数据都有可能超出sort_buffer的容量，超出之后，创建tmp文件进行合并排序，导致多次的I\O，但是使用单路排序的风险更大，所以要提高sort_buffer_size

尝试提高sort_buffer_size

不管使用哪种算法，提高这个参数都会提高效率
要根据系统的自身能力去提高，因为这个参数是针对每个进程的

尝试提高max_length_for_sort_data

提高这个参数，会增加用改进算法的概率。
但如果设置得太高，数据总容量超出sort_buffer_size的概率会增大，明显症状是高的磁盘I\O活动和低的处理器使用率

实例

数据表

*************************** ***************************
       Table: user
Create Table: CREATE TABLE `user` (
  `id` int(10) unsigned NOT NULL AUTO_INCREMENT,
  `name` varchar(20) NOT NULL,
  `age` int(10) NOT NULL DEFAULT '0',
  `city` varchar(20) NOT NULL,
  `addr` varchar(50) DEFAULT NULL,
  PRIMARY KEY (`id`),
  KEY `idx_name_age_city` (`name`,`age`,`city`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_0900_ai_ci

order by能使用索引最左前缀

* select id,name,age,city from user order by name;
* select id,name,age,city from user order by name,age,city;
* explain select id,name,age,city from user order by name desc,age desc,city desc;

Orderby 排序优化

如果where使用索引的最左前缀定义为常量，则order by 能使用索引

* select * from user where name = 'zhangsan' order by age,city;
* select * from user where name = 'zhangsan' and age = 20 order by city;
* select * from user where name = 'zhangsan' and age > 20 order by age,city;

Orderby 排序优化

不能使用索引进行排序

select * from user order by name,age,city;//query*字段
select * from user order by addr;//非索引字段排序
select * from user order by name,addr;//含有非索引字段
select * from user where age = 20 order by city;//跳过了name字段，违反最左前缀法则
select * from user where name = 'zhangsan' order by city;//跳过了age字段，违反最左前缀法则
select * from user where name = 'zhangsan' order by age,addr;//含有非索引字段

Orderby 排序优化

菜单 学习猿地 - LMONKEY

开通学习猿地VIP

尊享10项VIP特权 持续新增

知识通关挑战

打卡带练！告别无效练习

接私单赚外块

VIP优先接，累计金额超百万

学习猿地私房课免费学

大厂实战课仅对VIP开放

你的一对一导师

每月可免费咨询大牛30次

领取更多软件工程师实用特权

Java开发工程师

何以解忧，唯有 Java！

Python开发工程师

人生苦短我要学Python！

PHP开发工程师

PHP是世界上最好的编程语言!

GO开发工程师

想优雅的写程序，赶紧GO!

大数据开发工程师

弄大数据，就是在搞革命!

前端开发工程师

不仅最好，而且最全!

UI开发工程师

这个世界从来不缺少美，缺少你来创造美!

Linux运维工程师

不只是说说而已！

WEB前端1+X

不仅为考证，轻松做开发

计算机二级（C语言）

一切只为考证！

猿工手册

各种工具精挑细选

猿材料

各种工具精挑细选

猿代码

各种工具精挑细选

猿著课件

各种工具精挑细选

知识题库

知识闯关节节高，刷题涨知识！

阶段练习

单元测试知识学习状况秒掌握！

期末考试

期末测试，学习情况即刻知道！

面试题库

最新的企业技术人员招聘真题练习！

Java专区

2948篇 ｜ 24.5万人浏览

Python专区

2593篇 ｜ 19.5万人浏览

大数据专区

2948篇 ｜ 18.5万人浏览

PHP专区

3953篇 ｜ 27.5万人浏览

Go专区

1382篇 ｜ 12.5万人浏览

Web前端专区

1453篇 ｜ 31.5万人浏览

Linux云计算

1230篇 ｜ 4.5万人浏览

其他专区

53232篇文章 ｜ 11.5万人浏览

搜索

历史记录 清除记录

近期热搜

项目开发全程实录（电商EW_Shop）

8676 人 1年前

轻松学会Laravel-项目篇（商城API）

2022 人 1年前

Python数据分析2.0-金融

325 人 1年前

Python办公自动化2.0

241 人 1年前

使用账号登录

启用更安全省心的  微信登录

Java开发工程师

何以解忧，唯有 Java！

Python开发工程师

菜单学习猿地 - LMONKEY

尊享10项VIP特权持续新增

2948篇｜ 24.5万人浏览

2593篇｜ 19.5万人浏览

2948篇｜ 18.5万人浏览

3953篇｜ 27.5万人浏览

1382篇｜ 12.5万人浏览

1453篇｜ 31.5万人浏览

1230篇｜ 4.5万人浏览

53232篇文章｜ 11.5万人浏览

历史记录清除记录

2948篇｜ 24.5万人浏览

2593篇｜ 19.5万人浏览

2948篇｜ 18.5万人浏览

3953篇｜ 27.5万人浏览

1382篇｜ 12.5万人浏览

1453篇｜ 31.5万人浏览

1230篇｜ 4.5万人浏览

53232篇文章｜ 11.5万人浏览