概述
mysql查询使用select命令,配合limit,offset参数能够读取指定范围的记录。本文将介绍mysql查询时,offset过大影响性能的缘由及优化方法。
php
准备测试数据表及数据
1.建立表mysql
CREATE TABLE `member` (
`id` int(10) unsigned NOT NULL AUTO_INCREMENT,
`name` varchar(10) NOT NULL COMMENT '姓名',
`gender` tinyint(3) unsigned NOT NULL COMMENT '性别',
PRIMARY KEY (`id`),
KEY `gender` (`gender`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;
2.插入1000000条记录web
$pdo = new PDO("mysql:host=localhost;dbname=user","root",'');for($i=0; $i<1000000; $i++){
$name = substr(md5(time().mt_rand(000,999)),0,10);
$gender = mt_rand(1,2);
$sqlstr = "insert into member(name,gender) values('".$name."','".$gender."')";
$stmt = $pdo->prepare($sqlstr);
$stmt->execute();
}
?>
mysql> select count(*) from member;
+----------+
| count(*) |
+----------+
| 1000000 |
+----------+
1 row in set (0.23 sec)
3.当前数据库版本sql
mysql> select version();
+-----------+
| version() |
+-----------+
| 5.6.24 |
+-----------+
1 row in set (0.01 sec)
分析offset过大影响性能的缘由
1.offset较小的状况数据库
mysql> select * from member where gender=1 limit 10,1;
+----+------------+--------+
| id | name | gender |
+----+------------+--------+
| 26 | 509e279687 | 1 |
+----+------------+--------+
1 row in set (0.00 sec)
mysql> select * from member where gender=1 limit 100,1;
+-----+------------+--------+
| id | name | gender |
+-----+------------+--------+
| 211 | 07c4cbca3a | 1 |
+-----+------------+--------+
1 row in set (0.00 sec)
mysql> select * from member where gender=1 limit 1000,1;
+------+------------+--------+
| id | name | gender |
+------+------------+--------+
| 1975 | e95b8b6ca1 | 1 |
+------+------------+--------+
1 row in set (0.00 sec)
当offset较小时,查询速度很快,效率较高。
2.offset较大的状况svg
mysql> select * from member where gender=1 limit 100000,1;
+--------+------------+--------+
| id | name | gender |
+--------+------------+--------+
| 199798 | 540db8c5bc | 1 |
+--------+------------+--------+
1 row in set (0.12 sec)
mysql> select * from member where gender=1 limit 200000,1;
+--------+------------+--------+
| id | name | gender |
+--------+------------+--------+
| 399649 | 0b21fec4c6 | 1 |
+--------+------------+--------+
1 row in set (0.23 sec)
mysql> select * from member where gender=1 limit 300000,1;
+--------+------------+--------+
| id | name | gender |
+--------+------------+--------+
| 599465 | f48375bdb8 | 1 |
+--------+------------+--------+
1 row in set (0.31 sec)
当offset很大时,会出现效率问题,随着offset的增大,执行效率降低。
性能
分析影响性能缘由
select * from member where gender=1 limit 300000,1;
由于数据表是InnoDB,根据InnoDB索引的结构,查询过程为:测试
经过二级索引查到主键值(找出全部gender=1的id)。
再根据查到的主键值经过主键索引找到相应的数据块(根据id找出对应的数据块内容)。
根据offset的值,查询300001次主键索引的数据,最后将以前的300000条丢弃,取出最后1条。
不过既然二级索引已经找到主键值,为何还须要先用主键索引找到数据块,再根据offset的值作偏移处理呢?优化
若是在找到主键索引后,先执行offset偏移处理,跳过300000条,再经过第300001条记录的主键索引去读取数据块,这样就能提升效率了。ui
若是咱们只查询出主键,看看有什么不一样
mysql> select id from member where gender=1 limit 300000,1;
+--------+
| id |
+--------+
| 599465 |
+--------+
1 row in set (0.09 sec)
很明显,若是只查询主键,执行效率对比查询所有字段,有很大的提高。
推测
只查询主键的状况
由于二级索引已经找到主键值,而查询只须要读取主键,所以mysql会先执行offset偏移操做,再根据后面的主键索引读取数据块。
须要查询全部字段的状况
由于二级索引只找到主键值,但其余字段的值须要读取数据块才能获取。所以mysql会先读出数据块内容,再执行offset偏移操做,最后丢弃前面须要跳过的数据,返回后面的数据。
证明
InnoDB中有buffer pool,存放最近访问过的数据页,包括数据页和索引页。
为了测试,先把mysql重启,重启后查看buffer pool的内容。
mysql> select index_name,count(*) from information_schema.INNODB_BUFFER_PAGE where INDEX_NAME in('primary','gender') and TABLE_NAME like '%member%' group by index_name;
Empty set (0.04 sec)
能够看到,重启后,没有访问过任何的数据页。
查询全部字段,再查看buffer pool的内容
mysql> select * from member where gender=1 limit 300000,1;
+--------+------------+--------+
| id | name | gender |
+--------+------------+--------+
| 599465 | f48375bdb8 | 1 |
+--------+------------+--------+
1 row in set (0.38 sec)
mysql> select index_name,count(*) from information_schema.INNODB_BUFFER_PAGE where INDEX_NAME in('primary','gender') and TABLE_NAME like '%member%' group by index_name;
+------------+----------+
| index_name | count(*) |
+------------+----------+
| gender | 261 |
| PRIMARY | 1385 |
+------------+----------+
2 rows in set (0.06 sec)
能够看出,此时buffer pool中关于member表有1385个数据页,261个索引页。
重启mysql清空buffer pool,继续测试只查询主键
mysql> select id from member where gender=1 limit 300000,1;
+--------+
| id |
+--------+
| 599465 |
+--------+
1 row in set (0.08 sec)
mysql> select index_name,count(*) from information_schema.INNODB_BUFFER_PAGE where INDEX_NAME in('primary','gender') and TABLE_NAME like '%member%' group by index_name;
+------------+----------+
| index_name | count(*) |
+------------+----------+
| gender | 263 |
| PRIMARY | 13 |
+------------+----------+
2 rows in set (0.04 sec)
能够看出,此时buffer pool中关于member表只有13个数据页,263个索引页。所以减小了屡次经过主键索引访问数据块的I/O操做,提升执行效率。
所以能够证明,mysql查询时,offset过大影响性能的缘由是屡次经过主键索引访问数据块的I/O操做。(注意,只有InnoDB有这个问题,而MYISAM索引结构与InnoDB不一样,二级索引都是直接指向数据块的,所以没有此问题 )。
InnoDB与MyISAM引擎索引结构对比图
优化方法
根据上面的分析,咱们知道查询全部字段会致使主键索引屡次访问数据块形成的I/O操做。
所以咱们先查出偏移后的主键,再根据主键索引查询数据块的全部内容便可优化。
mysql> select a.* from member as a inner join (select id from member where gender=1 limit 300000,1) as b on a.id=b.id;
+--------+------------+--------+
| id | name | gender |
+--------+------------+--------+
| 599465 | f48375bdb8 | 1 |
+--------+------------+--------+
1 row in set (0.08 sec)
最后
以上就是热情火为你收集整理的mysql offset 的数不能太大_mysql查询时,offset过大影响性能的缘由与优化方法的全部内容,希望文章能够帮你解决mysql offset 的数不能太大_mysql查询时,offset过大影响性能的缘由与优化方法所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复