mysql offset 的数不能太大_mysql查询时，offset过大影响性能的缘由与优化方法

307 阅读 0 评论 203 点赞

我是靠谱客的博主热情火，这篇文章主要介绍mysql offset 的数不能太大_mysql查询时，offset过大影响性能的缘由与优化方法，现在分享给大家，希望可以做个参考。

mysql查询使用select命令，配合limit，offset参数能够读取指定范围的记录。本文将介绍mysql查询时，offset过大影响性能的缘由及优化方法。

php

准备测试数据表及数据

1.建立表mysql

CREATE TABLE `member` (

`id` int(10) unsigned NOT NULL AUTO_INCREMENT,

`name` varchar(10) NOT NULL COMMENT '姓名',

`gender` tinyint(3) unsigned NOT NULL COMMENT '性别',

PRIMARY KEY (`id`),

KEY `gender` (`gender`)

) ENGINE=InnoDB DEFAULT CHARSET=utf8;

2.插入1000000条记录web

$pdo = new PDO("mysql:host=localhost;dbname=user","root",'');for($i=0; $i<1000000; $i++){

$name = substr(md5(time().mt_rand(000,999)),0,10);

$gender = mt_rand(1,2);

$sqlstr = "insert into member(name,gender) values('".$name."','".$gender."')";

$stmt = $pdo->prepare($sqlstr);

$stmt->execute();

}

mysql> select count(*) from member;

+----------+

| count(*) |

+----------+

| 1000000 |

+----------+

1 row in set (0.23 sec)

3.当前数据库版本sql

mysql> select version();

+-----------+

| version() |

+-----------+

| 5.6.24 |

+-----------+

1 row in set (0.01 sec)

分析offset过大影响性能的缘由

1.offset较小的状况数据库

mysql> select * from member where gender=1 limit 10,1;

+----+------------+--------+

| id | name | gender |

+----+------------+--------+

| 26 | 509e279687 | 1 |

+----+------------+--------+

1 row in set (0.00 sec)

mysql> select * from member where gender=1 limit 100,1;

+-----+------------+--------+

| id | name | gender |

+-----+------------+--------+

| 211 | 07c4cbca3a | 1 |

+-----+------------+--------+

1 row in set (0.00 sec)

mysql> select * from member where gender=1 limit 1000,1;

+------+------------+--------+

| id | name | gender |

+------+------------+--------+

| 1975 | e95b8b6ca1 | 1 |

+------+------------+--------+

1 row in set (0.00 sec)

当offset较小时，查询速度很快，效率较高。

2.offset较大的状况svg

mysql> select * from member where gender=1 limit 100000,1;

+--------+------------+--------+

| id | name | gender |

+--------+------------+--------+

| 199798 | 540db8c5bc | 1 |

+--------+------------+--------+

1 row in set (0.12 sec)

mysql> select * from member where gender=1 limit 200000,1;

+--------+------------+--------+

| id | name | gender |

+--------+------------+--------+

| 399649 | 0b21fec4c6 | 1 |

+--------+------------+--------+

1 row in set (0.23 sec)

mysql> select * from member where gender=1 limit 300000,1;

+--------+------------+--------+

| id | name | gender |

+--------+------------+--------+

| 599465 | f48375bdb8 | 1 |

+--------+------------+--------+

1 row in set (0.31 sec)

当offset很大时，会出现效率问题，随着offset的增大，执行效率降低。

性能

分析影响性能缘由

select * from member where gender=1 limit 300000,1;

由于数据表是InnoDB，根据InnoDB索引的结构，查询过程为：测试

经过二级索引查到主键值(找出全部gender=1的id)。

再根据查到的主键值经过主键索引找到相应的数据块(根据id找出对应的数据块内容)。

根据offset的值，查询300001次主键索引的数据，最后将以前的300000条丢弃，取出最后1条。

不过既然二级索引已经找到主键值，为何还须要先用主键索引找到数据块，再根据offset的值作偏移处理呢？优化

若是在找到主键索引后，先执行offset偏移处理，跳过300000条，再经过第300001条记录的主键索引去读取数据块，这样就能提升效率了。ui

若是咱们只查询出主键，看看有什么不一样

mysql> select id from member where gender=1 limit 300000,1;

+--------+

| id |

+--------+

| 599465 |

+--------+

1 row in set (0.09 sec)

很明显，若是只查询主键，执行效率对比查询所有字段，有很大的提高。

推测

只查询主键的状况

由于二级索引已经找到主键值，而查询只须要读取主键，所以mysql会先执行offset偏移操做，再根据后面的主键索引读取数据块。

须要查询全部字段的状况

由于二级索引只找到主键值，但其余字段的值须要读取数据块才能获取。所以mysql会先读出数据块内容，再执行offset偏移操做，最后丢弃前面须要跳过的数据，返回后面的数据。

证明

InnoDB中有buffer pool，存放最近访问过的数据页，包括数据页和索引页。

为了测试，先把mysql重启，重启后查看buffer pool的内容。

mysql> select index_name,count(*) from information_schema.INNODB_BUFFER_PAGE where INDEX_NAME in('primary','gender') and TABLE_NAME like '%member%' group by index_name;

Empty set (0.04 sec)

能够看到，重启后，没有访问过任何的数据页。

查询全部字段，再查看buffer pool的内容

mysql> select * from member where gender=1 limit 300000,1;

+--------+------------+--------+

| id | name | gender |

+--------+------------+--------+

| 599465 | f48375bdb8 | 1 |

+--------+------------+--------+

1 row in set (0.38 sec)

mysql> select index_name,count(*) from information_schema.INNODB_BUFFER_PAGE where INDEX_NAME in('primary','gender') and TABLE_NAME like '%member%' group by index_name;

+------------+----------+

| index_name | count(*) |

+------------+----------+

| gender | 261 |

| PRIMARY | 1385 |

+------------+----------+

2 rows in set (0.06 sec)

能够看出，此时buffer pool中关于member表有1385个数据页，261个索引页。

重启mysql清空buffer pool，继续测试只查询主键

mysql> select id from member where gender=1 limit 300000,1;

+--------+

| id |

+--------+

| 599465 |

+--------+

1 row in set (0.08 sec)

mysql> select index_name,count(*) from information_schema.INNODB_BUFFER_PAGE where INDEX_NAME in('primary','gender') and TABLE_NAME like '%member%' group by index_name;

+------------+----------+

| index_name | count(*) |

+------------+----------+

| gender | 263 |

| PRIMARY | 13 |

+------------+----------+

2 rows in set (0.04 sec)

能够看出，此时buffer pool中关于member表只有13个数据页，263个索引页。所以减小了屡次经过主键索引访问数据块的I/O操做，提升执行效率。

所以能够证明，mysql查询时，offset过大影响性能的缘由是屡次经过主键索引访问数据块的I/O操做。(注意，只有InnoDB有这个问题，而MYISAM索引结构与InnoDB不一样，二级索引都是直接指向数据块的，所以没有此问题 )。

InnoDB与MyISAM引擎索引结构对比图