MYSQL(学习笔记)
<div>深分页怎么优化?</div> <div>还是以上面的SQL为空:select * from xxx order by id limit 500000, 10;</div> <div>方法一:</div> <div>从上面的分析可以看出,当offset非常大时,server层会从引擎层获取到很多无用的数据,而当select后面是*号时,就需要拷贝完整的行信息,拷贝完整数据相比只拷贝行数据里的其中一两个列字段更耗费时间。</div> <div>因为前面的offset条数据最后都是不要的,没有必要拷贝完整字段,所以可以将sql语句修改成:</div> <div>select * from xxx where id >=(select id from xxx order by id limit 500000, 1) order by id limit 10;</div> <div>先执行子查询 select id from xxx by id limit 500000, 1, 这个操作,其实也是将在innodb中的主键索引中获取到500000+1条数据,然后server层会抛弃前500000条,只保留最后一条数据的id。</div> <div>但不同的地方在于,在返回server层的过程中,只会拷贝数据行内的id这一列,而不会拷贝数据行的所有列,当数据量较大时,这部分的耗时还是比较明显的。</div> <div>在拿到了上面的id之后,假设这个id正好等于500000,那sql就变成了</div> <div>select * from xxx where id >=500000 order by id limit 10;</div> <div>这样innodb再走一次主键索引,通过B+树快速定位到id=500000的行数据,时间复杂度是lg(n),然后向后取10条数据。</div> <div>方法二:</div> <div>将所有的数据根据id主键进行排序,然后分批次取,将当前批次的最大id作为下次筛选的条件进行查询。</div> <div>select * from xxx where id > start_id order by id limit 10;</div> <div>通过主键索引,每次定位到start_id的位置,然后往后遍历10个数据,这样不管数据多大,查询性能都较为稳定。</div>