我是靠谱客的博主 爱撒娇心锁,最近开发中收集的这篇文章主要介绍mysql数据库诊断_MySQL数据库诊断——InnoDB关机问题 【转】,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

DBA的反馈是之前在做sysbench的全update性能测试,测试完成后就关闭了数据库。但是当再重启后就发现这个现象,并且等待3,4个小时候后问题依旧。待其叙述完后,我的第一反映是srv_innodb_fast_shutdown默认值为1,在关闭是不会对change buffer进行合并操作,因此会再下次启动时进行这类操作。因为MySQL 5.5版本InnoDB存储引擎的change buffer可以使用到1/2的Buffer Pool,故可能测试时期的update操作大部分都在change buffer中完成,再次启动会导致大量的合并操作。

问题可能是定位了,然而怎么证明我的想法又是另外一个过程了。首先根据DBA的描述,我在测试服务器上进行了类似的sysbench测试,然后关闭数据库,并对数据库进行备份以便再次进行观察。当再次启动MySQL数据库后,通过命令iotop可以观察到如下的运行状态:

TotalDISK READ:32.55M/s|TotalDISK WRITE:0.00B/s

TID  PRIO  USER     DISK READ  DISK WRITE  SWAPIN     IO>COMMAND

535 be/4mysql3.26M/s0.00B/s0.00%80.88%mysqld--basedir=...

536be/4mysql29.26M/s0.00B/s0.00%71.93%mysqld--basedir=...

......

可以发现的确有两个线程的IO负载较高,但是这两个进程对应于MySQL数据库的哪两个线程就不得而知了。接着,通过命令SHOW ENGINE INNODB STATUS可以观察到如下的内容:

--------------

ROW OPERATIONS

--------------

......

Mainthread processno.535,id140593741342464,state:doing insert buffer merge

Purge thread processno.536,id140593707771648

......

这里可以看到Main thread process显示当前的状态为doing insert buffer merge,可以判断当正在处理change buffer。InnoSQL对命令SHOW ENGINE INNODB STATUS进行小小的改进,可以看到每个线程对应于Linux的进程号,也就是iotop对于的进程号,而默认只能看到对应的线程号。配置文件中启用了innodb_purge_thread=1,因此还可以看到purge线程的信息。

可以发现进行535和536就是上述iotop中IO负载较高的进程。因此问题基本已经被证实。然而通过iotop发现,purge线程的IO负载要比main线程的要高许多。这是之前没有特别注意的,虽然InnoDB快速关闭不会进行change buffer的合并操作,但是其也不会等待purge操作全部完成。而之前的测试产生了大量的undo log需要等待被purge。通过命令SHOW ENGINE INNODB STATUS发现:

------------

TRANSACTIONS

------------

Trxid counter12552900

Purgedonefortrx's n:o < ECEB125 undo n:o < 0

History list length 29572089

可以看到History list length为29 572 089,也就是说差不多有接近3000W的undo log记录。OMG,还真不少。。。不过也好理解,毕竟测试的都是update操作。

另外,还可通过类似pstack工具找出当前MySQL数据库线程调用的函数信息:

5154pthread_cond_wait,os_event_wait_low,log_write_up_to,trx_commit_complete_for_mysql,innobase_commit,ha_commit_trans,trans_commit_stmt,mysql_execute_command,mysql_parse,dispatch_command,do_handle_one_connection,handle_one_connection,start_thread(libpthread.so.0),clone(libc.so.6),??

5008libaio::??(libaio.so.1),os_aio_linux_handle,fil_aio_wait,io_handler_thread,start_thread(libpthread.so.0),clone(libc.so.6),??

1701pthread_cond_wait,os_event_wait_low,buf_flush_wait_batch_end,log_check_margins,row_upd_step,row_update_for_mysql,ha_innobase::update_row,handler::ha_update_row,mysql_update,mysql_execute_command,mysql_parse,dispatch_command,do_handle_one_connection,handle_one_connection,start_thread(libpthread.so.0),clone(libc.so.6),??

......

384pread64(libpthread.so.0),os_file_pread,os_file_read_func,os_aio_func,fil_io,buf_read_page_low,buf_read_page,buf_page_get_gen,trx_purge_rseg_get_next_history_log,trx_purge_get_next_rec,row_purge_step,que_run_threads,trx_purge,srv_purge_thread,start_thread(libpthread.so.0),clone(libc.so.6),??

273read(libpthread.so.0),my_real_read,my_net_read,do_command,do_handle_one_connection,handle_one_connection,start_thread(libpthread.so.0),clone(libc.so.6),??

......

128pread64(libpthread.so.0),os_file_pread,os_file_read_func,os_aio_func,fil_io,buf_read_page_low,buf_read_page,buf_page_get_gen,btr_cur_latch_leaves,btr_cur_search_to_nth_level,btr_pcur_restore_position_func,ibuf_restore_pos,ibuf_delete_rec,ibuf_merge_or_delete_for_page,buf_read_ibuf_merge_pages,ibuf_contract_ext,ibuf_contract_for_n_pages,srv_master_thread,start_thread(libpthread.so.0),clone(libc.so.6),??

可以看到有大量的trx_purge,ibuf_contract_for_n_pages函数调用,也就是purge和change buffer的操作。从这里也可以进一步证实之前的猜测。pstack的另一个好处是可以看到线程具体的函数调用情况,这里通过之前SHOW ENGINE INNODB STATUS得到的main线程号140593741342464(对于十六进制0x7FDE8802A700)可以看到该线程的函数调用:

Thread5(Thread0x7fde8802a700(LWP535)):

#0  0x00007fe665a1b993 in pread64 () from /lib/libpthread.so.0

#1  0x00000000009227bf in os_file_pread ()

#2  0x0000000000923156 in os_file_read_fuc ()

#3  0x0000000000925ee2 in os_aio_func ()

#4  0x00000000008eb490 in fil_io ()

#5  0x00000000008bef7a in buf_read_page_low ()

#6  0x00000000008bf488 in buf_read_page ()

#7  0x00000000008b4230 in buf_page_get_gen ()

#8  0x000000000089de3c in btr_cur_open_at_rnd_pos_func ()

#9  0x00000000008fe37f in ibuf_contract_ext ()

#10 0x00000000008fe5a0 in ibuf_contract_for_n_pages ()

#11 0x000000000086bb2e in srv_master_thread ()

#12 0x00007fe665a138ca in start_thread () from /lib/libpthread.so.0

#13 0x00007fe664573b6d in clone () from /lib/libc.so.6

#14 0x0000000000000000 in ?? ()

问题定位并被证实了。然而为什么DBA的服务器在经历了3,4个小时后还没有完成purge操作呢?最后发现DBA测试服务器的磁盘较差,而purge需要大量的离散操作,因此导致了较长的purge与merge时间。

总之,innodb_fast_shutdown默认值为1,在关闭时不进行change buffer的merge操作以及purge操作。想要下次启动时,不发生这样的现象,那么必须将innodb_fast_shutdown的值设置为0。其实也就是将merge change buffer和purge的操作时间放在了关闭数据库的时候。但是,在数据库升级或者测试环境中,可能必须要进行这样的操作。

最后

以上就是爱撒娇心锁为你收集整理的mysql数据库诊断_MySQL数据库诊断——InnoDB关机问题 【转】的全部内容,希望文章能够帮你解决mysql数据库诊断_MySQL数据库诊断——InnoDB关机问题 【转】所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(36)

评论列表共有 0 条评论

立即
投稿
返回
顶部