百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

MySQL之慢查询日志分析_数据库慢查询日志

itomcoil 2025-09-11 21:05 6 浏览

一、慢查询设置与测试

1、慢查询介绍

  • MySQL的慢查询,全名是慢查询日志,是MySQL提供的一种日志记录,用来记录在MySQL中响应时间超过阈值的语句。
  • 默认情况下,MySQL数据库并不启动慢查询日志,需要手动来设置这个参数。如果不是调优需要的话,一般不建议启动该参数,因为开启慢查询日志会或多或少带来一定的性能影响。慢查询日志支持将日志记录写入文件和数据库表。


2、慢查询参数

执行下面的语句


mysql> show variables like '%slow_query_log%';
+---------------------+------------------------------+
| Variable_name 			| Value 											 |
+---------------------+------------------------------+
| slow_query_log 			| ON 													 |
| slow_query_log_file | /var/lib/mysql/test-slow.log |
+---------------------+------------------------------+
  
mysql> show variables like '%long_query%';
+-----------------+-----------+
| Variable_name 	| Value 		|
+-----------------+-----------+
| long_query_time | 10.000000 |
+-----------------+-----------+


MySQL 慢查询的相关参数解释:

  • slow_query_log:是否开启慢查询日志, ON(1) 表示开启,OFF(0) 表示关闭。
  • slow-query-log-fifile:新版(5.6及以上版本)MySQL数据库慢查询日志存储路径。
  • long_query_time: 慢查询阈值,当查询时间多于设定的阈值时,记录日志。


3、慢查询配置方式

1. 默认情况下slow_query_log的值为OFF,表示慢查询日志是禁用的


mysql> show variables like '%slow_query_log%';
+---------------------+------------------------------+
| Variable_name 			| Value 											 |
+---------------------+------------------------------+
| slow_query_log 			| ON 													 |
| slow_query_log_file | /var/lib/mysql/test-slow.log |
+---------------------+------------------------------+


2. 可以通过设置slow_query_log的值来开启

mysql> set global slow_query_log=1;


3. 使用 set global slow_query_log=1 开启了慢查询日志只对当前数据库生效,MySQL重启后则会失效。如果要永久生效,就必须修改配置文件my.cnf(其它系统变量也是如此)


-- 编辑配置
vim /etc/my.cnf

-- 添加如下内容
slow_query_log =1
slow_query_log_file=/var/lib/mysql/zhang-slow.log

-- 重启MySQL
service mysqld restart

mysql> show variables like '%slow_query%';
+---------------------+--------------------------------+
| Variable_name 			| Value 												 |
+---------------------+--------------------------------+
| slow_query_log 			| ON 														 |
| slow_query_log_file | /var/lib/mysql/zhang-slow.log |
+---------------------+--------------------------------+


4. 那么开启了慢查询日志后,什么样的SQL才会记录到慢查询日志里面呢? 这个是由参数long_query_time 控制,默认情况下long_query_time的值为10秒。


mysql> show variables like 'long_query_time';
+-----------------+-----------+
| Variable_name 	| Value 		|
+-----------------+-----------+
| long_query_time | 10.000000 |
+-----------------+-----------+
  
mysql> set global long_query_time=1;
Query OK, 0 rows affected (0.00 sec)

mysql> show variables like 'long_query_time';
+-----------------+-----------+
| Variable_name 	| Value 		|
+-----------------+-----------+
| long_query_time | 10.000000 | 
+-----------------+-----------+


5. 修改了变量long_query_time,但是查询变量long_query_time的值还是10,难道没有修改到呢?

注意:使用命令 set global long_query_time=1 修改后,需要重新连接或新开一个会话才能看到修改值。


mysql> show variables like 'long_query_time';
+-----------------+----------+
| Variable_name 	| Value 	 |
+-----------------+----------+
| long_query_time | 1.000000 |
+-----------------+----------+


6. log_output 参数是指定日志的存储方式。 log_output='FILE' 表示将日志存入文件,默认值是'FILE'。 log_output='TABLE' 表示将日志存入数据库,这样日志信息就会被写入到mysql.slow_log 表中。


mysql> SHOW VARIABLES LIKE '%log_output%';
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| log_output 		| FILE 	|
+---------------+-------+

MySQL数据库支持同时两种日志存储方式,配置的时候以逗号隔开即可,如:log_output='FILE,TABLE'。日志记录到系统的专用日志表中,要比记录到文件耗费更多的系统资源,因此对于需要启用慢查询日志,又需要能够获得更高的系统性能,那么建议优先记录到文件。


7. 系统变量
log-queries-not-using-indexes
:未使用索引的查询也被记录到慢查询日志中(可选项)。如果调优的话,建议开启这个选项。


mysql> show variables like 'log_queries_not_using_indexes';
+-------------------------------+-------+
| Variable_name 								| Value |
+-------------------------------+-------+
| log_queries_not_using_indexes | OFF 	|
+-------------------------------+-------+
  
mysql> set global log_queries_not_using_indexes=1;
Query OK, 0 rows affected (0.00 sec)

mysql> show variables like 'log_queries_not_using_indexes';
+-------------------------------+-------+
| Variable_name 								| Value |
+-------------------------------+-------+
| log_queries_not_using_indexes | ON 	|
+-------------------------------+-------+


3、慢查询测试

1. 执行 test_index.sql 脚本,监控慢查询日志内容


[root@localhost mysql]# tail -f /var/lib/mysql/zhang-slow.log
/usr/sbin/mysqld, Version: 5.7.30-log (MySQL Community Server (GPL)). started
with:
Tcp port: 0 Unix socket: /var/lib/mysql/mysql.sock
Time Id Command Argument


2. 执行下面的SQL,执行超时 (超过1秒) 我们去查看慢查询日志


SELECT * FROM test_index WHERE
hobby = '20009951' OR hobby = '10009931' OR hobby = '30009931'
OR dname = 'name4000' OR dname = 'name6600' ;


3. 日志内容

我们得到慢查询日志后,最重要的一步就是去分析这个日志。我们先来看下慢日志里到底记录了哪些内容。

如下图是慢日志里其中一条SQL的记录内容,可以看到有时间戳,用户,查询时长及具体的SQL等信息。


Time Id Command Argument
# Time: 2022-02-23 T03:55:15. 336037Z
# User@Host: root[root] @ localhost [] Id: 6
# Query_time: 2.375219 Lock_time: 0.000137 Rows_sent: 3 Rows_examined: 5000000
use db4;
SET timestamp=1645588515;
SELECT * FROM test_index WHERE hobby = '20009961' OR hobby = '10009941' OR
hobby = '30009961' OR dname = 'name4001' OR dname = 'name6601';


  • Time: 执行时间
  • Users: 用户信息
  • Query_time: 查询时长
  • Lock_time: 等待锁时长
  • Rows_sent: 结果行统计数量
  • Rows_examined: 扫描的行数
  • 具体的SQL语句信息


二、慢查询SQL优化思路

1、SQL性能下降的原因

在日常的运维过程中,经常会遇到DBA将一些执行效率较低的SQL发过来找开发人员分析,当我们拿到这个SQL语句之后,在对这些SQL进行分析之前,需要明确可能导致SQL执行性能下降的原因进行分析,执行性能下降可以体现在以下两个方面:

1)、等待时间长

锁表导致查询一直处于等待状态,后续我们从MySQL锁的机制去分析SQL执行的原理

2)、执行时间长

1.查询语句写的烂

2.索引失效

3.关联查询太多join

4.服务器调优及各个参数的设置

2、慢查询优化思路

1. 优先选择优化高并发执行的SQL,因为高并发的SQL发生问题带来后果更严重。


比如下面两种情况:

SQL1: 每小时执行10000次, 每次20个IO 优化后每次18个IO,每小时节省2万次IO

SQL2: 每小时10次,每次20000个IO,每次优化减少2000个IO,每小时节省2万次IO

SQL2更难优化,SQL1更好优化.但是第一种属于高并发SQL,更急需优化 成本更低


2. 定位优化对象的性能瓶颈(在优化之前了解性能瓶颈在哪)

在去优化SQL时,选择优化分方向有三个:
1.IO(数据访问消耗的了太多的时间,查看是否正确使用了索引) ,
2.CPU(数据运算花费了太多时间, 数据的运算分组 排序是不是有问题)
3.网络带宽(加大网络带宽)

3. 明确优化目标

需要根据数据库当前的状态

数据库中与该条SQL的关系

当前SQL的具体功能

最好的情况消耗的资源,最差情况下消耗的资源,优化的结果只有一个给用户一个好的体验

4. 从explain执行计划入手

只有explain能告诉你当前SQL的执行状态

5. 永远用小的结果集驱动大的结果集

小的数据集驱动大的数据集,减少内层表读取的次数
类似于嵌套循环
for(int i = 0; i < 5; i++){
  for(int i = 0; i < 1000; i++){
  }
}
如果小的循环在外层,对于数据库连接来说就只连接5次,进行5000次操作。
如果1000在外,则需要进行1000次数据库连接,从而浪费资源,增加消耗,这就是为什么要小表驱动大表。

6. 尽可能在索引中完成排序

排序操作用的比较多,order by 后面的字段如果在索引中,索引本来就是排好序的,所以速度很快,没有 索引的话,就需要从表中拿数据,在内存中进行排序,如果内存空间不够还会发生落盘操作


7. 只获取自己需要的列

不要使用select * ,select * 很可能不走索引,而且数据量过大


8. 只使用最有效的过滤条件

误区 where后面的条件越多越好,但实际上是应该用最短的路径访问到数据


9. 尽可能避免复杂的join和子查询


每条SQL的JOIN操作 建议不要超过三张表

将复杂的SQL, 拆分成多个小的SQL 单个表执行,获取的结果 在程序中进行封装

如果join占用的资源比较多,会导致其他进程等待时间变长


10. 合理设计并利用索引

如何判定是否需要创建索引?

1.较为频繁的作为查询条件的字段应该创建索引。

2.唯一性太差的字段不适合单独创建索引,即使频繁作为查询条件.(唯一性太差的字段主要是指哪

些呢?如状态字段,类型字段等等这些字段中的数据可能总共就是那么几个几十个数值重复使用)(当一条Query所返回的数据超过了全表的15%的时候,就不应该再使用索引扫描来完成这个Query了)。

3.更新非常频繁的字段不适合创建索引.(因为索引中的字段被更新的时候,不仅仅需要更新表中的

数据,同时还要更新索引数据,以确保索引信息是准确的)。

4.不会出现在WHERE子句中的字段不该创建索引。

如何选择合适索引?

1.对于单键索引,尽量选择针对当前Query过滤性更好的索引。

2.选择联合索引时,当前Query中过滤性最好的字段在索引字段顺序中排列要靠前。

3.选择联合索引时,尽量索引字段出现在w中比较多的索引。

相关推荐

python数据分析中你必须知道的陷阱和技巧

数据分析是一门既有趣又有挑战的技能,它可以帮助我们从海量的数据中提取有价值的信息,为决策提供支持。但是,数据分析也不是一件轻松的事情,它需要我们掌握一定的编程、统计、可视化等知识,同时也要注意避免一些...

python常见五大坑及避坑指南_python解决什么问题

python是一门非常流行和强大的编程语言,但是也有一些容易让初学者或者不熟悉的人掉入的坑。这里列举了一些python常见五大坑,以及如何避免或者解决它们。缩进问题。python使用缩进来表示代码块,...

收藏!2022年国家职业资格考试时间表公布

人社部14日公布2022年度专业技术人员职业资格考试工作计划,包括中小学生教师资格、会计师、精算师、建造师等各项考试日期。其中,证券期货基金业从业人员资格各次考试地点不同,具体安排以相关行业协会考试公...

苹果mac系统必须安装python3_macbook安装python3.7

苹果mac系统必须安装python3苹果mac系统口碑很好,但不能像linux系统一样同时提供python2和python3环境,对程序员来说是非常不友善的。资深程序员都知道,Python3才是P...

通过python实现猴子吃桃问题_python小猴子吃桃的问题

1、问题描述:猴子第一天摘下若干个桃子,当即吃了一半,还不过瘾,又多吃了一个,第二天早上又将剩下的桃子吃掉一半,又多吃了一个。以后每天早上都吃了前一天剩下的一半零一个。到第10天早上想再吃时,就只剩...

python 中的第一个 hello world 程序输出

程序运行:print("helloworld")我使用的是Python程序3.7.0版本介绍下print概念print字面意思打印,将文本输出内容打印出来输入:print(&...

持久化 Python 会话:实现数据持久化和可重用性

Midjourney生成R语言会话持久化熟悉或常用R语言进行数据分析/数据挖掘/数据建模的数据工作者可能对R语言的会话保存和会话恢复印象比较深刻,它可以将当前session会话持久化保存,以便分...

如何将Python算法模型注册成Spark UDF函数实现全景模型部署

背景Background对于算法业务团队来说,将训练好的模型部署成服务的业务场景是非常常见的。通常会应用于三个场景:部署到流式程序里,比如风控需要通过流式处理来实时监控。部署到批任务中部署成API服...

Python 字典l转换成 JSON_python转化字典

本文需要5分钟。如果对您有用可以点赞评论关注.Python字典到JSONJSON(JavaScriptObjectNotation)是一种轻量级的数据交换格式,它基于ECMAScrip...

[python] 基于PyOD库实现数据异常检测

PyOD是一个全面且易于使用的Python库,专门用于检测多变量数据中的异常点或离群点。异常点是指那些与大多数数据点显著不同的数据,它们可能表示错误、噪声或潜在的有趣现象。无论是处理小规模项目还是大型...

总结90条写Python程序的建议_python写程序的步骤

  1.首先  建议1、理解Pythonic概念—-详见Python中的《Python之禅》  建议2、编写Pythonic代码  (1)避免不规范代码,比如只用大小写区分变量、使用容易...

ptrade系列第六天:持久化处理2_持久化的三种状态

前一次跟大家分享了利用pickle进行策略数据的持久化。但是这种方式有个问题,就是保存下来的数据无法很直观的看到,比较不方便,所以今天给大家带来另一种方式,将数据通过json保存。importjso...

Python数据持久化:JSON_python的json用法

编程派微信号:codingpy上周更新的《ThinkPython2e》第14章讲述了几种数据持久化的方式,包括dbm、pickle等,但是考虑到篇幅和读者等因素,并没有将各种方式都列全。本文将介绍...

干货 | 如何利用Python处理JSON格式的数据,建议收藏

作者:俊欣来源:关于数据分析与可视化JSON数据格式在我们的日常工作中经常会接触到,无论是做爬虫开发还是一般的数据分析处理,今天,小编就来分享一下当数据接口是JSON格式时,如何进行数据处理进行详...

Python中Pyyaml模块的使用_python模块介绍

一、YAML是什么YAML是专门用来写配置文件的语言,远比JSON格式方便。YAML语言的设计目标,就是方便人类读写。YAML是一种比XML和JSON更轻的文件格式,也更简单更强大,它可以通过缩进来表...