被MySQL慢日志查询搞废了?3分钟教你快速定位慢查询问题
itomcoil 2025-09-11 21:06 5 浏览
一条慢查询会造成什么后果?刚开始使用MySQL的开发、初级DBA 以为就是简单的查询变慢些,体验稍微有一丢丢影响,殊不知,慢查询的破坏力远不止如此。业务高峰期,这头SQL还没处理完,大量新的查询请求堆积,CPU使用率长时间居高不下,甚至高达100%,系统直接崩溃……慢查询这样的黑天鹅事件,可能直接影响业务稳定性,造成巨大经济损失。
慢查询,字面理解就是查询慢的意思,比如某类查询,正常情况下消耗100ms 左右,异常时可能飙升到 15s。为定位慢查询问题,我们可以按如下几个步骤进行:
一、开启慢日志;
二、使用慢日志查询分析管理工具;
三、基于已有的慢日志分析,对系统本身做优化(如查询语句或表结构设计方面)。
一、启用慢日志,定位异常
慢日志默认情况下是不开启的,如果需要对SQL做优化,可以开启这个功能。登陆 MySQL 后,执行如下 SQL 语句即可开启慢日志(这里以MySQL 5.7.33 为例 ,其它版本基本通用):
SET GLOBAL slow_query_log = 'ON';
-- 未使用索引的查询也认为是一个可能的慢查询
set global
log_queries_not_using_indexes = 'ON';
一般情况下,MySQL 慢日志位于 /var/lib/mysql/<host-name>-slow.log,我们可以模拟一个慢查询,然后即可看到慢日志记录产生:
-- 手动触发一个慢查询:MySQL默认认为,一个大于 10s 的查询就是慢查询
SELECT sleep(11);
看下慢查询日志:
$ sudo cat /var/lib/mysql/ubt-server-slow.log
/usr/sbin/mysqld, Version: 5.7.33-0ubuntu0.18.04.1 ((Ubuntu)). started with:
Tcp port: 3306 Unix socket: /var/run/mysqld/mysqld.sock
# Time: 2021-03-12T08:52:54.227174Z
# User@Host: df-test[df-test] @ [10.100.64.118] Id: 2
# Query_time: 11.000551 Lock_time: 0.000000 Rows_sent: 1 Rows_examined: 0
use number1;
SET timestamp=1615539174;
select sleep(11);
从该日志中,我们能看到如下几个信息(根据不同的 MySQL 版本或者配置,这些信息可能有增减):
o 产生时间:
2021-03-12T08:52:54.227174Zo 来源:df-test[df-test] @ [10.100.64.118],即用户 df-test 在 10.100.64.118 这个机器上执行了这个查询
o 查询统计:如消耗的时间,发送/接收的行数
o 具体的 SQL 语句
从这些信息中,我们可以比较清晰地知道这个慢查询的来龙去脉,比较精确地定位具体的业务代码。但这里有个问题,为保障MySQL数据库安全,MySQL要求只有登录到具体服务器才能看到慢查询日志详情,这直接影响到对异常出现时的处理效率,拖累异常地位、分析和解决的进度。
除开启系统自带的慢日志之外,还有什么有效的方式能让开发人员快速、直接且准确地解决这个问题?
二、使用MySQL 慢日志分析工具
常用的对慢SQL做优化的分析工具有:mysqldumpslow、mysqlsla、mysql-explain-slow-log、mysql-log-filter、myprofi。
这里以mysqldumpslow和mysql-log-filter为例。
mysqldumpslow
mysqldumpslow是官方提供的慢查询日志分析工具。主要功能包括统计不同慢 sql 的
o 出现次数(Count)
o 执行耗费的平均时间和累计总耗费时间(Time)
o 等待锁耗费的时间(Lock)
o 发送给客户端的行总数(Rows)
o 扫描的行总数(Rows)
o 用户以及 SQL 语句本身(抽象了一下格式,比如 limit 1, 20 用 limit N,N 表示)
可参考:《4.6.9 mysqldumpslow-汇总慢查询日志文件》
https://dev.mysql.com/doc/refman/8.0/en/mysqldumpslow.html
mysql-log-filter
google code 上找到的一个分析工具,提供了 python 和 php 两种可执行的脚本。基本功能比官方的 mysqldumpslow 多了查询时间的统计信息(平均、最大、累计),其他类似。特色功能除了统计信息外,针对输出内容做了排版和格式化,保证整体输出的简洁。推荐给喜欢简洁报表的朋友。
可参考:
http://code.google.com/p/mysql-log-filter/
其他几款工具,这里就不再赘述,有兴趣的朋友可以直接从网上搜一下。上面介绍的这些工具,多多少少会有一些使用上的小问题,要么数据缺失,要么配置麻烦,诸如此类。下面介绍一下一站式数据监测云平台(DataFlux) 的解决方案。
DataFlux方案
如前所述,慢日志具有很大的破坏力,为进一步实现MySQL 数据库性能优化,我们需要解决如下几个问题:
o 数据采集
o 数据解析
o 数据存储
o 数据展示以及查询
在 DataFlux 中有专用于各种数据采集的工具——DataKit。针对 MySQL,它提供了各种 MySQL 日志的采集能力。这里我们介绍下 DataKit 采集器在 Linux 平台的基本使用。
首先,我们登录DataFlux官网注册并登录会员账号,接着可按照下图(控制台-管理-数据网关),或参考链接2找到并安装DataKit。
参考链接:
1. DataFlux官网:https://www.dataflux.cn/
2.《DataKit安装》:
https://help.dataflux.cn/doc/0c6ebce225784bd2ad994d5f89c5dbc89e025792#toc34
安装好 DataKit 后,在
/usr/local/cloudcare/dataflux/datakit/conf.d/log/ 目录下,复制一份 MySQL 日志采集配置
$ sudo cp mysqlog.conf.sample mysqlog.conf
编辑 mysqlog.conf:
[[inputs.tailf]]
# 填写各种 MySQL 日志的文件路径,不同版本可能不同
# 注意,这里只支持文本文件。我们这里使用的版本是 MySQL 5.7.33
logfiles = [
"/var/lib/mysql/*.log",
"/var/log/mysql/mysql.log",
"/var/log/mysql/error.log",
]
source = "mysqlog"
# 指定服务名
service = "mysqlog"
# 专用的日志解析脚本(DataKit 已经内置了)
pipeline = "mysql.p"
[inputs.tailf.tags]
# 这里可以添加一些标签,比如:
biz = "订单系统"
# 省略其它默认配置...
至此,MySQL 的日志采集就配置好了,重新启动一下 DataKit 的即可(数据需要稍等一会才能在 Dataflux 平台看到)
参考链接:《DataKit不同系统的重启方式》
https://help.dataflux.cn/doc/0c6ebce225784bd2ad994d5f89c5dbc89e025792#toc27
接下来,我们就能在 DataFlux 平台看到对应的日志了:
从图中我们可以看到,SQL 的执行时间(query_time)已经提取出来了,就是上文慢日志中看到的时间。沿着这条日志,点进去,即可看到日志详情:
从日志详情图中,我们可以看到红框标记的慢查询 SQL 语句,另外还有其它提取出来的日志信息,比如查询时间、来源、服务器主机名、请求发送的数据行数等信息。
除此之外,我们在拉出来的日志详情中,还可看到当前这台主机在慢日志产生的那个时间点附近(红色虚竖线)的资源占用情况(诸如 CPU、内存、磁盘、网络等信息),在一定程度上能帮助开发人员更好的解决问题。
至此,我们解决了 MySQL 慢日志的采集、解析以及展示问题。现在数据已经有了,开发人员就能方便的在网页上找到对应的慢查询日志,并且综合 MySQL 服务器的整体资源占用情况,给出更加合理的解决方案。
以上便是今天我们针对MySQL慢日志查询问题,提供的几种解决办法。在实际应用过程中,我们还是要多尝试不同维度的解决方案,并结合自身所处行业、业务等特点,挑选适合自己和团队使用的数据库分析工具,保障系统和业务的稳定。
相关推荐
- python数据分析中你必须知道的陷阱和技巧
-
数据分析是一门既有趣又有挑战的技能,它可以帮助我们从海量的数据中提取有价值的信息,为决策提供支持。但是,数据分析也不是一件轻松的事情,它需要我们掌握一定的编程、统计、可视化等知识,同时也要注意避免一些...
- python常见五大坑及避坑指南_python解决什么问题
-
python是一门非常流行和强大的编程语言,但是也有一些容易让初学者或者不熟悉的人掉入的坑。这里列举了一些python常见五大坑,以及如何避免或者解决它们。缩进问题。python使用缩进来表示代码块,...
- 收藏!2022年国家职业资格考试时间表公布
-
人社部14日公布2022年度专业技术人员职业资格考试工作计划,包括中小学生教师资格、会计师、精算师、建造师等各项考试日期。其中,证券期货基金业从业人员资格各次考试地点不同,具体安排以相关行业协会考试公...
- 苹果mac系统必须安装python3_macbook安装python3.7
-
苹果mac系统必须安装python3苹果mac系统口碑很好,但不能像linux系统一样同时提供python2和python3环境,对程序员来说是非常不友善的。资深程序员都知道,Python3才是P...
- 通过python实现猴子吃桃问题_python小猴子吃桃的问题
-
1、问题描述:猴子第一天摘下若干个桃子,当即吃了一半,还不过瘾,又多吃了一个,第二天早上又将剩下的桃子吃掉一半,又多吃了一个。以后每天早上都吃了前一天剩下的一半零一个。到第10天早上想再吃时,就只剩...
- python 中的第一个 hello world 程序输出
-
程序运行:print("helloworld")我使用的是Python程序3.7.0版本介绍下print概念print字面意思打印,将文本输出内容打印出来输入:print(&...
- 持久化 Python 会话:实现数据持久化和可重用性
-
Midjourney生成R语言会话持久化熟悉或常用R语言进行数据分析/数据挖掘/数据建模的数据工作者可能对R语言的会话保存和会话恢复印象比较深刻,它可以将当前session会话持久化保存,以便分...
- 如何将Python算法模型注册成Spark UDF函数实现全景模型部署
-
背景Background对于算法业务团队来说,将训练好的模型部署成服务的业务场景是非常常见的。通常会应用于三个场景:部署到流式程序里,比如风控需要通过流式处理来实时监控。部署到批任务中部署成API服...
- Python 字典l转换成 JSON_python转化字典
-
本文需要5分钟。如果对您有用可以点赞评论关注.Python字典到JSONJSON(JavaScriptObjectNotation)是一种轻量级的数据交换格式,它基于ECMAScrip...
- [python] 基于PyOD库实现数据异常检测
-
PyOD是一个全面且易于使用的Python库,专门用于检测多变量数据中的异常点或离群点。异常点是指那些与大多数数据点显著不同的数据,它们可能表示错误、噪声或潜在的有趣现象。无论是处理小规模项目还是大型...
- 总结90条写Python程序的建议_python写程序的步骤
-
1.首先 建议1、理解Pythonic概念—-详见Python中的《Python之禅》 建议2、编写Pythonic代码 (1)避免不规范代码,比如只用大小写区分变量、使用容易...
- ptrade系列第六天:持久化处理2_持久化的三种状态
-
前一次跟大家分享了利用pickle进行策略数据的持久化。但是这种方式有个问题,就是保存下来的数据无法很直观的看到,比较不方便,所以今天给大家带来另一种方式,将数据通过json保存。importjso...
- Python数据持久化:JSON_python的json用法
-
编程派微信号:codingpy上周更新的《ThinkPython2e》第14章讲述了几种数据持久化的方式,包括dbm、pickle等,但是考虑到篇幅和读者等因素,并没有将各种方式都列全。本文将介绍...
- 干货 | 如何利用Python处理JSON格式的数据,建议收藏
-
作者:俊欣来源:关于数据分析与可视化JSON数据格式在我们的日常工作中经常会接触到,无论是做爬虫开发还是一般的数据分析处理,今天,小编就来分享一下当数据接口是JSON格式时,如何进行数据处理进行详...
- Python中Pyyaml模块的使用_python模块介绍
-
一、YAML是什么YAML是专门用来写配置文件的语言,远比JSON格式方便。YAML语言的设计目标,就是方便人类读写。YAML是一种比XML和JSON更轻的文件格式,也更简单更强大,它可以通过缩进来表...
- 一周热门
- 最近发表
- 标签列表
-
- ps图案在哪里 (33)
- super().__init__ (33)
- python 获取日期 (34)
- 0xa (36)
- super().__init__()详解 (33)
- python安装包在哪里找 (33)
- linux查看python版本信息 (35)
- python怎么改成中文 (35)
- php文件怎么在浏览器运行 (33)
- eval在python中的意思 (33)
- python安装opencv库 (35)
- python div (34)
- sticky css (33)
- python中random.randint()函数 (34)
- python去掉字符串中的指定字符 (33)
- python入门经典100题 (34)
- anaconda安装路径 (34)
- yield和return的区别 (33)
- 1到10的阶乘之和是多少 (35)
- python安装sklearn库 (33)
- dom和bom区别 (33)
- js 替换指定位置的字符 (33)
- python判断元素是否存在 (33)
- sorted key (33)
- shutil.copy() (33)