百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

mysql进阶系列:基础架构_mysql底层架构

itomcoil 2025-09-11 21:06 5 浏览

mysql进阶系列第一篇

如果能够清楚知道的架构图以及各个组件之间的关联,会有助于深入理解mysql,如下是其的架构图

图中可以看出mysql分为service层和存储引擎层:

service层包含了mysql大多数核心功能,除了图中标注的连接器,查询缓存,分析器,优化器,执行器,还有所有的内置函数(日期,时间,数学和加密函数),所有跨存储引擎的功能都在这一层实现:存储过程、触发器、视图等。

存储引擎层负责mysql中数据的存储和提取。和Linux下的各种文件系统一样,每个存储引擎都有自己的优势和劣势,各种存储引擎通过提供API和service层对接,通过API屏蔽各种存储引擎之间的差异。常见的存储引擎有InnoDB、MyISAM、Memory,现在最常用的是InnoDB,也是从mysql5.5版本开始成为默认的存储引擎,在5.5之前默认的是MyISAM



1. 连接器

连接器是mysql service层的第一个模块,也是处理客户端请求的模块。

客户端和服务端的连接是使用经典的tcp协议,经过tcp握手之后,连接器开始进行身份验证

登录命令

mysql -h$ip -P$port -u$user -p
  • 如果账号或者密码错误,会提示Access denied for user
  • 如果正确则认证通过,之后会查询当前用户的权限,之后用户的操作都是在这个权限范围中,如果在连接期间修改权限也是无效的,需要重新连接才会生效。

如下命令也是可以的,但是这种命令会把密码暴露出来,建议还是使用如上图方式,采用交互交互输入密码更安全

mysql -h$ip -P$port -u$user -p$password

2. 查询缓存

了解即可,mysql8.0版本就去除缓存模块了

客户端发送一个sql查询请求后,会先去缓存中查看是否存在。如果之前这条sql已经执行过,而且结果缓存起来,那么这次查询就会直接从缓存中获取结果返回,不会在走分析器,优化器,执行器。如果缓存中没有命中,才会继续走后面的模块。

缓存以key-value的形式存储,存放在一个引用表中,key是通过一个哈希值的引用,这个哈希值包括查询本身(sql),当前要查询的数据库,客户端协议的版本等一些其他会影响返回结果的的信息;查询结果作为value(任何字符上的变化,例如空格,注释都会导致缓存不命中)。

如果表被更改,所有的缓存都将失效,表的更改是指数据的改变和表结构的改变,包括INSERT、UPDATE、 DELETE、TRUNCATE、ALTER TABLE、DROP TABLE或DROP DATABASE等。

对于经常变更的数据库来说缓存命中率就很低了 ,查询缓存往往弊大于利,所以不建议使用mysql的缓存,而对于长时间不变化的表可以使用redis缓存。mysql在8.0就完全去掉查询缓存模块了。

3. 分析器

我们根据mysql语法写出来一个sql之后交给服务层,分析器对sql语句进行词法分析和语法分析。

Mysql通过识别字符串中列名、表名、where、select/update/insert 等mysql关键字,再根据语法规则判断sql是否满足语法,最终会生成一个抽象语法树(AST)。

mysql分析器使用mysql语法规则验证和解析查询,例如验证是否使用错误的关键字或者使用关键字的顺序是否正确,再或者会验证引号是否能前后正确匹配。

如果关键字有误会提示You have an error in your SQL syntax的信息,具体错误需要关注use near后的内容

mysql> elect * from iam_user where id = 0;
ERROR 1064 (42000): You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'elect * from iam_user where id = 0' at line 1

4. 优化器

经过分析器生成的语法树被认为是合法的,并由优化器转化成执行计划

mysql判断出了这条sql需要做什么之后,对其进行各种优化,包括重写查询,决定表的读取顺序,以及选择合适的索引等。

mysql使用基于成本的优化的优化器,尝试预测一个查询使用某种执行计划时的成本,选择最小的那一个。

例如表中有多个索引的时候决定使用哪一个;使用联合索引的时候,会根据所以调整where条件的顺序;

如果想知道优化器是怎么进行优化决策的,可以通过explain获取优化的信息,explain具体的使用和解释后面章节会说明的。

5. 执行器

调用存储引擎的API操作数据

优化器完成sql的优化后,提供一个执行计划给执行器,执行器开始执行这个执行计划来操作数据。

执行查询阶段:mysql只是简单地根据执行计划给出的指令逐步执行,通过调用存储引擎实现的接口来完成的。

总结:用一个sql的执行过程来总结下

  • 客户端发送一条查询给服务器。
  • 服务器先检查查询缓存,如果命中缓存则直接返回缓存中的结果。否则进入下一阶段。
  • 服务器进行sql解析,预处理,再由优化器生成执行计划。
  • mysql根据执行计划,调用存储引擎的API来执行查询。
  • 将结果返回给客户端。




MySQL高级相关更多内容,如锁,MVCC,读写分离,分库分表等还在持续更新中,如果有想了解的内容也可以给我留言,欢迎关注催更。

我是阿纪,用输出倒逼输入而持续学习,持续分享技术系列文章,以及全网值得收藏的好文,欢迎关注,一起做一个持续成长的技术人。

相关推荐

python数据分析中你必须知道的陷阱和技巧

数据分析是一门既有趣又有挑战的技能,它可以帮助我们从海量的数据中提取有价值的信息,为决策提供支持。但是,数据分析也不是一件轻松的事情,它需要我们掌握一定的编程、统计、可视化等知识,同时也要注意避免一些...

python常见五大坑及避坑指南_python解决什么问题

python是一门非常流行和强大的编程语言,但是也有一些容易让初学者或者不熟悉的人掉入的坑。这里列举了一些python常见五大坑,以及如何避免或者解决它们。缩进问题。python使用缩进来表示代码块,...

收藏!2022年国家职业资格考试时间表公布

人社部14日公布2022年度专业技术人员职业资格考试工作计划,包括中小学生教师资格、会计师、精算师、建造师等各项考试日期。其中,证券期货基金业从业人员资格各次考试地点不同,具体安排以相关行业协会考试公...

苹果mac系统必须安装python3_macbook安装python3.7

苹果mac系统必须安装python3苹果mac系统口碑很好,但不能像linux系统一样同时提供python2和python3环境,对程序员来说是非常不友善的。资深程序员都知道,Python3才是P...

通过python实现猴子吃桃问题_python小猴子吃桃的问题

1、问题描述:猴子第一天摘下若干个桃子,当即吃了一半,还不过瘾,又多吃了一个,第二天早上又将剩下的桃子吃掉一半,又多吃了一个。以后每天早上都吃了前一天剩下的一半零一个。到第10天早上想再吃时,就只剩...

python 中的第一个 hello world 程序输出

程序运行:print("helloworld")我使用的是Python程序3.7.0版本介绍下print概念print字面意思打印,将文本输出内容打印出来输入:print(&...

持久化 Python 会话:实现数据持久化和可重用性

Midjourney生成R语言会话持久化熟悉或常用R语言进行数据分析/数据挖掘/数据建模的数据工作者可能对R语言的会话保存和会话恢复印象比较深刻,它可以将当前session会话持久化保存,以便分...

如何将Python算法模型注册成Spark UDF函数实现全景模型部署

背景Background对于算法业务团队来说,将训练好的模型部署成服务的业务场景是非常常见的。通常会应用于三个场景:部署到流式程序里,比如风控需要通过流式处理来实时监控。部署到批任务中部署成API服...

Python 字典l转换成 JSON_python转化字典

本文需要5分钟。如果对您有用可以点赞评论关注.Python字典到JSONJSON(JavaScriptObjectNotation)是一种轻量级的数据交换格式,它基于ECMAScrip...

[python] 基于PyOD库实现数据异常检测

PyOD是一个全面且易于使用的Python库,专门用于检测多变量数据中的异常点或离群点。异常点是指那些与大多数数据点显著不同的数据,它们可能表示错误、噪声或潜在的有趣现象。无论是处理小规模项目还是大型...

总结90条写Python程序的建议_python写程序的步骤

  1.首先  建议1、理解Pythonic概念—-详见Python中的《Python之禅》  建议2、编写Pythonic代码  (1)避免不规范代码,比如只用大小写区分变量、使用容易...

ptrade系列第六天:持久化处理2_持久化的三种状态

前一次跟大家分享了利用pickle进行策略数据的持久化。但是这种方式有个问题,就是保存下来的数据无法很直观的看到,比较不方便,所以今天给大家带来另一种方式,将数据通过json保存。importjso...

Python数据持久化:JSON_python的json用法

编程派微信号:codingpy上周更新的《ThinkPython2e》第14章讲述了几种数据持久化的方式,包括dbm、pickle等,但是考虑到篇幅和读者等因素,并没有将各种方式都列全。本文将介绍...

干货 | 如何利用Python处理JSON格式的数据,建议收藏

作者:俊欣来源:关于数据分析与可视化JSON数据格式在我们的日常工作中经常会接触到,无论是做爬虫开发还是一般的数据分析处理,今天,小编就来分享一下当数据接口是JSON格式时,如何进行数据处理进行详...

Python中Pyyaml模块的使用_python模块介绍

一、YAML是什么YAML是专门用来写配置文件的语言,远比JSON格式方便。YAML语言的设计目标,就是方便人类读写。YAML是一种比XML和JSON更轻的文件格式,也更简单更强大,它可以通过缩进来表...