百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

mysql表(mysql表连接)

itomcoil 2025-04-08 15:13 27 浏览

Innodb存储引擎表类型

在innodb存储引擎表中,每张表都有个主键,如果在创建表时没有显示地定义主键,则innodb存储引擎会按如下方式选择或创建主键

1.首先表中是否有非空的唯一索引(uni not null)如果有则该列即为主键.

2.不符合上述条件,innodb存储引擎自动创建一个6个字节大小的指针.

Innodb存储引擎的逻辑存储结构和oracle大致相同,所有数据都被逻辑地存放在一个空间中,我们称之为表空间tablespace.表空间又由段segment,区extent,页page组成.

段的介绍

表空间是由各个段组成,常见的段有数据段,索引段,回滚段.innodb存储引擎表是索引组织的,因此数据即索引,索引即数据.

那么数据段即为B+树的叶节点(leaf node segment),索引段即为B+树的非页节点(non-leaf node segment)

Innodb存储引擎对于段的管理是由引擎本身完成,简化了DBA的管理

区的介绍

区是由64个连续的页组成,每个页大小为16kb,即每个区大小为1MB.对于大数据段,innodb存储引擎最多每次可以申请4个区.以此来保证数据的顺序性能。

页的介绍

同大多数数据库一样,innodb有页page的概念,页是innodb磁盘管理的最小单位.

常见的页类型有:

1.数据页(B-tree node)

2.Undo页(undo log page)

3.系统页(system page)

4.事务数据页(transaction system page)

5.插入缓冲位图页(insert buffer bitmap)

6.插入缓冲空闲列表页(insert buffer free list)

7.未压缩的二进制大对象页

8.压缩的二进制大对象页

页头 (页相关的指针以及checksum) 页body (真正的数据) 页尾(存放相关checksum的值)

行的介绍

Innodb存储引擎是面向行的,也就是说数据的存放按行进行存放,每个页存放的行记录也是有定义的,最多可存放7992行.面向行(row-oriented)的数据库.

也有面向列的数据库,mysql infobright存储引擎就是按列来存放数据的,这对于数据仓库下的分析类sql语句的执行以及数据压缩很有好处.

4中格式

Compact Row Format

  • 默认格式,大多数情况下使用。
  • 适用于大多数应用,能够高效地存储和读取数据。
  • 采用 不压缩 的方式存储数据,但通过对 NULL 值、短文本列进行优化,能达到合理的存储效率。
  • 写入性能较高,因为没有额外的压缩和解压缩开销。

Dynamic Row Format

  • 适用于存储 变长列(如 VARCHAR、TEXT 等) 时,能够更有效地使用存储空间。
  • 当列数据较大时,它将不再存储数据在行中,而是将数据存储在一个外部页面(off-page)中,只在行中存储数据的指针,这样可以节省存储空间。
  • 提供更高的 灵活性,特别是在数据量较大的列(例如 TEXT 类型)上。
  • 空间效率高于 Compact 格式,尤其是对于变长数据。

TPS 每秒钟 事务的处理 QPS 每秒种查询的处理

1.datetimp 时间格式

2.char varchar 一个是定长 一个可变长度 (不能同时存在)


3.查看库中表的相关信息

select * from TABLES\G;

触发收集统计信息的方式(确保在执行sql查询时能走最优的执行计划)

1.访问information_schema.table 会收集

2.数据库重启

3.show table status

*************************** 540. row ***************************
  TABLE_CATALOG: def
   TABLE_SCHEMA: performance_schema
     TABLE_NAME: innodb_redo_log_files
     TABLE_TYPE: BASE TABLE
         ENGINE: PERFORMANCE_SCHEMA
        VERSION: 10
     ROW_FORMAT: Dynamic
     TABLE_ROWS: 2
 AVG_ROW_LENGTH: 0
    DATA_LENGTH: 0
MAX_DATA_LENGTH: 0
   INDEX_LENGTH: 0
      DATA_FREE: 0
 AUTO_INCREMENT: NULL
    CREATE_TIME: 2025-03-10 11:12:18
    UPDATE_TIME: NULL
     CHECK_TIME: NULL
TABLE_COLLATION: utf8mb3_general_ci
       CHECKSUM: NULL
 CREATE_OPTIONS: 
  TABLE_COMMENT: 
540 rows in set (0.04 sec)

如何统计表的大小

SELECT 
    table_schema AS `Database Name`, 
    table_name AS `Table Name`, 
    ROUND(SUM(data_length) / 1024 / 1024, 2) AS `Data Size (MB)`,
    ROUND(SUM(index_length) / 1024 / 1024, 2) AS `Index Size (MB)`,
    ROUND((SUM(data_length + index_length)) / 1024 / 1024, 2) AS `Total Size (MB)`
FROM 
    information_schema.tables
GROUP BY 
    table_schema, table_name
ORDER BY 
    `Total Size (MB)` DESC;

库的大小

SELECT 
    table_schema AS `Database Name`, 
    ROUND(SUM(data_length) / 1024 / 1024, 2) AS `Data Size (MB)`,
    ROUND(SUM(index_length) / 1024 / 1024, 2) AS `Index Size (MB)`,
    ROUND((SUM(data_length + index_length)) / 1024 / 1024, 2) AS `Total Size (MB)`
FROM 
    information_schema.tables
GROUP BY 
    table_schema
ORDER BY 
    `Total Size (MB)` DESC;


问题: 对于线上的表通过show table status 显示出来的行的信息 与select count(*) from table_name 不一样 这种问题是由于统计信息没有更新会影像表最优的执行计划


表碎片空间产生的原因

1.随机的方式插入新数据,可能导致辅助索引产生大量的碎片,意思是索引page和索引顺序不接近,

2.删除旧数据方式也会产生

  • 行删除后:删除的行会标记为空闲,但并不会立即回收占用的空间,导致数据页内有空闲区域未被回收,形成碎片。
  • 表空间管理:对于 InnoDB 表,每个表的数据都会存储在多个数据页中(默认情况下,每个数据页大小为 16KB)。删除的行将会“释放”数据页中的空间,但这个空间在没有新的数据行填充时,不会被回收。

更新操作

更新操作也是导致碎片的一个常见原因,尤其是对数据行大小有影响的更新(如更新 VARCHAR 字段的长度,或更新表中大字段的内容)。

  • 行扩展或缩小:在 MySQL 中,更新操作可能导致行的大小发生变化。如果一行的长度变大,InnoDB 会将其移动到新的位置,并在旧的页中留下空闲空间;如果行变小,原来占用的空间就变成了未使用的碎片,直到有其他行填充这些空间。
  • 数据行迁移:当更新导致数据行的大小改变时(例如修改了一个 VARCHAR 字段的长度),InnoDB 可能会将数据行移到另一个数据页上,而原数据页留下未使用的空间。

插入和删除的频繁交替

  • 空闲页:大量删除数据可能会留下大量的空闲页,而这些页在没有其他插入操作时无法被有效利用。
  • 未填满的数据页:如果删除的数据量大于插入的数据量,表中可能会有很多没有完全填满的数据页,从而产生碎片。

表的结构修改(如增加/删除列)

重建索引:添加、删除或修改列会导致索引的重建,可能会导致新的数据页分配,旧数据页的空间未被完全清理,形成碎片。

  • 列大小变化:某些字段的大小变化可能会影响行的整体大小,进而导致空间碎片。
  • 如何计算表中的碎片空间

    SHOW TABLE STATUS LIKE 'your_table_name';

  • Data_length:表中实际数据的字节数。
  • Index_length:表中索引的字节数。
  • Data_free:表中已分配但未使用的空间(即碎片空间)。
  • Data_free

    如何清理

    1.修改表的存储引擎 (会对表进行锁,数据从新整理且消耗cpu) 一般晚上进行操作修改 通过crontab定时任务进行处理 优点 数据的连续性比较好 全表扫描比较好

    2.删除和重建表的方式

    3 对于共享表空间使用导入导出的方式进行优化

    2.查看mysql正在运行的方式 show fulll processlists; show engine innodb status;

    相关推荐

    selenium(WEB自动化工具)

    定义解释Selenium是一个用于Web应用程序测试的工具。Selenium测试直接运行在浏览器中,就像真正的用户在操作一样。支持的浏览器包括IE(7,8,9,10,11),MozillaF...

    开发利器丨如何使用ELK设计微服务中的日志收集方案?

    【摘要】微服务各个组件的相关实践会涉及到工具,本文将会介绍微服务日常开发的一些利器,这些工具帮助我们构建更加健壮的微服务系统,并帮助排查解决微服务系统中的问题与性能瓶颈等。我们将重点介绍微服务架构中...

    高并发系统设计:应对每秒数万QPS的架构策略

    当面试官问及"如何应对每秒几万QPS(QueriesPerSecond)"时,大概率是想知道你对高并发系统设计的理解有多少。本文将深入探讨从基础设施到应用层面的解决方案。01、理解...

    2025 年每个 JavaScript 开发者都应该了解的功能

    大家好,很高兴又见面了,我是"高级前端进阶",由我带着大家一起关注前端前沿、深入前端底层技术,大家一起进步,也欢迎大家关注、点赞、收藏、转发。1.Iteratorhelpers开发者...

    JavaScript Array 对象

    Array对象Array对象用于在变量中存储多个值:varcars=["Saab","Volvo","BMW"];第一个数组元素的索引值为0,第二个索引值为1,以此类推。更多有...

    Gemini 2.5编程全球霸榜,谷歌重回AI王座,神秘模型曝光,奥特曼迎战

    刚刚,Gemini2.5Pro编程登顶,6美元性价比碾压Claude3.7Sonnet。不仅如此,谷歌还暗藏着更强的编程模型Dragontail,这次是要彻底翻盘了。谷歌,彻底打了一场漂亮的翻...

    动力节点最新JavaScript教程(高级篇),深入学习JavaScript

    JavaScript是一种运行在浏览器中的解释型编程语言,它的解释器被称为JavaScript引擎,是浏览器的一部分,JavaScript广泛用于浏览器客户端编程,通常JavaScript脚本是通过嵌...

    一文看懂Kiro,其 Spec工作流秒杀Cursor,可移植至Claude Code

    当Cursor的“即兴编程”开始拖累项目质量,AWS新晋IDEKiro以Spec工作流打出“先规范后编码”的系统工程思维:需求-设计-任务三件套一次生成,文档与代码同步落地,复杂项目不...

    「晚安·好梦」努力只能及格,拼命才能优秀

    欢迎光临,浏览之前点击上面的音乐放松一下心情吧!喜欢的话给小编一个关注呀!Effortscanonlypass,anddesperatelycanbeexcellent.努力只能及格...

    JavaScript 中 some 与 every 方法的区别是什么?

    大家好,很高兴又见面了,我是姜茶的编程笔记,我们一起学习前端相关领域技术,共同进步,也欢迎大家关注、点赞、收藏、转发,您的支持是我不断创作的动力在JavaScript中,Array.protot...

    10个高效的Python爬虫框架,你用过几个?

    小型爬虫需求,requests库+bs4库就能解决;大型爬虫数据,尤其涉及异步抓取、内容管理及后续扩展等功能时,就需要用到爬虫框架了。下面介绍了10个爬虫框架,大家可以学习使用!1.Scrapysc...

    12个高效的Python爬虫框架,你用过几个?

    实现爬虫技术的编程环境有很多种,Java、Python、C++等都可以用来爬虫。但很多人选择Python来写爬虫,为什么呢?因为Python确实很适合做爬虫,丰富的第三方库十分强大,简单几行代码便可实...

    pip3 install pyspider报错问题解决

    运行如下命令报错:>>>pip3installpyspider观察上面的报错问题,需要安装pycurl。是到这个网址:http://www.lfd.uci.edu/~gohlke...

    PySpider框架的使用

    PysiderPysider是一个国人用Python编写的、带有强大的WebUI的网络爬虫系统,它支持多种数据库、任务监控、项目管理、结果查看、URL去重等强大的功能。安装pip3inst...

    「机器学习」神经网络的激活函数、并通过python实现激活函数

    神经网络的激活函数、并通过python实现whatis激活函数感知机的网络结构如下:左图中,偏置b没有被画出来,如果要表示出b,可以像右图那样做。用数学式来表示感知机:上面这个数学式子可以被改写:...