MySQL 5.7 与 8.0 的对比分析

功能对比

NoSQL支持:

MySQL 从 5.7 版本开始提供 NoSQL 存储功能,在 8.0 版本中这部分功能也得到了更大的改进。

JSON:

MySQL 8 大幅改进了对 JSON 的支持,添加了基于路径查询参数从 JSON 字段中抽取数据的 JSON_EXTRACT() 函数,以及用于将数据分别组合到 JSON 数组和对象中的 JSON_ARRAYAGG() 和 JSON_OBJECTAGG() 聚合函数。

  • Varchar VS JSON:
    • 大家都应该知道,在没有JSON数据类型时,还不是一样可以使用varchar类型或text类型来存储就JSON格式的字符串,那么,JSON格式到底哪些“过人”之处呢?好处还真不少呢。
    • JSON数据类型,会自动校验数据是否为JSON格式,如果不是JSON格式数据,则会报错。
    • MySQL提供了一组操作JSON数据的内置函数。
    • 优化的存储格式,存储在JSON列中的JSON数据被转换成内部的存储格式。其允许快速读取。
    • 可以修改特定的键值,(如果之前在MySQL中存储过JSON格式字符串的小伙伴,应该经历过每次修改一个值,都要将整个JSON字符串更新一遍的尴尬。)

窗口函数:

从 MySQL 8.0 开始,新增了一个叫窗口函数的概念,它可以用来实现若干新的查询方式。

窗口函数与 SUM()、COUNT() 这种集合函数类似,但它不会将多行查询结果合并为一行,而是将结果放回多行当中。即窗口函数不需要 GROUP BY。

隐藏索引:

在 MySQL 8.0 中,索引可以被“隐藏”和“显示”。当对索引进行隐藏时,它不会被查询优化器所使用,我们可以使用这个特性用于性能调试。

在创建完索引后,我们先将其隐藏,然后观察其对数据库的影响。如果数据库性能有所下降,说明这个索引是有用的,然后将其“恢复显示”即可。如果数据库性能看不出变化,说明这个索引是多余的,可以考虑删掉。

降序索引:

MySQL 8.0 为索引提供按降序方式进行排序的支持,在这种索引中的值也会按降序的方式进行排序。

通用表表达式式(Common Table Expressions CTE):

在复杂的查询中使用嵌入式表时,使用 CTE 使得查询语句更清晰。

UTF-8 编码:

从 MySQL 8 开始,使用 utf8mb4 作为 MySQL 的默认字符集。

支持表 DDL 的原子性:

InnoDB 现在支持表 DDL 的原子性,也就是 InnoDB 表上的 DDL 也可以实现事务完整性,要么失败回滚,要么成功提交,不至于出现 DDL 时部分成功的问题,此外还支持 crash-safe 特性,元数据存储在单个事务数据字典中。

支持 crash-safe 特性:

元数据存储在单个事务数据字典中。

高可用性:

InnoDB 集群为数据库提供集成的原生 HA 解决方案。

caching_sha2_password 身份验证插件:

caching_sha2_password是MySQL 8.0中的默认身份验证插件,替换了mysql 5.7的mysql_native_password,身份验证安全性能提升。

授权

与帐户管理相关的授权语法略有差异:

MySQL5.7创建用户和用户授权命令可以同时执行

grant all privileges on . to 'Gary'@'%' identified by 'Gary@2019'

MySQL8.0创建用户和用户授权的命令需要分开执行

创建用户

create user 'Gary'@'%' identified by 'Gary@2019';

用户授权【给予所有权限】

grant all privileges on . to 'Gary'@'%'

性能对比

根据官方说法,MySQL 8 要比 MySQL 5.7 快 2 倍。

性能提升主要集中在三个领域:

  • 读写工作负载
  • I/O密集型工作负载
  • 热点竞争问题工作负载。

以下几张图,是腾讯团队测试的MySQL 5.7 与 8.0 的对比分析数据,可以作为参考。

当线程数量增加时,MySQL 8.0明显优于MySQL 5.7!

降序索引

MySQL 8.0 降序索引 避免了“filesort”,显著提升了读取性能。

在8.0版本中,影响MySQL读取性能的重要新增支持是:可以按降序(或正向索引扫描)创建索引的能力。从语法上,MySQL 4就支持了降序索引,但正如官方文档所言,”they are parsed but ignored”,实际创建的还是升序索引。 以前的版本只有升序或 反向索引扫描,如果需要降序,MySQL必须执行filesort(如果需要filesort,需要检查max_length_for_sort_data的值)。当最有效的扫描顺序混合某些列的升序和其他列的降序时,降序索引还使优化器可以使用多列索引。 如果只对单个列进行排序,降序索引的意义不是太大,无论是升序还是降序,升序索引完全可以应付。如果一个查询,需要对多个列进行排序,且顺序要求不一致。在这种场景下,要想避免数据库额外的排序-“filesort”,最好的方法就是使用降序索引。

避免隐式排序

由于降序索引的引入,MySQL 8.0再也不会对group by操作进行隐式排序。

参考文献: