OB小优系列文章 | 聚合类相关子查询提升(上)

  • 时间:
  • 浏览:0
  • 来源:uu快3注册_uu快3官网

在下一篇文章中,大家会介绍JA改写第二式,它不需要 很好的处理以上这个个多 大疑问。

OB 君分析了这两张表的具体情况,不禁感叹这家影院业绩果然不错。他向 S 君解释道:你的影院效益太好,PLAY 表里排片有 10K+ ,每个排片有的是算一次电影的平均售价,影院总共也就上映了400场电影,票却售出了5M 张,平均每部电影就售出了 400 K 张票,这麼 这条查询逻辑上要访问 10K * 400K = 4000 M 不需要 算出结果,一分钟为什么我么我会 将会算得出结果。X 君请求 OB 君帮个忙改进一下这条查询。OB 君祭出了一招:JA改写第一式,写下了查询Q2。

S 君仔细分析 Q1,发现这条查询是针对PLAY中的每一行,都需要去执行一次TICKETS上的聚合查询 Q3(其中 ?的取值由P.film决定)。

使用子查询可不不需要 让用户简洁明了地写出含义清晰的复杂性SQL励志的话 。这个功能对用户而言是非常友好的,之后 对数据库而言是很不友好的。从数据库宽度而言,处理子查询是相对低效的。为了改进子查询的处理,数据库系统通常会尝试改写SQL,消除子查询。业务中常见的子查询涵盖以下几种:

— 加入OceanBase钉钉互动群:搜索群号21949783

当 S 君执行这条查询的之前 ,发现等了一分钟都这麼 获得结果。万分焦急的 S 君向经验丰沛 的 OB 君求助:为哪些这麼 简单的查询执行的这麼 慢?

非常欢迎有志于让中国的政府和企业用上中国人另一方的通用商业数据库的同学加入大家,并肩为实现这个目标而并肩努力!发送简历到 OceanBase-Public@list.alibaba-inc.com,大家等的就遇见你!

S 君开了一家影院,生意红火。某一天,S 君想进一步改善影院的业绩,我让你知道哪些场次票价相对偏低。

OB小优系列(一):OceanBase查询优化器的设计之道和工程实践

OB小优系列(二):OceanBase并行执行引擎实现OB小优系列(三):OceanBase查询改写的最佳实践

JA 改写第一式不需要 很有效的提升聚合类子查询的处理速率。但它并有的是有有六个 劲适用的。通常大家认为它有有有六个 主要的局限性:

OceanBase 九年如一日,不忘初心,砥砺前行,致力于实现一有有六个 中国人全版自主设计的分布式通用数据库系统,打破西方大厂在商业数据库领域的绝对垄断地位。时至今日,OceanBase 将会成功应用于蚂蚁金服的交易、支付、账务等核心系统和网商银行、印度Paytm等业务系统。

之前 ,Q2只需要将PLAY和V按照film连接,就可不不需要 快速找出哪些排片的平均售价偏低了。从 Q1 -> Q2 的改写是将一有有六个 聚合类的相关子查询改写成了一次分组(GROUP BY) + 一次连接(JOIN)。改写后的查询预期需要扫描PLAY表和TICKETS表各一次,总计 5M + 行的记录;最后执行一次 400 : 10K 的内连接。相对于原始查询 4000 M+ 的预期数据访问量,执行速率会有巨大的提升。若果这两张表上有film字段的索引,这麼 还能利用索引加速聚合和连接的运算速率。

— 想了解更多OceanBase肩上的技术秘密?

在这个场景中, film 的取值数量不用说多。根据 film 的取值不同,Q3 实际生成的不同查询不需要 400 个。但这个 400 个参数不同的查询却会被反复执行 10K+ 次。OB 君给的优化措施是:用一有有六个 分组查询提前算出所有影片的平均售价,之前 主查询需要使用不同的统计值时,可不不需要 直接从提前计算的结果中获得。Q2 中的视图 V 实现了这个效果,它只需要扫描一遍 TICKETS 表就可不不需要 获得所有电影的平均售价。

可不不需要 就看,改写后的 SQL 在计划选者上有了更大空间。原始的 Q1 查询中,大家不需要 利用主查询中的 PLAY 来驱动子查询的计算,本质上是一有有六个 NEST LOOP JOIN 的过程。在改写后,大家可不不需要 采用更多的 JOIN 的算法,甚至可不不需要 利用子查询提升产生的视图来驱动主查询中的表进行连接。

OB 君发现这条查询是一有有六个 “聚合类相关子查询”(简称为 JA 子查询,Join Aggregation)。类式查询的主要特征是:用户使用一有有六个 相关的子查询来计算一有有六个 统计值,之后 利用该统计值来对主查询的结果进行过滤。

SPJ 相关子查询的处理难度是高于非相关查询的。而比前者更加复杂性的一类查询是:聚合类相关子查询。本系列文章重点介绍类式子查询的改写机制(简称为 JA 改写)。

为此,S 君写了下面这条查询。他用一有有六个 子查询统计了一部电影的平均售价,之后 找出定价偏低的排片场次哪些。PLAY表记录所有电影的排片信息;TICKETS 表记录了所有的售票信息。

OB君:查询优化器是关系数据库系统的核心模块,也是衡量整个数据库系统心智心智心智成熟期 期期是什么图片 的句子的句子 度的“试金石”。OceanBase的查询优化器历经了九年多时间的磨练,逐步提炼出一套独有的工程实践哲学。本系列文章将重点介绍聚合类相关子查询的改写机制,欢迎探讨~

传送门:

— 想与蚂蚁金服OceanBase的技术专家深入交流?