加入收藏 | 设为首页 | 会员中心 | 我要投稿 聊城站长网 (https://www.0635zz.com/)- 智能语音交互、行业智能、AI应用、云计算、5G!
当前位置: 首页 > 站长学院 > MsSql教程 > 正文

SQL Server联合运算符的使用和优化窍门是什么

发布时间:2023-05-24 14:12:20 所属栏目:MsSql教程 来源:
导读:这篇我们来学习和了解“SQL Server联合运算符的使用和优化技巧是什么”,下文的讲解详细,步骤过程清晰,对大家进一步学习和理解“SQL Server联合运算符的使用和优化技巧是什么”有一定的帮助。
这篇我们来学习和了解“SQL Server联合运算符的使用和优化技巧是什么”,下文的讲解详细,步骤过程清晰,对大家进一步学习和理解“SQL Server联合运算符的使用和优化技巧是什么”有一定的帮助。有这方面学习需要的朋友就继续往下看吧!
 
前言
 
上两篇文章我们介绍了查看查询计划的方式,以及一些常用的连接运算符的优化技巧,本篇我们总结联合运算符的使用方式和优化技巧。
 
废话少说,直接进入本篇的主题。
 
技术准备
 
基于SQL Server2008R2版本,利用微软的一个更简洁的案例库(Northwind)进行解析。
 
一、联合运算符
 
所谓的联合运算符,其实应用最多的就两种:UNION ALL和UNION。
 
这两个运算符用法很简单,前者是将两个数据集结果合并,后者则是合并后进行去重操作,如果有过写T-SQL语句的码农都不会陌生。
 
我们来分析下这两个运算符在执行计划中的显示,举个例子
 
SELECT FirstName+N''+LastName,City,Country FROM Employees
 
UNION ALL
 
SELECT ContactName,City,Country FROM Customers
 
就是上面这个图标了,这就是UNION ALL联合运算符的图标。
 
这个联合运算符很简单的操作,将两个数据集合扫描完通过联合将结果汇总。
 
我们来看一下UNION 这个运算符,例子如下
 
select City,Country from Employees
 
UNION
 
SELECT City,Country FROM Customers
 
我们可以看到,UNION 运算符是在串联运算符之后发生了一个Distinct Sort排序操作,经过这个操作会将结果集合中的重复值去掉。
 
我们一直强调:大数据表的排序是一个非常耗资源的动作!
 
所以,到这里我们已经找到了可优化的选项,去掉排序,或者更改排序方式。
 
替换掉Distinct Sort排序操作的方式就是哈序聚合。Distinct Sort排序操作需要的内存和去除重复之前数据集合的数据量成正比,而哈希聚合需要的内存则是和去除重复之后的结果集成正比!
 
所以如果数据行中重复值很多,那么相比而言通过哈希聚合所消耗的内存会少。
 
我们来举个例子
 
select ShipCountry from Orders
 
UNION
 
SELECT ShipCountry FROM Orders
 
这个例子其实没啥用处,这里就是为了演示,我们来看一下结果
 
我们知道,这张表里这个ShipCountry是存在大面积重复值的,所以采用了哈希匹配来去重操作是最优的方式。
 
其实,相比哈希匹配连接还有一种更轻量级的去重的连接方式:合并连接
 
上一篇我已经分析了这个连接方法,用于两个数据集的连接方式,这里其实类似,应用前都必须先将原结果集合排序!
 
我们知道优化的方式可以采用建立索引来提高排序速度。
 
我们来重现这种去重方式,我们新建一个表,然后建立索引,代码如下
 
--新建表
 
SELECT EmployeeID,FirstName+N' '+LastName AS ContactName,City,Country
 
INTO NewEmployees
 
FROM Employees
 
GO
 
--添加索引
 
ALTER TABLE NewEmployees ADD CONSTRAINT PK_NewEmployees PRIMARY KEY(EmployeeID)
 
CREATE INDEX ContactName ON NewEmployees(ContactName)
 
CREATE INDEX ContactName ON CUSTOMERS(ContactName)
 
GO
 
--新建查询,这里一定要加上一个显示的Order by才能出现合并连接去重
 
SELECT ContactName FROM NewEmployees
 
UNION ALL
 
SELECT ContactName FROM Customers
 
ORDER BY ContactName
 
我们采用索引扫描的方式可以避免显式的排序操作。
 
我们将UNION ALL改成UNION,该操作将会对两个数据集进行去重操作。
 
--新建查询,这里一定要加上一个显示的Order by才能出现合并连接去重
 
SELECT ContactName FROM NewEmployees
 
UNION
 
SELECT ContactName FROM Customers
 
ORDER BY ContactName
 
这里我们知道UNION操作会对结果进行去重操作,上面应用了流聚合操作,流聚合一般应用于分组操作中,当然这里用它进行了分组去重。
 
在我们实际的应用环境中,最常用的方式还是合并连接,但是有一种情况最适合哈希连接,那就是一个小表和大表进行联合操作,尤其适合哪种大表中存在大量重复值的情况下。
 
哈希算法真是个好东西!
 
结语
 
此篇文章先到此吧,简短一点,便于理解掌握,本篇主要介绍了查询计划中的联合操作运算符,下一篇我们分析SQL Server中的并行运算,在多核超线程云集的今天,来看SQL Server如何利用并行运算来最大化的利用现有硬件资源提升性能,有兴趣可提前关注,关于SQL Server性能调优的内容涉及面很广,后续文章中依次展开分析。
 
 
 

(编辑:聊城站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章