基于SQL,Server数据库的查询优化|SQL数据库优化
摘要:SQL数据库已广泛地应用于信息系统、电子商务以及教学等诸多领域中,使人们对数据的管理有了质的飞跃。但是人们在使用SQL查询数据时,往往太注重结果,而忽略了不同的查询方法,从而导致其性能和执行效率逐渐降低。通过对数据库的性能分析,提出查询优化方案,从而提高数据查询效率。
关键词:SQL server;数据库;查询优化
中图分类号:TP392文献标识码:A文章编号:16727800(2012)008013302
作者简介:张燕琴(1983-),女,华侨大学硕士研究生,泉州轻工职业学院助教,研究方向为数据库技术。
0引言
在众多数据库的应用实例中,查询操作所占的比重最大,数据库管理系统中80%的工作是用于数据的查询和检索,因此数据查询的快慢将直接影响到数据库系统的性能。为了优化数据库系统的性能,我们通过改进数据库使用的硬件条件、软件环境和规范化设计外,还应进行数据查询的优化。查询优化在关系数据库中是非常重要的,优化的目标是避免磁盘I/O瓶颈、减少CPU利用率和减少资源,能实现快速的数据查询。
1查询优化
数据库管理系统中的主要操作就是对数据的查询,为提高数据库的性能,查询优化必不可少。在实际的应用中,要尽可能避免排序(Sort)、连接(Join)和相关子查询操作。笔者认为查询优化要做到以下几点:
1.1SQL语句优化
(1)查询时要尽量减少对数据库的访问次数,不要过多地使用通配符,如:select * from STUDENT ,要用到几列就选择几列,如:select sno,sname from STUDENT。
(2)避免使用不兼容的数据类型,如:float和int、char和varchar等。数据类型的不兼容可能导致一些语句无法进行优化操作。如:select name from teacher where salary>5 000,在这里salary是money类型的,而5 000是一个整数,在程序编写的过程中就会将money变换为整数,而不是在运行时才转换。
(3)尽量避免在WHERE子句中对字段进行函数或表达式操作,这将导致引擎放弃使用索引而进行全表扫描。
如:SELECT * FROM sc WHERE grade1/2=200
应改为: SELECT * FROM sc WHERE grade=200*2
即:投影操作会导致全表扫描,它包括数据库函数、计算表达式等,查询时要尽可能将操作移至等号右边。
(4)不要有超过5个以上的表连接(JOIN)。连接的表越多,其编译的时间和连接的开销也越大,性能也越不好控制,最好是把连接拆开成较小的几个部分逐个顺序执行,优先执行那些能够大量减少结果的连接。拆分的好处不仅仅是减少SQL Server优化的时间,更使得SQL语句能够以你可以预测的方式和顺序执行。考虑使用临时表或表变量存放中间结果,少用子查询。如果一定需要连接很多表才能得到数据,那么也就意味着数据库在设计时存在很大的缺陷。
(5)使用视图加速查询。把表的一个子集进行排序并创建视图。它有助于避免多重排序操作,而且在其他方面还能简化优化器的工作。
1.2操作符优化
(1)避免使用!=或<>、IS NULL或IS NOT NULL、IN、NOT IN等这样的操作符,因为这会使系统无法使用索引而只能直接搜索表中的数据。例如: SELECT sno FROM student WHERE sno!= "2009101%",优化器将无法通过索引来确定将要命中的行数,因此需要搜索该表的所有行。NOT IN此操作符是强烈不建议使用的,因为它不能应用表的索引。推荐方案:用NOT EXISTS 方案代替 。
(2)> 及 < 操作符(大于或小于操作符)一般情况下是不用调整的,因为它有索引就会采用索引查找。但有的情况下可以对它进行优化,如一个表有200万记录,一个数值型字段A,60万记录的A=0,60万记录的A=1,79万记录的A=2,1万记录的A=3。那么执行A>2与A>=3的效果就有很大的区别了,因为A>2时SQL会先找出为2的记录索引再进行比较,而A>=3时SQL则直接找到=3的记录索引。
(3)LIKE操作符可以应用通配符查询,里面的通配符组合可以实现几乎是任意的查询。但是如果用得不好,则会产生性能上的问题,如LIKE ‘%3600%’ 这种查询不会引用索引,而LIKE ‘a3600%’则会引用范围索引。
1.3使用存储过程
存储过程是一个可重用的代码模块,可以高效率地完成指定的操作。存储过程允许用户进行模块化程序设计,大大提高了程序的设计效率,存储过程创建后,可以在程序中任意调用,减少了重新编译的时间。同时,存储过程也减少了客户端和服务器的繁复交互。如果程序发布后需要做某些改变,则可以直接修改存储过程而不用修改程序,从而提高效率。
2索引优化
对于查询的优化,数据库管理系统通常采用索引技术来加快对表中数据的检索。索引允许数据库应用程序迅速找到表中的数据,而不必扫描整个数据库。索引是一种表或视图关联的物理结构,可以用来加快从表或视图中检索数据行的速度。通过创建索引可以保证每一行数据的唯一性,可以大大加快数据的检索速度,也可以加快表和表之间的连接。在使用order by和group by子句进行数据查询时,可以减少查询中的分组和排序时间,且可以在查询的过程中使用优化隐藏器,提高系统的性能。
2.1索引的分类
聚集索引:将表中的记录在物理数据页中的位置按索引字段值重新排序,再将重排后的结果写回到磁盘上。每个表只能有一个聚集索引 。
非聚集索引:与表中数据行的实际存储结构无关,不会改变数据表中记录的实际存储顺序,每个表可以有多个非聚集索引 。
