一、优化基础本文主要向大家介绍的是正确优化SQL Server数据库的经验总结,其中包括在对其进行优化的实际操作中值得大家注意的地方描述,以及对SQL语句进行优化的最基本原则,以下就是文章的主要内容描述。
优化数据库的注意事项:1、关键字段建立索引。
2、使用存储过程,它使SQL变得更加灵活和高效。
3、备份数据库和清除垃圾数据。
4、SQL语句语法的优化。
(可以用Sybase的SQL Expert,可惜我没找到unexpired的序列号)5、清理删除日志。
SQL语句优化的基本原则:1、使用索引来更快地遍历表。
缺省情况下建立的索引是非群集索引,但有时它并不是最佳的。
在非群集索引下,数据在物理上随机存放在数据页上。
合理的索引设计要建立在对各种查询的分析和预测上。
一般来说:①.有大量重复值、且经常有范围查询(between, >,< ,>=,< =)和order by、group by发生的列,可考虑建立群集索引②.经常同时存取多列,且每列都含有重复值可考虑建立组合索引;③.组合索引要尽量使关键查询形成索引覆盖,其前导列一定是使用最频繁的列。
2、IS NULL 与IS NOT NULL不能用null作索引,任何包含null值的列都将不会被包含在索引中。
即使索引有多列这样的情况下,只要这些列中有一列含有null,该列就会从索引中排除。
也就是说如果某列存在空值,即使对该列建索引也不会提高性能。
任何在where子句中使用is null或is not null 的语句优化器是不允许使用索引的。
3、IN和EXISTSEXISTS要远比IN的效率高。
里面关系到full table scan和range scan。
几乎将所有的IN 操作符子查询改写为使用EXISTS的子查询。
4、在海量查询时尽量少用格式转换。
5、当在SQL SERVER 2000中如果存储过程只有一个参数,并且是OUTPUT类型的,必须在调用这个存储过程的时候给这个参数一个初始的值,否则会出现调用错误。
6、ORDER BY和GROPU BY使用ORDER BY和GROUP BY短语,任何一种索引都有助于SELECT的性能提高。
注意如果索引列里面有NULL值,Optimizer将无法优化。
7、任何对列的操作都将导致表扫描,它包括SQL Server数据库函数、计算表达式等等,查询时要尽可能将操作移至等号右边。
8、IN、OR子句常会使用工作表,使索引失效。
如果不产生大量重复值,可以考虑把子句拆开。
拆开的子句中应该包含索引。
9、SET SHOWPLAN_ALL>10、谨慎使用游标在某些必须使用游标的场合,可考虑将符合条件的数据行转入临时表中,再对临时表定义游标进行操作,这样可使性能得到明显提高。
注释:所谓的优化就是WHERE子句利用了索引,不可优化即发生了表扫描或额外开销。
经验显示,SQL Server数据库性能的最大改进得益于逻辑的数据库设计、索引设计和查询设计方面。
反过来说,最大的性能问题常常是由其中这些相同方面中的不足引起的。
其实SQL优化的实质就是在结果正确的前提下,用优化器可以识别的语句,充份利用索引,减少表扫描的I/O次数,尽量避免表搜索的发生。
其实SQL的性能优化是一个复杂的过程,上述这些只是在应用层次的一种体现,深入研究还会涉及SQL Server数据库层的资源配置、网络层的流量控制以及操作系统层的总体设计。
二、sql优化1、不要使用select *在select中指定所需要的列,将带来的好处:(1)减少内存耗费和网络的带宽(2)更安全(3)给查询优化器机会从索引读取所有需要的列2、使用参数查询主要是防止SQL注入,提高安全性。
3、使用exists或not exists代替in或not in(高效)select * from [emp] where [empno]>0 and exists (select 'X' from [dept] where [dept].[deptno]=[emp].[deptno] and [loc]='MELB');(低效)select * from [emp] where [empno]>0 and [deptno] in (select [deptno] from [dept] where [loc]='MELB');4、is null或is not null操作判断字段是否为空一般是不会应用索引的,因为索引不索引空值。
不能用null作索引,任何包含null值的列都将不会被包含在索引中。
也就是说如果某列存在空值,即使对该列建索引也不会提高性能。
任何在where子句中使用is null或is not null的语句优化器都不允许使用索引。
推荐方案:用其他相同功能的操作运算代替,如:a is not null改为a>0或a>''等。
5、<及>操作大于或小于一般情况不用调整,因为它有索引就会采用索引查找,但有的情况下可以对它进行优化。
如一个表有100万记录,那么执行>2与>=3的效果就有很大区别了。
(低效)select * from [emp] where [deptno]>2;(高效)select * from [emp] where [deptno]>=3;6、like操作like操作可以应用通配符查询,里面的通配符组合可能达到几乎是任意的查询,但是如果用不好则会产生性能上的问题,如lide '%5400%' 这种查询不会引用索引,而like 'X5400%' 则会引用范围索引。
7、where后面的条件顺序影响where子句后面的条件顺序对大数据量表的查询会产生直接的影响。
如:select * from zl_yhjbqk where dy_dj='1KV以下' and xh_bz=1;select * from zl_yhjbqk where dy_dj=1 and dy_dj='1KV以下';以上两个查询,两个字段都没进行索引,所以执行的时候都是全表扫描,第一条SQL的dy_dj='1KV以下'条件在记录集内比率为99%,而xh_bz=1的比率只为0.5%,在进行第一条SQL的时候99%条记录都进行dy_dj及xh_bz的比较。
而在进行第二条SQL的时候0.5%条记录都进行dy_dj及xh_bz的比较,以此可以得出第二条SQL的CPU占用率明显比第一条低。
8、用union替换or(适用于索引列)通常情况下,用union替换where子句中的or将会起到较好的效果。
对索引列使用or将造成全表扫描。
注意:这个规则只针对多个索引列有效。
如果有column没有被索引,查询效率可能会因为你没有选择or而降低。
下面的例子中loc_id和region上都有建索引。
(低效)select loc_id,loc_desc,begion from location where loc_id=10 orbegion='MELBOURNE';(高效)select loc_id,loc_desc,begion from location where loc_id=10unionselect loc_id,loc_desc_begion from location where begion='MELBOURNE';9、优化group by提高group by语句的效率,可以通过将不需要的记录在group by之前过滤掉。
(低效)select [job],avg([sal]) from [emp] group by [job] having job='PRESIDENT' or job='MANAGER';(高效)select [job],avg([sal]) from [emp] where [job]='PRESIDENT' orjob='MANAGER' group by [job];10、使用存储过程可以考虑使用存储过程封装那些复杂的SQL语句或业务逻辑,这样有几个好处:(1)存储过程的执行计划可以被缓存在内存中较长的时间,减少了重新编译的时间。
(2)存储过程减少了客户端和服务器的繁复交互。
(3)如果程序发布后需要做某些改变你可以直接修改存储过程而不用修改程序,避免需要重新安装部署程序。
11、用sp_configure 'query governor cost limit'或者SETQUERY_GOVERNOR_COST_LIMIT来限制查询消耗的资源。
当评估查询消耗的资源超出限制时,服务器自动取消查询,在查询之前就扼杀掉。
SET LOCKTIME设置锁的时间。
12、使用select top或set rowcount来限制操作的行。
13、如果使用了in或or等时发现查询没有走索引,使用显式申明指定索引: SELECT * FROM PersonMember (INDEX = IX_Title) WHERE processid IN ('男','女')。
14、如果要插入大的二进制值到Image列,使用存储过程,千万不要用内嵌insert来插入(不知JAVA是否)。
因为这样应用程序首先将二进制值转换成字符串(尺寸是它的两倍),服务器受到字符后又将他转换成二进制值。
存储过程就没有这些动作: 方法:Create procedure p_insert as insert into table(Fimage) values (@image), 在前台调用这个存储过程传入二进制参数,这样处理速度明显改善。
15、分析select emp_name form employee where salary>3000 在此语句中若salary是Float类型的,则优化器对其进行优化为Convert(float,3000),因为3000是个整数,我们应在编程时使用3000.0而不要等运行时让DBMS进行转化。
同样字符和整型数据的转换。