oracle执行计划解释一.相关概念1·rowid,伪列:就是系统自己给加上的,每个表都有一个伪列,并不是物理存在。
它不能被修改,删除,和添加,rowid在该行的生命周期是唯一的,如果向数据库插入一列,只会引起行的变化,但是rowid并不会变。
2·recursive sql概念:当用户执行一些SQL语句时,会自动执行一些额外的语句,我们把这些额外的SQL语句称为“recursive calls” 或者是“recursive sql statement”,当在执行一个DDL语句时,Oracle总会隐含的发出一些Recursiv sql语句,用于修改数据字典,如果数据字典没有在共享内存中,则就执行“resursive calls”,它会把数据字典从物理读取到共享内存。
当然DML和select语句都可能引起recursive SQL。
3·row source 行源:在查询中,由上一操作返回的符合条件的数据集,它可能是整个表,也可能是部分,当然也可以对2个表进行连接操作(join)最后得到的数据集4·predicate:一个查询中的where限制条件5·driving table 驱动表:该表又成为外层表,这个感念用于内嵌和HASH连接中,如果返回数据较大,会有负面影响,返回行数据较小的适合做驱动表6·probed table 被探查表:该表又称为内层表,我们在外层表中取得一条数据,在该表中寻找符合连接的条件的行。
7·组合索引(concatenated index)由多个列组成的索引,在组合索引中有一个重要的概念,就是引导索引,create index idx_tab on tab(col1,col2,col3),indx_tab则称为组合索引,col1则称为引导列在查询条件where后,必须使用引导索引,才会使用该组合索引8.可选择性(selectivity)比较一下列中唯一键的数量和表中的行数,就可以判断该列的可选择性。
如果该列的“唯一键的数量/表中的行数”的比值越接近1,则该列的可选择性越高,该列就越适合创建索引,同样索引的可选择性也越高。
在可选择性高的列上进行查询时,返回的数据就较少,比较适合使用索引查询。
二.Oracle访问数据的存取方法1.全表扫描(Full tabel scans,FTS)为了实现全表扫描,Oracle读取数据库中的每一行,并检查每一行是否满足语句的where限制条件一个多块读操作,可以使io能读取多块数据块。
减少了IO次数,提高了系统的吞吐量。
在多块读的方法的使用下,可以高效的实现数据库全表扫描,而且,中有在全表扫描的情况下,在可以使用多块读的方法。
在这个种访问模式下,数据块只读一次。
【注意】使用FTS的前提是,在较大的表中,不建议使用FTS,除非取出的数据较多,超过总量的5%-10%,或者使用并行查询时2.通过rowid的表存取行的ROWID指向了该行的数据文件,数据块,以及在数据块中的位置,使用rowid能快速的定位到要取得数据的行上,在Oracle中,这是取得单行最快的方式。
【注意】该存取方法,不会用到多块读操作,一次IO只能读取一个数据块。
3.索引扫描(index scan 和index lookup)索引扫描时通过index查找到对应行的rowid,然后通过rowid从数据库中得到具体的数据。
该方法分为两个步骤,(1)扫描索引得到得到rowid说明:索引中不止储存着索引值,还存放的行的rowid(2)通过rowid得到表中的数据【注意】1.由于索引经常使用,因此绝大多数都Cache到内存当中,所以第一步通常是逻辑IO,即数据可以从内存中取得2.但是对第二步来说,如果数据比较大,就不可能存放在内存,因此是个物理操作,是极其耗时间的,因此,从大表中进行索引扫描,如果数量大于总数的5%-10%,则效力会下降很多3.如果索引的数据都能在内存中能找到,就可以避免第二步操作,避免了不必要的IO。
效力会很高。
4.如果SQL语句会对索引排序,因为索引已经预先排好了序,索引在执行计划中不需要在对索引排序。
根据索引的类型与where限制条件的不同,有4种数据类型的索引1.唯一索引(index unique scan)通过唯一索引查找一个数值,通常是rowid,如果表中存在unique,或者是primary key的话,Oracle通常实现唯一索引;2.索引范围扫描(index range scan)如果要取得多行数据,通常在唯一索引上加上范围操作,例如(>,<)*使用index rang scan的三种情况(a)在唯一索引上有where条件筛选(b)在组合索引上,使用部分列进行查询,导致查询出多行(c)对非唯一索引列进行的任何查询3.索引全扫描(index full scan)与全表扫描想对应的就是全索引扫描,它必要保证要取得的数据都从索引中直接得到例:Index BE_IX is a concatenated index on big_emp (empno,ename)SQL> explain plan for select empno,ename from big_emp order by empno,ename;4.索引快速扫描(index fash full scan)索引快速扫描和index full scan相似,不会对查询出的数据进行排序。
三.表之间的连接根据row source连接的条件不同,可以分为等值连接(where a.col3=b.col4)非等值连接(where a.col3>b.col4)外连接(where a.col3=b.col4(+))1.典型的连接类型(a)排序--合并连接(sort merge join,SMJ)(b)嵌套循环(nested loops,NL)(c)哈希连接(hash join,)A.排序--合并连接1)首先生成row source1需要的数据,让后对连接关联的列进行排序。
2)然后生成row source2需要的数据,然后对这些数据按照与row socurce1相对应的操作关联列进行排序。
3)将两边排好序的数据进行合并操作,将2个row source按照连接条件连接起来。
[注意]·.如果row source已经在关联上列上被排序,那个连接操作就不会执行sort操作,将大大的提高效率,因为排序时极其消耗资源的,预先被排序的row source包括索引,或者已经排好序的列。
·.排序是非常耗时的操作,尤其是大表,基于这个原因,SMJ通常不是一个好的解决办法,如果排序的工作早已做好那将极大的提高效率·.对于非等值连接,这种连接方式的效率是比较高的。
B.嵌套循环。
在连接有驱动表的概念,实际上连接过程就是2层嵌套循环,外层表越小越好。
[执行原理]从内部表来看,需要得到外层表的每一行,去匹配内部表的所有行,因此保持外部表尽可能小,和高效率访问内部表,是连接性能的关键。
[优点]nested loops可以返回已经连接的行,而不必等待所有的行连接完,因此能快速响应,特别适合用在需要快速响应的语句中。
C.hash join较小的row source用来构建hash table和bitmap,而第二个用来被hansed,并与第一个生成的hash table进行匹配。
bitmap用来作为一种较快查询的方法,用来检查hash table是否有匹配的行,特别在表大的情况下,不能容纳在内存中,这个连接方法非常有效。
这个链接,也有驱动表的概念,有来构造hash table,bitmap的表叫驱动表,如果被构建的hash table,bitmap都能容纳在内存中,这个效率非常高。
【注意】1) 要使哈希连接有效,需要设置HASH_JOIN_ENABLED=TRUE,缺省情况下该参数为TRUE,另外,不要忘了还要设置hash_area_size参数,以使哈希连接高效运行,因为哈希连接会在该参数指定大小的内存中运行,过小的参数会使哈希连接的性能比其他连接方式还要低。
2)只能用于等值连接。
3)在2个较大的row source之间连接时会取得相对较好的效率,在一个row source较小时则能取得更好的效率。
解释结果:1.AND-EQUAL 该步骤具有两个或更多个子步骤,每一个子步骤返回一系列的ROWID.AND-EQUAL操作选择的是索引子操作返回的rowid2.BITMAPconversoin to rowids --将位图从位图索引转换成可以用于提取实际资料的一系列的ROWIDconversoin from rowids --将一系列的ROWID转换成位图表示conversoin count --对位图的行数进行统计index single scan --为单个索引提取位图index range scan --返回的位图是一定范围的关键值index full scan --扫描整个位图索引MERGE --合并两个位图,并作为一个位图返回结果Minus --该操作是merge的相反操作,而且可以具有两个或3个子操作并返回位图第一个子操作返回的位图用作起点,第一个位图减去第二个位图中提供所有行。
如果第二个位图为空,那么所有的null列也将被减去。
or --将两个位图作为输入3.connect by --分层提取行,因为查询采用了CONNECT BY C从句4.concatenaction --合并多个行集为一行。
5.count --计算从表中选择的行数stopkey --计算的行数被查询语句中的where 中的rownum所限制6.filter --将一系列的行数作为输入,并过滤到where从句查询而得到的结果7.first row --提取查询结果集的第一行8.for udpate -- 为提取的行加锁。
9.hash join --使用散列连接法连接两张表10.indexunique --从索引中查找唯一值range scan --从一定范围中查找,是按照升序的方式range scans desc --扫描行在一定范围之内,但是是按照降序的方式11.inlist iterator --在in谓词中为一个值执行一次或者多次操作13 intersection --将两个结果集合并成一个集,并返回在它们之间出现的共同的值14 merger join --提供共同值,用来连接两个结果集的结果。
是内连接output --外anit --反seml --半15 nested loops --该操作涉及到2个子操作,第一操作个返回一个行集,被用于行集中的每一行,执行第二个子操作。