当前位置:文档之家› 双重散列探查法的计算公式

双重散列探查法的计算公式

计算公式:
计算公式是人们在研究自然界物与物之间时发现的一些联系,并通过一定的方式表达出来的一种表达方法。

是表征自然界不同事物之数量之间的或等或不等的联系,它确切的反映了事物内部和外部的关系,是我们从一种事物到达另一种事物的依据,使我们更好的理解事物的本质和内涵。

二次再散列法:
散列(Hashing)是计算机科学中一种对资料的处理方法,通过某种特定的函数/算法(称为散列函数/算法)将要检索的项与用来检索的索引(称为散列,或者散列值)关联起来,生成一种便于搜索的数据结构(称为散列表)。

二次再散列法是指第一次散列产生哈希地址冲突,为了解决冲突,采用另外的散列函数或者对冲突结果进行处理的方法。

散列表:
设所有可能出现的关键字集合记为U(简称全集)。

实际发生(即实际存储)的关键字集合记为K(|K|比|U|小得多)。

散列方法是使用函数h将U映射到表T[0..m-1]的下标上(m=O(|U|))。

这样以U中关键字为自变量,以h为函数的运算结果就是相应结点的存储地址。

从而达到在O(1)时间内就可完成查找。

其中:
① h:U→{0,1,2,…,m-1} ,通常称h为散列函数(Hash Function)。

散列函数h的作用是压缩待处理的下标范围,使待处理
的|U|个值减少到m个值,从而降低空间开销。

② T为散列表(Hash Table)。

③ h(Ki)(Ki∈U)是关键字为Ki结点存储地址(亦称散列值或散列地址)。

④ 将结点按其关键字的散列地址存储到散列表中的过程称为散列(Hashing)
冲突:
两个不同的关键字,由于散列函数值相同,因而被映射到同一表位置上。

该现象称为冲突(Collision)或碰撞。

发生冲突的两个关键字称为该散列函数的同义词(Synonym)。

安全避免冲突的条件
最理想的解决冲突的方法是安全避免冲突。

要做到这一点必须满足两个条件:
①其一是|U|≤m
②其二是选择合适的散列函数。

这只适用于|U|较小,且关键字均事先已知的情况,此时经过精心设计散列函数h有可能完全避免冲突。

冲突不可能完全避免
通常情况下,h是一个压缩映像。

虽然|K|≤m,但|U|>m,故无论怎样设计h,也不可能完全避免冲突。

因此,只能在设计h时尽可能使冲突最少。

同时还需要确定解决冲突的方法,使发生冲突的同义词能够存储到表中。

影响冲突的因素
冲突的频繁程度除了与h相关外,还与表的填满程度相关。

设m和n分别表示表长和表中填人的结点数,则将α=n/m定义为散列表的装填因子(Load Factor)。

α越大,表越满,冲突的机会也越大。

通常取α≤1。

对于大多数应用程序来说,装填因子为0.75是比较合理的。

相关主题