一、定义
Hash表,也称散列表。一般应用于有大量“动态”的插入(删除)和查找操作的一类问题。(如果是“静态”的,通常可以先对数据排序,查找时就可以用“二分查找”)
虽然可以用“平衡树”之类方法,但实践中,用hash表更简单实用。
普通的查找方法建立在“比较”的基础上,查找的效率与比较次数密切相关。
hash的思想是能直接找到需要的元素,因此必须在元素的存储位置和它的关键字之间建立一确定的对应关系f,使每个关键字和存储结构中一个(几乎)唯一的存储位置相对应。(按我的理解就类似于高中数学中的映射)
注:虽然存储方式多样,但由于我是个OIer,就都用数组模拟了
e.g.本年级每个学生的记录中都有一个关键字:学号。学号是0000~9999之间的,每个学生学号唯一。因此就可以用函数f(key)=key 得到唯一的地址。因此可以直接(O(1))找到对应的位置(数组下标),插入、查找、删除操作都是O(1)。
(类似于计数排序法)
Hash函数:上面的记录中关键字key和存储位置(这里是数组下标)之间建立的对应关系函数f(key)。称这个对应关系f为哈希函数,按这个思想建立的表为哈希表(又称为杂凑法或散列表)。
冲突:通常的hash函数不是一一对应关系。普通情况下hash函数很可能会出现keyi≠keyj,f(keyi)=f(keyj) 的现象。也就是几个关键字可能对应同一个“地址”。
这就叫作冲突。
所有评论(0)