【C++进阶学习】第九弹——哈希的原理与实现——开放寻址法的讲解

前言:

在前面,我们已经学习了很多存储机构,包括线性存储、树性存储等,并学习了多种拓展结构,效率也越来越高,但是是否有一种存储结构可以在大部分问题中都一次找到目标值呢?哈希可能能实现

目录

一、哈希的概念

二、哈希冲突

三、哈希冲突解决

3.1 开放寻址法

节点结构

插入操作

查找操作

删除操作

打印操作

3.2 链地址法

四、测试代码(开放寻址法)

五、总结


一、哈希的概念

哈希就是一种特殊的存储结构,通过特定的函数,使得数据的存储位置与它的关键码之间建立一种一一映射的关系,这样在查找数据时就可以直接通过关键值来快速查找

通过这种方法:

当我们向其中插入数据时,就可以利用此特定函数插入到关键码对应的位置下

当我们搜索数据时,通过关键码,进行相应的处理就可以找到要找的数据

这种方法就叫做哈希,特定的函数就是哈希函数,这种方法所建立的结构就叫做哈希函表

我们来看这样一个例子:

对于这样一个数组{1,5,3,17,19,0},按照上述规则我们首先要先找一个合适的哈希函数,

这里我们哈希函数可以设为:hashi(key)=key%capacity;capacity为存储空间底层空间总的大小

现在我们根据上面这个例子来思考这样一个问题,如果有这样一个数据,比如13,通过上面的哈希函数计算得我们应该把它放在关键码为3的位置上,但是此时这个位置上已经有数据了,我们应该如何解决呢?这样的问题就叫做哈希冲突

二、哈希冲突

哈希冲突指的是在使用哈希表进行数据存储和查找时,不同的关键字通过哈希函数计算得到了相同的哈希值。

哈希函数是将关键字映射到哈希表中的某个位置的函数。由于哈希表的存储空间是有限的,而可能的关键字数量是无限的,所以不同的关键字有可能被映射到相同的位置,这就产生了哈希冲突。

哈希冲突会影响哈希表的性能,比如增加查找、插入和删除操作的时间复杂度。

常见的解决哈希冲突的方法有(这两种方法会在后面详细讲解):

  1. 开放寻址法:当发生冲突时,通过一定的探查方式在哈希表中寻找其他空闲的位置来存储冲突的元素。
  2. 链地址法:在哈希表的每个位置上建立一个链表,将所有哈希值相同的元素都存储在这个链表中。

三、哈希冲突解决

解决哈希冲突常见的两种方法主要是:开放寻址法和链地址法

3.1 开放寻址法

开放定址法是解决哈希冲突的一种方法,其基本思想是当发生冲突时,通过某种系统的方法在哈希表中寻找下一个空槽位,并将冲突的关键码存储在这个槽位中。下面我们先来看一下开放寻址法的重点:

  1. 探测序列:开放定址法中,探测序列决定了当发生冲突时如何查找下一个槽位。常见的探测序列方法有:

    • 线性探测:当冲突发生时,顺序检查表中的下一个槽位,直到找到空槽位。
    • 二次探测:探测序列为 1, 4, 9, 16, ...,即探测位置是 i^2 的倍数,其中 i 是从0开始的整数。
    • 伪随机探测:使用伪随机数生成器来确定探测序列。
  2. 删除操作:在开放定址法中,删除元素比较复杂,因为不能简单地将槽位置为空,否则会影响后续的查找操作。通常,删除一个元素时,将其标记为已删除,但在查找时跳过已删除的元素。

  3. 装填因子:装填因子是哈希表中已存储元素个数与哈希表大小的比值。开放定址法中,装填因子不宜过高,否则冲突概率增加,查找效率下降。(因为这个原因,所以需要扩容)

节点结构

因为我们并不知道插入要操作何种类型的数据,可能是整形,浮点型或string的,所以我们可以选择将它们全转化为整形来处理,这里就需要我们借助仿函数和模板特化来实现

	template<class K>       
struct HashFunc         //仿函数,这里的功能是将其他类型转化为整形
{size_t operator()(const K& key){return (size_t)key;}
};
template<>     //特化
struct HashFunc<string>    //string类的不可以直接转化为整形,所以需要特殊处理
{size_t operator()(const string& key){size_t hash = 0;for (auto e : key){hash *= 31;hash += e;}return hash;}
};enum Status{EMPTY,     //此位置为空EXIST,     //此位置不为空DELETE     //此位置数据已被删除};template<class K, class V>     //因为不能确定我们要处理什么类型的数据,所以我们采用类模板的形式struct HashData{pair<K, V> _kv;   Status _s;        //此位置的状态};template<class K, class V, class Hash = HashFunc<K>>class HashTable{public:HashTable()     //初始化HashTable{_tables.resize(10);}private:vector<HashData<K, V>> _tables;size_t _n = 0;        //存储个数};

插入操作

开放寻址法的关键就在于数据的插入,在这里我们重点讲解一下线性探测的思想

这就是线性探测的思路,同时我们还要在装填因子足够大的时候进行扩容,比如上面这个例子,此时10个位置中已经填入7个因子,我们就可以进行按2倍扩容:

代码实现如下:

		//插入bool Insert(const pair<K, V>& kv){if (Find(kv.first))return false;//负载因子0.7就扩容if (_n * 10 / _tables.size() == 7){size_t newSize = _tables.size() * 2;HashTable<K, V, Hash> newHT;newHT._tables.resize(newSize);for (size_t i = 0; i < _tables.size(); i++){if (_tables[i]._s == EXIST){newHT.Insert(_tables[i]._kv);}}_tables.swap(newHT._tables);    //直接交换就可以得到扩容后的结果}Hash hf;//线性探测size_t hashi = hf(kv.first) % _tables.size();  //这里涉及到模板的特化,后面会讲while (_tables[hashi]._s == EXIST)    //当此位置不为空时,就往后找{                                     //当为空或已删除时都是可以放入数据的hashi++;hashi %= _tables.size();        //这里进行这个操作的目的是防止hashi大于_tables.size()}_tables[hashi]._kv = kv;     //找到后将这个位置值改为插入值_tables[hashi]._s = EXIST;   //状态改为存在_n++;return true;}

查找操作

上面的插入操作中,我们首先就先用查找操作看是否已经有这个数据,因为哈希是不允许存在重复数据的,这里我们就来看一下这个查找操作

		//查找HashData<K, V>* Find(const K& key){Hash hf;      //仿函数size_t hashi = hf(key) % _tables.size();   //所有计算都要用仿函数将key转换为整形while (_tables[hashi]._s == EXIST)      //从不为空的位置开始找{if (_tables[hashi]._s != EMPTY&& _tables[hashi]._kv.first == key)return &_tables[hashi];hashi++;hashi %= _tables.size();}return NULL;}

删除操作

我们删除一个数据时,并不能简单的找到这个数据就进行删除,这样会对我们后序很多操作带来不少麻烦,比如我们把4删除了,再找44就会很不容易,这也就是我们前面在定义节点结构是要定义状态的原因,我们删除一个操作后可以把它的状态更改,这样我们在进行其他操作的时候就可以直到这个位置上的值已被删除

		//删除bool Erase(const K& key){HashData<K, V>* ret = Find(key);if (ret){ret->_s = DELETE;_n--;return 0;}elsereturn true;}

打印操作

		//打印void Print(){for (size_t i = 0; i < _tables.size(); i++){if (_tables[i]._s == EXIST)     //当这个位置有数据时,打印出有效数据cout << "[" << i << "]->" << _tables[i]._kv.first << ":"<< _tables[i]._kv.second << endl;else if (_tables[i]._s == EMPTY)printf("[%d]->EMPTY\n", i);elseprintf("[%d]->DELETE\n", i);}}

3.2 链地址法

链地址法有些东西与上面的代码有些冲突,不好测试,我们放在下一篇讲

四、测试代码(开放寻址法)

我们给出几个测试用例检验一下上面的开放寻址法是否有误:

测试一:

		void TestHT1(){HashTable<int, int> j;int a[] = { 4,14,24,34,5,7,1 };for (auto e : a){j.Insert(make_pair(e, e));}j.Insert(make_pair(3, 3));j.Print();j.Insert(make_pair(3, 3));     //这里有一个隐藏的bugif (j.Find(3))cout << "3存在" << endl;}

运行结果:

测试二:

	void TestHT2()    //测试string{string arr[] = { "香蕉","甜瓜","苹果","香蕉","苹果","苹果" };HashTable<string, int> ht;for (auto e : arr){auto ret = ht.Find(e);if (ret)ret->_kv.second++;else{ht.Insert(make_pair(e, 1));}}ht.Print();}

运行结果:

五、总结

以上就是用开放寻址法来创建一个哈希表的完整代码,由于排版原因,整体看起来可能有些乱,有不懂的地方欢迎与我私信交流!!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1488903.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

el-tree树添加向下移动按钮,前端界面调整顺序

需求&#xff1a;树上添加向下按钮&#xff0c;再不调用接口的情况下&#xff0c;调整树的顺序结构 遇到的问题&#xff1a;第一次点击更新的&#xff0c;数据和视图是调整好的&#xff0c;再次点击页面调整顺序&#xff0c;只有数据被调整了&#xff0c;视图没有发生改变。 &…

我澄清下,大数据界面虽然有点花,但对趋势的判断还是很准的!

我澄清下&#xff0c;大数据界面虽然有点花&#xff0c;但对趋势的判断还是很准的&#xff01; 艾斯视觉的观点认为&#xff1a;在这个充满不确定性的世界里&#xff0c;大数据就像一位智者&#xff0c;透过那些令人眼花缭乱的界面&#xff0c;总能以它独到的洞察力&#xff0…

链路聚合加单臂路由

一、实验目的及拓扑 实验目的&#xff1a;在路由器及交换机之间建立链接聚合&#xff0c;交换机接入两台主机并通过路由器子接口自动分配IP地址&#xff0c;通过单臂路由实现两台主机互联 二、基本配置 1、交换机配置 [S1]vlan batch 10 20 [S1-Eth-Trunk1]dis th # interf…

eclipse ui bug

eclipse ui bug界面缺陷&#xff0c;可能项目过多&#xff0c;特别maven项目过多&#xff0c;下载&#xff0c;自动编译&#xff0c;加载更新界面异常 所有窗口死活Restore不回去了 1&#xff09;尝试创建项目&#xff0c;还原界面&#xff0c;失败 2&#xff09;关闭所有窗口&…

mysql面试(六)

前言 本章节详细讲解了一下mysql执行计划相关的属性释义&#xff0c;以及不同sql所出现的不同效果 执行计划 一条查询语句经过mysql查询优化器的各种基于成本和各种规则优化之后&#xff0c;会生成一个所谓的 执行计划&#xff0c;这个执行计划展示了这条查询语句具体查询方…

模拟can信号实现通信

实车上算法一般通过ros进行通信&#xff0c;车辆和控制器之间则通过can通信实现&#xff0c;今天来学习一下如何模拟这个can。 can信号的发送和接收一般是需要载体的&#xff0c;我们一般都有can0和can1设备可以使用&#xff0c;在电脑上创建这个设备&#xff1a; 加载vcan内核…

数据库开发:MySQL基础(二)

MySQL基础&#xff08;二&#xff09; 一、表的关联关系 在关系型数据库中&#xff0c;表之间可以通过关联关系进行连接和查询。关联关系是指两个或多个表之间的关系&#xff0c;通过共享相同的列或键来建立连接。常见的关联关系有三种类型&#xff1a;一对多关系&#xff0c;…

Talk|新加坡国立大学赵轩磊:Pyramid Attention Broadcast - 通向视频模型的实时生成

本期为TechBeat人工智能社区第612期线上Talk&#xff01; 北京时间7月25日(周四)20:00&#xff0c;新加坡国立大学博士生—赵轩磊的Talk已准时在TechBeat人工智能社区开播&#xff01; 他与大家分享的主题是: “Pyramid Attention Broadcast - 通向视频模型的实时生成”&#x…

Spring Boot中如何实现全链路调用日志跟踪?

​ 博客主页: 南来_北往 系列专栏&#xff1a;Spring Boot实战 引言 在Spring Boot中实现全链路调用日志跟踪&#xff0c;主要依赖于Mapped Diagnostic Context&#xff08;MDC&#xff09;功能。MDC是一种用于在多线程条件下记录日志的功能&#xff0c;它可以看作是与当…

深入分析 Android ContentProvider (五)

文章目录 深入分析 Android ContentProvider (五)ContentProvider 的性能优化和实践案例1. 性能优化技巧1.1. 数据库索引优化示例&#xff1a;添加索引 1.2. 批量操作与事务管理示例&#xff1a;批量插入操作 1.3. 使用异步操作示例&#xff1a;使用 AsyncTask 进行异步查询 1.…

Nodejs实现微信订阅消息的发送

关于Nodejs的项目配置和路由配置我这里就不过多叙述了。着重关于订阅消息的发送 1.首先前往微信开发者平台配置好自己的订阅消息模板&#xff08;改版后的只支持一次性订阅&#xff1a;每次用户操作记录一次&#xff0c;openid只能发送一次消息给用户&#xff0c;不能持续订阅…

每日一知识点- Java 方法重载和方法重写

目录 &#x1f4dd; 每日一知识点方法重载方法重写 &#x1f4ce; 参考文章 &#x1f600; 准备好了吗&#xff1f;让我们一起步入这座Java神奇的城堡&#xff0c;揭开方法重载&#xff08;Overloading&#xff09;和方法重写&#xff08;Overriding&#xff09;的神秘面纱。 &…

基于迁移学习的手势分类模型训练

1、基本原理介绍 这里介绍的单指模型迁移。一般我们训练模型时&#xff0c;往往会自定义一个模型类&#xff0c;这个类中定义了神经网络的结构&#xff0c;训练时将数据集输入&#xff0c;从0开始训练&#xff1b;而迁移学习中&#xff08;单指模型迁移策略&#xff09;&#x…

一文掌握YOLOv1-v10

引言 YOLO目标检测算法&#xff0c;不过多介绍&#xff0c;是基于深度学习的目标检测算法中最出名、发展最好的检测器&#xff0c;没有之一。本文简要的介绍一下从YOLOv1-YOLOv10的演化过程&#xff0c;详细技术细节不过多介绍&#xff0c;只提及改进点&#xff0c;适合初学者…

Vue3二次封装axios

官网: https://www.axios-http.cn/docs/interceptors steps1: 安装 npm install axios -ssteps2: /src/api/request.js 文件 >>> 拦截器 import axios from axios // 如果没用element-plus就不引入 import { ElMessage } from element-plusconst service axios.cre…

7月22日学习笔记 文件共享服务nfs,SAMBA文件共享与DNS域名服务

任务背景 由于业务驱动&#xff0c;为了提⾼⽤户的访问效率&#xff0c;现需要将原有web服务器上的静态资源 ⽂件分离出来&#xff0c;单独保存到⼀台⽂件服务器上。 任务要求 1. ⼀台应⽤服务器web-server部署apache&#xff0c;静态⽹⻚资源存放在另外⼀台NFS服 务器上 …

四、GD32 MCU 常见外设介绍 (2) GPIO 模块介绍

2.GPIO 模块介绍 GPIO的全称为通用输入输出口&#xff0c;是很多外设能够正常工作的必要条件。除了一些特定功能的引脚(如电源脚)外&#xff0c;MCU上其他的引脚都可以当做GPIO来使用。本章&#xff0c;我们将对GPIO进行简单介绍&#xff0c;并通过一个“流水灯”的实验来熟悉…

MATLAB基础:数组及其数学运算

今天我们继续学习MATLAB中的数组 我们在学习MATLAB时了解到&#xff0c;MATLAB作者秉持着“万物皆可矩阵”的思想企图将数学甚至世间万物使用矩阵表示出来&#xff0c;而矩阵的处理&#xff0c;自然成了这门语言的重中之重。 数组基础 在MATLAB中&#xff0c;数组是一个基本…

【人工智能 | 机器学习 | 理论篇】线性模型

文章目录 1. 基本形式2. 线性回归3. 对数几率回归4. 线性判别分析5. 多分类学习6. 类别不平衡问题 1. 基本形式 设有 d 个属性描述的示例 x ( x 1 , x 2 , x 3 , . . . , x d ) x ({x_1, x_2, x_3, ..., x_d}) x(x1​,x2​,x3​,...,xd​) 线性模型&#xff08;linear mode…

使用C#手搓Word插件

WordTools主要功能介绍 编码语言&#xff1a;C#【VSTO】 1、选择 1.1、表格 作用&#xff1a;全选文档中的表格&#xff1b; 1.2、表头 作用&#xff1a;全选文档所有表格的表头【第一行】&#xff1b; 1.3、表正文 全选文档中所有表格的除表头部分【除第一行部分】 1.…