【C++之STL】摸清 string 的模拟实现(上)

文章目录

  • 1. 为什么要模拟实现?
  • 2. 基本框架搭建
  • 3. 构造函数
    • 3. 1 默认构造/from c_str
    • 3. 2 拷贝构造
      • 3. 2. 1 深浅拷贝
    • 3. 3 fill
    • 3. 4 迭代器区间构造
  • 4. 容量操作
    • 4. 1 `size()`和`capacity()`和`empty()`
    • 4. 2 `clear()`
    • 4. 3 `resize()`
    • 4. 4 `reserve()`


1. 为什么要模拟实现?

可能有人觉得STL既然已经提供了功能如此丰富的string类,就没有必要再学习它的底层,但这显然是错误的看法。
原因有2:

  1. 找工作时面试官很喜欢让求职者回答STL一些容器的模拟实现的思路。
  2. 学习底层有助于巩固知识,还能帮助我们更好地理解这个容器,使用时能更加得心应手。

2. 基本框架搭建

首先,我们要实现一个string类,就不可避免地会和库中string冲突,这时就需要用到命名空间,将自己实现的这个类放进一个和std不同的命名空间中就能避免冲突。

string是对字符数组的封装,尽管一些编译器在具体实现时会加上一些其它的东西来进行优化,但我们先不考虑这些。这里我们实现的string类的成员变量就只有一个字符指针 char* _str;

string的实现可以模仿数据结构初阶中的顺序表,还要有_size_capacity两个成员变量。

另外,虽然字符串的长度可以用strlen这个库函数获取,但这个函数的时间复杂度是O(N),会导致代码效率降低,不如创建一个变量存储起来。

这样我们就可以搭建出最基本的框架:

// 我们实现的 string 不是模板类,可以声明与定义分离。
namespace test
{class string{private:char* _str;size_t _capacity;size_t _size;};
}

当然这个基础和实际上的库中的string类是有差别的。

这是cplusplus上给出的string的定义:

typedef basic_string<char> string;

可以看到库中的 string 是对一个类模版basic_string指定类型char得到的,实际上这个类可以得到四个类:

stringString class (class )
wstringWide string (class )
u16string String of 16-bit characters (class )
u32string String of 32-bit characters (class )

也就是其他不同的字符类型,不是很常用,而且使用方式和string完全相同,就不介绍了。

除此之外,如果你使用的是VS2022编译器,在监视窗口也可以发现VS2022中除了这个字符指针之外还添加了一个16个字节大小Buf数组:

_Buf

当这个Buf数组存满之后,才会将数据转移到_Ptr中,然后进行可能的扩容操作,这是VS编译器独特(应该)的优化方式。

当然gcc下string的定义也不是我们像我们写的这样简单,它用到了写时拷贝,这一点在本文最后面会补充。

3. 构造函数

注:只会实现最常用的构造函数,其它的构造函数原理也差不多。

3. 1 默认构造/from c_str

在类和对象(中)中说过,我们应该显示地实现一个默认构造,最好是全缺省的,所以我们就实现一个全缺省的默认构造。

// string.h
string(const char* str="");// string.c
// 声明与实现分离时,实现中不能写出缺省值
string::string(const char* str):_capacity(strlen(str))
{// 初始化列表是按照类模版中变量声明的顺序走的,所以需要注意顺序。不如把其他放在函数体内初始化,防止出错// 当然,把 _size 和 _str 都在初始化列表初始化也是可以的,但是一定要注意顺序_size = _capacity;	_str = new char[_capacity + 1];// 这里一定要注意要把 str 的内容拷贝到 _str 中,千万不能 _str = str 完事strcpy(_str, str);
}

构造string对象的时候,不要让_strnullptr,不然可能会导致报错,不如直接初始化为""来得方便。

3. 2 拷贝构造

这样写可以吗?

//string::string(const string s);	// 会导致循环构造
string::string(string& s):_size(s.size), _capacity(s._capacity)
{_str = s._str;
}

这里就不得不提关于深浅拷贝的问题了。

3. 2. 1 深浅拷贝

  1. 浅拷贝:也称位拷贝,编译器只是将对象中的值(包括指针)直接拷贝过来。如果对象中有动态资源就会导致多个对象同时操作一个空间的内容。并且当一个对象销毁时就会将该资源释放掉,而此时另一些对象不知道该资源已经被释放,以为还有效,就会继续对资源进行操作,发生野指针访问。

  2. 如果一个类中涉及到资源的管理,其拷贝构造函数、赋值运算符重载以及析构函数必须要显式给出。并且一般情况都要用深拷贝方式实现。

像上面那样直接_str = s._str就是典型的浅拷贝。

如果要实现string的深拷贝,可以使用strcpy函数,将s._str中的数据挨个复制到_str中,这样_str就和s._str完全无关了。

因此拷贝构造要这么写:

string::string(const string& s):_capacity(s._capacity),_size(s._size)
{// 记得申请空间_str = new char[_capacity + 1];strcpy(_str, s._str);
}

3. 3 fill

string::string(size_t n, char c):_capacity(0), _size(0)
{for (int i = 0; i < n; i++)push_back(c);
}

这里用到了push_back(),可以节省不必要的代码,体现了复用的思想。

3. 4 迭代器区间构造

在此之前,我们先讲一下怎么实现迭代器:

typedef char* iterator;	//切记迭代器必须是这个名字!!!

现代编译器中迭代器的实现远比这个复杂,但功能上并没有差异,并且早期的STL版本中随机迭代器string的迭代器就是随机迭代器,迭代器的其他种类以后介绍)就是这样的实现。

既然迭代器就是一个指针,那么使用它进行构造也就算不上难事了。

// 注意,迭代器的类型各不相同,要使用模板(尽管string的构造一般也只会使用string的迭代器)
template<class InputIterator>
string(InputIterator first, InputIterator end):_str(nullptr), _size(0),_capacity(0)	// 对成员变量进行初始化
{reserve(end - first);	// 先预留足够的空间,减少损耗while (first != end){push_back(*first);	// 直接使用push_back(),减少重复的代码量,当然也可以不使用push_back()而是直接插入first++;}
}

这里要特别说明一下为什么用while (first != end)而不是while (first < end),因为迭代器不只有这一种类型,比如说链表也有迭代器,尽管说通过操作符重载也能实现和string的迭代器差不多的功能,但是链表的每个节点都是动态开辟的,而动态开辟的地址的大小是不确定的,所以first不一定小于end,为了兼容所有类型的迭代器,在需要对迭代器进行遍历操作时,我们统一都使用first != end作为循环的结束条件。

4. 容量操作

4. 1 size()capacity()empty()

前两个直接返回_size()_capacity就可以了。

size_t string::size()const
{return _size;
}size_t string::capacity()const
{return _capacity;
}

empty()就是返回_size是否为0.

bool string::empty()const
{return _size == 0;
}

别忘了在函数名后面加上const来兼容不可修改的实例化对象。

4. 2 clear()

将有效字符全部删除,大小置为0。

其实直接修改_size的大小,并在第一位加上'\0'就可以了。

void string::clear()
{_size = 0;_str[0] = '\0';
}

4. 3 resize()

void resize(size_t n, char c = '\0');

resize()需要处理两种情况:

  1. 新的大小>原来的大小:用字符c填补,还要判断容量是否足够。
  2. 新的大小<=原来的大小:缩减字符串的大小到新的大小。
void string::resize(size_t n, char c)
{// 第一种情况if (n > _size){// 判断是否需要扩容if (n + _size > _capacity){// 扩容,因为我们的构造函数不会吧_capacity置为0,而是2或其他值,所以不用判空size_t newcapacity = n + _size > 2 * _capacity ? n + _size : 2 * _capacity;reserve(newcapacity);_capacity = newcapacity;}// 插入字符 c,使 _size == nfor (size_t i = _size; i < n + _size; i++)_str[i] = c;// 添加'\0'_str[n + _size] = '\0';// 更新数组大小_size += n;}else{// 这个和clear()很像,只是不是把大小置为0而是n_str[n] = '\0';_size = n;}
}

但是第一种情况的书写未免太过复杂,有没有办法简化?

后面我们写push_back()的时候就会发现,其实第一种情况和push_back()的代码是高度重合的,我们可以直接对push_back()进行复用,这是string现代写法,本文会有一章来介绍所谓的现代写法。

4. 4 reserve()

void reserve (size_t n = 0);

用于预留空间。

需要注意的是,reserve()在扩容时一般不是n给多少就扩容到多少,我们先来看这个代码:

#include<string>
#include<iostream>
using namespace std;
int main()
{string s("");int last = 0;int i = 0;while (last < 1000){s.reserve(i++);if (s.capacity() != last){last = s.capacity();cout << last << endl;}}return 0;
}

这个程序可以输出当string对象的容量变化时的新容量。

VS2022上的输出结果为:VS2022

devc++(5.11,gcc4.9.2)的输出结果为:devc++

可以发现reserve()在VS2022上是以1.5倍的大小进行扩容(第一扩容是二倍,因为第二章中提到的_Buf数组),只有当新的容量大于现在的容量的1.5倍,才会进行扩容操作。

而devc++是2倍扩容,但是会在一些情况下缩小容量。

为了简化,我们采用简化版的VS2022的实现。

  1. n<=_capacity

这个函数不会做任何举动。

  1. n>_capacity

如果 n <= 1.5 * _capacity,就直接扩容至1.5倍,如果n <= 1.5 * _capacity,就扩容至n

void string::reserve(size_t n)
{// 如果 n < _capacity 就不做任何操作if (n > _capacity){int newcapacity = 0;// 如果 n <= 1.5 * _capacity,就直接扩容至1.5倍,如果 n <= 1.5 * _capacity ,就扩容至 nif (n < _capacity * 1.5)newcapacity = _capacity * 1.5;elsenewcapacity = n;// 创建新的字符指针,注意要动态开辟char* newstr = new char[newcapacity + 1]; // +1是为了给'\0'留位置// 拷贝数据strcpy(newstr, _str);// 释放原空间delete[] _str;// 修改成员变量_str = newstr;_capacity = newcapacity;}
}

剩余内容请看:(本文发布后3天内更新)
string模拟实现下

谢谢你的阅读,喜欢的话来个点赞收藏评论关注吧!
我会持续更新更多优质文章

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/19328.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

视频直播5G CPE解决方案:ZX7981PG/ZX7981PMWIFI6网络覆盖

方案背景 视频直播蓬勃发展的当下&#xff0c;传统直播网络联网方式的局限性越来越明显。目前传统直播的局限性主要集中在以下几个方面&#xff1a; 传统直播间网络架构条件有限&#xff0c;可连接WIFI数量少&#xff0c;多终端同时直播难以维持&#xff1b;目前4G网络带宽有限…

input file结合vue3和vant实现上传图片效果,并显示上传进度百分比%

这里写自定义目录标题 采用的dom结构是input file&#xff0c;label事件绑定&#xff0c;一下为代码传入参数为uploadNum实现效果如图上传中&#xff0c;图片1上传成功&#xff0c;图片2 采用的dom结构是input file&#xff0c;label事件绑定&#xff0c;一下为代码 传入参数为…

SELECT 语句详解

开发准备 注:如果你是从上一节直接进入本节进行学习的,请先删除上一节建立的数据库mysql_shiyan,删除语句为DROP DATABASE mysql_shiyan;。在正式开始本实验内容之前,需要先下载相关数据库表,搭建好一个名为mysql_shiyan 的数据库(有三张表:department,employee,projec…

重力传感器算法概述!

一、核心技术 高精度重力测量技术&#xff1a; 无人机重力传感器的核心技术之一是能够高精度地测量重力加速度数据。这通常依赖于先进的传感器设计和制造工艺&#xff0c;以确保传感器具有高度的灵敏度和稳定性。 例如&#xff0c;中国船舶第七〇七研究所自主研发的低空重力…

炼码LintCode--数据库题库(级别:中等;数量:更新中~)--刷题笔记_03

目录 炼码LintCode--数据库题库&#xff08;级别&#xff1a;中等&#xff1b;数量&#xff1a;更新中~&#xff09;--刷题笔记_033617 更换连续两个人的座位&#xff08;case when&#xff09;题&#xff1a;sql&#xff1a;解释&#xff1a; 3615 数据中位数&#xff08;窗…

【stm入门学习SPI_铁头山羊系列教程】

stm入门学习SPI_铁头山羊教程 1.SPI总线1.电路结构与通信协议2.SPI的特点&#xff1a;3. 极性 相位4. 4中时钟模式5. 比特位的传输模式6.数据宽度 2. SPI引脚IO引脚初始化 1.SPI总线 1.电路结构与通信协议 主机向从机NSS引脚发送低电压&#xff0c;选中该从机。 主机通过向MOS…

RK3568平台开发系列讲解(platform虚拟总线驱动篇)实验:点亮一个LED

🚀返回专栏总目录 文章目录 一、设备树二、平台驱动三、应用沉淀、分享、成长,让自己和他人都能有所收获!😄 📢xxx 程序编写的主要内容为添加 LED 灯的设备树节点、在驱动程序中使用 of 函数获取设备节点中的属性,编写测试应用程序。 • 首先向设备树添加 LED 设备节点…

Spring Boot 与腾讯云 MySQL 监听 Binlog 数据变化,并使用 UI 展示页面效果

引言 在现代的分布式系统和微服务架构中&#xff0c;数据同步和变更监控是保证系统一致性和实时性的核心问题之一。MySQL 数据库的 binlog&#xff08;二进制日志&#xff09;功能能够记录所有对数据库的修改操作&#xff0c;如插入&#xff08;INSERT&#xff09;、更新&…

菜鸟驿站二维码/一维码 取件识别功能

特别注意需要引入 库文 ZXing 可跳转&#xff1a; 记录【WinForm】C#学习使用ZXing.Net生成条码过程_c# zxing-CSDN博客 using System; using System.Collections.Generic; using System.Linq; using System.Text; using System.Threading.Tasks; using static System.Net.…

PlantUML——时序图

PlantUML时序图 背景 时序图&#xff08;Sequence Diagram&#xff09;&#xff0c;又名序列图、循序图&#xff0c;是一种UML交互图&#xff0c;用于描述对象之间发送消息的时间顺序&#xff0c;显示多个对象之间的动态协作。时序图的使用场景非常广泛&#xff0c;几乎各行各…

算法——链表相交(leetcode23)

链表相交这题就是找出两个相交链表相交的节点并返回 如上图假设上方第一个节点是链表A的头结点下方第一个节点是链表B的头结点 解法有以下两种 方法一(移动长链表指针后同步移动两个链表的指针直至相等) 也就是先遍历链表A和链表B的长度接着得到链表A和B长度的差值然后领长链…

STM32单片机锁死

自己画了一块stm32f407板子&#xff0c;外部晶振用了25MHz&#xff0c;烧写了8MHz的程序&#xff0c;第一次烧写成功&#xff0c;第二次开始识别不到芯片&#xff0c;第一次烧写成功由于外部晶振为25Hz&#xff0c;芯片内频率计算器却是按照8MHz写的&#xff0c;所以得出最后的…

Windows文件资源管理器增强工具

引言&#xff1a; 资源管理器在我们使用电脑时是经常用到的&#xff0c;各种文件资源等的分类整理都离不开它。但是Windows Explorer确实不好用&#xff0c;不智能&#xff0c;不符合人体工程学。特别是在一些场合&#xff0c;在打开的一堆文件夹里&#xff0c;想从中找到自己要…

聚类中3个解空间的描述

深度学习中做分类任务时&#xff0c;我们常常根据最后的全连接层得到一组向量A&#xff08;比如&#xff1a;[0.9, 0.7, 0.2]&#xff09;&#xff0c;这组向量经过归一化得到向量B(比如&#xff1a;[0.5&#xff0c; 0.3&#xff0c; 0.2])&#xff0c;再根据B向量采用概率最大…

Empirical analysis of hardware-assisted GPU virtualization

​ 年份&#xff1a;2019 作者&#xff1a;Anshuj Garg 会议&#xff1a;ESCI 出版商&#xff1a;IEEE 摘要 本篇文章对vGPU虚拟化的性能开销、调度算法的影响、同构与异构工作负载的干扰效应&#xff0c;以及PCI直通与vGPU的性能差异进行了研究。结果表明&#xff0c;vGP…

Java面试题2024-Java基础

Java基础 1、 Java语言有哪些特点 1、简单易学、有丰富的类库 2、面向对象&#xff08;Java最重要的特性&#xff0c;让程序耦合度更低&#xff0c;内聚性更高&#xff09; 3、与平台无关性&#xff08;JVM是Java跨平台使用的根本&#xff09; 4、可靠安全 5、支持多线程 2、…

【案例分享】运用 Infragistics Ultimate UI 让工业物联网 IIoT 数据流更易于访问

客户概况 贝克休斯旗下的 Bently Nevada 是状态监测和资产保护领域的全球领导者。该公司拥有 60 多年的专业知识&#xff0c;在全球安装了超过 600 万个传感器和 100,000 个机架监测系统。 如今&#xff0c;Bently Nevada的开发团队正在使用现代 UI 工具包来增强他们的系统&a…

PHM技术:基于支持向量机的智能故障诊断 | 行星齿轮箱智能故障诊断

目录 1.数据获取 2.特征提取与选择 3.健康状态识别 1.数据获取 用的行星齿轮箱数据采集自图1中的多级齿轮传动系统实验台中&#xff0c;在实验过程中&#xff0c;分别模拟了8种行星齿轮箱的健康状态&#xff0c;包括正常、第一级太阳轮点蚀、第一级太阳轮齿根裂纹、第一级…

推荐一款Windows系统精简工具:NTLite

NTLite是一款可以对Windows系统优化的安装工具&#xff0c;使用这款完全中文的NTLite授权注册版让你不会因为注册或者语言导致无法正常的使用&#xff0c;如果你正需要马上下载使用吧。 NTLite基本简介 NTLite 中文版可以用来做什么&#xff0c;它其实是一款 Windows 系统精简…

ESP-IDF VScode 项目构建/增加组件 新手友好!!!

项目构建 1.新建文件夹&#xff0c;同时在该文件夹内新建.c和.h文件 如图所示&#xff0c;在components中新建ADC_User.c、ADC_User.h、CMakeLists.txt文件。当然这里你也可以不在components文件夹内新建文件&#xff0c;下面会说没有在components文件夹内新建文件构建项目的方…