【本节目标】1. 为什么学习string类?
·1. 为什么要学习string类
·2. 标准库中的string类
·3. string类的模拟实现
1.1 C语言中的字符串
C语言中,字符串是以'\0'结尾的一些字符的集合,为了操作方便,C标准库中提供了一些str系列的库函数,但是这些库函数与字符串是分离开的,不太符合OOP的思想,而且底层空间需要用户自己管理,稍不留神可能还会越界访问。2. 标准库中的string类
2.1 string类
1. 字符串是表示字符序列的类
2. 标准的字符串类提供了对此类对象的支持,其接口类似于标准字符容器的接口,但添加了专门用于操作单字节字符字符串的设计特性。
3. string类是使用char(即作为它的字符类型,使用它的默认char_traits和分配器类型(关于模板的更多信息,请参阅basic_string)。
4. string类是basic_string模板类的一个实例,它使用char来实例化basic_string模板类,并用char_traits和allocator作为basic_string的默认参数(根于更多的模板信息请参考basic_string)。
5. 注意,这个类独立于所使用的编码来处理字节:如果用来处理多字节或变长字符(如UTF-8)的序列,这个类的所有成员(如长度或大小)以及它的迭代器,将仍然按照字节(而不是实际编码的字符)来操作。
总结:
1. string是表示字符串的字符串类
2. 该类的接口与常规容器的接口基本相同,再添加了一些专门用来操作string的常规操作。
3. string在底层实际是:basic_string模板类的别名,typedef basic_stringstring;
4. 不能操作多字节或者变长字符的序列。
在使用string类时,必须包含#include头文件以及using namespace std;
2.2 string类的常用接口说明
1. string类对象的常见构造
(constructor)函数名称 功能说明 string() (重点) 构造空的string类对象,即空字符串 string(const char* s) (重点) 用C-string来构造string类对象 string(const string&s) (重点) 拷贝构造函数 string(size_t n, char c) string类对象中包含n个字符c int main() { string s1; // 构造空的string类对象s1 string s2("hello bit"); // 用C格式字符串构造string类对象s2 string s3(s2); // 拷贝构造s3 return 0; }
2. string类对象的容量操作
函数名称 功能说明 size(重点) 返回字符串有效字符长度 length 返回字符串有效字符长度 capacity 返回空间总大小 empty (重点) 检测字符串释放为空串,是返回true,否则返回false clear (重点) 清空有效字符 reserve (重点) 为字符串预留空间 resize (重点) 将有效字符的个数改成n个,多出的空间用字符c填充
size,length,capacity,clear的实际应用:
文章图片
string在VS下的 增容:
文章图片
reserve:开空间,影响容量void TestPushBackReserve() { string s; // 利用reserve提高插入数据的效率,避免增容带来的开销 s.reserve(100); //申请至少能存储100个字符的空间 size_t sz = s.capacity(); cout << "capacity changed: " << sz << '\n'; cout << "making s grow:\n"; for (int i = 0; i < 100; ++i) { //s.push_back('c'); s += 'c'; if (sz != s.capacity()) { sz = s.capacity(); cout << "capacity changed: " << sz << '\n'; } } }
resize:开空间,对这些空间给一个初始值,进行初始化
文章图片
注意:
1. size()与length()方法底层实现原理完全相同,引入size()的原因是为了与其他容器的接口保持一致,一般情况下基本都是用size()。
2. clear()只是将string中有效字符清空,不改变底层空间大小。
3. resize(size_t n) 与 resize(size_t n, char c)都是将字符串中有效字符个数改变到n个,不同的是当字符个数增多时:resize(n)用0来填充多出的元素空间,resize(size_t n, char c)用字符c来填充多出的元素空间。注意:resize在改变元素个数时,如果是将元素个数增多,可能会改变底层容量的大小,如果是将元素个数减少,底层空间总大小不变。
4. reserve(size_t res_arg=0):为string预留空间,提前就开好了足够的空间,避免增容,不改变有效元素个数,当reserve的参数小于string的底层空间总大小时,reserver不会改变容量大小。
3. string类对象的访问及遍历操作
函数名称 功能说明 operator[] (重点) 返回pos位置的字符,const string类对象调用 begin+ end begin获取一个字符的迭代器 + end获取最后一个字符下一个位置的迭代器 rbegin + rend begin获取一个字符的迭代器 + end获取最后一个字符下一个位置的迭代器 范围for C++11支持更简洁的范围for的新遍历方式
迭代器的思路图解:void test_string1() { string s1("hello world"); //遍历字符串: //方式一:下标+[] for (size_t i = 0; i < s1.size(); i++) { s1[i] += 1; }//修改字符串元素 for (size_t i = 0; i < s1.size(); i++) { cout << s1[i] << " "; }//利用下标+[]遍历打印字符串 cout << endl; //方式二:迭代器 string::iterator it = s1.begin(); while (it != s1.end()) { *it -= 1; it++; }//利用迭代器修改字符串内容 it = s1.begin(); while (it != s1.end()) { cout << *it << " "; it++; }//利用迭代器遍历打印字符串 cout << endl; //方式三:范围for(语法糖)(C++11才可使用) //自动往后迭代,自动判断结束 for (auto& e : s1) //注意这里的auto要加上引用,s1把每个字符赋值给e,所以e是s1每个字符的拷贝,对e改变不会改变s1的内容,所以要加上引用 { e -= 1; }//利用范围for修改字符串 for (auto e : s1)//auto自动推导s1的类型 { cout << e << " "; }//利用范围for遍历字符串打印 cout << endl; }
文章图片
反向迭代器:主要用来倒着遍历字符串。
文章图片
void test_string2()
{
//反向迭代器
string s1("hello world");
//string::reverse_iterator rit = s1.rbegin();
auto rit = s1.rbegin();
//auto自动推导上面的类型
while (rit != s1.rend())
{
cout << *rit << " ";
rit++;
}
cout << endl;
}
迭代器遍历的意义是什么呢?-----所有的容器都可以使用迭代器这种方式去访问修改4. string类对象的修改操作
对于string,无论是正着遍历,倒着遍历,下标+[]的方式都已经足够方便了。为什么还需要迭代器呢?
对于string,下标+[]的方式就足够好用,可能大家觉得迭代器比较多余。但是如果是其他容器(数据结构)呢?那么下标+[]这种方式似乎就不适用了,所以迭代器才是最通用的方式!
函数名称 功能说明 push_back 在字符串后尾插字符c append 在字符串后追加一个字符串 operator+= (重点) 在字符串后追加字符串str c_str(重点) 返回C格式字符串 find + npos(重点) 从字符串pos位置开始往后找字符c,返回该字符在字符串中的位置 rfind 从字符串pos位置开始往前找字符c,返回该字符在字符串中的位置 substr 在str中从pos位置开始,截取n个字符,然后将其返回
尾插+=,append,push_back的应用场景:int main() { string s1; s1.push_back('a'); s1.append("bcde"); cout << s1 << endl; s1 += ':'; s1 += "hello world"; cout << s1 << endl; return 0; }
c_str的应用场景:
文章图片
find+nops,rfind,substr的场景应用:
void test_string4() { string file("test.txt"); FILE* fout=fopen(file.c_str(), "w"); //要求取出文件的后缀名 size_t pos = file.find('.'); //从头开始找使用find if (pos != string::npos) { string suffix = file.substr(pos, file.size() - pos); //file.size()-pos=4 cout << suffix << endl; } string file("test.txt.zip"); FILE* fout = fopen(file.c_str(), "w"); //要求取出文件的后缀名 size_t pos = file.rfind('.'); //从后面找使用rfind if (pos != string::npos) { string suffix = file.substr(pos, file.size() - pos); //file.size()-pos=4 cout << suffix << endl; } //上面两个查找类似于char * strstr ( const char *str2, const char * str1)的C库函数 }
void test_string5() { //find的第二个作用实例: string url("http://www.cplusplus.com/reference/string/string/?kw=string"); size_t pos1 = url.find(':'); string protocol = url.substr(0, pos1 - 0); cout << protocol << endl; //如何去取中间的域名? size_t pos2 = url.find('/', pos1 + 3); //pos1+3是从w开始找,找到/位置为止 string domainName = url.substr(pos1 + 3, pos2 - (pos1 + 3)); cout << domainName << endl; string usi = url.substr(pos2 + 1); cout << usi << endl; }
除了尾插的+=,append,push_back之外,还有insert可以进行头插和中间插入,但是效率很低,尽量少用。
文章图片
还有erase的头删尾删字符删除场景:
文章图片
5. string类非成员函数3. string类的模拟实现
函数 功能说明 operator+ 尽量少用,因为传值返回,导致深拷贝效率低 operator>> (重点) 输入运算符重载 operator<< (重点) 输出运算符重载 getline (重点) 获取一行字符串 relational operators (重点) 大小比较 int main() { string s; //cin>>s; //cin和scnaf默认以空格或换行符为间隔 getline(cin,s); //获取一行字符串 }
文章图片
文章图片
3.1 经典的string类问题
上面已经对string类进行了简单的介绍,大家只要能够正常使用即可。接下来自己来模拟实现string类,最主要是实现string类的构造、拷贝构造、赋值运算符重载以及析构函数。大家看下以下string类的实现是否有问题?
namespace Bernard
{
class string
{
public:
string(const char* str)
:_str(new char[strlen(str)+1])
{
strcpy(_str, str);
}
~string()
{
delete[] _str;
_str = nullptr;
}
private:
char* _str;
};
void Teststring()
{
string s1("hello bit!!!");
string s2(s1);
}
}
int main()
{
Bernard::Teststring();
return 0;
}
文章图片
说明:上述string类没有显式定义其拷贝构造函数与赋值运算符重载,此时编译器会合成默认的,当用s1构造s2时,编译器会调用默认的拷贝构造。最终导致的问题是,s1、s2共用同一块内存空间,在释放时同一块空间被释放多次而引起程序崩溃,这种拷贝方式,称为浅拷贝。3.2 浅拷贝
浅拷贝:也称位拷贝,编译器只是将对象中的值拷贝过来。如果对象中管理资源,最后就会导致多个对象共享同一份资源,当一个对象销毁时就会将该资源释放掉,而此时另一些对象不知道该资源已经被释放,以为还有效,所以当继续对资源进项操作时,就会发生发生了访问违规。要解决浅拷贝问题,C++中引入了深拷贝。3.3 深拷贝
如果一个类中涉及到资源的管理,其拷贝构造函数、赋值运算符重载以及析构函数必须要显式给出。一般情况都是按照深拷贝方式提供。
文章图片
3.3.1 传统版写法的string类
class string
{
public:
string(const char* str = "")//常量字符串默认加\0了
{
// 构造string类对象时,如果传递nullptr指针,认为程序非法,此处断言下
if (nullptr == str)
{
assert(false);
return;
}
_str = new char[strlen(str) + 1];
strcpy(_str, str);
}
string(const string& s)
: _str(new char[strlen(s._str) + 1])
{
strcpy(_str, s._str);
}
string& operator=(const string& s)
{
if (this != &s)//防止出现自己给自己拷贝(s3=s3)的时候空间被清理掉
{
char* tmp = new char[strlen(s._str) + 1];
//先开辟空间再释放this空间
strcpy(tmp, s._str);
delete[] _str;
_str = tmp;
}
return *this;
}
~string()
{
if (_str)
{
delete[] _str;
_str = nullptr;
}
}
private:
char* _str;
};
3.3.2 现代版写法的string类
class string
{
public:
string(const char* str = "")
{
if (nullptr == str)
str = "";
_str = new char[strlen(str) + 1];
strcpy(_str, str);
}
//s2(s1)
string(const string& s)
: _str(nullptr)//先把s2置为空指针
{
string tmp(s._str);
swap(_str, tmp._str);
}
string& operator=(string s)
{
swap(_str, s._str);
return *this;
}
~string()
{
if (_str)
{
delete[] _str;
_str = nullptr;
}
}
private:
char* _str;
};
这里看一个小知识点(C++98中),string类中的swap函数和全局函数的swap函数:3.4 string类的模拟实现
int main() { std::string s1("hello world"); std::string s2("111111"); s1.swap(s2); //string提供的swap函数,效率更高--仅仅是对成员变量进行交换即可 swap(s1, s2); //全局函数提供的swap,代价很大--中间进行了三次string的深拷贝过程 return 0; }
namespace Bernard
{
class string
{
public:
typedef char* iterator;
typedef const char* const_iterator;
const_iterator begin()const
{
return _str;
}
const_iterator end()const
{
return _str + _size;
}
iterator begin()//第一个位置的指针
{
return _str;
}
iterator end()//最后一个有效数据的下一位的指针
{
return _str + _size;
}
/*string()
:_str(new char[1])
,_size(0)
,_capacity(0)
{
_str[0] = '\0';
}*/
string(const char* str = "")//常量字符串默认加\0了
:_size(strlen(str))
, _capacity(_size)
{
_str = new char[_capacity + 1];
strcpy(_str, str);
}
~string()
{
delete[] _str;
_str = nullptr;
_size = _capacity = 0;
}
void Swap(string& s)
{
swap(_str, s._str);
swap(_size, s._size);
swap(_capacity, s._capacity);
}
//s2(s1)
string(const string& s)
:_str(nullptr)
, _size(0)
, _capacity(0)//初始化防止交换过后出现随机值
{
string tmp(s._str);
//this->Swap(tmp);
Swap(tmp);
}
//s1=s3
string& operator=(string& s)
{
Swap(s);
return *this;
}
const char* c_str()const
{
return _str;
}
size_t size()const
{
return _size;
}
char& operator[](size_t pos)//可读可写的方式
{
assert(pos < _size);
return _str[pos];
}
const char& operator[](size_t pos)const//只读的方式
{
assert(pos < _size);
return _str[pos];
}
void reserve(size_t n)//扩容函数
{
if (n > _capacity)
{
char* tmp = new char[n + 1];
//要给\0多开一个空间,+1一下
strcpy(tmp, _str);
delete[] _str;
_str = tmp;
_capacity = n;
}
}
void resize(size_t n, char ch = '\0')
{
if (n <= _size)//比size小的情况
{
_str[n] = '\0';
_size = n;
}
else//比size大的情况
{
if (n > _capacity)//如果n比容量大需要拿来扩容一下
{
reserve(n);
}
memset(_str + _size, ch, n - _size);
_size = n;
_str[_size] = '\0';
}
}
void push_back(char ch)
{
//if (_size == _capacity)
//{
// //增容
// reserve(_capacity == 0 ? 4 : _capacity * 2);
//}
//_str[_size] = ch;
//先放入字符
//_size++;
//_str[_size] = '\0';
//最后放入\0
insert(_size, ch);
//复用insert
}
void append(const char* str)
{
//size_t len = strlen(str);
//if (_size + len > _capacity)
//{
// reserve(_size + len);
//}
//strcpy(_str + _size, str);
//直接在\0处开始插入str即可
//_size += len;
insert(_size, str);
//复用insert
}
string& operator+=(char ch)//加上一个字符
{
push_back(ch);
return *this;
}
string& operator+=(const char* str)//加上一个字符串
{
append(str);
return *this;
}
size_t find(char ch)
{
for (size_t i = 0;
i < _size;
i++)
{
if (ch == _str[i])
{
return i;
}
}
return npos;
}
size_t find(const char* str, size_t pos = 0)
{
const char* ptr = strstr(_str + pos, str);
if (ptr == nullptr)
{
return npos;
}
else
{
return ptr - _str;
//用找到的起始下标-字符串起始下标就是需要返回的下标
}
}
string& insert(size_t pos, char ch)
{
assert(pos <= _size);
if (_size == _capacity)
{
reserve(_capacity == 0 ? 4 : _capacity * 2);
}
size_t end = _size + 1;
while (end > pos)
{
_str[end] = _str[end - 1];
end--;
}
_str[pos] = ch;
_size++;
return *this;
}
string& insert(size_t pos, const char* str)
{
assert(pos <= _size);
size_t len = strlen(str);
if (_size + len > _capacity)
{
reserve(_size + len);
}
size_t end = _size + len;
while (end >= pos + len)//注意这个地方的边界控制
{
_str[end] = _str[end - len];
end--;
}
strncpy(_str + pos, str, len);
_size += len;
return *this;
}
string& erase(size_t pos = 0, size_t len = npos)
{
assert(pos < _size);
if (len == npos || pos + len >= _size)//当需要删除的数据长度过大,超过了有效数据的个数时
{
_str[pos] = '\0';
//直接在pos位置填\0即可
_size = pos;
}
else
{
strcpy(_str + pos, _str + pos + len);
//直接把pos位置后面的值全部拷贝过去即可
_size -= len;
}
}
bool operator<(const string& s)const
{
return strcmp(_str, s._str) < 0;
}
void clear()
{
_str[0]='\0';
_size=0;
}
private:
char* _str;
size_t _size;
//有效字符的个数
size_t _capacity;
//能存储有效字符的空间数,不包括\0
static const size_t npos;
};
}
const size_t string::npos = -1;
//整型的最大值
bool operator<(const string& s1, const string& s2)
{
//size_t i1 = 0, i2 = 0;
//while (i1 < s1.size() && i2 < s2.size())
//{
// if (s1[i1] < s2[i2])
// {
//return true;
// }
// else if (s1[i1] > s2[i2])
// {
//return false;
// }
// else
// {
//i1++;
//i2++;
// }
//}
三种可能情况
"abcd" "abcd" --false
"abcd" "abcde" --true
"abcde" "abcd" --false
//return i2 < s2.size() ? true : false;
//第一种实现方式
strcmp(s1.c_str(), s2.c_str()) < 0;
//第二种实现方法
}
bool operator==(const string& s1, const string& s2)
{
return strcmp(s1.c_str(), s2.c_str()) == 0;
}
bool operator<=(const string& s1, const string& s2)
{
return s1 < s2 || s1 == s2;
}
bool operator>(const string& s1, const string& s2)
{
return !(s1 <= s2);
}
bool operator>=(const string& s1, const string& s2)
{
return !(s1 < s2);
}
bool operator!=(const string& s1, const string& s2)
{
return !(s1 == s2);
}
ostream& operator<<(ostream& out, const string& s)
{
/*for (auto ch : s)
{
out << ch;
}*///方法一
for (size_t i = 0;
i < s.size();
i++)
{
out << s[i];
}//方法二
//注意不能使用c_str(),因为c_str遇到\0就停止了
return out;
}
istream& operator>>(istream& in, string& s)
{
s.clear();
char ch = in.get();
while (ch != ' ' && ch != '\n')//遇到换行或空格结束
{
s += ch;
ch = in.get();
}
return in;
}
【c++|C++之string类(·标准库中的string类·string类的模拟实现)】
推荐阅读
- C++|【c++运算符重载】
- C|天天new对象的程序员,居然能找到女朋友(还能教你追女生?)
- c++|NMS 原理和c++实现,已测试通过
- vscode|Visual Studio Code(vscode)安装和插件安装
- visual|使用 Visual Studio Code 编写你的第一个 C 程序
- visual|visual studio html插件,Visual Studio Code 常用的插件
- visual|三大Visual Studio Code技巧,快速提升开发效率
- VC++|VC++使用画刷绘图 简单画刷 FillRect函数 位图画刷 透明画刷
- VC++|VC++ 利用MFC的CWindowDC类实现画线功能 在桌面窗口中画线 绘制彩色线条 CPen nPenStyle nWidth crColor