嵌入式软件|C语言之——字符串

一、C语言没有原生字符串类型
(1)很多高级语言像java、C#等就有字符串类型,有个String来表示字符串,用法和int这些很像,可以String s1 = "linux"; 来定义字符串类型的变量。
(2)C语言没有String类型,C语言中的字符串是通过字符指针来间接实现的。
二、C语言使用指针来管理字符串
(1)C语言中定义字符串方法:char *p = "linux"; 此时p就叫做字符串,但是实际上p只是一个字符指针(本质上就是一个指针变量,只是p指向了一个字符串的起始地址而已)。
(2)C语言中字符串有3个核心要点:第一是用一个指针指向字符串头;第二是固定尾部(字符串总是以'\0'来结尾);第三是组成字符串的各字符彼此地址相连。
【嵌入式软件|C语言之——字符串】(3)char *p = "linux"; 在这段代码中,p本质上是一个字符指针,占4字节;"linux"分配在代码段,占6个字节;实际上总共耗费了10个字节,这10个字节中:4字节的指针p叫做字符串指针(用来指向字符串的,理解为字符串的引子,但是它本身不是字符串),5字节的用来存linux这5个字符的内存才是真正的字符串,最后一个用来存'\0'的内存是字符串结尾标志(本质上也不属于字符串)。
note:

'\0'是一个ASCII字符,其实就是编码为0(NULL)的那个字符(真正的0,和数字0是不同的,数字0有它自己的ASCII编码)。要注意区分'\0'和'0'和0.(0等于'\0','0'等于48)
三、字符串与字符数组的初始化与sizeof、strlen
(1)char *p = "linux"; sizeof(p)得到的永远是4,因为这时候sizeof测的是字符指针p本身的长度,和字符串的长度是无关的。strlen刚好用来计算字符串的长度()。
char *p = "linux"; printf("sizeof(p) = %d.\n", sizeof(p)); // 4 printf("strlen(p) = %d.\n", strlen(p)); // 5

(2)当我们定义字符数组时如果没有明确给出数组大小,则必须同时对数组进行初始化,编译器会根据初始化式去自动计算数组的大小(会在最后自动添加'\0')
char a[] = "windows"; // a[0] = 'w', a[1] = 'i', ````a[6] = 's', a[7] = '\0' printf("sizeof(a) = %d.\n", sizeof(a)); // 8 printf("strlen(a) = %d.\n", strlen(a)); // 7

note:
数组定义时必须给出大小,要么直接给,要么给初始化式,像char a[];这样的代码就是错误的,编译器会报错!
(3)当定义的字符数组没有完全初始化时,自动补'\0',所以在使用strlen函数时会出现如下的现象。(strlen计算字符串长度的原理就是寻找第一次出现的'\0')
char a[5] = "lin"; printf("sizeof(a) = %d.\n", sizeof(a)); // 5 printf("strlen(a) = %d.\n", strlen(a)); // 3char a[5] = {2, 3}; printf("sizeof(a) = %d.\n", sizeof(a)); // 5 printf("strlen(a) = %d.\n", strlen(a)); // 2char a[5] = {0}; printf("sizeof(a) = %d.\n", sizeof(a)); // 5 printf("strlen(a) = %d.\n", strlen(a)); // 0

四、字符串与字符数组的内存空间分配
通过指针定义字符串:char *a="abcdef"和通过字符数组定义字符串char a[]="abcdef"在内存的分配上是不同的:
前者存放在常量区,不可修改,后则存放在栈中,可以修改,例如,我们想把linux改为finux,以下代码就会出错:
char *p = "linux"; *(p+0) = 'f'; printf("p = %s.\n", p);

所以,我们在用指针的方式定义字符串的时候,加上const 关键字,在编译阶段就防止类似错误才是最正规的写法!
const char *p = "linux"; // 最正确的写法应该是这个

REF:
https://my.oschina.net/u/3979769/blog/2879145
https://www.cnblogs.com/CBDoctor/archive/2012/09/27/2705776.html
朱有鹏老师课堂笔记

    推荐阅读