C语言之字符函数和字符串函数(下)
欢迎拜访:雾里看山-CSDN博客
本篇主题:C语言之字符函数和字符串函数(下)
发布时间:2025.1.19
隶属专栏:C语言
目录
- 字符串查找
- strstr
- 函数介绍
- 函数使用
- strtok
- 函数介绍
- 函数使用
- 错误信息报告
- strerror
- 函数介绍
- 函数使用
- 字符操作
- 字符分类函数
- 函数介绍
- 函数使用
- 字符转换函数
- 函数介绍
- 函数使用
- 内存操作
- memcpy
- 函数介绍
- 函数使用
- 函数实现
- memmove
- 函数介绍
- 函数使用
- 函数实现
- memset
- 函数介绍
- 函数使用
- 函数实现
- memcmp
- 函数介绍
- 函数使用
- 函数实现
字符串查找
strstr
函数介绍
strstr
函数格式:char *strstr (char *str1, char *str2 );
功能:在str1
中查找子串str2
,找到后返回子串的起始地址,找不到则返回空指针(NULL
)。
返回值:指向str2
中指定的整个字符序列在tr1
中第一次出现的指针,如果该序列不存在于str1
中,则为空指针(NULL
)。
头文件: strstr
函数的声明在string.h
的头文件中,在使用时,要使用#include <string.h>
操作包含头文件。
特别注意:
- C++中重载了另外两个版本的
strstr
: 1.const char * : strstr(const char *str1,const char *str2);
2.char *strstr (char *str1, const char *str2 );
函数使用
#include <stdio.h>
#include <string.h>
int main()
{
char str1[] = "abbbcdef";
char str2[] = "bbc";
char* ret = strstr(str1, str2);
if (ret != NULL)
printf("找到了,起始位置是:%d\n", ret-str1);
else
printf("找不到,该子串不存在");
return 0;
}
strtok
函数介绍
strtok
函数格式:char *strtok(char *str, const char *delimiters);
功能:对该函数的一系列调用将str
拆分为子串,子串是由delimiters
中的一个或多个字符进行分割的。子串的结尾自动替换为空字符\0
,并由函数返回子串的开头。在第一次调用时,该函数需要一个字符串作为strtok
的第一个参数,其第一个字符用作扫描令牌的起始位置。在随后的调用中,该函数需要一个空指针(NULL
),并使用上一个子串结束后的位置作为扫描的新起始位置。
返回值:如果找到子串,则返回指向该子串开头的指针。否则为空指针(NULL
)。当遇到正在扫描的字符串的末尾(即空字符\0
)时,返回空指针(NULL
)。
头文件: strtok
函数的声明在string.h
的头文件中,在使用时,要使用#include <string.h>
操作包含头文件。
特别注意:
delimiters
参数是个字符串,定义了用作分隔符的字符集合- 第一个参数指定一个字符串,它包含了0个或者多个由
delimiters
字符串中一个或者多个分隔符分割的标记。 strtok
函数找到str中的下一个标记,并将其用\0
结尾,返回一个指向这个标记的指针。strtok
函数会改变被操作的字符串,所以在使用strtok
函数切分的字符串一般都是临时拷贝的内容并且可修改。strtok
函数的第一个参数不为NULL
,函数将找到str
中第一个标记,strtok
函数将保存它在字符串中的位置。strtok
函数的第一个参数为NULL
,函数将在同一个字符串中被保存的位置开始,查找下一个标记。- 如果字符串中不存在更多的标记,则返回
NULL
指针。
函数使用
#include <stdio.h>
#include <string.h>
int main()
{
char str[] = "This, a sample string.";
char* pch;
printf("str = %s\n", str);
pch = strtok(str, " ,.");
while (pch != NULL)
{
printf("%s\n", pch);
pch = strtok(NULL, " ,.");
}
return 0;
}
错误信息报告
strerror
函数介绍
strerror
函数格式:char *strerror(int errnum);
功能:获取指向错误消息字符串的指针。解释errnum
的值,生成一个带有描述错误条件的消息的字符串。
返回值:指向描述错误errnum
的错误字符串的指针。
头文件: strerror
函数的声明在string.h
的头文件中,在使用时,要使用#include <string.h>
操作包含头文件。
特别注意:
- 返回的指针指向一个静态分配的字符串,该字符串不能被程序修改。
strerror
产生的错误字符串可能是特定于每个系统和库实现的。- 库函数在执行的时候,发生了错误,会将错误码存在
errno
这个变量中,errno
是C语言提供的一个全局变量。
错误码 | 错误信息 |
---|---|
0 | No error |
1 | Operation not permitted |
2 | No such file or directory |
3 | No such process |
4 | Interrupted function call |
5 | Input/output error |
6 | No such device or address |
7 | Arg list too long |
8 | Exec format error |
9 | Bad file descriptor |
10 | No child processes |
11 | Resource temporarily unavailable |
12 | Not enough space |
13 | Permission denied |
14 | Bad address |
15 | Unknown error |
16 | Resource device |
17 | File exists |
18 | Improper link |
19 | No such device |
20 | Not a directory |
21 | Is a directory |
22 | Invalid argument |
23 | Too many open files in system |
24 | Too many open files |
25 | Inappropriate I/O control operation |
26 | Unknown error |
27 | File too large |
28 | No space left on device |
29 | Invalid seek |
30 | Read-only file system |
31 | Too many links |
32 | Broken pipe |
33 | Domain error |
34 | Result too large |
35 | Unknown error |
36 | Resource deadlock avoided |
37 | Unknown error |
38 | Filename too long |
39 | No locks available |
40 | Function not implemented |
41 | Directory not empty |
42 | Illegal byte sequence |
函数使用
#include <stdio.h>
#include <string.h>
#include <errno.h>
int main()
{
FILE* pFile;
pFile = fopen("unexist.ent", "r");
if (pFile == NULL)
printf("打开文件错误,错误信息是: %s\n", strerror(errno));
return 0;
}
字符操作
字符分类函数
函数介绍
函数 | 如果符合条件就返回真 |
---|---|
iscntrl | 任何控制字符 |
isspace | 空白字符:空格‘ ’,换页‘\f’,换行’\n’,回车‘\r’,制表符’\t’或者垂直制表符’\v’ |
isdigit | 十进制数字 0~9 |
isxdigit | 十六进制数字,包括所有十进制数字,小写字母af,大写字母AF |
islower | 小写字母a~z |
isupper | 大写字母A~Z |
isalpha | 字母az或AZ |
isalnum | 字母或者数字,az,AZ,0~9 |
ispunct | 标点符号,任何不属于数字或者字母的图形字符(可打印) |
isgraph | 任何图形字符 |
isprint | 任何可打印字符,包括图形字符和空白字符 |
以上函数的声明在ctype.h
的头文件中,在使用时,要使用#include <ctype.h>
操作包含头文件。
函数使用
#include <stdio.h>
#include <ctype.h>
int main()
{
printf("%d\n", isdigit('2'));
printf("%d\n", isupper('a'));
printf("%d\n", isalpha('c'));
printf("%d\n", ispunct('.'));
return 0;
}
字符转换函数
函数介绍
tolower
toupper
函数格式:int tolower(int c);
int toupper(int c);
功能:tolower
是将大写字符转为小写字符,toupper
是将小写字符转为大写字符。
返回值:返回一个int
类型,该值可隐形转换为char
。
头文件: tolower
和toupper
函数的声明在ctype.h
的头文件中,在使用时,要使用#include <ctype.h>
操作包含头文件。
特别注意:
- 当不存在相应的小写或者大写字母时,返回其原值。
函数使用
#include <stdio.h>
#include <ctype.h>
int main()
{
printf("%c\n", toupper('a'));
printf("%c\n", tolower('A'));
printf("%c\n", toupper(','));
printf("%c\n", tolower('2'));
return 0;
}
内存操作
memcpy
函数介绍
memcpy
函数格式:void *memcpy(void *destination, const void *source, size_t num );
功能:将num
字节的值从source
指向的位置直接复制到destination
指向的内存块。
返回值:返回destination
的指针
头文件: memcpy
函数的声明在string.h
的头文件中,在使用时,要使用#include <string.h>
操作包含头文件。
特别注意:
source
指针和destination
指针所指向的对象的底层类型与此函数无关;结果是数据的二进制拷贝。- 该函数不检查
source
中是否有任何终止的\0
字符,它总是精确地复制num
个字节。 - 为了避免溢出,
destination
参数和source
参数所指向的内存的大小应该至少为num
字节. destination
和source
不应该重叠,重叠后的结果是不确定的(对于重叠的内存块,memmove
是一种更安全的方法)。
函数使用
#include<stdio.h>
#include<string.h>
int main()
{
int arr1[] = { 1,2,3,4,5,6,7,8,9,10 };
int arr2[20] = { 0 };
memcpy(arr2, arr1, 40);
for (int i = 0; i < 20; i++)
{
printf("%d ", arr2[i]);
}
printf("\n");
return 0;
}
函数实现
void* my_memcpy(void* dest, void* src, size_t num)
{
void* ret = dest;//记录起始地址
assert(dest != NULL);
assert(src != NULL);
while (num--)
{
*(char*)dest = *(char*)src;
dest = (char*)dest + 1;
src = (char*)src + 1;
}
return ret;
}
memmove
函数介绍
memmove
函数格式:void *memmove(void *destination, const void *source, size_t num );
功能:将num字节的值从 source
指向的位置复制到destination
指向的内存块。允许 source
和destination
重叠。
返回值:返回destination
的指针
头文件: memmove
函数的声明在string.h
的头文件中,在使用时,要使用#include <string.h>
操作包含头文件。
特别注意:
source
指针和destination
指针所指向的对象的底层类型与此函数无关;结果是数据的二进制拷贝。- 该函数不检查
source
中是否有任何终止的\0
字符,它总是精确地复制num
个字节。 - 为了避免溢出,
destination
参数和source
参数所指向的内存的大小应该至少为num
字节.
函数使用
#include<stdio.h>
#include<string.h>
int main()
{
int arr1[] = { 1,2,3,4,5,6,7,8,9,10 };
memmove(arr1+2, arr1, 20);
for (int i = 0; i < 10; i++)
{
printf("%d ", arr1[i]);
}
printf("\n");
return 0;
}
函数实现
void* my_memmove(void* dest, void* src, size_t num)
{
void* ret = dest;//记录起始地址
assert(dest != NULL);
assert(src != NULL);
if (dest < src)
{
while (num--)//从前往后
{
*(char*)dest = *(char*)src;
dest = (char*)dest + 1;
src = (char*)src + 1;
}
}
else
{
while (num--)//从后往前
{
*((char*)dest + num) = *((char*)src + num);
}
}
return ret;
}
memset
函数介绍
memset
函数格式:void* memset(void* ptr, int value, size_t num);
功能:将ptr
指向的内存块的前num
个字节设置为指定的值
返回值:返回ptr
的指针
头文件: memset
函数的声明在string.h
的头文件中,在使用时,要使用#include <string.h>
操作包含头文件。
特别注意:
value
作为int
类型传递,但函数使用该值的无符号字符(unsigned char
)转换来填充内存块。- 该函数不检查
ptr
中是否有任何终止的\0
字符,它总是精确地设置num
个字节。 - 为了避免溢出,
ptr
参数所指向的内存的大小应该至少为num
字节.
函数使用
#include <stdio.h>
#include <string.h>
int main()
{
char str[] = "hello world";
memset(str+1, '-', 6);
puts(str);
return 0;
}
函数实现
void* my_memset(void* ptr, int value, size_t num)
{
void* ret = ptr;//记录起始地址
unsigned char c = (unsigned char)value;
while (num--)//从前往后
{
*(char*)ptr = c;
ptr = (char*)ptr + 1;
}
return ret;
}
memcmp
函数介绍
memcmp
函数格式:int memcmp(const void* ptr1, const void* ptr2, size_t num );
功能:将ptr1
所指向的内存块的前num
字节与ptr2
所指向的前num字节进行比较,如果它们都匹配则返回0,如果不匹配则返回不同于0的值,表示哪个值更大。
返回值:返回一个整数,表示内存块内容之间的关系:
返回值 | 结果 |
---|---|
>0 | 在两个内存块中不匹配的第一个字节在ptr1中的值高于ptr2中的值 |
=0 | 两个内存块的内容是相等的 |
<0 | 在两个内存块中不匹配的第一个字节在ptr1中的值低于ptr2中的值 |
头文件: memcmp
函数的声明在string.h
的头文件中,在使用时,要使用#include <string.h>
操作包含头文件。
特别注意:
- 该函数在找到
\0
字符后不会停止比较。 ptr1
参数和ptr2
参数所指向的内存的大小应该至少为num
字节.- 字节之间的比较是通过转换成
unsigned char
类型进行比较的。
函数使用
#include<stdio.h>
#include<string.h>
int main()
{
int arr1[] = { 1,2,3,4,5,6,7,8,9,10 };
int arr2[] = { 1,2,257 };
int ret = memcmp(arr1, arr2, 10);
if (ret > 0)
{
printf("arr1 > arr2\n");
}
else if (ret < 0)
{
printf("arr1 < arr2\n");
}
else
{
printf("arr1 = arr2\n");
}
return 0;
}
函数实现
int my_memcmp(const void* ptr1, const void* ptr2, size_t num)
{
assert(ptr1 != NULL);
assert(ptr2 != NULL);
for (int i = 0; i < num; i++)
{
if (*(unsigned char*)ptr1 == *(unsigned char*)ptr2)
{
ptr1 = (char*)ptr1 + 1;
ptr2 = (char*)ptr2 + 1;
continue;
}
return (*(unsigned char*)ptr1 - *(unsigned char*)ptr2);
}
return 0;
}
⚠️ 写在最后:以上内容是我在学习以后得一些总结和概括,如有错误或者需要补充的地方欢迎各位大佬评论或者私信我交流!!!