统计一篇文本中空格、单词、句子、非字母字符个数

思路:每次从文件中读取一行放到缓存数组中,遍历该数组,单词个数等于空格个数加1,句子个数等于?、!、。个数之和, 用isalpha()统计非字母字符个数,, 要去掉空格, 头文件可统计时间, 处理"."时需要去掉小数点
参考资料是刘汝佳的《算法竞赛入门经典》
下面是源代码,不足之处请多指教

#include #include #include #include // 用该头文件的isalpha函数判断非字母字符 #include // 统计时间 char buffchar[1010]; // 每行最多统计不超过1010个字符 int countsum[4] = {0, 0 ,0, 0}; // 用来统计 int *dealcount(char *filename, int *countsum); // 声明 int main(void){ char filename[30]; // 读入文件名 printf("输入文件名:"); scanf("%s" ,filename); // 读文件 dealcount(filename, countsum); // 调用统计寒暑 printf("统计结果(个数):\n空格:%d\n单词:%d\n句子:%d\n非字母字符个数:%d", countsum[0], countsum[1], countsum[2] , countsum[3] ); printf("\n运行时间%0.2f:", (double)(clock()/CLOCKS_PER_SEC)); // 这个方法将键盘输入时间也计算在内,不太好 return 0; } /***下面是统计函数 **/ int *dealcount(char *filename, int *countsum){ FILE *fp; // 指向文件的指针 int len; // 记录长度 bool islastBlanck = true; // 上个字符是否是空格 char c; // 当前字符 char endflag[] = "?!"; // 一句话结束表志 if((fp = fopen(filename ,"r")) == NULL){perror(filename); // perror()打印上一个函数错误信息 return NULL; } while(fgets(buffchar, 1010, fp) != NULL){ // 这里使用fgets()而不是getc()是因为在不同的平台下对文本换行的处理不同,win上是\n和\r,而lunix上屏蔽 // \r,s所以用getc反而麻烦. len = strlen(buffchar); for(int i = 0; i < len; i++){c = buffchar[i]; if(!isalpha(c)){// 不是字符 if(c != ' '&&c != '\t' && c != '\n' && c != '\r') // 非字母字符个数将空格、换行去掉 countsum[3]++; if((strchr(endflag, c) != NULL) || ( (buffchar[i+1] == " " || buffchar[i+1]== "\t" || buffchar[i+1] == "\n"

|| buffchar[i+1] == "\r")&& c == '.')) // 一句话结束, strchr()查找某个字符是否在数组中, countsum[2]++; //在的话返回第一次出现位置指针 }if(c == ' ' || c == '\t'){countsum[0]++; // 统计空格个数 if(!islastBlanck){ // 空格前一个字符不是空格的话就是空格前有个单词 countsum[1]++; islastBlanck = true; } }else if(c != '\n' && c != '\r'){ // 忽略换行符 islastBlanck = false; } }if(!islastBlanck){ // 如果最后一个字符不是空格 countsum[1]++; }islastBlanck = true; } return countsum; }



【统计一篇文本中空格、单词、句子、非字母字符个数】

    推荐阅读