【一个统计字数的程序】统计字数的程序读取输入的字符并报告其中的单词个数。处理时有可以统计字符个数和行数。来看看这样一个程序包含哪些步骤。
首先,这个程序应该逐个读取字符,并且应该有些方法判断何时停止;第二,他应该能够识别并统计下列单位:字符、行和单词。下面是伪代码描述:
read a character
while there is more input
increment character count
if a line has been read,increment line count
if a word has been read,increment word count
read next character
前面已经有输入循环的模型了:
while((ch = getchar())!=STOP)
{
....
}
这里,STOP代表通知输入结束的ch取值。前面的示例程序已经使用了换行符和句号来用于该目的,但对于一个通用的单词统计程序这两个都不合适。现在我们暂且选择一个在文本中不常见的字符(|)。在后面会有一个更好的解决方案,以使程序即能处理文本文件又能处理键盘输入。
现在来考虑一下循环体。因为程序使用getchar()来输入字符,所以可以再每个循环周期通过递增一个计数器的值来统计字符。为了统计行数,程序可以检查换行符。如果字符是换行符,程序就递增行数计数器。有个问题是如果STOP字符出现在一行的中间该怎么办。行数计数器应不应该增加呢?一种做法是将他作为一个不完整行统计,也就是说 ,该行有字符而没有换行符。可以通过追踪前一个字符来识别这种情况。如果STOP之前所读入的最后一个字符不是换行符,就计为一个不完整行。
最棘手的部分是识别单词。首先,必须明确定义一个单词意味着什么。让我们以一个相对简单的方法将一个单词定义为不包括空白字符(也就是说,没有空格、制表符或换行符)的一系列字符。因此,“glymxck”和r2d2是单词。一个单词以程序首次遇到非空白字符开始,在下一个空白字符出现时结束。检测非空白字符最简单明了的判断表达式是这样的:
c !=' ' && c != '\n' && c != '\t' /* 当C不是空白字符时,该表达式为真*/
检测空白字符最简单明了的判断是:
c == ' ' c == '\n' || c == '\t' /*当C是空白字符时,该表达式为真*/
但是使用ctype.h的isspace()函数会更简单。如果该函数的参数是 空白字符,它就返回真。因此如果c是空白字符,isspace(c)为真;而如果c不是空白字符,!isspace(c)为真。
为了知道一个字符是不是在某单词里,可以再读一个单词的首字符时把一个标志(命名为inword)设置为1.也可以在此处递增单词技术。
然后,只要inword保持为1(或真),后续的非空白字符就不标记为一个单词的开始。到出现下一个空白字符是,必须将此标志重置为0(或假),并且程序准备搜索下一个单词。转换为伪代码是这样的:
ifc is not whitespace and inword is false
set inword to true and count the word
if c is whitespace and inword is true
set inword to false
这种方法为每个单词开始时将inword设为1(真),而在每个单词结束时将其设为0(假)。仅在该标志从0变为1时对单词计数。如果在您的系统上可以使用_Bool型变量,可以包含stdboo.h头文件并用bool作为inword的类型,取值分别为ture何false.否则,就使用int类型,取值为0和1.
如果使用布尔型变量,通常的习惯是用变量自身的值作为判断条件。也就是说,用:
if (inword)
来代替:
if (inword == true)
并且用:
if (!inword)
来代替:
if(inword==false)
依据是,如果inword为true,则表达式inword == true 结果为true;
而如果inword为false,则该表达式也为false。因此倒不如只用inword作为判断条件。与之类似,!inowrd与表达式inword == false值相同(非真即false,非假即true)。
以下附上完整源码:
#include
#include
#include
/*如果编译器较老,不支持C99,
则将以上#include 行注释,添加typedef enum{false=0,true=1}bool;
*/
#define STOP '|'
int main(void)
{
char c;
//读入字符
char prev;
//前一个读入字符
long n_chars=0L;
//字符数
int n_lines=0;
//行数
int n_words=0;
//单词数
int p_lines=0;
//不完整的行数
bool inword=false;
//如果c在一个单词中,则inword等于true
printf("Enter text to be analyzed(|to terminate):\n");
prev = '\n';
//用于识别完整的行
while((c = getchar()) != STOP)
{
n_chars++;
//统计字符
if(c == '\n')
{
n_lines ++;
//统计行
}
if( !isspace() && !inword)
{
inword = true;
//开始一个新单词
n_words ++;
//统计单词
}
if(isspace(c) && inword)
{
inword = false;
//到达单词的尾部
}
prev = c;
//保存字符值
}
if(prev != '\n')
{
p_lines = 1;
}
printf("characters = %ld,word = %d,lines = %d",
n_chars,n_words,n_lines);
printf("partial lines = %d\n",p_lines);
return 0;
}
推荐阅读
- C语言学习|第十一届蓝桥杯省赛 大学B组 C/C++ 第一场
- 【C】题目|【C语言】题集 of ⑥
- 单片机|自学单片机好找工作吗(会单片机能找什么工作?)
- 单片机|keil把源代码生成lib的方法
- c语言|一文搞懂栈(stack)、堆(heap)、单片机裸机内存管理malloc
- c语言|C语言初期学习遇到的特殊点 【三子棋详解】【初学者福音,详细总结,复习能手】
- 笔记|C语言数据结构——二叉树的顺序存储和二叉树的遍历
- 个人理解|【C语言基础之类型转换】
- c语言|【C语言】自定义类型 结构体 枚举 联合
- 学习分享|【C语言函数基础】