杭电oj——2030汉字统计

Problem Description
统计给定文本文件中汉字的个数。


Input
输入文件首先包含一个整数n,表示测试实例的个数,然后是n段文本。


Output
对于每一段文本,输出其中的汉字的个数,每个测试实例的输出占一行。
[Hint:]从汉字机内码的特点考虑~


Sample Input
2
WaHaHa! WaHaHa! 今年过节不说话要说只说普通话WaHaHa! WaHaHa!
马上就要期末考试了Are you ready?


Sample Output
14
9
思路分析:原先看这个题目觉得有点难,当时想把英文字母和符号那些ASCII范围找出来,然后除了这些其它字符全算中文。后来搞不定,上网查了下中文字符在机器内的编码。发现中文在机器内存储是2个字节,并且
汉字机内码在计算机的表达方式的描述是,使用二个字节,每个字节最高位一位为1.
计算机中,补码第一位是符号位,1 表示为负数,所以 汉字机内码的每个字节表示的十进制数都是负数
知道了这点代码实现就变简单了,直接创建数组存入。
参考了:https://blog.csdn.net/LOVELX1991/article/details/8530224
题目地址:http://acm.hdu.edu.cn/showproblem.php?pid=2030


源代码(参考):

#pragma warning(disable:4996);

#include
#include
int main()
{
char a[200];
int n, k, i, t;
scanf("%d", &n);
getchar();
while (n–)
{
t = 0;
gets(a);
k = strlen(a);
for (i = 0; i < k; i++)
if (a[i] < 0)
t++;
printf("%d\n", t / 2);
}
return 0;
}
是这位大佬的代码(下面附上链接):
汉字统计--统计给定文本文件中汉字的个数。 - 小小呆的博客 - CSDN博客

总结:
【杭电oj——2030汉字统计】需要补充下计算机底层知识,因为汉子是两个字节所以输出时候(t要除2),并且汉字每个字节表示的十进制数全都是负数,刚好成为if的条件。

    推荐阅读