Linux awk 命令详解(二) if 分支 数组

一、awk if分支结构

  • if分支结构(单分支、双分支、多分支)
  • 单分支
    -- if(条件){编辑指令}
  • 双分支
    -- if(条件){编辑指令1}else{编辑指令2}
  • 多分支
    -- if(条件){编辑指令1}else if(条件){编辑指令2}.. ..
    else{编辑指令N}
案例1
awk过滤中的if分支结构
1)单分支
统计/etc/passwd文件中UID小于或等于1000的用户个数:
[root@case100 ~]# awk -F: '{if($3<=1000){i++}}END{print i}' /etc/passwd 23

统计/etc/passwd文件中UID大于1000的用户个数:
[root@case100 ~]# awk -F: '{if($3>1000){i++}}END{print i}' /etc/passwd 3

统计/etc/passwd文件中登录Shell是“/bin/bash”的用户个数:
[root@case100 ~]# awk -F: '{if($7~/bash$/){i++}}END{print i}' /etc/passwd 5

2)双分支
分别统计/etc/passwd文件中UID小于或等于1000、UID大于1000的用户个数:
[root@case100 ~]# awk -F: '{if($3<=1000){i++}else{j++}}END{print i,j}' /etc/passwd 23 3

分别统计/etc/passwd文件中登录Shell是“/bin/bash”、 登录Shell不是“/bin/bash”的用户个数:
[root@case100 ~]# awk -F: '{if($7~/bash$/){i++}else{j++}}END{print i,j}' /etc/passwd 5 21

二、awk数组
  • 数组的语法格式
    数组是一个可以存储多个值的变量,具体使用的格式如下:
  • 定义数组
    -- 格式:数组名[下标]=元素值
  • 调用数组
    -- 格式:数组名[下标]
  • 遍历数组
    -- 用法:for(变量 in 数组名){print 数组名[变量]}
【Linux awk 命令详解(二) if 分支 数组】案例2 for循环
[root@case100 ~]# awk 'BEGIN{a[0]=11; a[1]=88; print a[1],a[0]}' 88 11 [root@case100 ~]# awk 'BEGIN{a++; print a}' 1 [root@case100 ~]# awk 'BEGIN{a[0]=0; a[1]=11; a[2]=222; for(i in a){print i,a[i]}}' 0 0 1 11 2 222

注意,awk数组的下标除了可以使用数字,也可以使用字符串,字符串需要使用双引号:
[root@case100 ~]# awk 'BEGIN{a["hehe"]=22; print a["hehe"]}' 22

案例3:awk扩展应用
1)awk统计Web访问排名
在分析Web日志文件时,每条访问记录的第一列就是客户机的IP地址,其中会有很多重复的IP地址。因此只用awk提取出这一列是不够的,还需要统计重复记录的数量并且进行排序。
通过awk提取信息时,利用IP地址作为数组下标,每遇到一个重复值就将此数组元素递增1,最终就获得了这个IP地址出现的次数。
针对文本排序输出可以采用sort命令,相关的常见选项为-r、-n、-k。其中-n表示按数字顺序升序排列,而-r表示反序,-k可以指定按第几个字段来排序
实现此案例需要按照如下步骤进行。
步骤一:统计Web访问量排名
分步测试、验证效果如下所述。
1)提取IP地址及访问量
[root@case100 ~]# awk '{ip[$1]++} \ >END{for(i in ip) {print ip[i],i }}' /var/log/httpd/access_log 4127.0.0.1 17 192.168.4.5 13 192.168.4.110 ... ...

2)对第1)步的结果根据访问量排名
[root@case100 ~]# awk'{ip[$1]++} END{for(i in ip) {print i,ip[i]}}'/var/log/httpd/access_log | sort -nr 17192.168.4.5 13192.168.4.110 4127.0.0.1 ... ...

案例4:编写监控脚本
本案例要求编写脚本,实现计算机各个性能数据监控的功能,具体监控项目要求如下:
CPU负载
网卡流量
内存剩余容量
磁盘剩余容量
计算机账户数量
当前登录账户数量
计算机当前开启的进程数量
本机已安装的软件包数量
步骤
实现此案例需要按照如下步骤进行。
步骤一:准备工作
1)查看性能数据的命令
[root@case100 ~]# uptime//查看CPU负载 [root@case100 ~]# ifconfig eth0//查看网卡流量 [root@case100 ~]# free//查看内存信息 [root@case100 ~]# df//查看磁盘空间 [root@case100 ~]# wc -l /etc/passwd//查看计算机账户数量 [root@case100 ~]# who |wc -l//查看登录账户数量 [root@case100 ~]# rpm -qa |wc -l//查看已安装软件包数量

步骤二:编写参考脚本
1)脚本内容如下:
[root@svr5 ~]# vim test.sh #!/bin/bash ip=`ifconfig eth0 | awk '/inet /{print $2}'` echo "本地IP地址是:"$ip cpu=`uptime | awk '{print $NF}'` #awk中NF为当前行的列数,$NF是最后一列 echo "本机CPU最近15分钟的负载是:"$cpu net_in=`ifconfig eth0 | awk '/RX p/{print $5}'` echo "入站网卡流量为:"$net_in net_out=`ifconfig eth0 | awk '/TX p/{print $5}'` echo "出站网卡流量为:"$net_out mem=`free | awk '/Mem/{print $4}'` echo "内存剩余容量为:"$mem disk=`df | awk '/\/$/{print $4}'` echo "根分区剩余容量为:"$disk user=`cat /etc/passwd |wc -l` echo "本地账户数量为:"$user login=`who | wc -l` echo "当前登陆计算机的账户数量为:"$login process=`ps aux | wc -l` echo "当前计算机启动的进程数量为:"$process soft=`rpm -qa | wc -l` echo "当前计算机已安装的软件数量为:"$soft

[root@logfile ~]# bash test.sh 本地IP地址是:192.168.44.99 本机CPU最近15分钟的负载是:0.05 入站网卡流量为:4942189501092 出站网卡流量为:9051024375282 内存剩余容量为:160136 根分区剩余容量为:84142524 本地账户数量为:32 当前登陆计算机的账户数量为:1 当前计算机启动的进程数量为:160 当前计算机已安装的软件数量为:403

    推荐阅读