Shell中正则表达式及sed和awk常见问题 Shell中正则表达式及sed和awk常见

1 正则表达式中的+、？、*分别表示什么含义？
2 如何编写正则表达式匹配11位的手机号？
3 简述sed定址符的作用及表示方式。
4 如何使用sed提取文本中的偶数行？
5 如何使用sed删除文本中每行的第4个字符？
6 提取/etc/passwd文件的第6-10行，另存为pass5.txt文件。
7 简述awk工具的基本语法格式。
8 简述awk工具常用的内置变量、各自的作用。
9 awk处理文本时，读文件前、读取文件内容中、读文件后后这三个环节是如何表示的？
10 提取当前eth0网卡的IPv4地址及掩码信息。
11 找出UID位于10~20之间的用户，输出用户名及对应的UID。
12 利用awk工具统计使用bash作为解释器的用户数量。
13 在awk中是否可以使用数组，分别以什么构成？
14 在linux中对文本的排序如何实现？

1 正则表达式中的+、？、*分别表示什么含义？
这三个字符用来限制关键词的匹配次数，含义分别如下：

+：最少匹配一次，比如a+可匹配a、aa、aaa等
？：最多匹配一次，比如a?可匹配零个或一个a
*：匹配任意多次，比如a*可匹配零个或任意多个连续的a

2 如何编写正则表达式匹配11位的手机号？

准备测试文件：[root@svr5 ~]# cat tel.txt 01012315137012345678134012345671008618966677788提取包含11位手机号的行：[root@svr5 ~]# egrep '^1[0-9]{10}$' tel.txt 1340123456718966677788

3 简述sed定址符的作用及表示方式。
作用：地址符（执行指令的条件）控制sed需要处理文本的范围；不加定址符则逐行处理所有行
表示方式：地址符可以使用行号或正则表达式

4 如何使用sed提取文本中的偶数行？
查看测试文本：

[root@svr5 ~]# cat -n /etc/rc.local 1#!/bin/sh2#3# This script will be executed *after* all the other init scripts.4# You can put your own initialization stuff in here if you don't5# want to do the full Sys V style init stuff.67touch /var/lock/subsys/local

提取偶数行的操作及效果：

[root@svr5 ~]# cat -n /etc/rc.local | sed -n '2~2p'2#4# You can put your own initialization stuff in here if you don't6

5 如何使用sed删除文本中每行的第4个字符？
查看测试文本：

[root@svr5 ~]# cat /etc/rc.local #!/bin/sh## This script will be executed *after* all the other init scripts.# You can put your own initialization stuff in here if you don't# want to do the full Sys V style init stuff.touch /var/lock/subsys/local

删除每行第4个字符的操作及效果：

[root@svr5 ~]# cat /etc/rc.local | sed 's/.//4'#!/in/sh## Tis script will be executed *after* all the other init scripts.# Yu can put your own initialization stuff in here if you don't# wnt to do the full Sys V style init stuff.touh /var/lock/subsys/local

6 提取/etc/passwd文件的第6-10行，另存为pass5.txt文件。
提取或导出文本：

[root@svr5 ~]# sed -n '6,10p' /etc/passwd > pass5.txt

确认提取结果：

[root@svr5 ~]# cat pass5.txt sync:x:5:0:sync:/sbin:/bin/syncshutdown:x:6:0:shutdown:/sbin:/sbin/shutdownhalt:x:7:0:halt:/sbin:/sbin/haltmail:x:8:12:mail:/var/spool/mail:/sbin/nologinuucp:x:10:14:uucp:/var/spool/uucp:/sbin/nologin

7 简述awk工具的基本语法格式。
格式1： awk [选项] ‘[条件]{处理动作}' 文件列表
格式2：命令 | awk [选项] ‘[条件]{处理动作}'

8 简述awk工具常用的内置变量、各自的作用。

$n：即$1、$2、$3……，表示指定分隔的第几个字段
$0：保存当前读入的整行文本内容
NF：记录当前处理行的字段个数（列数）
NR：记录当前已读入行的数量（行数）

9 awk处理文本时，读文件前、读取文件内容中、读文件后后这三个环节是如何表示的？

BEGIN{ } 文件前处理：awk没有读入行之前要执行的动作；一般对数据作初始化操作，可以单独使用。
{ } 行处理：对awk读入的每一行进行处理，可以单独使用。
END{ }文件后处理：awk 把所有的行都处理完后要执行的动作，一般输出数据处理的结果。可以单独使用。

10 提取当前eth0网卡的IPv4地址及掩码信息。
查看测试文本：

[root@svr5 ~]# ip add list eth02: eth0: mtu 1500 qdisc pfifo_fast state UP qlen 1000link/ether 00:0c:29:64:88:8e brd ff:ff:ff:ff:ff:ffinet 192.168.4.55/24 brd 192.168.4.255 scope global eth0inet 192.168.4.5/24 brd 192.168.4.255 scope global secondary eth0inet6 fe80::20c:29ff:fe64:888e/64 scope link valid_lft forever preferred_lft forever

提取IPv4地址及掩码信息的操作及效果：