linux文本处理工具--grep|linux文本处理工具--grep,cut,sort,uniq

查找关键字
grep [选项] '关键字’文件名
OPTIONS :
1:不区分大小写
-V:查找不包含指定内容的行,反向选择
-w:按单词搜索
-A:显示匹配行及后面多少行
-B: 显示匹配行及前面多少行
-C:显示匹配行前后多少行
^key:以关键字开头
key$ 以关键字结尾
--color=auto 加颜色突出显示
-0:打印匹配关键字
-C:统计匹配到的次数
-n:显示行号
-r:逐层遍历目录查找
-1:只列出匹配的文件名
-L:列出不匹配的文件名
-e:使用正则匹配
-E :使用扩展正则匹配
切割关键字
cut是列截取工具,用于列的截取
语法:
cut 选项 文件名
常见选项:
-C: 以字符为单位进行分割,截取自定义分隔符,默认为制表符\t
-f: 与-d一起使用,指定截取哪个区域
举例说明:
cut -d: -f1 1.txt 以:冒号分割,截取第1列内容
cut -d: -f1,6,7 1.txt 【linux文本处理工具--grep|linux文本处理工具--grep,cut,sort,uniq】以:置号分割,截取第1,6 ,7列内容
排序关键字--去重
sort工具用于排序; 它将文件的每一行作为一 个单位,从首字符向后,依次按ASCII码值进行比较,最后将他们按升序输出。(1-9,A-z)
语法和选项
-u :去除重复行
-r :降序排列,默认是升序
-0 :将排序结果输出到文件中,类似重定向符号>
-n :以数字排序,默认是按字符排序(按照数值排序,如1-10)
-t :分隔符
-k :第N列
-b :忽略前导空格。
-R :随机排序,每次运行的结果均不同
sort -t: -k3 -r /etc/password #使用:分割符,用第三列 倒叙排序
sort -u 去重(不连续的重复行也去重),然后排序
去重(只去重重复行)
4.uniq工具
uniq用于去除连续的重复行
常见选项:
-1:忽略大小写
-c:统计重复行次数
-d:只显示重复行
举例说明:
uniq 2.txt uniq -d 2.txt uniq -dc 2.txt sort 124.txt |uniq 排序然后去重重复
sort -u 1234.txt 去重并排序,和上述排序一样

    推荐阅读