linux文本处理工具--grep|linux文本处理工具--grep,cut,sort,uniq
查找关键字
grep [选项] '关键字’文件名
OPTIONS :
1:不区分大小写
-V:查找不包含指定内容的行,反向选择
-w:按单词搜索
-A:显示匹配行及后面多少行
-B: 显示匹配行及前面多少行
-C:显示匹配行前后多少行
^key:以关键字开头
key$ 以关键字结尾
--color=auto 加颜色突出显示
-0:打印匹配关键字
-C:统计匹配到的次数
-n:显示行号
-r:逐层遍历目录查找
-1:只列出匹配的文件名
-L:列出不匹配的文件名
-e:使用正则匹配
-E :使用扩展正则匹配
切割关键字
cut是列截取工具,用于列的截取
语法:
cut 选项 文件名
常见选项:
-C: 以字符为单位进行分割,截取自定义分隔符,默认为制表符\t
-f: 与-d一起使用,指定截取哪个区域
举例说明:
cut -d: -f1 1.txt
以:冒号分割,截取第1列内容
cut -d: -f1,6,7 1.txt
【linux文本处理工具--grep|linux文本处理工具--grep,cut,sort,uniq】以:置号分割,截取第1,6 ,7列内容
排序关键字--去重
sort工具用于排序;
它将文件的每一行作为一 个单位,从首字符向后,依次按ASCII码值进行比较,最后将他们按升序输出。(1-9,A-z)
语法和选项
-u :去除重复行
-r :降序排列,默认是升序
-0 :将排序结果输出到文件中,类似重定向符号>
-n :以数字排序,默认是按字符排序(按照数值排序,如1-10)
-t :分隔符
-k :第N列
-b :忽略前导空格。
-R :随机排序,每次运行的结果均不同
sort -t: -k3 -r /etc/password #使用:分割符,用第三列 倒叙排序
sort -u 去重(不连续的重复行也去重),然后排序
去重(只去重重复行)
4.uniq工具
uniq用于去除连续的重复行
常见选项:
-1:忽略大小写
-c:统计重复行次数
-d:只显示重复行
举例说明:
uniq 2.txt
uniq -d 2.txt
uniq -dc 2.txt
sort 124.txt |uniq 排序然后去重重复
sort -u 1234.txt 去重并排序,和上述排序一样
推荐阅读
- Java|Java OpenCV图像处理之SIFT角点检测详解
- 事件处理程序
- Linux下面如何查看tomcat已经使用多少线程
- Beego打包部署到Linux
- 爬虫数据处理HTML转义字符
- 第二阶段day1总结
- Android|Android BLE蓝牙连接异常处理
- Linux|109 个实用 shell 脚本
- linux定时任务contab
- 芯灵思SinlinxA33开发板Linux内核定时器编程