awk 是 Linux 中强大的文本处理工具,除了基本用法外,还有许多高级功能。以下是一些常见的高级用法:
awk
1.使用内置变量
awk 提供了多个内置变量,如 NR(当前记录号)、NF(当前记录的字段数)、FS(字段分隔符)等。
- 示例:打印文件行号及内容
awk '{print NR, $0}' file.txt
- 示例:打印每行的最后一个字段
awk '{print $NF}' file.txt
2.自定义字段分隔符
通过 -F 选项或 FS 变量,可以指定字段分隔符。
- 示例:使用逗号作为分隔符
awk -F, '{print $1, $2}' file.csv
- 示例:在脚本中设置分隔符
awk 'BEGIN {FS=","} {print $1, $2}' file.csv
3.使用条件语句
awk 支持 if-else 等条件语句,用于根据条件处理数据。
- 示例:打印第一字段大于 10 的行
awk '{if ($1 > 10) print $0}' file.txt
- 示例:根据条件输出不同内容
awk '{if ($1 > 10) print "High"; else print "Low"}' file.txt
4.使用循环
awk 支持 for 和 while 循环,适合处理数组或重复操作。
- 示例:打印每行的所有字段
awk '{for (i=1; i<=NF; i++) print $i}' file.txt
- 示例:计算字段总和
awk '{sum=0; for (i=1; i<=NF; i++) sum+=$i; print sum}' file.txt
5.使用数组
awk 支持关联数组,适合统计和分组操作。
- 示例:统计字段出现次数
awk '{count[$1]++} END {for (item in count) print item, count[item]}' file.txt
- 示例:按字段分组求和
awk '{sum[$1]+=$2} END {for (item in sum) print item, sum[item]}' file.txt
6.使用内置函数
awk 提供了多种内置函数,如 length、substr、gsub 等。
- 示例:计算每行长度
awk '{print length($0)}' file.txt
- 示例:替换字符串
awk '{gsub(/foo/, "bar"); print $0}' file.txt
7.多文件处理
awk 可以同时处理多个文件,通过 FILENAME 变量获取当前文件名。
- 示例:打印文件名及内容
awk '{print FILENAME, $0}' file1.txt file2.txt
8.BEGIN 和 END 块
BEGIN 和 END 块分别用于在处理前后执行操作。
- 示例:打印开始和结束信息
awk 'BEGIN {print "Start"} {print $0} END {print "End"}' file.txt
- 示例:计算总和
awk '{sum+=$1} END {print sum}' file.txt
9.输出重定向
awk 支持将输出重定向到文件。
- 示例:将输出写入文件
awk '{print $0 > "output.txt"}' file.txt
10.使用正则表达式
awk 支持正则表达式匹配。
- 示例:匹配包含 "error" 的行
awk '/error/ {print $0}' file.txt
- 示例:匹配以数字开头的行
awk '/^[0-9]/ {print $0}' file.txt
11.多行记录处理
通过设置 RS(记录分隔符),可以处理多行记录。
- 示例:处理以空行分隔的多行记录
awk 'BEGIN {RS=""; FS="\n"} {print $1, $2}' file.txt
12.自定义输出格式
使用 printf 可以格式化输出。
- 示例:格式化输出
awk '{printf "Name: %-10s Age: %d\n", $1, $2}' file.txt
13.处理命令行参数
通过 ARGC 和 ARGV 可以访问命令行参数。
- 示例:打印命令行参数
awk 'BEGIN {for (i=0; i<ARGC; i++) print ARGV[i]}' file1.txt file2.txt
14.使用 getline 读取额外行
getline 用于读取额外行,适合处理复杂文本。
- 示例:读取下一行并处理
awk '{print $0; getline; print $0}' file.txt
15.处理二进制数据
通过 strtonum 函数可以处理二进制数据。
- 示例:将二进制字符串转换为十进制
awk '{print strtonum("0x" $1)}' file.txt
还是那句话:干中学,学中干
如果觉得不错的话,麻烦点个关注,收藏谢谢。
毕竟:
我太想进步了