全面详解linux下的sed命令
作为shell编程三剑客之一的sed,重要程度不言而喻。sed是一个流编程器,每次处理一行,处理完后再接着处理下一行,它支持正则,功能非常的强大。但sed比一般的命令复杂一些,选项繁多,想要掌握它是需要花点功夫的。下面我们通过众多的例子来看看这个强大的sed命令的作用吧!
语法格式:sed [选项] [动作]
常用选项如下:
- -n:sed默认会输出所有stdin内容,但加上该选项后,只显示经过sed处理过的行。
- -e :允许在同一行里执行多个动作
- -f:从一个文件中读取动作
- -i:直接修改文件而不是输入到屏幕上(危险)
动作中的参数及太多了,下面列一下:
- a:在匹配行下面加入一行
- c:将匹配的行修改新的内容
- d:删除匹配的行
- i:在匹配行前加入内容
- p:打印
- s:替换匹配行的内容
范例一:打印/etc/passwd文件的第5-10行
# sed -n '5,10p' /etc/passwd
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
sync:x:5:0:sync:/sbin:/bin/sync
shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
halt:x:7:0:halt:/sbin:/sbin/halt
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin
operator:x:11:0:operator:/root:/sbin/nologin
范例二:删除/etc/passwd文件的第2行,第2到10行
# cat -n /etc/passwd | sed '2d' | sed '5,10d'
除了上面的方法,我们还可以用-e选项来完成
# cat -n /etc/passwd | sed -e '2d' -e '5,10d'
下面我们再来补充点关于sed动作的知识
解释 | |
---|---|
x | 指定行号 |
x,y | x到y行号 |
/pattern/ | 查询包含模式的行 |
/pattern/pattern/ | 查询包含两个模式行 |
/pattern/,x | 匹配行到x行 |
x,/pattern/ | x行到匹配行 |
/pattern/,/pattern/ | 查询两个模式之间的行 |
x,y! | 不包含x至y行 |
sed ‘s/old/new/g’ text.txt | old全部替换成new,如果没有g则只替换第一个匹配到的 |
sed -n ‘1,3p’ text.txt | 打印第一行至第三行 |
sed ‘s/book/books/’ file | -n选项和p命令一起使用表示只打印那些发生替换的行 |
sed -n ‘1p;$p’ text.txt | 打印第一行和最后一行 |
sed ‘1,3d’ text.txt | 删除第一至第三行 |
sed ‘/gwx/,$d’ text.txt | 删除匹配行至最后一行 |
sed ‘/gwx/a word’ text.txt | 查找gwx所在行,并在下一行插入word |
sed ‘/gwx/i word’ text.txt | 查找gwx所在行,并在上一行插入word |
范例三:获取服务器ip地址
这个案例非常的棒,建议大家仔细看看
# ifconfig eth0
eth0: flags=4163<UP,BROADCAST,RUNNING,MULTICAST> mtu 1500
inet 172.26.9.143 netmask 255.255.240.0 broadcast 172.26.15.255
ether 00:16:3e:0a:01:ad txqueuelen 1000 (Ethernet)
……
我们需要的是172.26.9.143。
第一步,获取我们想要处理的行
# ifconfig eth0 | sed -n '/.*inet/p'
inet 172.26.9.143 netmask 255.255.240.0 broadcast 172.26.15.255
第二步,将不需要的信息给替换位空白字符
# ifconfig eth0 | sed -n '/.*inet/p' | sed 's/.*inet\s\+//g'
172.26.9.143 netmask 255.255.240.0 broadcast 172.26.15.255
接下来把ip地址后面的全部替换位空就行了
# ifconfig eth0 | sed -n '/.*inet/p' | sed 's/.*inet\s\+//g' | sed 's/\s\+.*//g'
172.26.9.143
下面我们来说说上面的例子,首先第一步我们使用了-n和p来获取我们想要的行。然后,我们将不需要的信息进行过滤,需要注意的时,正则中\s+表示至少匹配一个空格,但在这里需要在加号前使用转义字符\。
范例四
最后一个范例,我给出我昨天一个真实案例。需求是这样的,获取一段文本中的url地址,但不需要前面的http://。部分文本内容如下:
<td width=820> <a href=http://beijing.hellozx.com onclick="co('beijing')"><font color="red">北京</font></a>
<a href=http://shanghai.hellozx.com onclick="co('shanghai')"><font color="red">上海</font></a>
<a href=http://tianjin.hellozx.com onclick="co('tianjin')"><font color="red">天津</font></a>
<a href=http://chongqing.hellozx.com onclick="co('chongqing')"><font color="red">重庆</font></a></td></tr>
<tr><td width=80 height=30 align=right>
<b><font style="font-size:14px;">山东</font>:</b> </td><td width=820>
<a href="http://jinan.hellozx.com" onclick="co('jinan')"><font color=red style="font-size:14px;">济南</font></a>
<a href="http://qingdao.hellozx.com" onclick="co('qingdao')"><font color=red style="font-size:14px;">青岛</font></a>
下面我们分几步去完成该需求,首先,将不含url地址的行全部过滤
# sed -n '/http:/p' a.txt
然后,将不需要的信息全部替换位空白字符即可。先把http://及之前字符全部删除
sed -n '/http:/p' a.txt | sed 's/.*http:\/\///g'
,接着把双引号及之后字符全部删除
# sed -n '/http:/p' a.txt | sed 's/.*http:\/\///g' | sed 's/".*//g'
现在屏幕输出的内容如下
haikou.hellozx.com
sanya.hellozx.com
kunming.hellozx.com
dali.hellozx.com
xining.hellozx.com
yinchuan.hellozx.com
wulumuqi.hellozx.com
……