sed命令详解

2016-4-4 杜世伟

1)简介
sed是非交互式的编辑器。它不会修改文件，除非使用shell重定向来保存结果。默认情况下，所有的输出行都被打印到屏幕上。
sed编辑器逐行处理文件（或输入），并将结果发送到屏幕。具体过程如下：首先sed把当前正在处理的行保存在一个临时缓存区中（也称为模式空间），然后处理临时缓冲区中的行，完成后把该行发送到屏幕上。sed每处理完一行就将其从临时缓冲区删除，然后将下一行读入，进行处理和显示。处理完输入文件的最后一行后，sed便结束运行。sed把每一行都存在临时缓冲区中，对这个副本进行编辑，所以不会修改原文件。
2)命令详解

sed: invalid option -- 'h'
Usage: sed [OPTION]... {script-only-if-no-other-script} [input-file]...

  -n, --quiet, --silent
                 suppress automatic printing of pattern space
  -e script, --expression=script
                 add the script to the commands to be executed
  -f script-file, --file=script-file
                 add the contents of script-file to the commands to be executed
  --follow-symlinks
                 follow symlinks when processing in place
  -i[SUFFIX], --in-place[=SUFFIX]
                 edit files in place (makes backup if SUFFIX supplied)
  -c, --copy
                 use copy instead of rename when shuffling files in -i mode
  -b, --binary
                 does nothing; for compatibility with WIN32/CYGWIN/MSDOS/EMX (
                 open files in binary mode (CR+LFs are not treated specially))
  -l N, --line-length=N
                 specify the desired line-wrap length for the `l' command
  --posix
                 disable all GNU extensions.
  -r, --regexp-extended
                 use extended regular expressions in the script.
  -s, --separate
                 consider files as separate rather than as a single continuous
                 long stream.
  -u, --unbuffered
                 load minimal amounts of data from the input files and flush
                 the output buffers more often
  -z, --null-data
                 separate lines by NUL characters
  --help
                 display this help and exit
  --version
                 output version information and exit

命令描述
a\ 在当前行后添加一行或多行。多行时除最后一行外，每行末尾需用“\”续行

c\ 用此符号后的新文本替换当前行中的文本。多行时除最后一行外，每行末尾需用"\"续行
i\ 在当前行之前插入文本。多行时除最后一行外，每行末尾需用"\"续行
d 删除行
h 把模式空间里的内容复制到暂存缓冲区
H 把模式空间里的内容追加到暂存缓冲区
g 把暂存缓冲区里的内容复制到模式空间，覆盖原有的内容
G 把暂存缓冲区的内容追加到模式空间里，追加在原有内容的后面
l 列出非打印字符
p 打印行
n 读入下一输入行，并从下一条命令而不是第一条命令开始对其的处理
q 结束或退出sed
r 从文件中读取输入行
! 对所选行以外的所有行应用命令
s 用一个字符串替换另一个
g 在行内进行全局替换

w 将所选的行写入文件
x 交换暂存缓冲区与模式空间的内容
y 将字符替换为另一字符（不能对正则表达式使用y命令）

3)pattern中的元字符
^：行首定位符。如/^my/表示匹配所有以my开始的行。
$：行尾定位符。如/my$/表示匹配所有以my结尾的行。
.：匹配除换行符以外的任意单个字符。如/m..y/ 匹配包含字母m，后跟两个任意字符，再跟字母y的行。
*：表示匹配前一个字符出现0次或多次。如/my*/ 匹配包含字母m,后跟零个或多个y字母的行。
[]：表示匹配范围内的任意一个字符。如/[Mm]y/ 匹配包含My或my的行。
[^]：表示匹配不再指定范围外的任意一个字符。如/[^Mm]y/ 匹配包含y，但y之前的那个字符不是M或m的行。
$..$：保存已匹配的字符。如1,20s/$you$self/\1r/ 标记元字符之间的模式，并将其保存为标签1，之后可以使用\1来引用它。最多可以定义9个标签，从左边开始编号，最左边的是第一个。此例中，对第1到第20行进行处理，you被保存为标签1，如果发现youself，则替换为your。
&：保存查找串以便在替换串中引用。如s/my/**&**/ 符号&代表查找串。my将被替换为**my**
\<：词首定位符。如/\<my/ 匹配包含以my开头的单词的行。
\>：词尾定位符。如/my\>/ 匹配包含以my结尾的单词的行。
x\{m\}：连续m个x。如/9\{5\}/ 匹配包含连续5个9的行。
x\{m,\}:至少m个x。如/9\{5,\}/ 匹配包含至少连续5个9的行
x\{m,n\}。至少m个，但不超过n个x。如/9\{5,7\}/ 匹配包含连续5到7个9的行
如下这些同样可用：
[:alnum:] [:alpha:] [:blank:] [:cntrl:]
[:digit:] [:graph:] [:lower:] [:print:]
[:punct:] [:space:] [:upper:] [:xdigit:]