孤独求学人
sed命令详解
2016-4-4 杜世伟
1)简介
sed是非交互式的编辑器。它不会修改文件,除非使用shell重定向来保存结果。默认情况下,所有的输出行都被打印到屏幕上。
sed编辑器逐行处理文件(或输入),并将结果发送到屏幕。具体过程如下:首先sed把当前正在处理的行保存在一个临时缓存区中(也称为模式空间),然后处理临时缓冲区中的行,完成后把该行发送到屏幕上。sed每处理完一行就将其从临时缓冲区删除,然后将下一行读入,进行处理和显示。处理完输入文件的最后一行后,sed便结束运行。sed把每一行都存在临时缓冲区中,对这个副本进行编辑,所以不会修改原文件。
2)命令详解

sed: invalid option -- 'h'
Usage: sed [OPTION]... {script-only-if-no-other-script} [input-file]...

  -n, --quiet, --silent
                 suppress automatic printing of pattern space
  -e script, --expression=script
                 add the script to the commands to be executed
  -f script-file, --file=script-file
                 add the contents of script-file to the commands to be executed
  --follow-symlinks
                 follow symlinks when processing in place
  -i[SUFFIX], --in-place[=SUFFIX]
                 edit files in place (makes backup if SUFFIX supplied)
  -c, --copy
                 use copy instead of rename when shuffling files in -i mode
  -b, --binary
                 does nothing; for compatibility with WIN32/CYGWIN/MSDOS/EMX (
                 open files in binary mode (CR+LFs are not treated specially))
  -l N, --line-length=N
                 specify the desired line-wrap length for the `l' command
  --posix
                 disable all GNU extensions.
  -r, --regexp-extended
                 use extended regular expressions in the script.
  -s, --separate
                 consider files as separate rather than as a single continuous
                 long stream.
  -u, --unbuffered
                 load minimal amounts of data from the input files and flush
                 the output buffers more often
  -z, --null-data
                 separate lines by NUL characters
  --help
                 display this help and exit
  --version
                 output version information and exit

 命令 描述
 a\  在当前行后添加一行或多行。多行时除最后一行外,每行末尾需用“\”续行

 c\ 用此符号后的新文本替换当前行中的文本。多行时除最后一行外,每行末尾需用"\"续行
 i\ 在当前行之前插入文本。多行时除最后一行外,每行末尾需用"\"续行
 d 删除行
 h 把模式空间里的内容复制到暂存缓冲区
 H 把模式空间里的内容追加到暂存缓冲区
 g 把暂存缓冲区里的内容复制到模式空间,覆盖原有的内容
 G 把暂存缓冲区的内容追加到模式空间里,追加在原有内容的后面
 l 列出非打印字符
 p 打印行
 n 读入下一输入行,并从下一条命令而不是第一条命令开始对其的处理
 q 结束或退出sed
 r 从文件中读取输入行
 ! 对所选行以外的所有行应用命令
 s 用一个字符串替换另一个
 g 在行内进行全局替换
 
 w 将所选的行写入文件
 x 交换暂存缓冲区与模式空间的内容
 y 将字符替换为另一字符(不能对正则表达式使用y命令)

3)pattern中的元字符
^:行首定位符。如/^my/表示匹配所有以my开始的行。
$:行尾定位符。如/my$/表示匹配所有以my结尾的行。
.:匹配除换行符以外的任意单个字符。如/m..y/  匹配包含字母m,后跟两个任意字符,再跟字母y的行。
*:表示匹配前一个字符出现0次或多次。如/my*/  匹配包含字母m,后跟零个或多个y字母的行。
[]:表示匹配范围内的任意一个字符。如/[Mm]y/  匹配包含My或my的行。
[^]:表示匹配不再指定范围外的任意一个字符。如/[^Mm]y/  匹配包含y,但y之前的那个字符不是M或m的行。
\(..\):保存已匹配的字符。如1,20s/\(you\)self/\1r/  标记元字符之间的模式,并将其保存为标签1,之后可以使用\1来引用它。最多可以定义9个标签,从左边开始编号,最左边的是第一个。此例中,对第1到第20行进行处理,you被保存为标签1,如果发现youself,则替换为your。
&:保存查找串以便在替换串中引用。如s/my/**&**/  符号&代表查找串。my将被替换为**my**
\<:词首定位符。如/\<my/  匹配包含以my开头的单词的行。
\>:词尾定位符。如/my\>/  匹配包含以my结尾的单词的行。
x\{m\}:连续m个x。如/9\{5\}/ 匹配包含连续5个9的行。
x\{m,\}:至少m个x。如/9\{5,\}/  匹配包含至少连续5个9的行
x\{m,n\}。至少m个,但不超过n个x。如/9\{5,7\}/  匹配包含连续5到7个9的行
如下这些同样可用:
[:alnum:]  [:alpha:]  [:blank:]  [:cntrl:]
[:digit:]  [:graph:]  [:lower:]  [:print:]
[:punct:]  [:space:]  [:upper:]  [:xdigit:]