xml地图|网站地图|网站标签 [设为首页] [加入收藏]

您的位置:澳门赌搏网站大全 > 计算机网络 > Linux sort命令中文手册(info sort翻译)

Linux sort命令中文手册(info sort翻译)

发布时间:2019-12-01 02:13编辑:计算机网络浏览(96)

    bash&shell系列文章:http://www.cnblogs.com/f-ck-need-u/p/7048359.html**

    为了考虑可移植性,建议将全局选项指定在"-k"(或"--key")的前面。

    1.1 条件表达式

    条件表达式

    意义

    1.文件类检测,例如[ -e /tmp/a.log ]。如非特别说明,则所有文件类操作都会追踪到软链接的源文件。

    -e file

    文件是否存在(exist)

    -f file

    文件是否存在且为普通文件(file)

    -d file

    文件是否存在且为目录(directory)

    -b file

    文件是否存在且为块设备block device

    -c file

    文件是否存在且为字符设备character device

    -S file

    文件是否存在且为套接字文件Socket

    -p file

    文件是否存在且为命名管道文件FIFO(pipe)

    -L file

    文件是否存在且是一个链接文件(Link)

    2. 文件属性检测,如test -r /tmp/a.log。如非特别说明,则所有文件类操作都会追踪到软链接的源文件。

    -r file

    文件是否存在且当前用户可读

    -w file

    文件是否存在且当前用户可写

    -x file

    文件是否存在且当前用户可执行

    -u file

    文件是否存在且设置了SUID

    -g file

    文件是否存在且设置了SGID

    -k file

    文件是否存在且设置了sbit(sticky bit)

    -s file

    文件是否存在且大小大于0字节,即用于检测文件是否为非空白文件

    -N file

    文件是否存在,且自上次read后是否被modify

    3. 两个文件之间的比较,如:test file1 -nt file2

    file1 -nt file2

    (newer than)判断file1是否比file2新

    file1 -ot file2

    (older than)判断file1是否比file2旧

    file1 -ef file2

    (equal file)判断file2与file2是否为同一文件,可用在判断hard link的判定上。主要意义在判定,两个文件是否均指向同一个分区上的同一个inode

    4. 两个整数之间的判定,支持正负数,但不支持小数。例如test n1 -eq n2

    int1 -eq int2

    两数值相等(equal)

    int1 -ne int2

    两数值不等(not equal)

    int1 -gt int2

    n1大于n2(greater than)

    int1 -lt int2

    n1小于n2(less than)

    int1 -ge int2

    n1大于等于n2(greater than or equal)

    Linux sort命令中文手册(info sort翻译)。int1 -le int2

    n1小于等于n2(less than or equal)

    5. 判定字符串

    -z string

    (zero)判定字符串是否为空?若string为空字符串,则为true

    string

    -n string

    判定字符串是否非空?若string为空字符串,则false。注:-n可省略

    string1 = string2

    string1 == string2

    string1和string2是否相同。相同则返回true。"=="和"="等价,但"="可移植性更好

    str1 != str2

    str1是否不等于str2,若不等,则返回true

    str1 > str2

    str1字母顺序是否大于str2,若大于,则返回true

    str1 < str2

    str1字母顺序是否小于str2,若小于,则返回true

    6.逻辑运算符,例如:test -r filename -a -x filename

    -a或&&

    (and)两表达式同时为true时才为true。"-a"只能在test或[]中使用,&&只能在[[]]中使用

    -o或||

    (or)两表达式任何一个true则为true。"-o"只能在test或[]中使用,||只能在[[]]中使用

    !

    对表达式取反

    ( )

    用于改变表达式的优先级,为了防止被shell解析,应该加上反斜线转义( )

     

    因此,对于"abc 100 200"这样的输入,假设字段分隔符为空格,当指定"-k 2n"时,该key为"100 200",但由于中间包含了空白,使得该key的排序在第二字段就结束。如果是"abc 100\0200 200","-k 2n"在排序时,虽然看上去是100200,但却只对100进行排序,也就是说,如果此时另有一行第2字段值为110,看上去很大的100200将小于110。测试语句:

    1.3 [[ ]]

    [[]]基本等价于[],但有些功能写法更简洁,且[[]]提供了[]澳门赌搏网站大全,所不具备的正则表达式匹配。所以,[[]]的功能可以认为是[]和expr命令的相加。

    语法格式:

    [[ conditional_expression ]]

    除了以下特别注明的几项,其余用法等同[]。

    (1).当条件表达式中使用的运算符是"=="或"!="时,该运算符的右边会被当作pattern被匹配,"=="表示能匹配成功则返回0,"!="则相反。但此时只是通配符匹配,不支持正则表达式匹配。通配符包括:"*"、"?"和"[...]"。

    例如:

    [root@xuexi ~]# [[ abc == a* ]];echo $?
    0
    
    [root@xuexi ~]# [[ abc == a*d ]];echo $?
    1
    

    (2).当条件表达式中使用的运算符是"=~"时,该运算符的右边会被当作正则表达式的pattern被匹配。

    例如:

    [root@xuexi ~]# [[ abc =~ aa* ]];echo $?
    0
    
    [root@xuexi ~]# [[ abc =~ aa.* ]];echo $?
    1
    

    (3).除了可以使用逻辑运算符!和(),还可以使用&&、||,分别表示逻辑与和逻辑或,等价于[]的"-a"和"-o"。但是[[]]不再支持"-a"和"-o"。

    例如:

    [root@xuexi ~]# [[ 3 -eq 3 && 5 -eq 5 ]];echo $? 
    0
    

    总之,除了模式匹配和正则表达式匹配时需要使用[[]],其余时候建议使用[www.4355.com, ]。

    '-t SEPARATOR'
    '--field-separator=SEPARATOR'

    1.2 test和[ ]的用法说明

    test和[]的用法非常简单,但语法较复杂。它们是根据参数的个数来完成测试的,所以测试的结果也依赖于参数的个数。如下所述:

    (1).不带任何参数时,直接返回false。

    [root@xuexi ~]# [ ];echo $?
    1
    

    (2).只有一个参数时,测试表达式采取的是[ arg ],根据条件表达式的说明,仅当arg为非空时返回true。

    [root@xuexi ~]# test haha;echo $?
    0
    
    [root@xuexi ~]# test $abcd;echo $?
    1
    
    [root@xuexi ~]# test '';echo $?
    1
    

    (3).两个参数时,有几种情况:

    ①.第一个参数是单目条件运算符,包括文件类测试(如[ -e file1 ])和[ -n string ]、[ -z string ]。

    ②.第一个参数是"!"时,则只能是[ ! string ],等价于[ ! -n string ]。因为"!"是对条件表达式取反,所以当string为空时才true。

    ③第一个参数不是任何有效的操作符。将直接报错

    (4).三个参数时,也有几种情况:

    ①.使用了双目运算符,如[ file1 -nt file2 ],[ init1 -eq int2 ]以及[ string1 != string2 ]。

    ②.使用了逻辑运算符,如[ string1 -a string2 ]、[ ! -e file ]、[ ! -z string ]、[ ! -n string ]。

    ③.使用了括号,则只能是[ (string) ]。

    (5).四个参数以上时,则处理方法参照上面。如[ ! string1 == string2 ]、[ string1 == string2 -o string1 == string3 ]。

    无论参数数量多少个,总的来说还是对条件表达式的测试,所以最重要的还是条件表达式的逻辑结果。

    (注:任何时候,只想对某字段进行排序时,都建议明确指定其起始和结束位置)


    禁止sort执行"最后的排序"。在没有指定字段选项或全局选项时,该选项将不起作用,除非指定的是"-r"选项。
    (注:最后的排序:在key的比较结果相同时,sort的最后手段是对整行再进行一次完全默认的排序,即按照字母、升序对整行做最后排序。这称为"最后的排序"。如果未指定任何选项,其本身就是完全默认的,因此没必要再做最后的排序。如果指定的是"-r"选项,由于"-r"是对最终结果进行反转排序,因此会影响这次的"最后的排序"的结果)

    test可用于测试表达式,支持测试的范围包括:字符串比较,算术比较,文件存在性、属性、类型等判断。例如,判断文件是否为空、文件是否存在、是否是目录、变量是否大于5、字符串是否等于"longshuai"、字符串是否为空等等。在shell中,几乎所有的判断都使用test实现。

    '-C'
    '--check=quiet'
    '--check=silent'

    test、[ ]以及[[ ]]都使用条件表达式来完成测试。test和[]用法虽简单,但语法比较复杂,反而是[[]]的语法较为简单。但不管如何,先解释条件表达式。

    4.150.156.3 - - [01/Apr/2004:06:31:51 0000] message 1
    211.24.3.231 - - [24/Apr/2004:20:17:39 0000] message 2

    其中[]完全等价于test,只是写法不同。双中括号[[]]基本等价于[],它支持更多的条件表达式,还允许在双中括号内使用逻辑运算符"&&"、"||"、"!"和"()",但这些使用单中括号都能实现,只不过多写几个单中括号而已。单中括号[]无法实现的功能是正则表达式匹配,而[[]]可以实现。因此,在能使用单中括号的情况下,无需考虑使用双中括号。

    以上三个命令是等价的。第一个命令指定了第一个key的POS1要忽略前导空白,且第二个key要按照数值排序。另外两个命令中,缺少选项的key将继承全局选项。此处继承之所以能正确工作,是因为"-k 5b,5b"和"-k 5b,5"是等价的。

    1.4 使用建议

    1.无论是[]还是[[]],都建议对其内变量、字符串使用双引号包围。换句话说,能做字符串比较的时候,不要用数值比较。

    例如:

    name="Ma long"
    [ $name = "Ma long" ]
    

    上面的测试语句将报错,因为在变量替换阶段,$name被替换为Ma long,但它们没有在引号内,于是进行单词拆分,这就等价于执行的是[ Ma long = "Ma long" ],显然这是错误的语法。所以,建议加上双引号:

    [ "$name" = "Ma long" ]
    

    2.如果条件允许,建议将对数值的等值比较改为字符串的比较。避免变量为空时报错。

    例如,变量a为空,下面的表达式是错误的。因为它被shell解析后相当于[ -eq 7 ],而这是错误的语法。

    [root@xuexi ~]# [ $a -eq 7 ]
    -bash: [: -eq: unary operator expected
    

    采取第一种建议,将$a使用引号包围的话,还是错的。因为被shell解析后相当于[ "" -eq 7 ],字符串和数值无法比较。注意这里的报错和上面的错误信息不一样。

    [root@xuexi ~]# [ "$a" -eq 7 ]
    -bash: [: : integer expression expected
    

    所以最好的方法是将它改为字符串来测试。

    [root@xuexi ~]# [ "$a" = "7" ]
    

    3.当变量可能为空的时候,强烈建议在变量的基础上加上其他辅助字符串。看过/etc/init.d下的脚本的人肯定都见过这种用法。

    上面的语句虽然能正确测试。其实更安全的方法是采用下面的形式:

    [root@xuexi ~]# [ "a$a" = "a7" ]   # 判断a是否为7
    [root@xuexi ~]# [ "a$a" = "a" ]    # 判断a是否为空
    [root@xuexi ~]# [ ! -z "$a" -a "a$a" = "a7" ]  # a不为空且a=7时才为真
    

    4.另外,在[]和[[]]中,每个地方都有空格。这不是书写建议,而是强制要求的格式。

    按数值排序。空字符串""或"\0"被当作无。数值排序是精确排序,不会四舍五入后排序。

    使用"\0"分割每行而不是使用换行符。

    sort -s -t '.' -n -k1 -k2 -k3 -k4
    
    sort -t : -k 2 -k 5.3,5.4n
    sort -t : -k 2,2 -k 5.3,5.4n
    

    还需注意,"n"选项作用范围为第一个key。这等价于"-k 2n,2"或"-k 2n,2n"。所有的修饰符,除了"-b",无论写在pos1还是pos2,都会作用于整个key。

     

    '-o OUTPUT-FILE'
    '--output=OUTPUT-FILE'

    (3).本文的sort命令为CentOS 7.2上的,版本为sort (GNU coreutils) 8.22,有些选项在CentOS 6上不支持,如"--debug"。


    当在每行中搜索key的时候,使用SEPARATOR字符作为字段的分隔符。默认情况下,字段是由空白字符和非空白字符之间的空字符串分割而来的。

    指定排序的key,即每行排序的起始和终止字段(若省略POS2,则终止位置为行尾)。

    '-M'
    '--month-sort'
    '--sort=month'

    '-b'
    '--ignore-leading-blanks'

    因此,如果输入行为" foo bar",默认将切分为两个字段" foo"和" bar",(注:空白和非空白字符之间的空字符为行开头和"oo"后的位置)。字段分隔符不是分隔后字段中的内容,因此"sort -t ' '"对" foo bar"分隔时,将分割为3个字段:空字段、"foo"和"bar"。但是,每个单独的字段都是扩展到行结尾的,就像"-k 2",或像"-k 2,3"包含了范围的字段,它们都在扩展的时候保留字段分隔符。
    (注:以sort -t ' '为例,"-k 2"实际上表示的是"foo bar",它扩展到行尾,且中间的字段分隔符被保留。而"-k 1,2"实际上表示的是" foo",因为明确指定了这个key到第二个字段结束,但中间的字段分隔符仍保留)
    如果要指定字段分隔符为空,则使用"\0",例如"sort -t '\0'"。

    注意,如果写的是"-k 2n"而不是"-k 2,2n",该key将从第二字段一直扩展到行尾,这是主排序key,而副排序key"-k 5.3,5.4"在主排序key的排序基础上再按照字母排序。绝大多数情况下,让key向后扩展一般不是所期望的行为。

    忽略key的前导空白符号(包括空格、制表符)。不给定该选项时,空白符号对"-k"选项指定字符位置有影响(注:例如"-k 2.2"指定的第2个字符可能是空白)。

    '-z'
    '--zero-terminated'

    除非明确指定,否则所有的比较都按照"LC_COLLATE"指定的字符集的排序规则进行排序。

    (1).本手册只挑选了info sort中有用的信息进行翻译,如要查看完完整整的内容,请自行info sort。

    "sort -u"和"sort | uniq"是等价的,但扩展了更多选项后将可能不等价,例如,"sort -n -u"只会检查数值部分的唯一性,但"sort -n | uniq"在sort对行的数值排序后,uniq将检查整个行的唯一性。

    '-c'
    '--check'
    '--check=diagnose-first'

    (注:由于n选项无法跨越key,因此上面即使写成了"-k 2n"也是等价的,但下面两个命令则不一样:

    '-r'
    '--reverse'

    由于默认的字符集排序规则会跨越key,第一条命令中主key从第2字段开始,直到行尾结束,于是会先对整个key按字符排序,然后在此基础上再对副key按数值排序。
    再如下面的例子:即使主key的字段在副key的字段后面,副key由于是做字符集排序,所以仍会跨越主key。)

    '-h'
    '--human-numeric-sort'
    '--sort=human-numeric'

    以下是一些示例,用于说明不同选项的结合使用:

    它类似于"-c",但不会输出诊断信息。如果文件已排序,则以成功状态退出,否则以状态码1退出。最多只能给定一个文件。

    "cat file1 | sort -m -o file1 -"
    

    以下选项影响排序的输出结果。它们既可以指定为全局选项,也可以作为key的一部分。如果未指定任何key,则全局选项将作用于整行,否则指定的key将继承全局选项,除非key自身也指定了选项(注:自身指定了选项的key将覆盖全局选项)。

    ===========================

    ' 显示每行中用于排序的部分。还会给出额外的信息。

    echo -e "b 100:200 200na 110 300" | tr ':' '\0'|sort -t ' ' -k2n -k1
    

    (4).在没搞懂sort处理字段和排序机制时,强烈建议不要看man sort。

    示例:为了排序第二个字段,使用"--key=2,2"(-k 2,2)。可使用"--debug"选项帮助查看、分析和决定每行中被用于排序的字段。

    因此,对于"-n"来说,它绝对不可能跨越key的边界。但默认的排序规则会跨越key起作用。)

    (注:由于n选项无法跨越key边界和非数学字符,因此上面第二个sort命令和下面的命令是等价的:)

    本文由澳门赌搏网站大全发布于计算机网络,转载请注明出处:Linux sort命令中文手册(info sort翻译)

    关键词: www.4355.com

上一篇:date、sleep和usleep命令

下一篇:没有了