当前位置：首页 > news >正文

Linux基本功系列之sort命令实战

news 2026/2/8 0:44:04

在这里插入图片描述

文章目录

前言
一. sort命令介绍
二. 语法格式及常用选项
三. 参考案例
- 3.1 按照文本默认排序
- 3.2 忽略相同的行
- 3.3 按数字大小进行排序
- 3.4 检查文件是否已经按照顺序排序
- 3.5 将第3列按照数字大小进行排序
- 3.6 将排序结果输出到文件
四. 探讨 -k的高级用法
总结

前言

大家好，又见面了，我是沐风晓月，本文是专栏【linux基本功-基础命令实战】的第43篇文章。

专栏地址：[linux基本功-基础命令专栏] ，此专栏是沐风晓月对Linux常用命令的汇总，希望能够加深自己的印象，以及帮助到其他的小伙伴😉😉。

如果文章有什么需要改进的地方还请大佬不吝赐教👏👏。

🏠个人主页：我是沐风晓月
🧑个人简介：大家好，我是沐风晓月，双一流院校计算机专业😉😉
💕 座右铭：先努力成长自己，再帮助更多的人，一起加油进步🍺🍺🍺
💕欢迎大家：这里是CSDN，我总结知识的地方，喜欢的话请三连，有问题请私信😘

一. sort命令介绍

sort命令是一个排序命令，可以对文件进行排序，然后将排序结果标准输出。

sort将文件的每一行作为一个单位，相互比较，比较原则是从首字符向后，依次按ASCII码值进行比较，最后将他们按升序输出。

二. 语法格式及常用选项

依据惯例，我们还是先查看帮助，使用 sort --help

[root@mufenggrow ~]# sort --help
用法：sort [选项]... [文件]...或：sort [选项]... --files0-from=F
Write sorted concatenation of all FILE(s) to standard output.Mandatory arguments to long options are mandatory for short options too.
排序选项：-b, --ignore-leading-blanks	忽略前导的空白区域-d, --dictionary-order	    只考虑空白区域和字母字符-f, --ignore-case		       忽略字母大小写-g, --general-numeric-sort  compare according to general numerical value-i, --ignore-nonprinting    consider only printable characters-M, --month-sort            compare (unknown) < 'JAN' < ... < 'DEC'-h, --human-numeric-sort    使用易读性数字(例如： 2K 1G)-n, --numeric-sort		  根据字符串数值比较-R, --random-sort		     根据随机hash 排序--random-source=文件	从指定文件中获得随机字节-r, --reverse			    逆序输出排序结果--sort=WORD		    按照WORD 指定的格式排序：一般数字-g，高可读性-h，月份-M，数字-n，随机-R，版本-V-V, --version-sort		在文本内进行自然版本排序其他选项：--batch-size=NMERGE	             一次最多合并NMERGE 个输入；如果输入更多则使用临时文件-c, --check, --check=diagnose-first	检查输入是否已排序，若已有序则不进行操作-C, --check=quiet, --check=silent	   类似-c，但不报告第一个无序行--compress-program=程序	      使用指定程序压缩临时文件；使用该程序的-d 参数解压缩文件--debug			             为用于排序的行添加注释，并将有可能有问题的用法输出到标准错误输出--files0-from=文件       	从指定文件读取以NUL 终止的名称，如果该文件被指定为"-"则从标准输入读文件名-k, --key=KEYDEF          sort via a key; KEYDEF gives location and type-m, --merge               merge already sorted files; do not sort-o, --output=文件		     将结果写入到文件而非标准输出-s, --stable		     	禁用last-resort 比较以稳定比较算法-S, --buffer-size=大小  	指定主内存缓存大小-t, --field-separator=分隔符	使用指定的分隔符代替非空格到空格的转换-T, --temporary-directory=目录	使用指定目录而非$TMPDIR 或/tmp 作为临时目录，可用多个选项指定多个目录--parallel=N		   将同时运行的排序数改变为N-u, --unique		       配合-c，严格校验排序；不配合-c，则只输出一次排序结果-z, --zero-terminated  	以0 字节而非新行作为行尾标志--help		      显示此帮助信息并退出--version		      显示版本信息并退出

为了更直观一些，我们把常用的参数用表格来展示：

参数	描述
GNU 参数说明
-c	检查文件是否按照顺序进行排序
-d	排序时，处理英文字母，数字及空格字母外，忽略其他字符
-f	排序，将小写字母视为大写字母
-M	将前面的3个字母依照月份缩写进行排序
-r	以相反的顺序进行排序
-n	依照数值的大小进行排序-
-o	排序后存入指定的文件
-t	指定一个用来区分键位置字符
-k	后面跟数字，指定按第几列进行排

有了具体的参数之后，我们再来看实战案例：

三. 参考案例

3.1 按照文本默认排序

此时，无需加任何参数，sort将文件/文本的每一行作为一个单位，相互比较.

比较原则是从首字符向后，依次按ASCII码值进行比较，最后将他们按升序输出。

[root@mufenggrow ~]# sort /etc/passwd |head -5
abrt:x:173:173::/etc/abrt:/sbin/nologin
adm:x:3:4:adm:/var/adm:/sbin/nologin
avahi:x:70:70:Avahi mDNS/DNS-SD Stack:/var/run/avahi-daemon:/sbin/nologin
bin:x:1:1:bin:/bin:/sbin/nologin
chrony:x:993:988::/var/lib/chrony:/sbin/nologin

从上面的代码可以看到：按照首字符的ASCII码排序，

这里要理解什么是ASCII码：

在计算机中，所有的数据在存储和运算时都要使用二进制表示。而ASCII是基于拉丁字母的一套电脑编码系统，主要用于显示现代英语和其他西欧语言，它是现今最通用的单字节编码系统。

英文字母对应的ACSII码如下：
在这里插入图片描述

3.2 忽略相同的行

-u参数主要用来忽略相同的行

## 可以看到有相同的行
[root@mufeng-06 ~]# cat a.txt
tiger
deer
lion
elphant
monkey
bear
dog
pig
pig
## 使用-u参数后
[root@mufeng06 ~]# sort -u a.txt    删除重复的行，但是空行不会被删除bear
deer
dog
elphant
lion
monkey
pig
tiger

使用-u参数后，相同的行就没有了。

我们之前写过一个脚本统计在线的IP数有多少个，代码如下：

先写一个测试脚本：

[root@mufenggrow ~]# cat ping1.sh 
#!/bin/bash
str="192.168.1."
for num in {1..10}
do
ip=${str}${num}
ping -c1 -w1 $ip &>/dev/nullif [ $? -eq 0 ];then
echo $ip >>/root/online.txtfi
done
# 统计在线IP的个数
online=`cat /root/online.txt|wc -l `
echo "在线ip总数为 $online"

执行上面的脚本查看效果：


[root@mufenggrow ~]# ./ping1.sh 
在线ip总数为 12

我们发现执行的结果为12个IP，这个结果是否准确？我们查看文件内容：

[root@mufenggrow ~]# cat online.txt 
192.168.1.1
192.168.1.2
192.168.1.4
192.168.1.10
192.168.1.1
192.168.1.2
192.168.1.4
192.168.1.10
192.168.1.1
192.168.1.2
192.168.1.4
192.168.1.10

通过查看文件，我们发现文件的内容为中有很多重复的IP，这时候我们就可以使用sort -u 参数：

[root@mufenggrow ~]# sort -u online.txt |wc -l
4

使用这个命令之后，是不是就感觉IP少了很多，去掉了重复的，结果就对了。

3.3 按数字大小进行排序

此处使用-n 参数

当你使用sort命令对数字进行排序，但是又不用-n参数的时候，就会发现是乱序的：

[root@mufenggrow ~]# cat a.txt 
1
2
333
111
110
112
223
229
91
54
[root@mufenggrow ~]# sort a.txt 
1
110
111
112
2
223
229
333
54
91

是不是从排序里感觉112 反而不如2大了？

加上-n参数才是正常的，我们来看下代码：

[root@mufenggrow ~]# sort -n a.txt
1
2
54
91
110
111
112
223
229
333

如果向对数字进行倒序排列，需要加-r 参数，当然这里要对数字排序，所以-n还是少不了的。

[root@mufenggrow ~]# sort -nr a.txt 
333
229
223
112
111
110
91
54
2
1

3.4 检查文件是否已经按照顺序排序

-c参数，可以检查文件是否按照顺序排序

[root@mufenggrow ~]# sort -c a.txt 
sort：a.txt:4：无序： 111

可以看到无序，表示没有按照顺序排序，这里需要主要，当我们对一个文件排序后，虽然会再屏幕上显示，但并不会修改源文件。

3.5 将第3列按照数字大小进行排序

这里用到以下几个参数：

-n是按照数字大小排序
-r是以相反顺序
-k是指定需要排序的栏位
-t指定栏位分隔符为冒号

我们对/etc/passwd 以冒号为分隔符，把第三列进行大小排序

[root@mufenggrow ~]# sort -t: -nk 3 /etc/passwd |head -5
root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin
adm:x:3:4:adm:/var/adm:/sbin/nologin
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin

如果我们要将上面的排序变成从大到小排列：

[root@mufenggrow ~]# sort -t: -nrk 3 /etc/passwd |head -5
nfsnobody:x:65534:65534:Anonymous NFS User:/var/lib/nfs:/sbin/nologin
laoxin:x:1000:1000:laoxin:/home/laoxin:/bin/bash
polkitd:x:999:998:User for polkitd:/:/sbin/nologin
colord:x:998:997:User for colord:/var/lib/colord:/sbin/nologin
libstoragemgmt:x:997:995:daemon account for libstoragemgmt:/var/run/lsm:/sbin/nologin

注意：

-t后面可以跟分隔符，如果分割符为：比如容易操作，但如果分隔符为空格的时候，需要确认空格是否是规则的，比如有的是多个空格，有的是一个空格，就很难达到预期的效果

root@mufenggrow ~]# sort -t " " -k 3 b.txt 
9 9 1 0
1 2 3 4 
2 2 4 5 
5 6 7 8 
[root@mufenggrow ~]# cat c.txt 
1   2   33   44 
2 2 3 4
7     9   11 43 4  6 7[root@mufenggrow ~]# sort -t " " -k 4 c.txt1   2   33   44 
2 2 3 4
3 4  6 7
7     9   11 4

最后一个的排序按照第四列，就没成功，所以还是那句话，如果空格比较杂乱的时候，不建议使用空格进行排序，如果非要用空格，可以先做预处理。

3.6 将排序结果输出到文件

-o参数可以将结果输出到文件，比如我们把3.5的排序输出到a.txt中

root@mufenggrow ~]# sort -t: -nrk 3 /etc/passwd -o a.txt

四. 探讨 -k的高级用法

案例一：使用-u 参数去重的时候，希望参照第一个域进行去重

我们知道-u参数是去重，但是必须两行完全重复才可以，而有时候我们根据一部分来去重。

如果我们只用-u去重：

[root@mufenggrow ~]# sort -u d.txt 
lisi: 34
mufeng: 100
mufeng:60
mufeng:99
wangwu: 66
zhangsan: 59
可以看到有三个mufeng

结合 -k试一下：

[root@mufenggrow ~]# sort -t: -u -k 1,1 d.txt lisi: 34
mufeng: 100
wangwu: 66
zhangsan: 59
[root@mufenggrow ~]#

可以看到mufeng下面的两个mufeng被去掉了。

这里的 -k 1,1 我们写作 -k start,end , 如果start 第一个域的第一个字符~end 最后一个域的最后一个字符，如果完全相同，仅保留第一次出现的行，后面出现的相同行都会被消除。

总结

sort命令在日常工作中，应用的比较广泛，一定要认真学习，记熟记牢常用参数。

💕💕💕 好啦，这就是今天要分享给大家的全部内容了，我们下期再见！✨ ✨ ✨
🍻🍻🍻如果你喜欢的话，就不要吝惜你的一键三连了~

请添加图片描述
在这里插入图片描述

Linux基本功系列之sort命令实战

文章目录前言一. sort命令介绍二. 语法格式及常用选项三. 参考案例3.1 按照文本默认排序3.2 忽略相同的行3.3 按数字大小进行排序3.4 检查文件是否已经按照顺序排序3.5 将第3列按照数字大小进行排序3.6 将排序结果输出到文件四. 探讨 -k的高级用法总结前言大家好，…...

编程日记 2023/2/10 5:07:48

【笔记】移动端自动化：adb调试工具+appium+UIAutomatorViewer

学习源： https://www.bilibili.com/video/BV11p4y197HQ https://blog.csdn.net/weixin_47498728/category_11818905.html 一、移动端测试环境搭建学习目标 1.能够搭建java 环境 2.能够搭建android 环境 （一）整体思路我们的目标是Andr…...

编程日记 2023/2/10 5:06:40

面试复习题--性能检测原理

1、布局性能检测 Systrace，内存优化工具中也用到了 Systrace,这里关注 Systrace 中的 Frames 页面，正常情况下圆点为绿色，当出现黄色或者红色的圆点时，表现出现了丢帧。 Layout Inspector，是 AndroidStudio 自带工具…...

编程日记 2023/2/10 5:05:33

@LoadBalanced 和 @RefreshScope 同时使用，负载均衡失效分析

背景最近引入了 Nacos Config 配置管理能力，说起来用法很简单，还是踩了三个坑。 Nacos Config 的 nacos 的帐号密码加密配置后，怎么解密而且在 NacosConfigBootstrapConfiguration 真正注入 Nacos Config 注入之前，而且不能触发…...

编程日记 2023/2/10 5:04:26

2023年个人计划

2023年个人计划可能是最近太清闲，感觉生活很无聊，就胡乱做下新年的规划吧，扰乱下烦闷的心 1 二宝健健康康，活泼可爱目前老婆已经怀孕5周左右了，二宝将在进行年中降生，希望老婆少受点罪，二宝…...

编程日记 2023/2/10 5:03:15

加拿大访问学者家属如何办理探亲签证？

由于大多数访问学者的访学期限都为一年，家人来访不仅可以缓解访学的寂寞生活，而且也是家人到加拿大体验国外风情的好机会。家属在国内申请赴加签证时，如果材料齐全，一般上午递交了申请，下午就可以拿到签证。以下是家人…...

编程日记 2023/2/10 5:02:06

操作系统基础---多线程

文章目录操作系统基础---多线程1.为何引入线程程序并发的时空开销线程的设计思路线程的状态和线程控制块TCB2.线程与进程的比较3.线程的实现⭐1.内核支持线程KST2.用户级线程3.组合方式操作系统基础—多线程 1.为何引入线程利用传统的进程概念和设计方法已经难以设计出适合于…...

编程日记 2023/2/10 5:00:58

2022-12-10青少年软件编程（C语言）等级考试试卷（六级）解析

2022-12-10青少年软件编程（C语言）等级考试试卷（六级）解析T1、区间合并给定 n 个闭区间 [ai; bi]，其中i1,2,...,n。任意两个相邻或相交的闭区间可以合并为一个闭区间。例如，[1;2] 和 [2;3] 可以合并为 [1;3…...

编程日记 2023/2/10 4:59:50

太酷了，用Python实现一个动态条形图！

大家好，我是小F～说起动态条形图，小F之前推荐过两个Python库，比如「Bar Chart Race」、「Pandas_Alive」，都可以实现。今天就给大家再介绍一个新的Python库「pynimate」，一样可以制作动态条形图，…...

编程日记 2023/2/10 4:58:43

单元测试junit+mock

单元测试是什么？ 单元测试（unit testing），是指对软件中的最小可测试单元进行检查和验证。至于“单元”的大小或范围，并没有一个明确的标准，“单元”可以是一个方法、类、功能模块或者子系统。单元测试通…...

编程日记 2023/2/10 4:57:33

2022Q4手机银行新版本聚焦提升客群专属、财富开放平台、智能化能力，活跃用户规模6.91亿人

易观：2022年第4季度，手机银行APP迭代升级加快，手机银行作为零售银行服务及经营的主阵地，与零售银行业务发展的联系日益紧密。迭代升级一方面可以顺应零售银行发展战略及方向，对手机银行业务布局进行针对性调整优化&…...

编程日记 2023/2/10 4:56:24

YOLO-V1~V3经典物体检测算法介绍

大名鼎鼎的YOLO物体检测算法如今已经出现了V8版本，我们先来了解一下它前几代版本都做了什么吧。本篇文章介绍v1-v3，后续会继续更新。一、节深度学习经典检测方法概述1.1 检测任务中阶段的意义我们所学的深度学习经典检测方法 ，有些是单阶段的…...

编程日记 2023/2/10 4:55:17

SparkSQL 核心编程

文章目录SparkSQL 核心编程1、新的起点2、SQL 语法1) 读取 json 文件创建 DataFrame2) 对 DataFrame 创建一个临时表3) 通过SQL语句实现查询全表3、DSL 语法1) 创建一个DataFrame2) 查看DataFrame的Schema信息3) 只查看"username"列数据4) 查看"username"列…...

编程日记 2023/2/10 4:54:04

Android核心开发【UI绘制流程解析+原理】

一、UI如何进行具体绘制 UI从数据加载到具体展现的过程： 进程间的启动协作： 二、如何加载到数据应用从启动到onCreate的过程： Activity生产过程详解： 核心对象绘制流程源码路径 1、Activity加载ViewRootImpl ActivityThread…...

编程日记 2023/2/10 4:52:57

计算机组成原理第七章笔记记录

仅仅作为笔记记录,B站视频链接，若有错误请指出，谢谢基本概念演变过程 I/O系统基本组成 I/O软件包括驱动程序、用户程序、管理程序、升级补丁等下面的两种方式是用来实现CPU和I/O设备的信息交换的 I/O指令 CPU指令的一部分,由操作码,命令码,设备…...

编程日记 2023/2/10 4:51:50

ORB-SLAM2编译、安装等问题汇总大全（Ubuntu20.04、eigen3、pangolin0.5、opencv3.4.10）

ORB-SLAM2编译、安装等问题汇总大全（Ubuntu20.04、eigen3、pangolin0.5、opencv3.4.10） 1：环境说明: 使用的Linux发行版本为Ubuntu 20.04 SLAM2下载地址为：git clone https://github.com/raulmur/ORB_SLAM2.git ORB_SLAM2 2&a…...

编程日记 2023/2/10 4:50:43

QuickBuck：一款专为安全研究人员设计的勒索软件模拟器

关于QuickBuck QuickBuck是一款基于Golang开发的勒索软件模拟工具，在该工具的帮助下，广大研究人员可以通过更简单的方法来判断反病毒保护方案是否能够有效地预防勒索软件的攻击。功能介绍该工具能够模拟下列勒索软件典型行为，其中包括&a…...

编程日记 2023/2/10 4:49:35

【八大数据排序法】堆积树排序法的图形理解和案例实现 | C++

第二十一章堆积树排序法目录第二十一章堆积树排序法 ●前言 ●认识排序 1.简要介绍 2.图形理解 3.算法分析 ●二、案例实现 1.案例一 ● 总结前言排序算法是我们在程序设计中经常见到和使用的一种算法，它主要是将一堆不规则的数据按照递增…...

编程日记 2023/2/10 4:48:28

低代码开发平台|生产管理-生产加工搭建指南

1、简介1.1、案例简介本文将介绍，如何搭建生产管理-生产加工。1.2、应用场景在主生产计划列表中下达加工后，在加工单列表可操作领料、质检。2、设置方法2.1、表单搭建1）新建表单【产品结构清单（BOM）】，字段…...

编程日记 2023/2/10 4:47:20

Python类型-语句-函数

文章目录类型动态类型:变量类型会随着程序的运行发生改变注释控制台控制台输入input()运算符算术关系逻辑赋值总结语句判断语句while循环for循环函数链式调用和嵌套调用递归关键字传参在C/java中，整数除以整数结果还是整数，并不会将小数部分舍弃&#xf…...

编程日记 2023/2/10 4:46:12

Chapter03-Authentication vulnerabilities

文章目录 1. 身份验证简介1.1 What is authentication1.2 difference between authentication and authorization1.3 身份验证机制失效的原因1.4 身份验证机制失效的影响 2. 基于登录功能的漏洞2.1 密码爆破2.2 用户名枚举2.3 有缺陷的暴力破解防护2.3.1 如果用户登录尝试失败次…...

编程新知 2026/2/7 4:57:53

【Python】 -- 趣味代码 - 小恐龙游戏

文章目录文章目录 00 小恐龙游戏程序设计框架代码结构和功能游戏流程总结01 小恐龙游戏程序设计02 百度网盘地址00 小恐龙游戏程序设计框架这段代码是一个基于 Pygame 的简易跑酷游戏的完整实现，玩家控制一个角色（龙）躲避障碍物（仙人掌和乌鸦）。以下是代码的详细介绍：…...

编程新知 2026/1/31 13:59:37

1 方法一先用方法 keySet() 获取集合中的所有键。再通过 gey(key) 方法用对应键获取值 import java.util.HashMap; import java.util.Set;public class Test {public static void main(String[] args) {HashMap hashMap new HashMap();hashMap.put("语文",99);has…...

编程新知 2026/1/24 15:08:45

《从零掌握MIPI CSI-2: 协议精解与FPGA摄像头开发实战》-- CSI-2 协议详细解析 (一）

CSI-2 协议详细解析 (一） 1. CSI-2层定义（CSI-2 Layer Definitions） 分层结构 ：CSI-2协议分为6层： 物理层（PHY Layer） ： 定义电气特性、时钟机制和传输介质（导线&#…...

编程新知 2026/1/23 12:18:20

YSYX学习记录（八）

C语言，练习0： 先创建一个文件夹，我用的是物理机： 安装build-essential 练习1： 我注释掉了 #include <stdio.h> 出现下面错误在你的文本编辑器中打开ex1文件，随机修改或删除一部分，之后…...

编程新知 2026/1/24 14:31:01

Nginx server_name 配置说明

Nginx 是一个高性能的反向代理和负载均衡服务器，其核心配置之一是 server 块中的 server_name 指令。server_name 决定了 Nginx 如何根据客户端请求的 Host 头匹配对应的虚拟主机（Virtual Host）。 1. 简介 Nginx 使用 server_name 指令来确定…...

编程新知 2025/9/6 16:47:17

【Web 进阶篇】优雅的接口设计：统一响应、全局异常处理与参数校验

系列回顾： 在上一篇中，我们成功地为应用集成了数据库，并使用 Spring Data JPA 实现了基本的 CRUD API。我们的应用现在能“记忆”数据了！但是，如果你仔细审视那些 API，会发现它们还很“粗糙”：有…...

编程新知 2026/1/22 20:46:43

HashMap中的put方法执行流程（流程图）

1 put操作整体流程 HashMap 的 put 操作是其最核心的功能之一。在 JDK 1.8 及以后版本中，其主要逻辑封装在 putVal 这个内部方法中。整个过程大致如下： 初始判断与哈希计算： 首先，putVal 方法会检查当前的 table（也就…...

编程新知 2026/2/5 4:32:47

AI病理诊断七剑下天山，医疗未来触手可及

一、病理诊断困局：刀尖上的医学艺术 1.1 金标准背后的隐痛病理诊断被誉为"诊断的诊断"，医生需通过显微镜观察组织切片，在细胞迷宫中捕捉癌变信号。某省病理质控报告显示，基层医院误诊率达12%-15%，专家会诊…...

编程新知 2026/2/6 20:53:34

Go语言多线程问题

打印零与奇偶数（leetcode 1116） 方法1：使用互斥锁和条件变量 package mainimport ("fmt""sync" )type ZeroEvenOdd struct {n intzeroMutex sync.MutexevenMutex sync.MutexoddMutex sync.Mutexcurrent int…...

编程新知 2025/9/23 8:19:28