当前位置: 首页 > news >正文

Linux Shell 019-文本行处理工具sed

Linux Shell 019-文本行处理工具sed

本节关键字:Linux、Bash Shell、文本行处理工具
相关指令:sed、

sed介绍

sed是Stream Editor(流编辑器)的缩写,简称流编辑器;用来处理文件的。sed是一行一行读取文件内容并按照要求进行处理,把处理后的结果输出到屏幕。sed的工作流程如下:

  • 首先sed读取文件中的一行内容,把其保存在一个临时缓存区中(也称为模式空间)
  • 然后根据需求处理临时缓冲区中的行,完成后把该行发送到屏幕上

sed语法

sed常见的语法格式有两种,一种叫命令行模式,另一种叫脚本模式。

sed命令行格式

基本语法

sed [options] ‘处理动作’ 文件名

常用选项

选项说明备注
-e进行多项(多次)编辑
-n取消默认输出不自动打印模式空间
-r使用扩展正则表达式
-i原地编辑(修改源文件)
-f指定sed脚本的文件名

常见处理动作

提示:以下所有的动作都要在单引号里

动作说明备注
p打印
i在指定行之前插入内容类似vim里的大写O
a在指定行之后插入内容类似vim里的小写o
c替换指定行所有内容
d删除指定行
对文件进行增删改查操作

基本语法

sed 选项 ‘定位+命令’ 需要处理的文件

打印文件内容

命令说明
$ sed ‘’ a.txt对文件什么都不做
$ sed -n ‘p’ a.txt打印每一行,并取消默认输出
$ sed -n ‘1p’ a.txt打印第1行
$ sed -n ‘2p’ a.txt打印第2行
$ sed -n ‘1,5p’ a.txt打印1到5行
$ sed -n ‘$p’ a.txt打印最后1行

增加文件内容

说明:

  • i 在光标所在行的上面插入
  • a 在光标所在行的下面插入
$ sed '$a99999' a.txt                # 文件最后一行下面增加内容
$ sed 'a99999' a.txt                 # 文件每行下面增加内容
$ sed '5a99999' a.txt                # 文件第5行下面增加内容
$ sed '$i99999' a.txt                # 文件最后一行上一行增加内容
$ sed 'i99999' a.txt                 # 文件每行上一行增加内容
$ sed '6i99999' a.txt                # 文件第6行上一行增加内容
$ sed '/^uucp/ihello'                # 以uucp开头行的上一行插入内容

修改文件内容

# c   替换指定的整行内容
$ sed '5chello world' a.txt        # 替换文件第5行内容
$ sed 'chello world' a.txt         # 替换文件所有内容
$ sed '1,5chello world' a.txt      # 替换文件1到5号内容为hello world
$ sed '/^user01/c888888' a.txt     # 替换以user01开头的行

删除文件内容

$ sed '1d' a.txt             删除文件第1行
$ sed '1,5d' a.txt             删除文件1到5行
$ sed '$d' a.txt            删除文件最后一行
对文本进行搜索替换操作

基本语法

# sed 选项 's/搜索的内容/替换的内容/动作' 需要处理的文件
# 其中,s表示search搜索;斜杠/表示分隔符,可以自己定义;动作一般是打印p和全局替换g
$ sed -n 's/root/ROOT/p' 1.txt 
$ sed -n 's/root/ROOT/gp' 1.txt 
$ sed -n 's/^#//gp' 1.txt 
$ sed -n 's@/sbin/nologin@itcast@gp' a.txt
$ sed -n 's/\/sbin\/nologin/itcast/gp' a.txt
$ sed -n '10s#/sbin/nologin#itcast#p' a.txt 
uucp:x:10:14:uucp:/var/spool/uucp:itcast
$ sed -n 's@/sbin/nologin@itcastheima@p' 2.txt 
# 注意:搜索替换中的分隔符可以自己指定# 注释掉文件的1-5行内容
$ sed -n '1,5s/^/#/p' a.txt
#root:x:0:0:root:/root:/bin/bash
#bin:x:1:1:bin:/bin:/sbin/nologin
#daemon:x:2:2:daemon:/sbin:/sbin/nologin
#adm:x:3:4:adm:/var/adm:/sbin/nologin
#lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
其它命令
命令解释备注
r从另外文件中读取内容
w内容另存为
&保存查找串以便在替换串中引用和\(\)相同
=打印行号
对所选行以外的所有行应用命令,放到行数之后‘1,5!’
q退出

使用示例

# r    从文件中读取输入行
# w    将所选的行写入文件
$ sed '3r /etc/hosts' 2.txt 
$ sed '$r /etc/hosts' 2.txt
$ sed '/root/w a.txt' 2.txt 
$ sed '/[0-9]{4}/w a.txt' 2.txt
$ sed  -r '/([0-9]{1,3}\.){3}[0-9]{1,3}/w b.txt' 2.txt# !    对所选行以外的所有行应用命令,放到行数之后
$ sed -n '1!p' 1.txt 
$ sed -n '4p' 1.txt 
$ sed -n '4!p' 1.txt 
$ cat -n 1.txt 
$ sed -n '1,17p' 1.txt 
$ sed -n '1,17!p' 1.txt # &   保存查找串以便在替换串中引用   \(\)
$ sed -n '/root/p' a.txt 
root:x:0:0:root:/root:/bin/bash
$ sed -n 's/root/#&/p' a.txt 
#root:x:0:0:root:/root:/bin/bash# 注释掉以root开头的行
$ sed -n 's/^root/#&/p' passwd# 注释掉以root开头或者以stu开头的行
$  sed -n -r 's/^root|^stu/#&/p' /etc/passwd# 注释掉1~5行中以任意小写字母开头的行
$ sed -n '1,5s/^[a-z].*/#&/p' passwd# 注释1~5行
$ sed -n '1,5s/^/#/p' /etc/passwd
# 或者
# 以空开头的加上#
$ sed -n '1,5s/^/#/p' passwd
# 以#开头的替换成空
$ sed -n '1,5s/^#//p' passwd$ sed -n '/^root/p' 1.txt 
$ sed -n 's/^root/#&/p' 1.txt 
$ sed -n 's/\(^root\)/#\1/p' 1.txt 
$ sed -nr '/^root|^stu/p' 1.txt 
$ sed -nr 's/^root|^stu/#&/p' 1.txt # =     打印行号
# 打印以bash结尾的行的行号
$ sed -n '/bash$/=' passwd
$ sed -ne '/root/=' -ne '/root/p' passwd 
$ sed -n '/nologin$/=;/nologin$/p' 1.txt
$ sed -ne '/nologin$/=' -ne '/nologin$/p' 1.txt# q    退出
$ sed '5q' 1.txt
$ sed '/mail/q' 1.txt
$ sed -r '/^yunwei|^mail/q' 1.txt
$ sed -n '/bash$/p;10q' 1.txt
ROOT:x:0:0:root:/root:/bin/bash

综合运用:

$ sed -n '1,5s/^/#&/p' 1.txt 
#root:x:0:0:root:/root:/bin/bash
#bin:x:1:1:bin:/bin:/sbin/nologin
#daemon:x:2:2:daemon:/sbin:/sbin/nologin
#adm:x:3:4:adm:/var/adm:/sbin/nologin
#lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin$ sed -n '1,5s/\(^\)/#\1/p' 1.txt 
#root:x:0:0:root:/root:/bin/bash
#bin:x:1:1:bin:/bin:/sbin/nologin
#daemon:x:2:2:daemon:/sbin:/sbin/nologin
#adm:x:3:4:adm:/var/adm:/sbin/nologin
#lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
其它选项
选项说明
-e多项编辑
-r扩展正则
-i修改原文件
$ sed -ne '/root/p' 1.txt -ne '/root/='
root:x:0:0:root:/root:/bin/bash
1
$ sed -ne '/root/=' -ne '/root/p' 1.txt 
1
root:x:0:0:root:/root:/bin/bash# 在1.txt文件中的第5行的前面插入“hello world”;在1.txt文件的第8行下面插入“哈哈哈哈”
$ sed -e '5ihello world' -e '8a哈哈哈哈哈' 1.txt  -e '5=;8='$ sed -n '1,5p' 1.txt
$ sed -ne '1p' -ne '5p' 1.txt
$ sed -ne '1p;5p' 1.txt# 过滤vsftpd.conf文件中以#开头和空行:
$ grep -Ev '^#|^$' /etc/vsftpd/vsftpd.conf
$ sed -e '/^#/d' -e '/^$/d' /etc/vsftpd/vsftpd.conf
$ sed '/^#/d;/^$/d' /etc/vsftpd/vsftpd.conf
$ sed -r '/^#|^$/d' /etc/vsftpd/vsftpd.conf# 过滤smb.conf文件中生效的行:
$ sed -e '/^#/d' -e '/^;/d' -e '/^$/d' -e '/^\t$/d' -e '/^\t#/d' smb.conf
$ sed -r '/^(#|$|;|\t#|\t$)/d' smb.conf 
$ sed -e '/^#/d' -e '/^;/d' -e '/^$/d' -e '/^\t$/d' -e '/^\t#/' smb.conf$ grep '^[^a-z]' 1.txt
$ sed -n '/^[^a-z]/p' 1.txt# 过滤出文件中的IP地址:
$ grep -E '([0-9]{1,3}\.){3}[0-9]{1,3}' 1.txt
$ sed -nr '/([0-9]{1,3}\.){3}[0-9]{1,3}/p' 1.txt
$ grep -o -E '([0-9]{1,3}\.){3}[0-9]{1,3}' 2.txt
$ sed -nr '/([0-9]{1,3}\.){3}[0-9]{1,3}/p' 2.txt# 过滤出ifcfg-eth0文件中的IP、子网掩码、广播地址
$ grep -Eo '([0-9]{1,3}\.){3}[0-9]{1,3}' ifcfg-eth0 
$ sed -nr '/([0-9]{1,3}\.){3}[0-9]{1,3}/p' ifcfg-eth0|cut -d'=' -f2
$ sed -nr '/([0-9]{1,3}\.){3}[0-9]{1,3}/p' ifcfg-eth0|sed -n 's/[A-Z=]//gp'
$ ifconfig eth0|sed -n '2p'|sed -n 's/[:a-Z]//gp'|sed -n 's/ /\n/gp'|sed '/^$/d'
$ ifconfig | sed -nr '/([0-9]{1,3}\.)[0-9]{1,3}/p' | head -1|sed -r 's/([a-z:]|[A-Z/t])//g'|sed 's/ /\n/g'|sed  '/^$/d'
$ ifconfig eth0|sed -n '2p'|sed -n 's/.*addr:\(.*\) Bcast:\(.*\) Mask:\(.*\)/\1\n\2\n\3/p'# -i 选项  直接修改原文件
$ sed -i 's/root/ROOT/;s/stu/STU/' 11.txt
$ sed -i '17{s/YUNWEI/yunwei/;s#/bin/bash#/sbin/nologin#}' 1.txt
$ sed -i '1,5s/^/#&/' a.txt

注意:

  • -ni 不要一起使用
  • p命令 不要再使用-i时使用

sed与正则表达式的综合使用示例

基本语法

sed 选项 ‘sed命令或者正则表达式或者地址定位’ 文件名

定址用于决定对哪些行进行编辑。地址的形式可以是数字、正则表达式、或二者的结合。

如果没有指定地址,sed将处理输入文件的所有行。

正则说明备注
/key/查询包含关键字的行sed -n ‘/root/p’ 1.txt
/key1/,/key2/匹配包含两个关键字之间的行sed -n ‘/adm/,/mysql/p’ 1.txt
/key/,x从匹配关键字的行开始到文件第x行之间的行(包含关键字所在行)sed -n ‘/^ftp/,7p’
x,/key/从文件的第x行开始到与关键字的匹配行之间的行
x,y!不包含x到y行
/key/!不包括关键字的行sed -n ‘/bash$/!p’ 1.txt

脚本格式

基本语法

$ sed -f scripts.sh  file        //使用脚本处理文件
# 建议使用   ./sed.sh   file# 脚本的第一行写上
#!/bin/sed -f
1,5d
s/root/hello/g
3i777
5i888
a999
p

注意事项

1) 脚本文件是一个sed的命令行清单。‘commands’
2) 在每行的末尾不能有任何空格、制表符(tab)或其它文本。
3) 如果在一行中有多个命令,应该用分号分隔。
4) 不需要且不可用引号保护命令
5) #号开头的行为注释

使用示例

$ cat passwd
stu3:x:509:512::/home/user3:/bin/bash
stu4:x:510:513::/home/user4:/bin/bash
stu5:x:511:514::/home/user5:/bin/bash$ cat sed.sh 
#!/bin/sed -f
2a\
******************
2,$s/stu/user/
$a\
we inster new line
s/^[a-z].*/#&/$ cat 1.sed 
#!/bin/sed -f
3a**********************
$chelloworld
1,3s/^/#&/$ sed -f 1.sed -i 11.txt 
$ cat 11.txt 
#root:x:0:0:root:/root:/bin/bash
#bin:x:1:1:bin:/bin:/sbin/nologin
#daemon:x:2:2:daemon:/sbin:/sbin/nologin
**********************
adm:x:3:4:adm:/var/adm:/sbin/nologin
helloworld

扩展说明

1、正则表达式必须以”/“前后规范间隔

$ sed '/root/d' file
$ sed '/^root/d' file

2、如果匹配的是扩展正则表达式,需要使用-r选来扩展sed

$ grep -E
$ sed -r
# + ? () {n,m} | \d

注意:
在正则表达式中如果出现特殊字符(^$.*/[]),需要以前导 “” 号做转义
eg:sed ‘/$foo/p’ file

3、逗号分隔符

# 删除5到7行
$ sed '5,7d' file
# 删除第一个匹配字符串"root"到第一个匹配字符串"ftp"的所有行本行不找 循环执行
$ sed '/root/,/ftp/d' file

4、组合方式

$ sed '1,/foo/d' file            # 删除第一行到第一个匹配字符串"foo"的所有行
$ sed '/foo/,+4d' file           # 删除从匹配字符串”foo“开始到其后四行为止的行
$ sed '/foo/,~3d' file           # 删除从匹配字符串”foo“开始删除到3的倍数行(文件中)
$ sed '1~5d' file                # 从第一行开始删每五行删除一行
$ sed -nr '/foo|bar/p' file      # 显示配置字符串"foo"或"bar"的行
$ sed -n '/foo/,/bar/p' file     # 显示匹配从foo到bar的行
$ sed '1~2d' file                # 删除奇数行
$ sed '0-2d' file                # 删除偶数行 sed '1~2!d'  file

5、特殊情况

$ sed '$d' file                  # 删除最后一行
$ sed '1d' file                  # 删除第一行

6、其他:

$ sed 's/.//' a.txt              # 删除每一行中的第一个字符
$ sed 's/.//2' a.txt             # 删除每一行中的第二个字符
$ sed 's/.//N' a.txt             # 从文件中第N行开始,删除每行中第N个字符(N>2)
$ sed 's/.$//' a.txt             # 删除每一行中的最后一个字符
$ cat 2.txt 
1 a
2 b
3 c
4 d
5 e
6 f
7 u
8 k
9 o
$ sed '/c/,~2d' 2.txt 
1 a
2 b
5 e
6 f
7 u
8 k
9 o

相关文章:

Linux Shell 019-文本行处理工具sed

Linux Shell 019-文本行处理工具sed 本节关键字:Linux、Bash Shell、文本行处理工具 相关指令:sed、 sed介绍 sed是Stream Editor(流编辑器)的缩写,简称流编辑器;用来处理文件的。sed是一行一行读取文件…...

Ubuntu中fdisk磁盘分区并挂载、扩容逻辑卷

Ubuntu中fdisk磁盘分区并挂载、扩容逻辑卷 一:fdisk磁盘分区并挂载1.查看磁盘分区信息2.分区3.强制系统重新读取分区(避免重启系统)4.格式化分区5.创建挂载目录6.设置开机自动挂载:7.验证并自动挂载(执行了该命令不需要重启系统)8.查看挂载007.异常情况处…...

【leetcode】栈与队列总结

本文内容来自于代码随想录 栈 用栈实现队列 两个栈实现队列。思路:两个栈分别表示入栈和出栈。 入队:直接入栈出队: a. 出栈为空,先把入栈中的元素全部放到出栈中(相当于反过来,这样在出栈的时候先进的元…...

[EFI]HP Spectre 13 v102nl电脑 Hackintosh 黑苹果efi引导文件

硬件型号驱动情况主板 HP Spectre 13 v102nl 处理器Intel Core i7-7500U (7th gen - Kaby Lake)已驱动内存8 GB LPDDR3-1866 SDRAM已驱动硬盘512 GB Toshiba NVMe™ M.2 SSD已驱动显卡Intel HD Graphics 620已驱动声卡Conexant CX8200 (0x2008)已驱动网卡I1211 Gigabit Etherne…...

【Pytorch】学习记录分享8——PyTorch自然语言处理基础-词向量模型Word2Vec

【Pytorch】学习记录分享7——PyTorch自然语言处理基础-词向量模型Word2Vec 1. 词向量模型Word2Vec)1. 如何度量这个单词的?2.词向量是什么样子?3.词向量对应的热力图:4.词向量模型的输入与输出![在这里插入图片描述](https://img-blog.csdni…...

【Kotlin 】协程

Kotlin协程 背景定义实践GlobalScope.launchrunBlocking业务实践 背景 在项目实践过程中,笔者发现很多异步或者耗时的操作,都使用了Kotlin中的协程,所以特地研究了一番。 定义 关于协程(Coroutine),其实…...

用Xshell连接虚拟机的Ubuntu20.04系统记录。虚拟机Ubuntu无法上网。本机能ping通虚拟机,反之不能。互ping不通

先别急着操作,看完再试。 如果是:本机能ping通虚拟机,反之不能。慢慢看到第8条。 如果是:虚拟机不能上网(互ping不通),往下一直看。 系统是刚装的,安装步骤:VMware虚拟机…...

人机对话--关于意识机器

人机对话–关于意识机器 这段内容是我和《通义千问》的对话。这本身展示的是人工智能的效果,同时这里面的内容也有人工智能相关,与各位分享。 我:阿尼尔赛斯 《意识机器》这本书写的是什么? 通义千问: 阿尼尔赛斯教…...

八股文打卡day16——计算机网络(16)

面试题:TCP连接是如何确保可靠性的? 我的回答: 1.数据分块控制。应用数据被分成被认为最适合传输的数据块大小,再发送到传输层,数据块被称为数据报文段或数据段。 2.序列号和确认应答。TCP为每一个数据包分配了一个序…...

Java Object浅克隆深克隆

对象克隆 把A对象的属性值完全拷贝给B对象,也叫对象拷贝,对象复制。 实现Cloneable接口,表示当前类的对象就可以被克隆,反之,表示当前类的对象就不能克隆。 如果一个接口里面没有抽象方法,表示当前的接口…...

概率的 50 个具有挑战性的问题 [8/50]:完美的桥牌

一、说明 我最近对与概率有关的问题产生了兴趣。我偶然读到了弗雷德里克莫斯特勒(Frederick Mosteller)的《概率论中的五十个具有挑战性的问题与解决方案》)一书。我认为创建一个系列来讨论这些可能作为面试问题出现的迷人问题会很有趣。每篇…...

自动驾驶学习笔记(二十四)——车辆控制开发

#Apollo开发者# 学习课程的传送门如下,当您也准备学习自动驾驶时,可以和我一同前往: 《自动驾驶新人之旅》免费课程—> 传送门 《Apollo开放平台9.0专项技术公开课》免费报名—>传送门 文章目录 前言 控制算法 控制标定 控制协议…...

【起草】【第十二章】定制ChatGPT数字亲人

身为普普通通的我们,不知道亲人们在哪一天就要离开这个世界 ? 作为普普通通的程序员,我们可以为我们的亲人做点什么 ? 让他们以数字资产形式留在人世间 ? 对话|6岁女孩病逝捐器官,妈妈:她去…...

MySQL数据库索引

索引的定义 索引是一个排序的列表,包含索引字段的值和其对应的行记录的数据所在的物理地址 索引的作用 加快表的查询速度,还可以对字段排序 索引的副作用 会额外占用磁盘空间;更新包含索引的表会花费更多的时间,效率会更慢 …...

【LLM 】7个基本的NLP模型,为ML应用程序赋能

在上一篇文章中,我们已经解释了什么是NLP及其在现实世界中的应用。在这篇文章中,我们将继续介绍NLP应用程序中使用的一些主要深度学习模型。 BERT 来自变压器的双向编码器表示(BERT)由Jacob Devlin在2018年的论文《BERT:用于语言…...

数字人私人定制

数字人是什么? 在回答这个问题之前,我们先回答另一个问题,人如何与人工智能交流?目前可以通过文字、语音、电脑屏幕、手机屏幕、平板、虚拟现实设备等和人工智能交流,为了得到更好的交流体验,人工智能必然…...

CollectionUtils

使用 CollectionUtils 类的常用方法 在Java开发中,我们经常需要对集合进行各种操作,而Apache Commons Collections库提供了一个方便的工具类 CollectionUtils,其中包含了许多实用的方法。在这篇博客中,我们将深入了解一些常用的方…...

很想写一个框架,比如,spring

很想写一个框架,比如,spring。 原理很清楚,源码也很熟悉。 可惜力不从心,是不是可以找几个小弟一起做。...

Java集合/泛型篇----第五篇

系列文章目录 文章目录 系列文章目录前言一、说说LinkHashSet( HashSet+LinkedHashMap)二、HashMap(数组+链表+红黑树)三、说说ConcurrentHashMap前言 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站,这篇文章男女通…...

ACES 增强版不丹水稻作物地图(2016-2022 年)

ACES 增强版不丹水稻作物地图(2016-2022 年) 用于改善粮食安全决策的 2016-2022 年年度作物类型稻米地图仍然是不丹的一项挑战。这些地图是与不丹农业部和 SERVIR 合作开发的。通过专注于发展不丹的科学、技术、工程和数学 (STEM),我们共同开…...

JavaSec-RCE

简介 RCE(Remote Code Execution),可以分为:命令注入(Command Injection)、代码注入(Code Injection) 代码注入 1.漏洞场景:Groovy代码注入 Groovy是一种基于JVM的动态语言,语法简洁,支持闭包、动态类型和Java互操作性&#xff0c…...

Linux 文件类型,目录与路径,文件与目录管理

文件类型 后面的字符表示文件类型标志 普通文件:-(纯文本文件,二进制文件,数据格式文件) 如文本文件、图片、程序文件等。 目录文件:d(directory) 用来存放其他文件或子目录。 设备…...

反向工程与模型迁移:打造未来商品详情API的可持续创新体系

在电商行业蓬勃发展的当下,商品详情API作为连接电商平台与开发者、商家及用户的关键纽带,其重要性日益凸显。传统商品详情API主要聚焦于商品基本信息(如名称、价格、库存等)的获取与展示,已难以满足市场对个性化、智能…...

日语学习-日语知识点小记-构建基础-JLPT-N4阶段(33):にする

日语学习-日语知识点小记-构建基础-JLPT-N4阶段(33):にする 1、前言(1)情况说明(2)工程师的信仰2、知识点(1) にする1,接续:名词+にする2,接续:疑问词+にする3,(A)は(B)にする。(2)復習:(1)复习句子(2)ために & ように(3)そう(4)にする3、…...

工业安全零事故的智能守护者:一体化AI智能安防平台

前言: 通过AI视觉技术,为船厂提供全面的安全监控解决方案,涵盖交通违规检测、起重机轨道安全、非法入侵检测、盗窃防范、安全规范执行监控等多个方面,能够实现对应负责人反馈机制,并最终实现数据的统计报表。提升船厂…...

JavaScript 中的 ES|QL:利用 Apache Arrow 工具

作者:来自 Elastic Jeffrey Rengifo 学习如何将 ES|QL 与 JavaScript 的 Apache Arrow 客户端工具一起使用。 想获得 Elastic 认证吗?了解下一期 Elasticsearch Engineer 培训的时间吧! Elasticsearch 拥有众多新功能,助你为自己…...

Golang dig框架与GraphQL的完美结合

将 Go 的 Dig 依赖注入框架与 GraphQL 结合使用,可以显著提升应用程序的可维护性、可测试性以及灵活性。 Dig 是一个强大的依赖注入容器,能够帮助开发者更好地管理复杂的依赖关系,而 GraphQL 则是一种用于 API 的查询语言,能够提…...

Qwen3-Embedding-0.6B深度解析:多语言语义检索的轻量级利器

第一章 引言:语义表示的新时代挑战与Qwen3的破局之路 1.1 文本嵌入的核心价值与技术演进 在人工智能领域,文本嵌入技术如同连接自然语言与机器理解的“神经突触”——它将人类语言转化为计算机可计算的语义向量,支撑着搜索引擎、推荐系统、…...

大模型多显卡多服务器并行计算方法与实践指南

一、分布式训练概述 大规模语言模型的训练通常需要分布式计算技术,以解决单机资源不足的问题。分布式训练主要分为两种模式: 数据并行:将数据分片到不同设备,每个设备拥有完整的模型副本 模型并行:将模型分割到不同设备,每个设备处理部分模型计算 现代大模型训练通常结合…...

智能仓储的未来:自动化、AI与数据分析如何重塑物流中心

当仓库学会“思考”,物流的终极形态正在诞生 想象这样的场景: 凌晨3点,某物流中心灯火通明却空无一人。AGV机器人集群根据实时订单动态规划路径;AI视觉系统在0.1秒内扫描包裹信息;数字孪生平台正模拟次日峰值流量压力…...