东莞中小企业网站制作/百度推广合作
😁博客主页😁:🚀https://blog.csdn.net/wkd_007🚀
🤑博客内容🤑:🍭嵌入式开发、Linux、C语言、C++、数据结构、音视频🍭
🤣本文内容🤣:🍭介绍数字音频的PCM格式🍭
😎金句分享😎:🍭子曰:君子不器。 ——《论语·为政篇》。意思是,君子不应像器具那样,只有一种用途。🍭
目录
- 🎄一、PCM是什么?
- ✨1.1 PCM 的定义
- ✨1.2 PCM 和 声音(音频) 的关系
- 🎄二、PCM 生成过程
- ✨2.1 采样(Sampling)
- ✨2.2 量化(Quantization)
- ✨2.3 编码(Encoding)
- 🎄三、PCM音频的特征或参数
- 🎄四
- 🎄五
- 🎄六、
🎄一、PCM是什么?
✨1.1 PCM 的定义
PCM(Pulse Code Modulation)又称脉冲编码调制,是一种用于数字通信和音频记录的技术。PCM通过对模拟信号进行采样、量化、编码,将连续的模拟信号转换为离散的数字信号,从而实现信号的高保真传输和存储。
✨1.2 PCM 和 声音(音频) 的关系
从PCM的定义来看,它主要是将模拟信号转成数字信号。那它和音频有什么关系呢?为什么是要转成数字信号呢?
1、自然界中的声音通过麦克风等采集设备处理后,首先会将声音信号转换成电信号,但此时的电信号是连续的模拟信号,将这些音频模拟信号在坐标系表示就类似于下图:
2、计算机只认识0和1,这样连续的模拟信号要被计算机传输或存储等处理的话,就需要先转换成数字信号;
3、通过模数转换器(A/D),将音频模拟信号转换成数字信号后就可以被计算机处理,经过模数转换器处理后的
音频数字信号
就是PCM,是声音的原始数据。在音视频编程中,常被称为音频裸数据,它还可以继续被编码成其他格式的音频数据如:wav、mp3、aac、ogg;
4、计算机处理后的数字音频信号,再通过数模转换器(D/A),转换成音频模拟信号,最后通过扬声器等设备转成声音信号,进行播放。
通过前面的介绍,PCM可以总结为:通过模数转换器处理后,将声音模拟信号转换而成的数字信号,是声音要给计算机处理的最原始的音频数据。
🎄二、PCM 生成过程
读者可以先思考一下,怎样才能将连续的模拟信号转成数字信号呢?
既然模拟信号看起来像连续的一段曲线,是不是可以用很密集的一些点去表示,只要有足够多的点,就可以让这些点看起来像模拟信号的曲线了;
如果选择用很多点去表示连续的曲线,那么这些点的取值范围应该是多少呢?取值范围越大,越能精确地表示模拟信号曲线;
确定范围后,表示曲线的每个点就成了各个数值,最后将这些数值按照格式排列起来,就成了数字信号了。
其实,PCM也是大概按照上面的流程去生成的,PCM生成需要经过 采样(Sampling)、量化(Quantization)、编码(Encoding)。
✨2.1 采样(Sampling)
采样就是将模拟信号的音频转换成数字信号音频的过程,通过模/数转换器(A/D)对声波进行采样,每一次采样都记录下了原始模拟声波在某一时刻的状态,称之为样本,将一串的样本连接起来,就可以描述一段声波。把每一秒钟所采样的次数称为
采样频率
,单位为HZ(赫兹)。其实,采样就是在时间轴上对信号进行数字化。
采用过程如上图,用若干个黑点来表示红色的曲线。红色的曲线是音频模拟信号,各个黑点就是样本。
采样率
:每一秒钟所采样的样本个数;如果每秒所采集的样本越多,越能精确的表示曲线。常见的采样率有:通话时的采样率为8KHz(每秒8000个样本),常用的媒体采样率有44.1KHz(每秒44100个样本),更高要求的有48KHz(每秒48000个样本)等等。
✨2.2 量化(Quantization)
量化就是为采集的样本确定一个取值范围。
比如用16比特的二进制信号来表示声音的一个样本, 而16比特(一个short) 所表示的范围是
[-32768,32767]
, 共有65536个可能取值, 因此最终音频的数字信号在幅度上也分为了65536层。
如果用8比特的二进制信号来表示声音的一个样本,8比特(一个unsigned char)所表示的范围是
[0,255]
,共有256个层级。
注意:
在8位的PCM音频数据中,样本的取值范围是从0到255。对于有符号的8位PCM编码,取值范围为-128到127。每个样本使用一个8位字节来表示其幅度值,其中最低位(LSB)表示0,最高位(MSB)表示255。这种编码方式使得正负幅度能够均匀地分布在取值范围内,方便存储和处理。如果没有明确指定是有符号还是无符号的情况下,通常默认为无符号的0到255取值范围。
在16位PCM音频数据中,样本的取值范围是-32768到32767。16位PCM音频数据使用两个字节(16个比特)来表示每个样本的取值,其中一个比特用于表示正负号(16位中最高位为符号位)。因此,样本的取值范围可以表示为从 − 2 15 -2^{15} −215(-32768)到 2 15 2^{15} 215-1(32767)。这个范围与8位PCM音频数据的取值范围不同,因为它们使用了不同数量的比特来表示每个样本的取值。
✨2.3 编码(Encoding)
编码, 就是按照一定的格式记录采样和量化后的样本数据,将量化后的数字信号转换为二进制码的过程。比如顺序存储或压缩存储, 等等。
采样、量化后的数据经过编码后产生的二进制数据,就是PCM数据。
🎄三、PCM音频的特征或参数
- 采样率(Sampling Rate):表示每秒钟采样的样本数量,单位为赫兹(Hz)。它决定了PCM音频的时间分辨率和频率范围。
- 位深度(Bit Depth):表示每个样本的取值精度,通常以位数表示。它决定了PCM音频的动态范围和信噪比。一般为16bit。
- 字节序(Byte Order):表示多字节数据在存储或传输中的排列顺序。常见的字节序有大端序(Big Endian)和小端序(Little Endian)两种。常见的为小端字节序。
- 采样数据是否有符号(Signed or Unsigned Samples):表示每个样本的取值是否包含符号位。有符号PCM样本的取值范围涵盖正负值,而无符号PCM样本的取值范围仅包含非负值。
- 声道数(Number of Channels):表示PCM音频中的独立声道数量。常见的声道数有单声道(Mono)和立体声(Stereo),还可以有更多声道如5.1声道、7.1声道等。
这些参数共同定义了PCM音频的基本特征,对于处理、存储和传输PCM音频非常重要。不同的应用场景和需求可能需要不同的参数设置来满足特定的要求。
🎄四
🎄五
🎄六、
如果文章有帮助的话,点赞👍、收藏⭐,支持一波,谢谢 😁😁😁
参考资料:
https://blog.csdn.net/qq_25333681/article/details/90682989
相关文章:

【音视频|PCM】PCM格式详解
😁博客主页😁:🚀https://blog.csdn.net/wkd_007🚀 🤑博客内容🤑:🍭嵌入式开发、Linux、C语言、C、数据结构、音视频🍭 🤣本文内容🤣&a…...

行为型模式-行为型模式
在模板模式中,一个抽象类公开定义了执行它的方法的方式/模板。它的子类可以按需要重写方法实现,但调用将以抽象类中定义的方式进行。这种类型的设计模式属于行为型模式。 意图:定义一个操作中的算法的骨架,而将一些步骤延迟到子类…...

openpnp - Warning - Unknown firmware
文章目录 openpnp - Warning - Unknown firmware概述笔记https://github.com/openpnp/openpnp/wiki/Motion-Controller-Firmwares备注END openpnp - Warning - Unknown firmware 概述 接上飞达控制板后, 显示未知固件的警告 开始没看源码之前, 总以为是回答的版本号不合适, …...

Android 中如何使用 App Links
1. 简介 什么是 App Links呢?App Links 是 Android 6.0 (API 级别23) 引入的新功能,它是基于 DeepLinking,允许应用自动处理网站的 URL,而无需提示用户启动相应的应用。 例如:如果你在手机浏览器中输入了某个网站&am…...

7 款好用的 PDF 密码删除工具
这是最佳 PDF 密码删除工具列表。该列表包括免费和付费软件。将要在线完成的所有事情都需要密码才能感到安全。数据传输也是如此。大多数数据是通过文件传输的,PDF有自己的标志。PDF是一种灵活的文件格式,因此也可以专业使用。 有多种PDF 编辑器软件&am…...

你一般什么时候会用到GPT?
GPT(Generative Pre-trained Transformer)是一种自然语言处理技术,它在各种领域和场景中都有广泛的应用。下面将详细介绍一些常见的情况,人们在这些情况下通常会使用GPT: 自然语言生成: GPT可以用于生成文本…...

YUV编码格式解析
YUV 颜色编码 YUV 颜色编码采用的是 明亮度 和 色度 来指定像素的颜色。 其中,Y 表示明亮度(Luminance、Luma),而 U 和 V 表示色度(Chrominance、Chroma)。 而色度又定义了颜色的两个方面:色…...

mysql-面试50题-5
一、查询数据 ymysql-面试50题-2-CSDN博客 二、问题 41.按照出生日期来算,当前月日 < 出生年月的月日则,年龄减一 mysql> select student.SId as 学生编号,student.Sname as 学生姓名, -> TIMESTAMPDIFF(YEAR,student.Sage,CURDATE(…...

微服务初始和Nacos安装
一)初始微服务: 微服务是将一个大型的,单一的应用程序拆分成多个小型服务,每一个服务负责于特定的业务功能,并且可以通过网络来和其他服务进行通讯,是一个思想,将一个大的项目拆分成多个小的项目,多个小的项…...

YouTube博主数据信息资源
YouTube博主数据信息资源 🔥我是一位拥有10年编程经验的程序猿,为你带来一个全新的优质资源 🔍您是否在寻找最新、最活跃的YouTube博主数据,以助力你的项目、营销或研究? 我们的数据,您的优势:…...

算法通过村第十七关-贪心|黄金笔记|跳跃游戏
文章目录 前言跳跃游戏最短跳跃游戏总结 前言 提示:曾走过山,走过水,其实只是借助他们走过我的生命;我看着天,看着地,其实只是借助它们确定我的位置;我爱这她,爱着你,其实…...

【精选】VMware部署ESXI6.5 vCenter Server详解
VMware部署ESXI6.5 vCenter Server 一、ESXi主机介绍1、虚拟机的好处2、为什么要使用虚拟机 二、虚拟化服务器概述1、VSphere物理架构2、体系架构3、VMware vSphere 组件 三、ESXi安装环境1、安装步骤2、使用VMware新建ESXi主机3、初始环境安装 四、创建虚拟机五、安装部署VMwa…...

如何借助数据集更好的评估NLP模型的性能?
随着信息时代的迅猛发展,每天有无数文本、声音、图片和视频不断涌入互联网。如何从海量数据中提炼有意义信息成为学术界和工业界迫切需要解决的问题。在此背景下,自然语言处理(NLP)应运而生,成为人工智能领域最为活跃的…...

2023年腾讯云服务器地域节点选择指南(亲自整理)
腾讯云轻量应用服务器地域是指轻量服务器数据中心所在的地理位置,如上海、广州和北京等地域,如何选择地域?腾讯云百科txybk.com建议地域选择遵循就近原则,用户距离轻量服务器地域越近,网络延迟越低,速度就越…...

华媒舍:日韩媒体发稿推广中8个关键因素帮助你实现突破
在当今经济全球化的时代背景下,日韩地域媒体影响力日益提高。对于需要在这一地区开展发稿推广的人来讲,掌握适度的思路和流程是十分重要的。下面我们就为大家介绍8个关键因素,以帮助你在日韩地域媒体发稿推广中实现突破。 1.科学研究行业在逐…...

Docker数据卷
目录 1.bind mount 2.docker managed volume 1.bind mount docker run -it --rm -v /tmp/data1:/data1 -v /tmp/data2:/data2:ro -v /etc/passwd:/mnt/passwd:ro busybox 2.docker managed volume docker run -d --name web1 webserver:v3 docker inspect web1 cd/var/lib/doc…...

LightGBM 的完整解释 - 最快的梯度提升模型
文章最前: 我是Octopus,这个名字来源于我的中文名--章鱼;我热爱编程、热爱算法、热爱开源。所有源码在我的个人github ;这博客是记录我学习的点点滴滴,如果您对 Python、Java、AI、算法有兴趣,可以关注我的…...

Think-Queue3一直提示[Exception]redis扩展未安装
场景 tp6tq3实现的任务队列,使用redis作为数据驱动,目前是tp6可以正常使用redis了,但tq3不行,一直提示[Exception]redis扩展未安装。 解决思路 1.分析tq3源码 定位到是这一行出了问题 if (!extension_loaded(redis)) {throw n…...

Spring cloud教程Gateway服务网关
Spring cloud教程|Gateway服务网关 写在前面的话: 本笔记在参考网上视频以及博客的基础上,只做个人学习笔记,如有侵权,请联系删除,谢谢! Spring Cloud Gateway 是 Spring Cloud 的一个全新项目,…...

【C++代码】爬楼梯,不同路径,整数拆分,不同搜索树,动态规划--代码随想录
动态规划,英文:Dynamic Programming,简称DP,如果某一问题有很多重叠子问题,使用动态规划是最有效的。所以动态规划中每一个状态一定是由上一个状态推导出来的,这一点就区分于贪心,贪心没有状态推…...

设计模式(单例模式、工厂模式及适配器模式、装饰器模式)
目录 0 、设计模式简介 一、单例模式 二、工厂模式 三、适配器模式 四、装饰器模式 0 、设计模式简介 设计模式可以分为以下三种: 创建型模式:用来描述 “如何创建对象”,它的主要特点是 “将对象的创建和使用分离”。包括单例、原型、工厂方法、…...

为wget命令设置代理
使用-e参数 wget本身没有专门设置代理的命令行参数,但是有一个"-e"参数,可以在命令行上指定一个原本出现在".wgetrc"中的设置。于是可以变相在命令行上指定代理: -e, --executeCOMMAND 执行.wgetrc格式的命令 例如&…...

【C++深入浅出】模版初识
目录 一. 前言 二. 泛型编程 三. 函数模版 3.1 函数模版的概念 3.2 函数模版的格式 3.3 函数模版的原理 3.4 函数模板的实例化 3.5 模板参数的匹配原则 四. 类模版 4.1 类模版的定义 4.2 类模版的实例化 一. 前言 本期我们要介绍的是C的又一大重要功能----模版。通…...

系统架构设计师-第18章-安全架构设计理论与实践-软考学习笔记
安全架构概述 信息的可用性、元略性、机密性、可控性和不可抵赖性等安全保障显得尤为重要,而满足这些诉求,离不开好的架构设计. 信息安全面临的威胁 常见的安全威胁有以下几种. (1)信息泄露 (2) 破坏信息的元整性: 数据被非授极地进行增删、修改成破坏…...

2023年吉安市“振兴杯”职业技能大赛网络安全项目样题
2023年吉安市“振兴杯”职业技能大赛 网络安全项目样题 需要竞赛环境可私信博主 赛题说明 一、竞赛项目简介 竞赛共分为:A.基础设施设置与安全加固;B.网络安全事件响应、数字取证调查和应用安全;C.CTF夺旗-攻击;D.CTF夺旗-防御等四…...

python爬虫selenium和ddddocr使用
python爬虫selenium和ddddocr使用 selenium使用 selenium实际上是web自动化测试工具,能够通过代码完全模拟人使用浏览器自动访问目标站点并操作来进行web测试。 通过pythonselenium结合来实现爬虫十分巧妙。 由于是模拟人的点击来操作,所以实际上被反…...

【vim 学习系列文章 12 -- vimrc 那点事】
文章目录 系统级及本地 vimrc 文件设置 vimrc 的路径 系统级及本地 vimrc 文件 当 Vim 启动时,编辑器会去搜索一个系统级的 vimrc 文件来进行系统范围内的默认初始化工作。 这个文件通常在你系统里 $VIM/vimrc 的路径下,如果没在那里,那你可…...

spring.factories介绍
spring.factories 是 Spring Framework 中的一个配置文件,它用于自动装配和加载 Spring 应用程序中的各种组件。该文件位于 META-INF/spring.factories,通常位于 JAR 文件的资源路径下。 spring.factories 文件采用键值对的形式,每个键代表一…...

业务设计——用户敏感信息展示脱敏及其反脱敏
业务需求 将用户敏感信息脱敏展示到前端是出于保护用户隐私和信息安全的考虑。 敏感信息包括但不限于手机号码、身份证号、银行卡号等,这些信息泄露可能导致用户个人信息的滥用、身份盗用等严重问题。脱敏是一种常用的保护用户隐私的方式,它的目的是减少…...

Hadoop分布式安装
首先准备好三台服务器或者虚拟机,我本机安装了三个虚拟机,安装虚拟机的步骤参考我之前的一篇 virtualBox虚拟机安装多个主机访问虚拟机虚拟机访问外网配置-CSDN博客 jdk安装 参考文档:Linux 环境下安装JDK1.8并配置环境变量_linux安装jdk1.8并…...