音视频入门基础:AAC专题(12)——FFmpeg源码中,解码AudioSpecificConfig的实现
=================================================================
音视频入门基础:AAC专题系列文章:
音视频入门基础:AAC专题(1)——AAC官方文档下载
音视频入门基础:AAC专题(2)——使用FFmpeg命令生成AAC裸流文件
音视频入门基础:AAC专题(3)——AAC的ADTS格式简介
音视频入门基础:AAC专题(4)——ADTS格式的AAC裸流实例分析
音视频入门基础:AAC专题(5)——FFmpeg源码中,判断某文件是否为AAC裸流文件的实现
音视频入门基础:AAC专题(6)——FFmpeg源码中解码ADTS格式的AAC的Header的实现
音视频入门基础:AAC专题(7)——FFmpeg源码中计算AAC裸流每个packet的size值的实现
音视频入门基础:AAC专题(8)——FFmpeg源码中计算AAC裸流AVStream的time_base的实现
音视频入门基础:AAC专题(9)——FFmpeg源码中计算AAC裸流每个packet的duration和duration_time的实现
音视频入门基础:AAC专题(10)——FFmpeg源码中计算AAC裸流每个packet的pts、dts、pts_time、dts_time的实现
音视频入门基础:AAC专题(11)——AudioSpecificConfig简介
音视频入门基础:AAC专题(12)——FFmpeg源码中,解码AudioSpecificConfig的实现
=================================================================
一、引言
在《音视频入门基础:AAC专题(11)——AudioSpecificConfig简介》中对AudioSpecificConfig进行了简介,本文讲述FFmpeg源码中是怎样解码AudioSpecificConfig,拿到里面的信息。
二、decode_audio_specific_config_gb函数的定义
FFmpeg源码中使用decode_audio_specific_config_gb函数来读取AudioSpecificConfig的信息。该函数定义在FFmpeg源码(本文演示用的FFmpeg源码版本为7.0.1)的源文件libavcodec/aacdec_template.c中:
/*** Decode audio specific configuration; reference: table 1.13.** @param ac pointer to AACDecContext, may be null* @param avctx pointer to AVCCodecContext, used for logging* @param m4ac pointer to MPEG4AudioConfig, used for parsing* @param gb buffer holding an audio specific config* @param get_bit_alignment relative alignment for byte align operations* @param sync_extension look for an appended sync extension** @return Returns error status or number of consumed bits. <0 - error*/
static int decode_audio_specific_config_gb(AACDecContext *ac,AVCodecContext *avctx,MPEG4AudioConfig *m4ac,GetBitContext *gb,int get_bit_alignment,int sync_extension)
{int i, ret;GetBitContext gbc = *gb;MPEG4AudioConfig m4ac_bak = *m4ac;if ((i = ff_mpeg4audio_get_config_gb(m4ac, &gbc, sync_extension, avctx)) < 0) {*m4ac = m4ac_bak;return AVERROR_INVALIDDATA;}if (m4ac->sampling_index > 12) {av_log(avctx, AV_LOG_ERROR,"invalid sampling rate index %d\n",m4ac->sampling_index);*m4ac = m4ac_bak;return AVERROR_INVALIDDATA;}if (m4ac->object_type == AOT_ER_AAC_LD &&(m4ac->sampling_index < 3 || m4ac->sampling_index > 7)) {av_log(avctx, AV_LOG_ERROR,"invalid low delay sampling rate index %d\n",m4ac->sampling_index);*m4ac = m4ac_bak;return AVERROR_INVALIDDATA;}skip_bits_long(gb, i);switch (m4ac->object_type) {case AOT_AAC_MAIN:case AOT_AAC_LC:case AOT_AAC_SSR:case AOT_AAC_LTP:case AOT_ER_AAC_LC:case AOT_ER_AAC_LD:if ((ret = decode_ga_specific_config(ac, avctx, gb, get_bit_alignment,m4ac, m4ac->chan_config)) < 0)return ret;break;case AOT_ER_AAC_ELD:if ((ret = decode_eld_specific_config(ac, avctx, gb,m4ac, m4ac->chan_config)) < 0)return ret;break;default:avpriv_report_missing_feature(avctx,"Audio object type %s%d",m4ac->sbr == 1 ? "SBR+" : "",m4ac->object_type);return AVERROR(ENOSYS);}ff_dlog(avctx,"AOT %d chan config %d sampling index %d (%d) SBR %d PS %d\n",m4ac->object_type, m4ac->chan_config, m4ac->sampling_index,m4ac->sample_rate, m4ac->sbr,m4ac->ps);return get_bits_count(gb);
}
形参ac:既是输入型参数也是输出型参数。指向一个AACDecContext类型变量。
形参avctx:输入型参数。用来输出日志,可忽略。
形参m4ac:输出型参数,指向一个MPEG4AudioConfig类型变量,执行decode_audio_specific_config_gb函数后,m4ac指向的变量会得到从AudioSpecificConfig中解码出来的属性。MPEG4AudioConfig结构体声明如下:
typedef struct MPEG4AudioConfig {int object_type;int sampling_index;int sample_rate;int chan_config;int sbr; ///< -1 implicit, 1 presenceint ext_object_type;int ext_sampling_index;int ext_sample_rate;int ext_chan_config;int channels;int ps; ///< -1 implicit, 1 presenceint frame_length_short;
} MPEG4AudioConfig;
形参gb:既是输入型参数也是输出型参数,为GetBitContext类型,用来对“位”进行操作(具体可以参考:《FFmpeg中位操作相关的源码:GetBitContext结构体,init_get_bits函数、get_bits1函数和get_bits函数分析》)。
执行decode_audio_specific_config_gb函数前,gb->buffer为指向某个缓冲区的指针。该缓冲区存放AudioSpecificConfig的二进制数据。
形参get_bit_alignment:输入型参数。字节对齐操作的相对对齐。
形参sync_extension:输入型参数。寻找附加的同步扩展。
三、decode_audio_specific_config_gb函数的内部实现分析
decode_audio_specific_config_gb函数中,首先调用ff_mpeg4audio_get_config_gb函数:
if ((i = ff_mpeg4audio_get_config_gb(m4ac, &gbc, sync_extension, avctx)) < 0) {*m4ac = m4ac_bak;return AVERROR_INVALIDDATA;}
(一)ff_mpeg4audio_get_config_gb函数
ff_mpeg4audio_get_config_gb函数定义在libavcodec/mpeg4audio.c中:
int ff_mpeg4audio_get_config_gb(MPEG4AudioConfig *c, GetBitContext *gb,int sync_extension, void *logctx)
{int specific_config_bitindex, ret;int start_bit_index = get_bits_count(gb);c->object_type = get_object_type(gb);c->sample_rate = get_sample_rate(gb, &c->sampling_index);c->chan_config = get_bits(gb, 4);if (c->chan_config < FF_ARRAY_ELEMS(ff_mpeg4audio_channels))c->channels = ff_mpeg4audio_channels[c->chan_config];else {av_log(logctx, AV_LOG_ERROR, "Invalid chan_config %d\n", c->chan_config);return AVERROR_INVALIDDATA;}c->sbr = -1;c->ps = -1;if (c->object_type == AOT_SBR || (c->object_type == AOT_PS &&// check for W6132 Annex YYYY draft MP3onMP4!(show_bits(gb, 3) & 0x03 && !(show_bits(gb, 9) & 0x3F)))) {if (c->object_type == AOT_PS)c->ps = 1;c->ext_object_type = AOT_SBR;c->sbr = 1;c->ext_sample_rate = get_sample_rate(gb, &c->ext_sampling_index);c->object_type = get_object_type(gb);if (c->object_type == AOT_ER_BSAC)c->ext_chan_config = get_bits(gb, 4);} else {c->ext_object_type = AOT_NULL;c->ext_sample_rate = 0;}specific_config_bitindex = get_bits_count(gb);if (c->object_type == AOT_ALS) {skip_bits(gb, 5);if (show_bits(gb, 24) != MKBETAG('\0','A','L','S'))skip_bits(gb, 24);specific_config_bitindex = get_bits_count(gb);ret = parse_config_ALS(gb, c, logctx);if (ret < 0)return ret;}if (c->ext_object_type != AOT_SBR && sync_extension) {while (get_bits_left(gb) > 15) {if (show_bits(gb, 11) == 0x2b7) { // sync extensionget_bits(gb, 11);c->ext_object_type = get_object_type(gb);if (c->ext_object_type == AOT_SBR && (c->sbr = get_bits1(gb)) == 1) {c->ext_sample_rate = get_sample_rate(gb, &c->ext_sampling_index);if (c->ext_sample_rate == c->sample_rate)c->sbr = -1;}if (get_bits_left(gb) > 11 && get_bits(gb, 11) == 0x548)c->ps = get_bits1(gb);break;} elseget_bits1(gb); // skip 1 bit}}//PS requires SBRif (!c->sbr)c->ps = 0;//Limit implicit PS to the HE-AACv2 Profileif ((c->ps == -1 && c->object_type != AOT_AAC_LC) || c->channels & ~0x01)c->ps = 0;return specific_config_bitindex - start_bit_index;
}
1.获取audioObjectType属性
ff_mpeg4audio_get_config_gb函数中,首先通过语句:c->object_type = get_object_type(gb) 获取AudioSpecificConfig的audioObjectType属性。get_object_type函数定义如下。关于get_bits函数的用法可以参考:《FFmpeg中位操作相关的源码:GetBitContext结构体,init_get_bits函数、get_bits1函数和get_bits函数分析》:
static inline int get_object_type(GetBitContext *gb)
{int object_type = get_bits(gb, 5);if (object_type == AOT_ESCAPE)object_type = 32 + get_bits(gb, 6);return object_type;
}
2.获取samplingFrequencyIndex属性
获取完audioObjectType属性后,ff_mpeg4audio_get_config_gb函数中,通过语句:c->sample_rate = get_sample_rate(gb, &c->sampling_index)获取AudioSpecificConfig的samplingFrequencyIndex属性。get_sample_rate定义如下:
static inline int get_sample_rate(GetBitContext *gb, int *index)
{*index = get_bits(gb, 4);return *index == 0x0f ? get_bits(gb, 24) :ff_mpeg4audio_sample_rates[*index];
}
全局数组ff_mpeg4audio_sample_rates定义如下:
const int ff_mpeg4audio_sample_rates[16] = {96000, 88200, 64000, 48000, 44100, 32000,24000, 22050, 16000, 12000, 11025, 8000, 7350
};
3.获取channelConfiguration属性
ff_mpeg4audio_get_config_gb函数中,通过语句:c->chan_config = get_bits(gb, 4)获取AudioSpecificConfig的channelConfiguration属性。
——————————————————分隔符——————————————————
回到decode_audio_specific_config_gb函数,所以执行下面代码块后,m4ac指向的变量会得到从AudioSpecificConfig中解析出来的audioObjectType、samplingFrequencyIndex、channelConfiguration属性:
if ((i = ff_mpeg4audio_get_config_gb(m4ac, &gbc, sync_extension, avctx)) < 0) {*m4ac = m4ac_bak;return AVERROR_INVALIDDATA;}
然后decode_audio_specific_config_gb函数通过下面代码块解析AudioSpecificConfig中的GASpecificConfig:
switch (m4ac->object_type) {case AOT_AAC_MAIN:case AOT_AAC_LC:case AOT_AAC_SSR:case AOT_AAC_LTP:case AOT_ER_AAC_LC:case AOT_ER_AAC_LD:if ((ret = decode_ga_specific_config(ac, avctx, gb, get_bit_alignment,m4ac, m4ac->chan_config)) < 0)return ret;break;
通过下面代码块解析AudioSpecificConfig中的ELDSpecificConfig(channelConfiguration):
case AOT_ER_AAC_ELD:if ((ret = decode_eld_specific_config(ac, avctx, gb,m4ac, m4ac->chan_config)) < 0)return ret;break;
相关文章:
音视频入门基础:AAC专题(12)——FFmpeg源码中,解码AudioSpecificConfig的实现
音视频入门基础:AAC专题系列文章: 音视频入门基础:AAC专题(1)——AAC官方文档下载 音视频入门基础:AAC专题(2)——使用FFmpeg命令生成AAC裸流文件 音视频入门基础:AAC…...
UDP组播测试
支持组播的接口: ip a | grep MULTICAST 环回接口虽然显示不支持组播,实际也可以用于本地测试。 添加路由(非必须?): ip route add 239.0.0.0/24 via 10.10.10.206 dev eth0 开放防火墙: 查…...
【Nas】X-Doc:jellyfin“该客户端与媒体不兼容,服务器未发送兼容的媒体格式”问题解决方案
【Nas】X-Doc:jellyfin“该客户端与媒体不兼容,服务器未发送兼容的媒体格式”问题解决方案 当使用Jellyfin播放视频时出现“该客户端与媒体不兼容,服务器未发送兼容的媒体格式”,这是与硬件解码和ffmpeg设置有关系,具体…...
504 Gateway Time-outopenresty
504 Gateway Time-out openresty 问题背景: 当自己点开知乎页面以后,发现官网没有出现任何问题,点击官网以后开始出现各种各样的报错! 一下是来源ai的介绍:(通过搜索这种形式帮助自己进行记忆)…...
SpringBoot篇(自动装配原理)
目录 一、自动装配机制 1. 简介 2. 自动装配主要依靠三个核心的关键技术 3. run()方法加载启动类 4. 注解SpringBootApplication包含了多个注解 4.1 SpringBootConfiguration 4.2 ComponentScan 4.3 EnableAutoConfiguration 5. SpringBootApplication一共做了三件事 …...
《Web性能权威指南》-WebRTC-读书笔记
本文是《Web性能权威指南》第四部分——WebRTC的读书笔记。 第一部分——网络技术概览,请参考网络技术概览; 第二部分——无线网络性能,请参考无线网络性能; 第三部分——HTTP,请参考HTTP; 第四部分——浏览…...
跨境电商独立站:打造你的全球品牌
什么是跨境电商独立站? 跨境电商独立站是指一个独立的电子商务网站,企业可以通过这个网站直接向全球消费者销售产品。与入驻亚马逊、eBay等第三方平台不同,独立站拥有完全自主权,可以自由定制店铺风格、营销策略,并直…...
基于uniapp微信小程序的旅游系统
作者:计算机学姐 开发技术:SpringBoot、SSM、Vue、MySQL、JSP、ElementUI、Python、小程序等,“文末源码”。 专栏推荐:前后端分离项目源码、SpringBoot项目源码、Vue项目源码、SSM项目源码、微信小程序源码 精品专栏:…...
怿星科技薛春宇丨智能汽车软件研发工具链国产化的挑战和探索
2024年7月25日,由上海良益企业管理咨询有限公司主办的“2024域控制器技术论坛“在上海成功举办,十位嘉宾做了精彩分享。“整零有道”将陆续刊出部分演讲的文字实录,以飨读者。 本期刊出怿星科技副总经理薛春宇的演讲实录:智能汽车…...
Flutter动画渐变
User experience is everything. One way to improve it is by making transitions between different UI elements smoother and more visually appealing. This is where the AnimatedCrossFade widget comes in handy. 用户体验就是一切。改善用户体验的方法之一就是让不同…...
Python毕业设计选题:基于Web学生会网站的设计与实现-django
开发语言:Python框架:djangoPython版本:python3.7.7数据库:mysql 5.7数据库工具:Navicat11开发软件:PyCharm 系统展示 系统首页界面 用户注册界面 用户登录界面 校内报道界面 品牌活动界面 个人中心界面 …...
如何选购高性价比百元头戴式耳机?六大选购技巧加性价比耳机推荐
在日益繁忙的生活中,头戴式耳机已成为许多人享受音乐、放松心情的重要工具。然而,市面上的头戴式耳机种类繁多,价格各异,如何选购高性价比百元头戴式耳机?成为了许多消费者的难题。为了帮助大家更好地做出选择…...
Java爬虫的京东“寻宝记”:揭秘商品类目信息
开篇:Java特工的神秘任务 在这个数据驱动的时代,我们就像一群特工,穿梭在数字的海洋中,寻找着隐藏的宝藏——商品类目信息。今天,我们将带领你一起,用Java这把精密的瑞士军刀,深入京东的神秘领…...
React前端框架
React 是一个用于构建用户界面的 JavaScript 库,由 Facebook 开发和维护。React 采用组件化的开发方式,使得开发者可以构建可复用的 UI 组件,从而提高开发效率和代码的可维护性。 React 的基本概念 组件:React 的核心概念是组件…...
React-query vs. 神秘新工具:前端开发的新较量
流畅的分页体验:AlovaJS的分页请求策略 在现代web应用中,分页是一个常见的功能需求。无论是浏览商品列表、查看文章集合,还是管理后台的数据表格,用户都需要一种高效且流畅的方式来浏览大量数据。然而,实现一个流畅且…...
TensorFlow面试整理-分布式
在深度学习的训练过程中,随着数据量和模型的复杂性增加,单个 GPU 或 CPU 无法满足高效训练的需求。TensorFlow 提供了强大的 分布式训练 功能,通过并行处理加速训练过程。分布式训练可以在多个 GPU、多个机器甚至是 TPU 上运行。以下是分布式训练的关键概念及其使用方法。 1…...
OceanBase 回收站机制详解
OceanBase 回收站机制详解 在 OceanBase 数据库中,回收站机制用于在执行 DROP 或 TRUNCATE 等操作后,临时保存被删除的对象,以便在需要时进行恢复。以下是对回收站机制的详细说明: 1. 不同租户对回收站的访问权限 SYS 租户 权…...
Java特工队:潜入京东,高效获取商品详情的绝密行动
在这个由代码和逻辑编织的电商世界里,京东商品详情就像是被锁在高塔中的神秘卷轴,等待着勇敢的Java特工队成员去解救。今天,我们要讲述的是如何装备你的Java代码装备,化身为一名编程界的特工,潜入京东的API网络&#x…...
车易泊相机 —— 智能车位管理的得力助手
在当今社会,停车问题日益成为城市管理和人们日常生活中的一大难题。寻找车位耗费时间、车位被非法占用、停车管理效率低下等问题层出不穷。然而,车易泊相机的出现,为车位管理带来了全新的解决方案。 一、车易泊相机的强大功能 车易泊相机是一…...
C++初阶(七)--类和对象(4)
目录 编辑 一、再谈构造函数 1.构造函数体赋值 2.初始化列表 二、类型转换 1.隐式类型转换 2.explicit关键字 3.类类型之间的对象隐式转换 三、static成员函数 1.概念 2.特性 3.面试题: 四、友元函数 1.基本介绍 2.回顾: 3.友元类&am…...
Python 爬虫的寻宝大冒险:如何捕获 API 数据的宝藏
在这个信息爆炸的数字时代,数据就像是隐藏在网络深处的宝藏,等待着勇敢的探险家去发现。今天,我们要讲述的是如何成为一名 Python 爬虫探险家,装备你的代码工具,深入 API 的迷宫,捕获那些珍贵的数据宝藏。 …...
电力物联网环境下的售电研究
泛在电力物联网打破了传统能源网络的壁垒,形成了能源共享、信息互通、数据开放的能源物联网。泛在电力物联网环境下,可再生能源接入更为容易。更加开放的能源接人、更加丰富的信息获取以及更加智能的电力设备,促进了电力市场的进一步开放。 …...
Oracle视频基础1.1.4练习
1.1.4 dbb,ddabcPMON,SMON,LGWR,CKPT,DBWna5,b4,c2,d3,e1ad,a,c,b,eOracle instance,Oracle databaseSGA,background processcontrol file,data file,online redo file 以下是一篇关于 Oracle 基础习题 1.1.4 的博客: Oracle 基础习题解析:1.1.4 本篇文…...
【水下生物数据集】 水下生物识别 深度学习 目标检测 机器视觉 yolo(含数据集)
一、背景意义 随着全球海洋生态环境的日益变化,水下生物的监测和保护变得愈发重要。水下生物种类繁多,包括螃蟹、鱼类、水母、虾、小鱼和海星等,它们在海洋生态系统中扮演着关键角色。传统的水下生物监测方法通常依赖于人工观察,效…...
【宠物狗狗数据集】 犬类品种识别 宠物狗检测 深度学习 目标检测(含数据集)
一、背景意义 随着人们对宠物狗的喜爱日益增加,犬种的多样性也逐渐受到重视。狗狗不仅是家庭的好伴侣,更在多个领域中发挥着重要作用,如导盲、搜救、疗愈等。因此,准确识别和分类各种犬种显得尤为重要。传统的犬种识别方法往往依赖…...
C语言中的数组并非指针:深入理解数组和指针的区别
前言 在C语言中,数组和指针是两个非常重要的概念,它们在很多方面有着紧密的联系,但也存在显著的区别。尽管数组名有时可以像指针那样使用,但它们本质上并不是一回事。理解这些差异对于编写正确和高效的代码至关重要。本文将深入探…...
Topaz Video AI for Mac 视频无损放大软件安装教程【保姆级,操作简单轻松上手】
Mac分享吧 文章目录 Topaz Video AI for Mac 视频无损放大软件 安装完成,软件打开效果一、Topaz Video AI 视频无损放大软件 Mac电脑版——v5.3.5⚠️注意事项:1️⃣:下载软件2️⃣:安装软件,将安装包从左侧拖入右侧文…...
虚函数和纯虚函数是 C++ 中实现多态性的关键概念
虚函数(Virtual Function) 定义:虚函数是在基类中使用 virtual 关键字声明的函数,目的是允许派生类重写该函数。用途:通过虚函数,基类指针或引用可以调用派生类中重写的函数,从而实现动态多态性…...
计算机网络IP地址分类,子网掩码,子网划分复习资料
IP 地址的概念 IP 地址是独立于硬件地址的逻辑地址,它是由软件提供的地址。 IP 地址是网络层地址。 IP 编址方案和分类 IP 地址由 32 位二进制数构成,分为前缀(网络地址)和后缀(主机地址) 同一网段中每台计算机的 IP 地址是唯一的网络地址的分配全球…...
LINUX下使用SQLite查看.db数据库文件
目录 1. 安装 SQLite 对于 Debian/Ubuntu 系统: 2.安装完成后操作 打开 SQLite 命令行工具并连接到数据库文件 查看表结构 查询表中的数据 执行其他 SQL 操作 3. 退出 SQLite 命令行工具 4. 使用图形化工具(可选) 总结 在 Linux 环…...
做图片视频的网站有哪些问题/海外社交媒体营销
css定义第二个div. float:right或者left。 margin-top:0px 确保第二个DIV的宽度。如果宽度宽的话,会自动到下方的。 转载于:https://www.cnblogs.com/mr-wuxiansheng/p/10334226.html...
什么网站能和欧美国家的人做笔友/市场调研报告范文模板word
重复点击,多次触发的解决方案 $("").unbind(click).click(function(){}); 转载于:https://www.cnblogs.com/ch-zaizai/p/6509650.html...
南宁小程序制作/海南快速seo排名优化
复制、粘贴及其他常规的键盘快捷方式 按键组合操作Ctrl X剪切选定项。Ctrl C(或 Ctrl Insert)复制选定项。Ctrl V(或 Shift Insert)粘贴选定项。Ctrl Z撤消操作。Alt Tab在打开的应用之间切换。Alt F4关闭活动项…...
海南专业做网站的公司/域名注册需要多久
献给所有得到过所爱却又失去所爱的人,给从未得到所爱的人,给因为仍旧爱着,于是选择自欺欺人的人。这,是一面镜子,勇敢面对,勇敢放弃,勇敢重新开始。 当她不爱你的时候,无论过去她是…...
做网站等保收费/怎么申请建立网站
[aligncenter][sizex-large][b][colorred] 在myeclipse配置subclipse插件,使用SVN服务器[/color][/b][/size][/align][colorgreen]项目管理软件:Subversion(SVN服务器客户端)下载[/color]:[url]http://subversion.apache.org/[/url][colorgre…...
万网做网站花多少钱/优化大师下载安装
在前面提到过,Starling是Sparrow的姊妹篇,正因为这样,Starling里的touch事件的机制其实是为移动设备的触摸交互设计的,所以当你使用它进行使用鼠标交互的桌面应用开发时,第一眼会感觉有些困惑。 首先,如果你…...