当前位置：首页 > news >正文

ffmpeg7.0 aac转pcm

news 2026/2/8 17:23:24


#pragma once
#define __STDC_CONSTANT_MACROS
#define _CRT_SECURE_NO_WARNINGSextern "C"
{
#include "libavcodec/avcodec.h"
}//缓冲区大小（缓存5帧数据）
#define AUDIO_INBUF_SIZE 40960  
/*name   depthu8        8s16      16s32      32flt      32dbl      64u8p       8s16p     16s32p     32fltp     32dblp     64s64      64s64p     64//此代码解码的音频文件格式如下://AAC文件(一帧1024字节)，双声道（2），FLTP（32位，4字节）//AAC文件 frame_size 和 nb_samples 大小均为1024//一帧音频所占字节大小//1024*2*4=8192字节
*/
#define AUDIO_REFILL_THRESH 8192using namespace std;#define INPUT_FILE_NAME "d:\\123.aac"
#define OUTPUT_FILE_NAME "d:\\1111.pcm"static int get_format_from_sample_fmt(const char** fmt,	enum AVSampleFormat sample_fmt)
{struct sample_fmt_entry {enum AVSampleFormat sample_fmt; const char* fmt_be, * fmt_le;} sample_fmt_entries[] = {{ AV_SAMPLE_FMT_U8,  "u8",    "u8"    },{ AV_SAMPLE_FMT_S16, "s16be", "s16le" },{ AV_SAMPLE_FMT_S32, "s32be", "s32le" },{ AV_SAMPLE_FMT_FLT, "f32be", "f32le" },{ AV_SAMPLE_FMT_DBL, "f64be", "f64le" },};*fmt = NULL;for (int i = 0; i < FF_ARRAY_ELEMS(sample_fmt_entries); i++) {struct sample_fmt_entry* entry = &sample_fmt_entries[i];if (sample_fmt == entry->sample_fmt) {*fmt = AV_NE(entry->fmt_be, entry->fmt_le);return 0;}}av_log(NULL, AV_LOG_ERROR, "sample format %s is not supported as output format\n", av_get_sample_fmt_name(sample_fmt));return -1;
}static void decode(AVCodecContext* pCodecContext, AVFrame* pFrame, AVPacket* pPacket, FILE* pFile)
{int ret = avcodec_send_packet(pCodecContext, pPacket);if (ret < 0) {av_log(NULL, AV_LOG_ERROR, "发送数据包到解码器出错。\n");exit(1);}while (ret >= 0) {ret = avcodec_receive_frame(pCodecContext, pFrame);if (ret == AVERROR(EAGAIN) || ret == AVERROR_EOF) {return;}else if (ret < 0) {av_log(NULL, AV_LOG_ERROR, "Error sending a packet for decoding.\n");exit(1);}//获取每个采样点当中每个声道的大小int nDataSize = av_get_bytes_per_sample(pCodecContext->sample_fmt);if (nDataSize < 0) {av_log(NULL, AV_LOG_ERROR, "Failed to calculate data size.\n");exit(1);}//遍历采样点for (int i = 0; i < pFrame->nb_samples; i++) {//遍历声道for (int ch = 0; ch < pCodecContext->ch_layout.nb_channels; ch++) {fwrite(pFrame->data[ch] + nDataSize * i, 1, nDataSize, pFile);}}}
}int main(int argc, char* argv[])
{//初始化inbuf数字默认值uint8_t inbuf[AUDIO_INBUF_SIZE + AV_INPUT_BUFFER_PADDING_SIZE] = {0};//获取解码器（此处需要读取的文件是AAC，故）const AVCodec* pCodecOfAAC = avcodec_find_decoder(AV_CODEC_ID_AAC);if (!pCodecOfAAC) {av_log(NULL, AV_LOG_ERROR, "Codec not found.\n");exit(1);}//注册解析器AVCodecParserContext* pCodecParserParser = av_parser_init(pCodecOfAAC->id);if (!pCodecParserParser) {av_log(NULL, AV_LOG_ERROR, "parser not found.\n");exit(1);}//分配解析器上下文AVCodecContext* pCodecContextOfAAC = avcodec_alloc_context3(pCodecOfAAC);if (!pCodecContextOfAAC) {av_log(NULL, AV_LOG_ERROR, "Could not allocate video codec context.\n");exit(1);}//打开解码器if (avcodec_open2(pCodecContextOfAAC, pCodecOfAAC, NULL) < 0) {av_log(NULL, AV_LOG_ERROR, "Could not open codec.\n");exit(1);}//分配AVPacketAVPacket* pPacket = av_packet_alloc();if (!pPacket) {exit(1);}//分配AVFrameAVFrame* pFrame = av_frame_alloc();if (!pFrame) {exit(1);}//打开输入文件FILE* ifile = fopen(INPUT_FILE_NAME, "rb");if (!ifile) {av_log(NULL, AV_LOG_ERROR, "Could not open \s.\n", INPUT_FILE_NAME);exit(1);}//打开输入文件FILE* ofile = fopen(OUTPUT_FILE_NAME, "wb+");if (!ofile) {av_log(NULL, AV_LOG_ERROR, "Could not open \s.\n", OUTPUT_FILE_NAME);exit(1);}//从输入流 ifile 读取数据到 inbuf 所指向的数组中uint8_t* data = inbuf;size_t nDataSize = fread(inbuf, 1, AUDIO_INBUF_SIZE, ifile);while (nDataSize > 0) {//使用注册的解析器 parser 把数据分割成帧int nRet = av_parser_parse2(pCodecParserParser, pCodecContextOfAAC, &pPacket->data, &pPacket->size, data, nDataSize, AV_NOPTS_VALUE, AV_NOPTS_VALUE, 0);if (nRet < 0) {fprintf(stderr, "Error while parsing\n");exit(1);}//根据使用情况重置数据位置data += nRet;nDataSize -= nRet;//送往解码if (pPacket->size) {decode(pCodecContextOfAAC, pFrame, pPacket, ofile);}//判断缓存区剩余数据是否小于一帧音频大小//小于的话从文件继续读取，之后在送往解码if (nDataSize < AUDIO_REFILL_THRESH) {memmove(inbuf, data, nDataSize);data = inbuf;int nLen = fread(data + nDataSize, 1, AUDIO_INBUF_SIZE - nDataSize, ifile);if (nLen > 0) {nDataSize += nLen;}}}//flush 解码器decode(pCodecContextOfAAC, pFrame, NULL, ofile);//此时就已经解码完了，我们稍后使用ffplay播放下音频//解码出来的pcm数据是没有这些基础数据的，我们需要从元数据获取//打印下基本信息//声道数printf("channels: %d \n", pCodecContextOfAAC->ch_layout.nb_channels);//采样率printf("sample_rate: %d  \n", pCodecContextOfAAC->sample_rate);//一帧音频所占字节代销printf("buffer: %d  \n", av_samples_get_buffer_size(NULL, pCodecContextOfAAC->ch_layout.nb_channels, pCodecContextOfAAC->frame_size, pCodecContextOfAAC->sample_fmt, 1));//采样格式enum AVSampleFormat sfmt = pCodecContextOfAAC->sample_fmt;printf("sample_fmt: %s  \n", av_get_sample_fmt_name(sfmt));//如果为planar，转换为packed格式if (av_sample_fmt_is_planar(sfmt)) {const char* packed = av_get_sample_fmt_name(sfmt);sfmt = av_get_packed_sample_fmt(sfmt);}const char* fmt = NULL;if (get_format_from_sample_fmt(&fmt, sfmt) < 0) {av_log(NULL, AV_LOG_ERROR, "Could not get forma \s.\n", av_get_sample_fmt_name(sfmt));exit(1);}//资源释放fclose(ifile);fclose(ofile);av_parser_close(pCodecParserParser);avcodec_free_context(&pCodecContextOfAAC);av_frame_free(&pFrame);av_packet_free(&pPacket);return 0;
}

ffmpeg7.0 aac转pcm

#pragma once #define __STDC_CONSTANT_MACROS #define _CRT_SECURE_NO_WARNINGSextern "C" { #include "libavcodec/avcodec.h" }//缓冲区大小（缓存5帧数据） #define AUDIO_INBUF_SIZE 40960 /*name depthu8 8s16 …...

编程日记 2025/1/12 12:14:10

【Pandas】pandas Series rdiv

Pandas2.2 Series Binary operator functions 方法描述Series.add()用于对两个 Series 进行逐元素加法运算Series.sub()用于对两个 Series 进行逐元素减法运算Series.mul()用于对两个 Series 进行逐元素乘法运算Series.div()用于对两个 Series 进行逐元素除法运算Series.true…...

编程日记 2025/1/12 12:11:05

线程安全问题介绍

文章目录 **什么是线程安全？****为什么会出现线程安全问题？****线程安全问题的常见场景****如何解决线程安全问题？**1. **使用锁**2. **使用线程安全的数据结构**3. **原子操作**4. **使用volatile关键字**5. **线程本地存储**6. **避免死锁*…...

编程日记 2025/1/12 12:07:00

为AI聊天工具添加一个知识系统之27 支持边缘计算设备的资源存储库及管理器

本文问题现在我们回到 ONE/TWO/TREE 的资源存储库的设计--用来指导足以支持本项目（为AI聊天工具增加一套知识系统）的核心能力 “语言处理” 中最高难度系数的“自然语言处理” 中最具挑战性的“含糊性” 问题的解决。--因为足以解决自然语言中最…...

编程日记 2025/1/12 12:04:57

初识verilog HDL

为什么选择用Verilog HDL开发FPGA？？？ 硬件描述语言（Hardware Descriptipon Lagnuage，HDL）通过硬件的方式来产生与之对应的真实的硬件电路，最终实现所设计的预期功能，其设计方法与软件…...

编程日记 2025/1/12 12:01:39

VS2015 + OpenCV + OnnxRuntime-Cpp + YOLOv8 部署

近期有个工作需求是进行 YOLOv8 模型的 C 部署，部署环境如下系统：WindowsIDE：VS2015语言：COpenCV 4.5.0OnnxRuntime 1.15.1 0. 预训练模型保存为 .onnx 格式假设已经有使用 ultralytics 库训练并保存为 .pt 格式的 YOLOv8 模型…...

编程日记 2025/1/12 12:00:37

Notepad++上NppFTP插件的安装和使用教程

一、NppFTP插件下载图示是已经安装好了插件。在搜索框里面搜NppFTP，一般情况下，自带的下载地址容易下载失败。这里准备了一个下载连接：Release v0.29.10 ashkulz/NppFTP GitHub 这里我下载的是x86版本下载好后在nodepad的插件里面选择打…...

编程日记 2025/1/12 11:59:34

Kotlin | Android Provider 的实现案例

目标使用 Android Room 实现持久化库。代码 Kotlin 代码编写 DemoDatabase，在build生成 DemoDatabase_Impl 疑问 Provider的数据会存在设备吗？ 内部存储: 当使用 Room 创建数据库（如 DemoDatabase），数据库文件通常…...

编程日记 2025/1/12 11:58:33

频域自适应空洞卷积FADC详解

定义与原理在探讨FADC的核心策略之前，我们需要深入了解其定义和工作原理。FADC是一种创新性的卷积技术，旨在克服传统空洞卷积的局限性。其核心思想是从频谱分析的角度改进空洞卷积，通过动态调整膨胀率来平衡有效带宽和感受野大小。 FADC的工作原理可以从以下几个方面…...

编程日记 2025/1/12 11:55:29

Edge浏览器内置的截长图功能

Edge浏览器内置截图功能近年来，Edge浏览器不断更新和完善，也提供了长截图功能。在Edge中，只需点击右上角的“...”，然后选择“网页捕获”->“捕获整页”，即可实现长截图。这一功能的简单易用，使其成为…...

编程日记 2025/1/12 11:54:28

GAN的应用

5、GAN的应用 GANs是一个强大的生成模型，它可以使用随机向量生成逼真的样本。我们既不需要知道明确的真实数据分布，也不需要任何数学假设。这些优点使得GANs被广泛应用于图像处理、计算机视觉、序列数据等领域。上图是基于GANs的实际应用场景对不同G…...

编程日记 2025/1/12 11:53:27

Math Reference Notes: 希腊字母表

希腊字母（Greek alphabet）是古希腊语使用的字母系统，也是西方字母系统的先驱之一，广泛应用于现代数学、物理学、工程学以及各种科学领域。希腊字母有24个字母，它们分为大写和小写两种形式。 1. Alpha (Α, α) 发音&a…...

编程日记 2025/1/12 11:49:21

高通，联发科（MTK）等手机平台调优汇总

一、常见手机型号介绍： ISP除了用在安防行业，还有手机市场，以及目前新型的A/VR眼睛，机器3D视觉机器人，医疗内窥镜这些行业。下面是一些最近几年发布的,,,旗舰SOC型号： 1.联发科：天玑92…...

编程日记 2025/1/12 11:47:18

Rust语言使用iced实现简单GUI页面

使用cargo新建一个rust项目 cargo new gui_demo cd gui_demo 编辑Cargo.toml文件 ,添加iced依赖 [package] name "gui_demo" version "0.1.0" edition "2021"[dependencies] iced "0.4.2" 编辑src/main.rs文件： u…...

编程日记 2025/1/12 11:45:16

使用wav2vec 2.0进行音位分类任务的研究总结

使用wav2vec 2.0进行音位分类任务的研究总结原文名称： Using wav2vec 2.0 for phonetic classification tasks: methodological aspects 研究背景自监督学习在语音中的应用自监督学习在自动语音识别任务中表现出色，例如说话人识别和验证。变换器模型…...

编程日记 2025/1/12 11:42:12

用Arduino平台，学习了点亮led灯。 //定义LED引脚 int led_pin 12；void setup() {//设定引脚为输出模式pinMode(led_pin,OUTPUT):}void loop() {// 点亮LED:digitalWrite(led_pin,HIGH);//延时1sdelay(1000);//熄灭LEDdigitalWrite(led_pin,LOW)://延时…...

编程日记 2025/1/12 11:41:11

基于SMT32U575RIT单片机-中断练习

任务查看手册对所有的拓展板上和相对应的底板的引脚对应的端口找到以下结论通过STM32MX软件对各个引脚进行相应的配置 1.第一种切换模式电脑发送 #include "main.h" #include "icache.h" #include "usart.h" #include "gpio.h"/*…...

编程日记 2025/1/12 11:40:10

在Django的Serializer的列表数据中剔除指定元素

【Python工作随笔】提问如何在List序列化方法中剔除不要的元素，例如在成绩中剔除0 class BasicDescriptionSubjectBoxPlotSerializer(serializers.Serializer):语文 serializers.ListField(sourcescore_chinese)数学 serializers.ListField(sourcescore_math…...

编程日记 2025/1/12 11:36:06

我喜欢的数学题

偏向抖机灵性质的，考察理解的，而不是比拼计算量的，可能跟现在岁数大了算不明白了多少有点关系吧。高高手，别太重计算，给普通孩子留条路。就算将来真的理工治国，也没必要都往人形计算机方面引导。毕竟你未来…...

编程日记 2025/1/12 11:28:59

Redis解决热key问题

当Redis遇到热key问题时，即某个或某些key被频繁访问，可能导致单个Redis节点负载过高，影响整个系统性能。以下是一些常见的解决方案： 1. 缓存预热与复制缓存预热：在系统启动阶段，将热key对应的value预先加…...

编程日记 2025/1/12 11:22:53

利用最小二乘法找圆心和半径

#include <iostream> #include <vector> #include <cmath> #include <Eigen/Dense> // 需安装Eigen库用于矩阵运算 // 定义点结构 struct Point { double x, y; Point(double x_, double y_) : x(x_), y(y_) {} }; // 最小二乘法求圆心和半径 …...

编程新知 2026/2/8 4:37:37

网络六边形受到攻击

大家读完觉得有帮助记得关注和点赞！！！ 抽象现代智能交通系统 （ITS） 的一个关键要求是能够以安全、可靠和匿名的方式从互联车辆和移动设备收集地理参考数据。Nexagon 协议建立在 IETF 定位器/ID 分离协议 （…...

编程新知 2026/2/8 5:22:04

web vue 项目 Docker化部署

Web 项目 Docker 化部署详细教程目录 Web 项目 Docker 化部署概述Dockerfile 详解构建阶段生产阶段构建和运行 Docker 镜像 1. Web 项目 Docker 化部署概述 Docker 化部署的主要步骤分为以下几个阶段： 构建阶段（Build Stage）&#xff1a…...

编程新知 2025/8/12 16:28:43

在鸿蒙HarmonyOS 5中实现抖音风格的点赞功能

下面我将详细介绍如何使用HarmonyOS SDK在HarmonyOS 5中实现类似抖音的点赞功能，包括动画效果、数据同步和交互优化。 1. 基础点赞功能实现 1.1 创建数据模型 // VideoModel.ets export class VideoModel {id: string "";title: string ""…...

编程新知 2025/11/14 9:31:35

定时器任务——若依源码分析

分析util包下面的工具类schedule utils： ScheduleUtils 是若依中用于与 Quartz 框架交互的工具类，封装了定时任务的创建、更新、暂停、删除等核心逻辑。 createScheduleJob createScheduleJob 用于将任务注册到 Quartz，先构建任务的 JobD…...

编程新知 2026/1/26 14:24:46

1.3 VSCode安装与环境配置

进入网址Visual Studio Code - Code Editing. Redefined下载.deb文件，然后打开终端，进入下载文件夹，键入命令 sudo dpkg -i code_1.100.3-1748872405_amd64.deb 在终端键入命令code即启动vscode 需要安装插件列表 1.Chinese简化 2.ros …...

编程新知 2026/1/29 3:35:37

postgresql|数据库|只读用户的创建和删除（备忘）

CREATE USER read_only WITH PASSWORD 密码 -- 连接到xxx数据库 \c xxx -- 授予对xxx数据库的只读权限 GRANT CONNECT ON DATABASE xxx TO read_only; GRANT USAGE ON SCHEMA public TO read_only; GRANT SELECT ON ALL TABLES IN SCHEMA public TO read_only; GRANT EXECUTE O…...

编程新知 2025/9/18 19:34:22

学习STC51单片机31（芯片为STC89C52RCRC）OLED显示屏1

每日一言生活的美好，总是藏在那些你咬牙坚持的日子里。硬件：OLED 以后要用到OLED的时候找到这个文件 OLED的设备地址 SSD1306"SSD" 是品牌缩写，"1306" 是产品编号。驱动 OLED 屏幕的 IIC 总线数据传输格式示意图 …...

编程新知 2026/1/30 4:16:26

iOS性能调优实战：借助克魔(KeyMob)与常用工具深度洞察App瓶颈

在日常iOS开发过程中，性能问题往往是最令人头疼的一类Bug。尤其是在App上线前的压测阶段或是处理用户反馈的高发期，开发者往往需要面对卡顿、崩溃、能耗异常、日志混乱等一系列问题。这些问题表面上看似偶发，但背后往往隐藏着系统资源调度不当…...

编程新知 2025/9/24 12:50:07

认识CMake并使用CMake构建自己的第一个项目

1.CMake的作用和优势跨平台支持：CMake支持多种操作系统和编译器，使用同一份构建配置可以在不同的环境中使用简化配置：通过CMakeLists.txt文件，用户可以定义项目结构、依赖项、编译选项等，无需手动编写复杂的构建脚本…...

编程新知 2026/2/7 19:54:51

ffmpeg7.0 aac转pcm

相关文章：

ffmpeg7.0 aac转pcm

【Pandas】pandas Series rdiv

线程安全问题介绍

为AI聊天工具添加一个知识系统之27 支持边缘计算设备的资源存储库及管理器

初识verilog HDL

VS2015 + OpenCV + OnnxRuntime-Cpp + YOLOv8 部署

Notepad++上NppFTP插件的安装和使用教程

Kotlin | Android Provider 的实现案例

频域自适应空洞卷积FADC详解

Edge浏览器内置的截长图功能

GAN的应用

Math Reference Notes: 希腊字母表

高通，联发科（MTK）等手机平台调优汇总

Rust语言使用iced实现简单GUI页面

使用wav2vec 2.0进行音位分类任务的研究总结

25/1/11 嵌入式笔记＜esp32＞初入esp32

基于SMT32U575RIT单片机-中断练习

在Django的Serializer的列表数据中剔除指定元素

我喜欢的数学题

Redis解决热key问题

利用最小二乘法找圆心和半径

网络六边形受到攻击

web vue 项目 Docker化部署

在鸿蒙HarmonyOS 5中实现抖音风格的点赞功能

定时器任务——若依源码分析

1.3 VSCode安装与环境配置

postgresql|数据库|只读用户的创建和删除（备忘）

学习STC51单片机31（芯片为STC89C52RCRC）OLED显示屏1

iOS性能调优实战：借助克魔(KeyMob)与常用工具深度洞察App瓶颈

认识CMake并使用CMake构建自己的第一个项目