当前位置：首页 > news >正文

第3课获取并播放音频流

news 2026/2/8 12:08:02

本课对应源文件下载链接：

https://download.csdn.net/download/XiBuQiuChong/88680079

FFmpeg作为一套庞大的音视频处理开源工具，其源码有太多值得研究的地方。但对于大多数初学者而言，如何快速利用相关的API写出自己想要的东西才是迫切需要的，至于原理的进一步学习那是以后的事情。

在上一课中，我们已经成功获取到视频流并显示，这节课我们将参考视频的工作流程来获取音频并播放。

1.与处理视频的过程差不多，要播放音频就要先初始化音频解码器，在函数runFFmpeg中加入以下代码：

//音频解码器
int audioIndex = -1;
AVCodec *aDecodec;
AVCodecContext *aDecodeCtx = NULL;//初始化并打开音频解码器
aDecodec = avcodec_find_decoder(inFormatCtx->streams[audioIndex]->codecpar->codec_id);
aDecodeCtx = avcodec_alloc_context3(aDecodec);
avcodec_parameters_to_context(aDecodeCtx, inFormatCtx->streams[audioIndex]->codecpar);
avcodec_open2(aDecodeCtx, aDecodec, 0);

2.在处理视频数据包后我们可以接着处理音频数据包，并把音频帧转换为pcm数组加入音频队列备用：

if (normalPkt.stream_index == videoIndex){ret = avcodec_send_packet(vDecodeCtx, &normalPkt);ret = avcodec_receive_frame(vDecodeCtx, deVideoFrame);av_packet_unref(&normalPkt);ret = sws_scale(bgrSwsCtx, (const uint8_t* const*)deVideoFrame->data, deVideoFrame->linesize, 0, deVideoFrame->height, bgrFrame.data, bgrFrame.linesize);srcMat = cv::Mat(bgrFrame.height, bgrFrame.width, CV_8UC3, bgrFrame.data[0]);//imshow("viceo", srcMat);//cv::waitKey(10);mainDlg->drawMatOfPlay(srcMat);av_frame_unref(deVideoFrame);}else if (normalPkt.stream_index == audioIndex){ret = avcodec_send_packet(aDecodeCtx, &normalPkt);while (1){ret = avcodec_receive_frame(aDecodeCtx, deAudioFrame);if (ret != 0){break;}else{int originAudioDataSize = deAudioFrame->linesize[0] * deAudioFrame->channels << 1;outAudioBuff = new char[originAudioDataSize];int outSampleNum = convertAudioFrameToAudioBuff(deAudioFrame, &outAudioBuff, originAudioDataSize);int finalAudioDataSize = outSampleNum *av_get_bytes_per_sample(AV_SAMPLE_FMT_S16) *deAudioFrame->channels;tmpAudioQueObj.audioDataArr = outAudioBuff;tmpAudioQueObj.audioDataSize = finalAudioDataSize;EnterCriticalSection(&queLock);outAudioQue.push(tmpAudioQueObj);if (outAudioQue.size() > 50){free(outAudioQue.front().audioDataArr);outAudioQue.front().audioDataSize = 0;outAudioQue.front().audioDataArr = NULL;outAudioQue.front().audioDataSize = NULL;outAudioQue.pop();}LeaveCriticalSection(&queLock);}av_frame_unref(deAudioFrame);}av_packet_unref(&normalPkt);}

3.为了能播放声音，需要先打开扬声器，然后把队列中的数据送入扬声器：

//打开扬声器
void fmlp::openSpeaker(){outWaveform.wFormatTag = WAVE_FORMAT_PCM;outWaveform.nSamplesPerSec = 44100;outWaveform.wBitsPerSample = 16;outWaveform.nChannels = 2;//waveform.nBlockAlign = (waveform.wBitsPerSample * waveform.nChannels) / 8;outWaveform.nBlockAlign = (outWaveform.wBitsPerSample*outWaveform.nChannels) >> 3;outWaveform.nAvgBytesPerSec = outWaveform.nBlockAlign * outWaveform.nSamplesPerSec;outWaveform.cbSize = 0;waveOutOpen(&hWaveOut, WAVE_MAPPER, &outWaveform, (DWORD)(speakerCallback), 0L, CALLBACK_FUNCTION);waveOutSetVolume(hWaveOut, 4 * 0xffffffff);waveHdrArr = new WAVEHDR[audioDataArrNum];for (int i = 0; i < audioDataArrNum; i++){waveHdrArr[i].lpData = new char[finalAudioDataSize];waveHdrArr[i].dwBufferLength = finalAudioDataSize;waveHdrArr[i].dwBytesRecorded = 0;waveHdrArr[i].dwUser = 0;waveHdrArr[i].dwFlags = 0;waveHdrArr[i].dwLoops = 0;waveHdrArr[i].lpNext = NULL;waveHdrArr[i].reserved = 0;waveOutPrepareHeader(hWaveOut, &waveHdrArr[i], sizeof(WAVEHDR));}}
//扬声器回调函数
DWORD CALLBACK fmlp::speakerCallback(HWAVEOUT hwaveout, UINT uMsg, DWORD dwInstance, DWORD dwParam1, DWORD dwParam2)
{switch (uMsg){case WOM_OPEN:break;case WOM_DONE:{LPWAVEHDR pwh = (LPWAVEHDR)dwParam1;if (pwh->lpData){free(pwh->lpData);pwh->dwBufferLength = 0;pwh->lpData = NULL;pwh->dwBufferLength = NULL;}}break;case WOM_CLOSE:break;default:break;}return 0;
}//播放声音
DWORD WINAPI fmlp::playAudioThreadProc(LPVOID lpParam){fmlp *pThis = (fmlp*)lpParam;pThis->playAudio();return 0;}int fmlp::playAudio(){int i = 0;while (true){if (outAudioQue.empty()){Sleep(5);continue;}EnterCriticalSection(&queLock);if (waveHdrArr[i].dwFlags & WHDR_PREPARED){waveHdrArr[i].lpData = (LPSTR)outAudioQue.front().audioDataArr;waveHdrArr[i].dwBufferLength = outAudioQue.front().audioDataSize;waveOutWrite(hWaveOut, &waveHdrArr[i], sizeof(WAVEHDR));outAudioQue.pop();i++;}LeaveCriticalSection(&queLock);if (i >= audioDataArrNum){i = 0;}Sleep(5);}}

4.这样一个最简单的既能播放视频也能播放音频的播放器就完成了。

第3课获取并播放音频流

本课对应源文件下载链接： https://download.csdn.net/download/XiBuQiuChong/88680079 FFmpeg作为一套庞大的音视频处理开源工具，其源码有太多值得研究的地方。但对于大多数初学者而言，如何快速利用相关的API写出自己想要的东西才是迫切需要…...

编程日记 2023/12/31 8:41:45

Spark编程实验四：Spark Streaming编程

目录一、目的与要求二、实验内容三、实验步骤 1、利用Spark Streaming对三种类型的基本数据源的数据进行处理 2、利用Spark Streaming对Kafka高级数据源的数据进行处理 3、完成DStream的两种有状态转换操作 4、把DStream的数据输出保存到文本文件或MySQL数据库中四…...

编程日记 2023/12/31 8:39:44

Flink去重计数统计用户数

1.数据订单表，分别是店铺id、用户id和支付金额 "店铺id,用户id,支付金额", "shop-1,user-1,1", "shop-1,user-2,1", "shop-1,user-2,1", "shop-1,user-3,1", "shop-1,user-3,1", "shop-1,user…...

编程日记 2023/12/31 8:36:41

力扣：62. 不同路径（动态规划，附python二维数组的定义）

题目： 一个机器人位于一个 m x n 网格的左上角 （起始点在下图中标记为 “Start” ）。机器人每次只能向下或者向右移动一步。机器人试图达到网格的右下角（在下图中标记为 “Finish” ）。问总共有多少条不同的路径&…...

编程日记 2023/12/31 8:32:36

2022年全球运维大会（GOPS深圳站）-核心PPT资料下载

一、峰会简介 GOPS 主要面向运维行业的中高端技术人员，包括运维、开发、测试、架构师等群体。目的在于帮助IT技术从业者系统学习了解相关知识体系，让创新技术推动社会进步。您将会看到国内外知名企业的相关技术案例，也能与国内顶尖的技术专家…...

编程日记 2023/12/31 8:30:34

8868体育助力意甲罗马俱乐部迪巴拉有望付出

8868体育助力意甲罗马俱乐部迪巴拉有望付出意甲罗马俱乐部是8868体育合作球队之一，本赛季，在意甲第14轮的比赛中，罗马客场2-1战胜萨索洛，积分上升到意甲第4位。有报道称，迪巴拉在对阵佛罗伦萨的比赛中受伤&#xff…...

编程日记 2023/12/31 8:22:24

java设计模式实战【策略模式+观察者模式+命令模式+组合模式，混合模式在支付系统中的应用】

引言在代码开发的世界里，理论知识的重要性毋庸置疑，但实战经验往往才是知识的真正试金石。正所谓，“读万卷书不如行万里路”，理论的学习需要通过实践来验证和深化。设计模式作为软件开发中的重要理论，其真正的价值在…...

编程日记 2023/12/31 8:16:19

小程序wx:if 和hidden的区别？

在小程序中，wx:if 和 hidden 是用于条件渲染的两种不同方式。选择使用哪种方式取决于具体情况。如果条件变化频繁或节点包含复杂的子节点，可以考虑使用 wx:if 进行条件渲染；如果条件变化较少且节点结构简单，可以使用 hidden 控制…...

编程日记 2023/12/31 8:15:18

自动驾驶学习笔记（二十三）——车辆控制模型

#Apollo开发者# 学习课程的传送门如下，当您也准备学习自动驾驶时，可以和我一同前往： 《自动驾驶新人之旅》免费课程—> 传送门《Apollo开放平台9.0专项技术公开课》免费报名—>传送门文章目录前言运动学模型动力学模型总结…...

编程日记 2023/12/31 8:13:16

Linux Shell 015-文本双向覆盖重定向工具tee

Linux Shell 015-文本双向覆盖重定向工具tee 本节关键字：Linux、Bash Shell、文本双向覆盖重定向工具相关指令：tee、echo、cat tee介绍 tee工具是从标准输入读取并写入到标准输出和文件，即：双向覆盖重定向（屏幕输出…...

编程日记 2023/12/31 8:10:13

【PyQt】(自定义类)QIcon派生，更易用的纯色Icon

嫌Qt自带的icon太丑，自己写了一个，主要用于纯色图标的自由改色。当然，图标素材得网上找。 Qt原生图标与现代图标对比： 没有对比就没有伤害 Qt图标网络素材图标自定义类XJQ_Icon： from PyQt5.QtGui import QIc…...

编程日记 2023/12/31 8:06:09

【mysql】数据处理格式化、转换、判断

数据处理判断是否超时，时间是否大于当前时间计算分钟数时间格式化处理如果数值类型进行转换字符类型字符拼接case-when代替if-else判断数据空（特殊：含空数据、空字符处理） select /*判断是否超时，时间是否大于当前…...

编程日记 2023/12/31 8:05:08

深入探索Java中的UDP网络通信机制

在网络通信中，UDP（User Datagram Protocol，用户数据报协议）是一种无连接的协议，它在某些情况下比TCP更适合，尤其是在要求速度快、对数据准确性要求相对较低的场景下。本文将介绍如何使用Java进行UDP网络通信…...

编程日记 2023/12/31 8:01:04

List常见方法和遍历操作

List集合的特点有序： 存和取的元素顺序一致有索引：可以通过索引操作元素可重复：存储的元素可以重复 List集合的特有方法 Collection的方法List都继承了List集合因为有索引，所以有了很多操作索引的方法 ublic static void main…...

编程日记 2023/12/31 8:00:02

【基础篇】一、认识JVM

文章目录 1、虚拟机2、Java虚拟机3、JVM的整体结构4、Java代码的执行流程5、JVM的三大功能6、JVM的分类7、JVM的生命周期 1、虚拟机虚拟机，Virtual Machine，一台虚拟的计算机，用来执行虚拟计算机指令。分为： 系统虚拟机&#x…...

编程日记 2023/12/31 7:58:00

DrGraph原理示教 - OpenCV 4 功能 - 颜色空间

前言前段时间，甲方提出明确需求，让把软件国产化。稍微研究了一下，那就转QT开发，顺便把以前的功能代码重写一遍。至于在Ubuntu下折腾QT、OpenCV安装事宜，网上文章很多，照猫画虎即可。这个过程&#xff0…...

编程日记 2023/12/31 7:56:58

听GPT 讲Rust源代码--src/tools(36)

File: rust/src/tools/clippy/clippy_lints/src/loops/empty_loop.rs 在Rust源代码中，empty_loop.rs文件位于src/tools/clippy/clippy_lints/src/loops/目录下，它的作用是实现并提供一个名为EMPTY_LOOP的Lint规则。Clippy是一个Rust的静态分析工具&#…...

编程日记 2023/12/31 7:55:58

学生数据可视化与分析工具 vue3+flask实现

目录一、技术栈亮点二、功能特点三、应用场景四、结语学生数据可视化与分析工具介绍在当今的教育领域，数据驱动的决策正变得越来越重要。为了满足学校、教师和学生对于数据深度洞察的需求，我们推出了一款基于Vue3和Flask编写的学生数据可视化…...

编程日记 2023/12/31 7:54:57

uni-app condition启动模式配置

锋哥原创的uni-app视频教程： 2023版uniapp从入门到上天视频教程(Java后端无废话版)，火爆更新中..._哔哩哔哩_bilibili2023版uniapp从入门到上天视频教程(Java后端无废话版)，火爆更新中...共计23条视频，包括：第1讲 uni…...

编程日记 2023/12/31 7:53:56

网大为卸任腾讯CXO；Midjourney 1 月训练视频模型；2023年马斯克赚了7700亿

投融资 • 2023 年大型科技公司在生成式 AI 初创企业上的投资远超风险投资集团• 恒信东方与无锡政府合作成立布局 MR/XR 技术及 3D 数字资产 AIGC 产业投资基金• 新公司法完善注册资本认缴登记制度• 网大为卸任腾讯CXO，曾促成南非MIH的投资• 宁波蔚孚科技完成数…...

编程日记 2023/12/31 7:52:55

对WWDC 2025 Keynote 内容的预测

借助我们以往对苹果公司发展路径的深入研究经验，以及大语言模型的分析能力，我们系统梳理了多年来苹果 WWDC 主题演讲的规律。在 WWDC 2025 即将揭幕之际，我们让 ChatGPT 对今年的 Keynote 内容进行了一个初步预测，聊作存档。等到明…...

编程新知 2026/2/6 23:56:39

使用van-uploader 的UI组件，结合vue2如何实现图片上传组件的封装

以下是基于 vant-ui（适配 Vue2 版本 ）实现截图中照片上传预览、删除功能，并封装成可复用组件的完整代码，包含样式和逻辑实现，可直接在 Vue2 项目中使用： 1. 封装的图片上传组件 ImageUploader.vue <te…...

编程新知 2026/1/31 2:37:22

tree 树组件大数据卡顿问题优化

问题背景项目中有用到树组件用来做文件目录，但是由于这个树组件的节点越来越多，导致页面在滚动这个树组件的时候浏览器就很容易卡死。这种问题基本上都是因为dom节点太多，导致的浏览器卡顿，这里很明显就需要用到虚拟列表的技术&…...

编程新知 2026/2/8 5:28:24

短视频矩阵系统文案创作功能开发实践，定制化开发

在短视频行业迅猛发展的当下，企业和个人创作者为了扩大影响力、提升传播效果，纷纷采用短视频矩阵运营策略，同时管理多个平台、多个账号的内容发布。然而，频繁的文案创作需求让运营者疲于应对，如何高效产出高质量文案成…...

编程新知 2026/2/1 8:24:29

纯 Java 项目（非 SpringBoot）集成 Mybatis-Plus 和 Mybatis-Plus-Join

纯 Java 项目（非 SpringBoot）集成 Mybatis-Plus 和 Mybatis-Plus-Join 1、依赖1.1、依赖版本1.2、pom.xml 2、代码2.1、SqlSession 构造器2.2、MybatisPlus代码生成器2.3、获取 config.yml 配置2.3.1、config.yml2.3.2、项目配置类 2.4、ftl 模板2.4.1、…...

编程新知 2025/9/26 12:26:35

脑机新手指南（七）：OpenBCI_GUI：从环境搭建到数据可视化（上）

一、OpenBCI_GUI 项目概述 （一）项目背景与目标 OpenBCI 是一个开源的脑电信号采集硬件平台，其配套的 OpenBCI_GUI 则是专为该硬件设计的图形化界面工具。对于研究人员、开发者和学生而言，首次接触 OpenBCI 设备时，往…...

编程新知 2026/2/3 4:26:32

AI语音助手的Python实现

引言语音助手（如小爱同学、Siri）通过语音识别、自然语言处理（NLP）和语音合成技术，为用户提供直观、高效的交互体验。随着人工智能的普及，Python开发者可以利用开源库和AI模型，快速构建自定义语音助手。本文由浅入深，详细介绍如何使用Python开发AI语音助手，涵盖基础功…...

编程新知 2026/2/3 13:01:10

永磁同步电机无速度算法--基于卡尔曼滤波器的滑模观测器

一、原理介绍传统滑模观测器采用如下结构： 传统SMO中LPF会带来相位延迟和幅值衰减，并且需要额外的相位补偿。采用扩展卡尔曼滤波器代替常用低通滤波器(LPF)，可以去除高次谐波，并且不用相位补偿就可以获得一个误差较小的转子位…...

编程新知 2026/2/7 9:27:22

前端中slice和splic的区别

1. slice slice 用于从数组中提取一部分元素，返回一个新的数组。特点： 不修改原数组：slice 不会改变原数组，而是返回一个新的数组。提取数组的部分：slice 会根据指定的开始索引和结束索引提取数组的一部分。不包含…...

编程新知 2025/11/27 20:15:13

【FTP】ftp文件传输会丢包吗？批量几百个文件传输，有一些文件没有传输完整，如何解决？

FTP（File Transfer Protocol）本身是一个基于 TCP 的协议，理论上不会丢包。但 FTP 文件传输过程中仍可能出现文件不完整、丢失或损坏的情况，主要原因包括： ✅ 一、FTP传输可能“丢包”或文件不完整的原因原因描述网络…...

编程新知 2025/8/17 3:31:21

相关文章：