当前位置: 首页 > news >正文

音视频开发15 FFmpeg FLV封装格式分析

FLV(Flash Video)简介

FLV(Flash Video)是Adobe公司推出的⼀种流媒体格式,由于其封装后的⾳视频⽂件体积⼩、封装简单等特点,⾮常适合于互联⽹上使⽤。⽬前主流的视频⽹站基本都⽀持FLV。采⽤ FLV格式封装的⽂件后缀为.flv。

FLV封装格式的组成

FLV封装格式是由⼀个 ⽂件头( file header ) ⽂件体( file Body ) 组成。
其中,FLV body由⼀ 对对的(Previous Tag Size字段 + tag)组成。
Previous Tag Size字段 排列在Tag之前,占⽤ 4个字节。
Previous Tag Size记录了前⾯⼀个Tag的⼤⼩,⽤于逆向读取处理。
由于 Previous Tag Size 记录的是前面一个Tag 的大小,因此FLV header 后的第⼀个Pervious Tag Size的值为0。
Tag⼀般可以分为3种类型
脚本(帧)数据类型
⾳频数据类型、
视频数据。
FLV数据以 ⼤端序 进⾏存储 ,在解析时需要注意。⼀个标准FLV⽂件结构如下图:

FLV 文件的分析工具

可以使用UltraEdit 分析。 将 flv 文件直接拖入到 UE 中。

使用 mediainfo 工具进行分析。

然后将flv 文件拖入 mediainfo工具中

FLV Header 解析

我们这里使用 believe.flv文件做为标准分析结果如下:

注:在下⾯的数据type中,UI表示⽆符号整形,后⾯跟的数字表示其⻓度是多少位。⽐如
UI8 ,表示⽆符号整形,⻓度⼀个字节。 UI24 是三个字节,UI [8*n] 表示多个字节。UB表示位
域, UB5 表示 ⼀个字节的5位 。可以参考c中的位域结构体。
FLV头占9个字节,⽤来标识⽂件为FLV类型,以及后续存储的⾳视频流。⼀个FLV⽂件,每种
类型的tag都属于⼀个流,也就是⼀个flv⽂件最多只有⼀个⾳频流,⼀个视频流,不存在多个
独⽴的⾳视频流在⼀个⽂件的情况。
00000 1 0 1

FLV Body 解析

FLV Header之后,就是FLV File Body。
FLV File Body是由⼀连串的   Previous Tag Size + Tag Header + Tag Data 构成。

Previous Tag Size

Previous Tag Size (前⼀个tag 的字节数据⻓度),占 4个字节 。注意是前一个tag的字节数据长度,因此FLV Header后面的第一个   Previous Tag Size的值是0,

Tag Header 

tag header⼀般占11个字节的内存空间。FLV tag结构如下:
注意:
1. flv⽂件中Timestamp和TimestampExtended拼出来的是dts 。也就是解码时间。
Timestamp和TimestampExtended拼出来dts单位为ms。 (如果不存在B帧,当然dts等于
pts)
2. CompositionTime 表示PTS相对于DTS的偏移值, 在每个视频tag的第14~16字节, 。
显示时间(pts) = 解码时间(tag的第5~8字节) + CompositionTime
CompositionTime的单位也是ms
如下是将 FLV Header 的9个字节,
第一个 previous tag size 
第一个tag header 解析

Tag Data

Tag Header 的类型有三种 script data,video,audio

script data

该类型Tag⼜被称为 MetaData Tag ,存放⼀些关于FLV视频和⾳频的元信息,⽐如: duration、width、 height 等。
通常该类型Tag会作为FLV⽂件的第⼀个tag,并且只有⼀个,跟在File Header后。该类型Tag
DaTa的结构如下所示
接前面的分析:

Tag Body 对于tag type = 18,对应16进制为0X12来说:表示的是Script Tag Data,script tag data 的数据结构会在后面的具体讲解,这里只是对于一个简单的描述。

从data size 中看到,tag data的大小是 0x0000 01 8C,十进制是396.

那么从下图开始位置到下下图截止为止,就都是这个data 的数据,我们要做的是分析这个数据

第一个AMF包分析。

第⼀个AMF包: 第1个字节表示AMF包类型,⼀般总是0x02,表示字符串。

第2-3个字节为UI16类型值,标识字符串的⻓度,⼀般总是0x000A(“onMetaData”⻓度)。

后⾯字节为具体的字符串,⼀般总为“onMetaData”(6F,6E,4D,65,74,61,44,61,74,61)。

第二个AMF包分析。

第⼆个AMF包: 第1个字节表示AMF包类型,⼀般总是0x08,表示数组。

第2-5个字节为UI32类型值,表示数组元素的个数。

后⾯即为各数组元素的封装,数组元素为元素名称和值组成的对。常⻅的数组元素如下表所示

第⼆个AMF包: 第1个字节表示AMF包类型,⼀般总是0x08,表示数组。

第2-5个字节为UI32类型值,表示数组元素的个数。

后⾯即为各数组元素的封装,数组元素为元素名称和值组成的对。常⻅的数组元素如下表所示

注:Lavf54.63.104即是 *L*ib*avf*ormat version 54.63.104. 即是ffmpeg对于库的版本

audio

⾳频Tag Data区域开始的:
第⼀个字节包含了⾳频数据的参数信息,
第⼆个字节开始为⾳频流数据
(这两个字节属于tag的data部分,不是header部分)
第⼀个字节为⾳频的信息(仔细看spec发现对于AAC⽽⾔,⽐较有⽤的字段是 SoundFormat ),格式如下:

If the SoundFormat indicates AAC, the SoundType should be set to 1 (stereo) and the SoundRate should be set to 3 (44 kHz).

However, this does not mean that AAC audio in FLV is always stereo, 44 kHz data.

Instead, the Flash Player ignores these values and extracts the channel and sample rate data is encoded in the AAC bitstream.

如果SoundFormat指示AAC,则SoundType应设置为1(立体声),SoundRate应设置为3(44 kHz)。
然而,这并不意味着FLV中的AAC音频总是立体声的,44kHz的数据。
相反,Flash Player会忽略这些值,并提取信道和采样率数据被编码在AAC比特流中。

AudioTagHeader如上图所示,占1个字节,包含audio的各种信息。其后就是audio tag的data部分。

这里有一个特例,如果音频格式(SoundFormat)是10 = AAC,AudioTagHeader中会多出1个字节的数据AACPacketType,这个字段来表示AACAUDIODATA的类型:0 = AAC sequence header,1 = AAC raw。

AAC sequence header也就是包含了AudioSpecificConfig,AudioSpecificConfig包含着一些更加详细音频的信息,AudioSpecificConfig的定义在ISO14496-3中1.6.2.1 AudioSpecificConfig。在FLV的文件中,一般情况下 AAC sequence header 这种包只出现1次,而且是第一个audio tag。

如果是AAC数据,如果他是AAC RAW, tag data[2] 开始才是真正的AAC frame data。这里说的tag data[2],是以下标0开始的,也就是第三个字节才是真正的 aac 数据,

AAC raw 这种包含的就是音频ES流了,也就是audio payload。

video

视频Tag Data开始的:
第⼀个字节 包含视频数据的参数信息,
第⼆个字节 开始为视频流数据。
如果是AVC,那么第2个字节是  AVCPacketType ,3,4,5个字节是Compositon,从第6个字节开始才是data。
更具体的说,第二个字节有可能不是视频的真正数据。
这里也有一个特例,如果视频的格式是AVC(H.264)的话, VideoTagHeader会多出4个字节的信息 AVCPacketType 和  CompositionTime
(1)CompositionTime 单位毫秒
CompositionTime 每个视频tag(整个tag)的第 14~16 字节(如果是tag data偏移[3]~[5],
[0],[1][2:AVCPackettype] )(表示PTS相对于DTS的偏移值 )。
CompositionTime 单位为ms : 显示时间 = 解码时间( tag的第5~8字节,位置索引[4]~[7]
+ CompositionTime
(2)AVCDecoderConfigurationRecord
AVC sequence header就是 AVCDecoderConfigurationRecord 结构,该结构在标准⽂
档“ ISO-14496-15 AVC file format
📎 ISOIEC 14496-15 Advanced Video Coding (AVC) file format.pdf 中有详细说明。
如果不是AVC,那么从第二个字节开始就是视频数据了。

相关文章:

音视频开发15 FFmpeg FLV封装格式分析

FLV(Flash Video)简介 FLV(Flash Video)是Adobe公司推出的⼀种流媒体格式,由于其封装后的⾳视频⽂件体积⼩、封装简单等特点,⾮常适合于互联⽹上使⽤。⽬前主流的视频⽹站基本都⽀持FLV。采⽤ FLV格式封装的⽂件后缀为.flv。 FLV封装格式的组成 FLV封装…...

Qt 的 d_ptr (d-pointer) 和 q_ptr (q-pointer)解析;Q_D和Q_Q指针

篇一: Qt之q指针(Q_Q)d指针(Q_D)源码剖析---源码面前了无秘密_qtq指针-CSDN博客 通常情况下,与一个类密切相关的数据会被作为数据成员直接定义在该类中。然而,在某些场合下,我们会…...

【机器学习】深度探索:从基础概念到深度学习关键技术的全面解析——梯度下降、激活函数、正则化与批量归一化

🔥 个人主页:空白诗 文章目录 一、机器学习的基本概念与原理二、深度学习与机器学习的关系2.1 概念层次的关系2.2 技术特点差异2.3 机器学习示例:线性回归(使用Python和scikit-learn库)2.4 深度学习示例:简…...

C++模板类与Java泛型类的实战应用及对比分析

C模板类和Java泛型类都是用于实现代码重用和类型安全性的重要工具,但它们在实现方式和应用上有一些明显的区别。下面,我将先分别介绍它们的实战应用,然后进行对比分析。 C模板类的实战应用 C模板类允许你定义一种通用的类,其中类…...

使用Qt对word文档进行读写

目录 开发环境原理使用的QT库搭建开发环境准备word模板测试用例结果Gitee地址 开发环境 vs2022 Qt 5.9.1 msvc2017_x64,在文章最后提供了源码。 原理 Qt对于word文档的操作都是在书签位置进行插入文本、图片或表格的操作。 使用的QT库 除了基本的gui、core、…...

docker容器内无法使用命令问题

更换国内源 /etc/apt/source.list 可以先apt-get install vim #进入容器 docker exec -it 容器ID /bin/bashmv /etc/apt/source.list /etc/apt/source.list.bd vim /etc/apt/source.list#此处我使用腾讯云的源 deb http://mirrors.cloud.tencent.com/debian/ buster main non…...

【深度学习】安全帽检测,目标检测,Faster RCNN训练

文章目录 资料环境尝试训练安全帽数据训练测试预测全部数据、代码、训练完的权重等资料见: 资料 依据这个进行训练: https://github.com/WZMIAOMIAO/deep-learning-for-image-processing/tree/master/pytorch_object_detection/faster_rcnn ├── bac…...

IDEA2024创建maven项目

1、new->project 2、创建后展示 3、生成resources文件夹 4、测试--编写一个hello文件...

linux上VirtualBox使用

前言 最近想把唯一的windows系统装成linux, 但是确实存在一些特殊软件无法舍弃,所有装完linux需要用虚拟机装个windows 上来使用特定的一些软件(不想用wine了)。 还有对一些特定usb设备的透传,这样才能保证在虚拟机中…...

PID控制算法介绍及使用举例

PID 控制算法是一种常用的反馈控制算法,用于控制系统的稳定性和精度。PID 分别代表比例(Proportional)、积分(Integral)和微分(Derivative),通过组合这三个部分来调节控制输出&#…...

因子区间[牛客周赛44]

思路分析: 我们可以发现125是因子个数的极限了,所以我们可以用二维数组来维护第几个数有几个因子,然后用前缀和算出来每个区间合法个数,通过一个排列和从num里面选2个 ,c num 2 来计算即可 #include<iostream> #include<cstring> #include<string> #include…...

代码随想录算法训练营第四十四天 | 01背包问题理论基础、01背包问题滚动数组、416. 分割等和子集

背包问题其实有很多种&#xff0c;01背包是最基础也是最经典的&#xff0c;软工计科学生一定要掌握的。 01背包问题 代码随想录 视频讲解&#xff1a;带你学透0-1背包问题&#xff01;| 关于背包问题&#xff0c;你不清楚的地方&#xff0c;这里都讲了&#xff01;| 动态规划经…...

【PingPong_注册安全分析报告】

前言 由于网站注册入口容易被黑客攻击&#xff0c;存在如下安全问题&#xff1a; 暴力破解密码&#xff0c;造成用户信息泄露短信盗刷的安全问题&#xff0c;影响业务及导致用户投诉带来经济损失&#xff0c;尤其是后付费客户&#xff0c;风险巨大&#xff0c;造成亏损无底洞 …...

车辆路径规划之Dubins曲线与RS曲线简述

描述 Dubins和RS曲线都是路径规划的经典算法&#xff0c;其中车辆运动学利用RS曲线居多&#xff0c;因此简单介绍Dubins并引出RS曲线。 花了点时间看了二者的论文&#xff0c;并阅读了一个开源的代码。 Dubins曲线 Dubins曲线是在满足曲率约束和规定的始端和末端的切线&#…...

PostgreSQL 和Oracle锁机制对比

PostgreSQL 和Oracle锁机制对比 PostgreSQL 和 Oracle 都是业界广泛使用的关系型数据库管理系统&#xff0c;它们在锁机制方面都有独到的设计来控制并发访问&#xff0c;确保数据的一致性和完整性。下面我们详细比较一下这两个数据库系统的锁机制。 1. 锁类型 PostgreSQL P…...

6月05日,每日信息差

第一、特斯拉在碳博会上展示了其全品类的可持续能源解决方案&#xff0c;包括首次在国内展出的超大型电化学商用储能系统 Megapack 和家庭储能系统 Powerwall。此外&#xff0c;特斯拉还展示了电动汽车三电系统的解构和电池回收技术产品 第二、2024 年第一季度&#xff0c;全球…...

MongoDB~俩大特点管道聚合和数据压缩(snappy)

场景 在MySQL中&#xff0c;通常会涉及多个表的一些操作&#xff0c;MongoDB也类似&#xff0c;有时需要将多个文档甚至是多个集合汇总到一起计算分析&#xff08;比如求和、取最大值&#xff09;并返回计算后的结果&#xff0c;这个过程被称为 聚合操作 。 根据官方文档介绍&…...

HTML+CSS+JS 动态登录表单

效果演示 实现了一个登录表单的背景动画效果,包括一个渐变背景、一个输入框和一个登录按钮。背景动画由多个不同大小和颜色的正方形组成,它们在页面上以不同的速度和方向移动。当用户成功登录后,标题会向上移动,表单会消失。 Code <!DOCTYPE html> <html lang=&q…...

统一返回响应

前言 我们为什么要设置统一返回响应 提高代码的可维护性&#xff1a;通过统一返回请求的格式&#xff0c;可以使代码更加清晰和易于维护&#xff0c;减少重复的代码&#xff0c;提高代码质量。 便于调试和测试&#xff1a;统一的返回格式使得在调试和测试时更为简单&#xff…...

大数据学习问题记录

问题记录 node1突然无法连接finalshell node1突然无法连接finalshell 今天我打开虚拟机和finalshell的时候&#xff0c;发现我的node1连接不上finalshell,但是node2、node3依旧可以链接&#xff0c;我在网上找了很多方法&#xff0c;但是是关于全部虚拟机连接不上finalshell&a…...

第N4周:中文文本分类

&#x1f368; 本文为&#x1f517;365天深度学习训练营 中的学习记录博客&#x1f356; 原作者&#xff1a;K同学啊 一、预备知识 中文文本分类和英文文本分类都是文本分类&#xff0c;为什么要单独拎出来个中文文本分类呢&#xff1f; 在自然语言处理&#xff08;NLP&#x…...

【kubernetes】探索k8s集群的pod控制器详解(Deployment、StatefulSet、DaemonSet、Job、CronJob)

目录 一、Pod控制器及其功用 二、pod控制器有多种类型 2.1ReplicaSet 2.1.1ReplicaSet主要三个组件组成 2.2Deployment 2.3DaemonSet 2.4StatefulSet 2.5Job 2.6Cronjob 三、Pod与控制器之间的关系 3.1Deployment 3.2SatefulSet 3.2.1StatefulSet三个组件 3.2.2为…...

直接插入排序

#include <stdio.h>void insert_sort(int arr[], int n) {int i;int j;int tmp;for (i 1; i < n; i){tmp arr[i];j i - 1;// 将要插入的元素与数组中的元素比较&#xff08;从后向前比&#xff09; while (j > 0 && arr[j] > tmp){arr[j 1] arr[…...

esp32s3 nvs 存储过程中使用malloc和free函数的一点困惑

我的项目中&#xff0c;大量使用了malloc()和free()函数&#xff0c;在使用nvs存储之前没有出现问题。 esp32厂家nvs的blob存储的例程中&#xff0c;有使用malloc()和free()&#xff0c;我参照例程写了自己的blob存储函数f&#xff0c;一开始是可以正常使用的&#xff0c;后来…...

除visio以外的几款好用流程图绘制工具

流程图绘制软件在嵌入式软件开发中扮演着重要的角色&#xff0c;它们能够帮助用户清晰、直观地展示工作流程。以下是几款流行的流程图绘制软件及其特点的详细报告&#xff1a; 思维导图MindMaster MindMaster作为一款专业的思维导图软件&#xff0c;不仅具备强大的思维导图制作…...

CentOS 7 64位 常用命令

一、系统管理命令 systemctl start firewalld.service&#xff1a;启动防火墙服务 systemctl stop firewalld.service&#xff1a;停止防火墙服务 systemctl enable firewalld.service&#xff1a;设置防火墙服务开机自启 systemctl disable firewalld.service&#xff1a;禁止…...

ChatGPT-4o抢先体验

速度很快&#xff0c;结果很智能&#xff0c;支持多模态输入输出&#xff0c;感兴趣联系作者。 windows/linux/mac 客户端下载参考&#xff1a;https://github.com/lencx/Noi...

STM32实验之USART串口发送+接受数据(二进制/HEX/文本)

涉及三个实验&#xff1a; 1.USART串口发送和接收数据 我们使用的是将串口封装成为一个Serial.c模块.其中包含了 void Serial_Init(void);//串口初始化 void Serial_SendByte(uint8_t Byte);//串口发送一个字节 void Serial_SendArray(uint8_t *Array,uint16_t Length);//…...

网关(Gateway)- 内置过滤器工厂

官方文档&#xff1a;Spring Cloud Gateway 内置过滤器工厂 AddRequestHeaderGatewayFilterFactory 为请求添加Header Header的名称及值 配置说明 server:port: 8088 spring:application:name: api-gatewaycloud:nacos:discovery:server-addr: 127.0.0.1:8847username: nacos…...

电风扇如何实现跌倒断电保护功能

电风扇作为日常生活中常用的家电产品&#xff0c;为了提升安全性能&#xff0c;在设计上通常会考虑加入跌倒断电保护功能。其中&#xff0c;光电倾倒开关是实现跌倒断电保护功能的关键组件之一。 光电倾倒开关内置红外发光二极管和光敏接收器&#xff0c;其工作原理非常巧妙。…...

庆阳门户网站/网络营销类型有哪些

Spring Cloud 之 配置中心Spring Cloud Config 1、Spring Cloud Config 简介 Spring Cloud Config为服务端和客户端提供了分布式系统的外部化配置支持。配置服务器为各应用的所有环境提供了一个中心化的外部配置。Spring Cloud Config具有中心化、版本控制、支持动态更新和语言…...

杭州做网站需要多少钱/台州seo优化

1、先用encodeURI("你好")编码变成%A类似的字符&#xff1b; 2、获取值要用encodeURI()解码就是中文了。转载于:https://www.cnblogs.com/tangan/p/7777035.html...

做动态网站的软件有哪些/搭建一个网站平台需要多少钱

centos7下使用pip7.1.0安装软件&#xff0c;在shell下设置了全局http_proxy和https_proxy&#xff0c;但是每次都遇到网络超时问题&#xff0c; 后来使用pip install xxx --proxy <proxy>&#xff0c;安装成功了。...

wordpress算数验证/电脑版百度网盘

在OPC UA Server里&#xff0c;往往会有很多runtime信息&#xff0c;这些信息由底层的某种物理过程产生&#xff0c;如锅炉的温度值&#xff0c;是在锅炉运行过程中产生的&#xff0c;锅炉运行过程就可以看做是一个物理过程。 Server会提供一个变量&#xff0c;这个变量存放锅…...

招商加盟网站模板html/口碑营销理论

目录 文件操作和IO流复习一、map集合如何实现排序本节任务教学目标教学内容一、File类二、IO流四、字符流1. 输入流2. 输出流五、编码文件操作和IO流 复习 一、map集合如何实现排序 // TODO HashMap - key为一个引用类型(自定义类型)// 定义Hash结构的Map集合Map<Student, I…...

寿光做网站/推广咨询服务公司

1970年&#xff0c;修女玛丽尤肯达给美国航空航天局马绍尔太空航行中心的科学副总监恩斯特史图林格博士写了一封信&#xff0c;在信中她问道&#xff1a;目前地球上还有很多孩子吃不上饭&#xff0c;你们怎么舍得为远在火星的项目花费数十亿美元&#xff1f;史图林格给尤肯达的…...