阿里mod_asr3.0集成webrtc静音算法
alibabacloud-nls-cpp-sdk-master
先到阿里官网下载nls库的源代码,编译生成对应的库文件和头文件。
我编译的放到了以下目录。
/home/jp/2025/alibabacloud-nls-cpp-sdk-master/build/install/NlsSdk3.X_LINUX/include/
/home/jp/2025/alibabacloud-nls-cpp-sdk-master/build/install/NlsSdk3.X_LINUX/lib/
mod_asr demo
https://download.csdn.net/download/qq_46187594/89714581https://download.csdn.net/download/qq_46187594/89714581下载asr的一个demo,在其中的mod_asr.cpp中调用webrtc静音检测算法,先判断语音静音包,非静音包丢给asr进行识别。
在/home/jp/2025/alibabacloud-nls-cpp-sdk-master/build/install/NlsSdk3.X_LINUX/include目录下mkdir vad目录,用于放后面静音检测的文件代码。
webrtc静音检测
GitHub - cpuimage/WebRTC_VAD: Voice Activity Detector Module Port From WebRTCVoice Activity Detector Module Port From WebRTC. Contribute to cpuimage/WebRTC_VAD development by creating an account on GitHub.https://github.com/cpuimage/WebRTC_VAD/下载这个webrtc静音检测程序,稍微修改下,进行调用。
下载完成后,include目录拷贝到/home/jp/2025/alibabacloud-nls-cpp-sdk-master/build/install/NlsSdk3.X_LINUX/include/vad/下,dr_wav.h,timing.h,
vad.cc也放到/home/jp/2025/alibabacloud-nls-cpp-sdk-master/build/install/NlsSdk3.X_LINUX/include/vod目录下。
main.c修改文件名为windaka.h.
mod_asr集成静音检测
在mod_asr.cpp的asr_callback()方法中增加vadProcess()方法的调用。返回为1表示非静音包,返回不为1表示静音包。特别注意vadProcess()第四个参数为WebRTC_VAD允许设置四个不同级别的敏感度(0-3),其中0最不敏感,3最敏感。
编译mod_asr3.0
编译语句为
g++ -shared -fPIC -O2 -Wall -o mod_asr.so mod_asr.cpp ./vod/*.c -I/home/jp/2025/alibabacloud-nls-cpp-sdk-master/build/install/NlsSdk3.X_LINUX/include -I/home/jp/2025/alibabacloud-nls-cpp-sdk-master/build/install/NlsSdk3.X_LINUX/include/vod -I/home/jp/2025/alibabacloud-nls-cpp-sdk-master/build/install/NlsSdk3.X_LINUX/include/vod/include -L/home/jp/2025/alibabacloud-nls-cpp-sdk-master/build/install/NlsSdk3.X_LINUX/lib -lpthread -lalibabacloud-idst-speech -ldl -D_GLIBCXX_USE_CXX11_ABI=1 -lrt -lz -ldl -lanl -I/usr/local/freeswitch/include/freeswitch -L/usr/local/freeswitch/lib -lfreeswitch
编译出来的mod_asr放到/usr/local/freeswitch/mod下,启动freeswitch时手动加载此模块,即可测试静音是否被检测出来。
代码下载
https://download.csdn.net/download/ware_soft/90239465
相关文章:
![](https://i-blog.csdnimg.cn/direct/6b0c07837bc547fe9b43fd35a3ee56d0.png)
阿里mod_asr3.0集成webrtc静音算法
alibabacloud-nls-cpp-sdk-master 先到阿里官网下载nls库的源代码,编译生成对应的库文件和头文件。 我编译的放到了以下目录。 /home/jp/2025/alibabacloud-nls-cpp-sdk-master/build/install/NlsSdk3.X_LINUX/include/ /home/jp/2025/alibabacloud-nls-cpp-sdk-…...
![](https://www.ngui.cc/images/no-images.jpg)
[Git] git pull --rebase / git rebase origin/master
1. git pull --rebase 这个命令是用来更新当前分支的,它会从远程仓库拉取更新,然后将你的本地提交重新应用到更新后的基础之上。它相当于先执行 git fetch,然后在当前分支上执行 git rebase origin/。使用 --rebase 而不是默认的 merge 可以…...
![](https://www.ngui.cc/images/no-images.jpg)
Leetcode3270:求出数字答案
题目描述: 给你三个 正 整数 num1 ,num2 和 num3 。 数字 num1 ,num2 和 num3 的数字答案 key 是一个四位数,定义如下: 一开始,如果有数字 少于 四位数,给它补 前导 0 。答案 key 的第 i 个数…...
![](https://www.ngui.cc/images/no-images.jpg)
第十一章 施工监测
11 施工监测 11.1 施工监测主要内容、常用仪器与方法 11.1.1 主要内容 1.目的和意义 及时掌握工程自身及周边环境风险动态、通过分析和预测工程结构及周边环境的安全状态与发展趋势,优化调整设计参数和施工参数提供数据支撑。为今后同类工程施工提供类比资料 2…...
![](https://www.ngui.cc/images/no-images.jpg)
Python爬虫应用领域
Python爬虫作为一种强大的数据获取工具,在多个领域发挥着重要作用。以下是Python爬虫在不同领域的应用情况: 一、数据采集与分析 (一)市场调研 产品信息收集:爬取电商平台的产品详情、价格、销量、用户评价等数据&am…...
![](https://www.ngui.cc/images/no-images.jpg)
软件架构考试基础知识 002:进程的状态与其切换
进程状态转换的说明 在操作系统中,进程的状态表示其当前的执行情况和资源占用情况。进程状态的转换反映了操作系统如何管理和调度进程。以下是进程状态转换的说明: 1. 三态模型(Three-state Model) 三态模型是最基础的进程状态模…...
![](https://i-blog.csdnimg.cn/direct/a10c2659ef41463189c6e8ca634f7304.png)
新车月交付突破2万辆!小鹏汽车“激活”智驾之困待解
首次突破月交付2万辆规模的小鹏汽车,稳吗? 本周,高工智能汽车研究院发布的最新监测数据显示,2024年11月,小鹏汽车在国内市场(不含出口)交付量(上险口径,下同)…...
![](https://i-blog.csdnimg.cn/direct/921913888d8246f9a20008f872443b63.png#pic_center)
VideoPlayer插件的功能和用法
文章目录 1. 概念介绍2. 使用方法2.1 实现步骤2.2 具体细节3. 示例代码4. 内容总结我们在上一章回中介绍了"如何获取文件类型"相关的内容,本章回中将介绍如何播放视频.闲话休提,让我们一起Talk Flutter吧。 1. 概念介绍 播放视频是我们常用的功能,不过Flutter官方…...
![](https://www.ngui.cc/images/no-images.jpg)
.NET体系架构
引言 .NET是由微软开发的一个广泛应用的开发平台,旨在帮助开发者构建各种类型的应用程序,包括桌面应用、Web应用、移动应用和云服务。最初,.NET平台的构建主要集中在Windows环境上,但随着.NET Core和随后.NET 5及以上版本的推出&…...
![](https://www.ngui.cc/images/no-images.jpg)
QT中引入OpenCV库总结(qmake方式和cmake方式)
文章目录 前言opencv环境配置一、opencv库获取的两种方式二、qmake和cmake配置2.1、 qmake2.2、cmake2.2.1、引入opencv示例 三、qt与opencv对应关系四、问题 前言 我的软件环境,写在前面 Windows10QT5.12.12VS2017OpenCV4.5.4 opencv环境配置 一、opencv库获取…...
![](https://www.ngui.cc/images/no-images.jpg)
matlab系列专栏-快捷键速查手册
目录 1在命令窗口(Command Window)中 2. 在编辑器(Editor)(m文件)中 1在命令窗口(Command Window)中 1)【↑、↓】——切换到之前、之后运行过的命令,可以重复按多次来达到想要的命令。 2)【Tab】——自动补全。在Command窗口,…...
![](https://www.ngui.cc/images/no-images.jpg)
对于 NestJS + TypeORM 查询构造器分页功能的简单二次封装
NestJS 作为 Node.js 领域备受欢迎的框架,其与 TypeORM 的结合为开发者提供了强大的 ORM 能力,简化了数据库操作。然而,在处理分页查询时,直接在每个服务方法中重复编写分页逻辑既不高效也容易出错。为此,我们可以通过…...
![](https://www.ngui.cc/images/no-images.jpg)
Kafka消息队列出现消息堆积如何解决
Kafka消息队列出现消息堆积,通常是由于消息生产速度远大于消费速度,可能由消费者处理能力不足、网络问题、Kafka配置不合理等原因导致。以下从多个方面介绍应对消息堆积的方法: 消费者端优化 提升消费并行度 增加消费者实例数量:…...
![](https://www.ngui.cc/images/no-images.jpg)
LeetCode hot100-100
287. 寻找重复数 给定一个包含 n 1 个整数的数组 nums ,其数字都在 [1, n] 范围内(包括 1 和 n),可知至少存在一个重复的整数。假设 nums 只有 一个重复的整数 ,返回 这个重复的数 。你设计的解决方案必须 不修改 数组…...
![](https://i-blog.csdnimg.cn/direct/22a4d5d9b9ee47f8a18083bbb95d1679.png#pic_center)
Vue.js:现代前端开发的灵活框架
大家好!我是 [数擎 AI],一位热爱探索新技术的前端开发者,在这里分享前端和 Web3D、AI 技术的干货与实战经验。如果你对技术有热情,欢迎关注我的文章,我们一起成长、进步! 开发领域:前端开发 | A…...
![](https://i-blog.csdnimg.cn/direct/020c3c9f78a3496980687046302b7f80.png)
CUDNN详解
文章目录 CUDNN详解一、引言二、cuDNN的基本使用1、初始化cuDNN句柄2、创建和设置描述符 三、执行卷积操作1、设置卷积参数2、选择卷积算法3、执行卷积 四、使用示例五、总结 CUDNN详解 一、引言 cuDNN(CUDA Deep Neural Network library)是NVIDIA为深度…...
![](https://www.ngui.cc/images/no-images.jpg)
下载并安装MySQL
在Linux系统上下载并安装数据库(以MySQL为例)的步骤如下: 一、下载MySQL 访问MySQL官网 打开浏览器,访问MySQL的官方网站:https://www.mysql.com/。 进入下载页面 在MySQL官网首页,找到并点击“Downloads…...
![](https://www.ngui.cc/images/no-images.jpg)
Linux ffmpeg 基础用法
简介 FFmpeg 是一个强大的开源多媒体框架,用于处理视频、音频和其他多媒体文件和流。它允许转换、录制、编辑、流媒体等等。 安装 Debian/Ubuntu sudo apt update sudo apt install ffmpegRed Hat/CentOS sudo dnf install ffmpegmacOS (via Homebrew) brew i…...
![](https://i-blog.csdnimg.cn/direct/5cbe13136c2b4135a9f151baa91fa5ef.png)
【C++入门】详解(中)
目录 💕1.函数的重载 💕2.引用的定义 💕3.引用的一些常见问题 💕4.引用——权限的放大/缩小/平移 💕5. 不存在的空引用 💕6.引用作为函数参数的速度之快(代码体现) Ǵ…...
![](https://www.ngui.cc/images/no-images.jpg)
深度学习的加速器:Horovod,让分布式训练更简单高效!
什么是 Horovod? Horovod 是 Uber 开发的一个专注于深度学习分布式训练的开源框架,旨在简化和加速多 GPU、多节点环境下的训练过程。它以轻量级、易用、高性能著称,特别适合需要快速部署分布式训练的场景。Horovod 的名字来源于俄罗斯传统舞…...
计算机的错误计算(二百零八)
摘要 用两个大模型计算 arccot(0.9911588354432518e10) . 保留16位有效数字。两个的输出均是错误的。代码的输出格式亦均出错。 本节题目为一读者来信提议(不知该题目有何玄机?)。 例1. 计算 arccot(0.9911588354432518e10) . 保留16位有…...
![](https://i-blog.csdnimg.cn/img_convert/ad8c23697157803df8ec6174d500489a.png)
海康机器人IPO,又近了一步
导语 大家好,我是社长,老K。专注分享智能制造和智能仓储物流等内容。欢迎大家到本文底部评论区留言。 海康机器人的IPO之路,一路跌宕起伏,让无数投资者和业内人士关注。这不仅仅是一家企业的上市之旅,更是中国智能制造…...
![](https://i-blog.csdnimg.cn/direct/fe2d27d92fcd43b3aa353c4db9379e58.png)
【环境搭建】Metersphere v2.x 容器部署教程踩坑总结
前言 Metersphere部署过程中遇到的问题有点多,原因是其容器的架构蛮复杂的,比较容易踩坑,所以记录一下。 介绍 MeterSphere 是开源持续测试平台,遵循 GPL v3 开源许可协议,涵盖测试管理、接口测试、UI 测试和性能测…...
![](https://i-blog.csdnimg.cn/direct/31e0dd13c136467293de362d5e2fa017.png)
系统看门狗配置--以ubuntu为例
linux系统配置看门狗 以 ubuntu 系统配置看门狗为例 配置看门狗使用的脚本文件,需要使用管理员权限来执行: 配置是:系统每 30S 喂一次狗,超过 60S 不进行投喂,就会自动重启。 1. 系统脚本内容: #!/bin/b…...
![](https://i-blog.csdnimg.cn/direct/810e3489f4bb4699a9af4c58727d442a.png)
阅读笔记——《A survey of protocol fuzzing》
【参考文献】Zhang X, Zhang C, Li X, et al. A survey of protocol fuzzing[J]. ACM Computing Surveys, 2024, 57(2): 1-36.【注】本文仅为作者个人学习笔记,如有冒犯,请联系作者删除。 目录 1、Introduction 2、Background 2.1、Communication Pro…...
![](https://www.ngui.cc/images/no-images.jpg)
C# 语法中级
总目录 C# 语法总目录 C# 语法中级 lambda 表达式1. 捕获外部变量2. 捕获迭代变量 匿名类型匿名方法异常相关1. 枚举器2. 可枚举对象3. 迭代器3. 迭代器语义4. yield break 语句5. 组合序列 可空类型1. Nullable< T > 结构体 lambda 表达式 编译器在内部将lambda表达式编…...
![](https://i-blog.csdnimg.cn/direct/393fa98f7dee4556a9375ab35ad73aa7.png)
STORM:从多时间点2D图像中快速重建动态3D场景的技术突破
随着计算机视觉和机器学习技术的迅猛发展,我们已经能够利用AI来解决许多复杂的问题。然而,在处理大规模室外动态3D场景重建时,现有的方法往往面临着诸多挑战,如需要大量人工标注数据、处理速度慢以及难以准确捕捉移动物体等。为了解决这些问题,研究者们开发了STORM(Spati…...
![](https://www.ngui.cc/images/no-images.jpg)
excel前缀和(递增求和)
方法一:https://www.zhihu.com/zvideo/1382164996659515392?utm_id0 假设输入数据在B2:B10,选中单元格C2,输入SUM(B2:B2,然后选中其中的B2,按F4(或者直接输入SUM(B$2:B2),回车确认&…...
![](https://i-blog.csdnimg.cn/direct/14a48dff36144c48b077e0ab92c08c98.png)
【AI日记】25.01.11 Weights Biases | AI 笔记 notion
【AI论文解读】【AI知识点】【AI小项目】【AI战略思考】【AI日记】【读书与思考】 AI kaggle 比赛:Forecasting Sticker Sales笔记:我的 AI 笔记主要记在两个地方 有道云笔记:数学公式和符号比较多的笔记notion:没什么数学公式的…...
![](https://www.ngui.cc/images/no-images.jpg)
P8772 [蓝桥杯 2022 省 A] 求和
题目描述 给定 𝑛 个整数 𝑎1,𝑎2,⋯ ,𝑎𝑛 求它们两两相乘再相加的和,即 𝑆𝑎1⋅𝑎2𝑎1⋅𝑎3⋯𝑎1⋅𝑎𝑛&…...
![](https://img-blog.csdnimg.cn/35de1f51dd034bcdb898c7fd3db5c7b2.png)
深圳网站建设小江/泉州网站seo外包公司
智慧寻源 多策略、多场景寻源,多种看板让寻源过程全程可监控,根据不同采购场景,采取不同寻源策略, 实现采购寻源线上化管控;同时支持公域和私域寻源。 询价比价 全程线上询比价,信息公开透明,可…...
![](/images/no-images.jpg)
经典网站域名/网站seo文章该怎么写
1、服务端解析: 1)使用BufferedReader 包装获得的数据,为了使连接长时间不断,必须使用while(true) 2)另外开启一个新的线程用户回复客户端,这里使用了PrintWriter 包装数据,从键盘输入数据,结…...
总结网站推广策划书的共同特点/小红书推广方案
在小米的2020年开发者大会上,小米创始人兼董事长雷军表示将“坚定不移地全球化,目标是在未来几年在欧洲排到第一名”,这代表着它将继承华为的愿望在欧洲市场击败三星。由于众所周知的原因,中国手机企业难以进入海外两大最具价值的…...
![](/images/no-images.jpg)
设计公司资质等级/北京朝阳区优化
前言:每次安装mysql都被烦的要死,痛并思痛记下此篇文章;参考:正文:1、下载mysql2、安装,下一步下一步即可!3、修改密码(1)执行 cd /usr/local/mysql/bin(2)执行 vim ~/.bash_profile在该文件中添…...
![](/images/no-images.jpg)
做代购的购物网站/十大搜索引擎地址
先上辗转相除的代码 while (true) {int t a % b;if (t 0) break;else {a b;b t;} } 为什么要这么做? 我们来证明余数也是公因数的倍数 a,b两个数,(a>b),肯定是有一个公因数1的,或者也可…...
![](/images/no-images.jpg)
wordpress解除上传限制/百度推广投诉中心
linux minicom 命令详解功能说明:调制解调器通信程序。语 法:minicom [-8lmMostz][-a ][-c ][-C<取文件>][-d<编号>][-p<模拟终端机>][-S ][配置文件]补充说明:minicom是一个相当受欢迎的PPP拨号连线程序。参 数&…...