免费开源!AI视频自动剪辑已成现实!效率提升80%,打工人福音!(附详细教程)
大家好,我是程序员X小鹿,前互联网大厂程序员,自由职业2年+,也一名 AIGC 爱好者,持续分享更多前沿的「AI 工具」和「AI副业玩法」,欢迎一起交流~
想象一下,假设老板给你布置了一项任务:
将一大段视频中的高光时刻或者重点部分,剪成一段短视频,你怎么做?
再比如,老板参加了一个访谈,访谈后让你把他说话的部分单独剪辑出来,你怎么做?
把视频 2 倍速全部看一遍,然后一帧一帧剪辑?今天还想下班吗?
如何高效完成,光速下班呢?
今天分享一款 AI 视频剪辑神器,可以一键自动剪辑视频!
像上面的场景,5 分钟就可以搞定。工作效率直接拉满!
而且项目完全开源,支持本地部署,不懂技术不会本地部署的,也可在线直接使用,完全免费!
一、FunClip 如何工作
这个 AI 工具是 FunClip。
FunClip 是一个完全开源、支持本地部署的自动化视频剪辑工具,由阿里达摩院通义实验室推出。
FunClip 利用 AI 技术(阿里巴巴通义语音实验室的开源 FunASR Paraformer 系列模型),准确识别视频中的语音。用户基于识别结果的文字,快速选择需要的文本 / 说话人,裁剪成视频片段。
二、FunClip 如何使用
懂技术的小伙伴,可以看 FunClip 的 Github 进行本地部署。不会本地部署也没有关系,有两个快速体验网址,可以直接使用。
Github地址及两个体验网址,都贴在文末了。
为了考虑大多数用户,所以这里以在线体验网址来演示 FunClip 的使用。
识别
进入网站后,上传视频。(这里直接用官方示例视频演示)
选填:
1、热词:
用户可以指定特定的实体、名称,来增强 FunClip 的识别效果。可以根据自己情况填写。
2、文件输出路径:
可不填,也可根据自己情况填写。
最后点「识别 | ASR」,FunClip 就开始对视频进行语音识别了。
ps:如果是多人对话,需要区分说话人,可以点右侧的识别按钮。
稍等一会,下面会出现识别结果和 SRT 字幕内容:
裁剪
识别好后,点右侧的「根据文本 \ 说话人裁剪」。
从上一步的识别结果中,复制粘贴想保留的文本,多段文本用 ‘#’ 链接。
如果想根据说话人进行裁剪,可以输入说话人,多个说话人同样用 ‘#’ 链接。(建议本地部署使用 FunClip)
最后点「裁剪」就可以等待视频输出了。裁剪完成后,点 ↓ 可以下载视频。
其他配置:
1、位置偏移:
不需要修改。
2、字幕:
FunClip 还可以修改「字幕」大小及颜色,但在体验网址上是不支持的,需要本地部署 FunClip,且安装 imagemagick。
不过如果不想本地部署也可以,下载好视频后,直接用剪映识别添加字幕,也挺方便。
三、FunClip 有什么亮点
- FunClip 集成了阿里巴巴的开源工业级模型 Paraformer-Large,这是目前性能最好的开源中文 ASR 模型之一,可以以集成方式准确预测时间戳。
- FunClip 支持用户自定义设置「热词 | Hotwords」,即指定特定的实体、名称,以增强识别效果。
- FunClip 能自动识别说话人 ID,并剪辑特定说话人的视频片段。
- FunClip 支持多段自由剪辑,自动返回全视频 SRT 字幕和目标段 SRT 字幕。
四、结束语
在使用 FunClip 的过程中也发现一些小问题,比如多人对话中,如果多人的音色相近,FunClip 目前识别地不是很准确。
不过总体来说,相对于人工剪辑视频,FunClip 可以大大提升特定场景下的视频剪辑效率,至少提高 80% 以上。
有需要的朋友快去试试吧~
五、FunClip 相关地址
FunClip Github 项目地址:
https://github.com/modelscope/FunClip
FunClip 快速体验地址:
ModelScope(国内可用):
https://modelscope.cn/studios/iic/funasr_app_clipvideo/summary
HuggingFace(需要外网):
https://huggingface.co/spaces/R1ckShi/FunClip
更多 AI 工具见【AI工具】专栏,持续更新中。
AI 资料都在公众号,回复【资料】领取。
觉得文章有帮助,请帮忙点赞收藏关注一下呦~
我是程序员X小鹿,前互联网大厂程序员,自由职业2年+,也是一名 AIGC 爱好者,欢迎一起交流~
相关文章:
免费开源!AI视频自动剪辑已成现实!效率提升80%,打工人福音!(附详细教程)
大家好,我是程序员X小鹿,前互联网大厂程序员,自由职业2年,也一名 AIGC 爱好者,持续分享更多前沿的「AI 工具」和「AI副业玩法」,欢迎一起交流~ 想象一下,假设老板给你布置了一项任务:…...
NtripShare全站仪自动化监测之气象改正
最近有幸和自动化监测领域权威专家进行交流,讨论到全站仪气象改正的问题,因为有些观点与专家不太一致,所以再次温习了一下全站仪气象改正的技术细节。 气象改正的概念 全站仪一般利用光波进行测距,首先仪器会处理测距光波的相位漂…...
【人工智能】项目案例分析:使用自动编码器进行信用卡欺诈检测
一、项目背景 信用卡欺诈是金融行业面临的一个重要问题,快速且准确的欺诈检测对于保护消费者和金融机构的利益至关重要。本项目旨在通过利用自动编码器(Autoencoder)这一无监督学习算法,来检测信用卡交易中的欺诈行为,…...
【工控】线扫相机小结
背景简介 我目前接触到的线扫相机有两种形式: 无采集卡,数据通过网线传输。 配备采集卡,使用PCIe接口。 第一种形式的数据通过网线传输,速度较慢,因此扫描和生成图像的速度都较慢,参数设置主要集中在相机本身。第二种形式的相机配备采集卡,通常速度更快,但由于相机和…...
将Web应用部署到Tomcat根目录的三种方法
将应用部署到Tomcat根目录的三种方法 将应用部署到Tomcat根目录的目的是可以通过"http://[ip]:[port]"直接访问应用,而不是使用"http://[ip]:[port]/[appName]"上下文路径进行访问。 方法一:(最简单直接的方法࿰…...
工业和信息化部教育与考试中心计算机相关专业介绍
国家工信部的认证证书在行业内享有较高声誉。 此外,还设有专门的工业和信息化技术技能人才数据库查询服务,进一步方便了个人和企业对相关职业能力证书的查询需求。 序号 专业工种 级别 备注 1 JAVA程序员 初级 职业技术 2 电子…...
第二证券:生物天然气线上交易达成 创新探索互联互通、气证合一
8月20日,上海石油天然气生意中心在国内立异推出生物天然气线上生意。当日,绿气新动力(北京)有限公司(简称“绿气新动力”)挂单的1500万立方米生物天然气被百事食物(我国)有限公司&am…...
重磅!RISC-V+OpenHarmony平板电脑发布
仟江水商业电讯(8月18日 北京 委托发布)RISC-V作为历史上全球发展速度最快、创新最为活跃的开放指令架构,正在不断拓展高性能计算领域的边界。OpenHarmony是由开放原子开源基金会孵化并运营的开源项目,已成为发展速度最快的智能终…...
[DL]深度学习_扩散模型
扩散模型原理 深入浅出扩散模型 一、概念简介 1、Denoising Diffusion Probalistic Models,DDPM 1.1 扩散模型运行原理 首先sample一个都是噪声的图片向量,这个向量的shape和要生成的图像大小相同。通过Denoise过程来一步一步有规律的滤去噪声。Den…...
AI学习记录 - 如何快速构造一个简单的token词汇表
创作不易,有用的话点个赞 先直接贴代码,我们再慢慢分析,代码来自openai的图像分类模型的一小段 def bytes_to_unicode():"""Returns list of utf-8 byte and a corresponding list of unicode strings.The reversible bpe c…...
JAVA中的数组流ByteArrayOutputStream
Java 中的 ByteArrayOutputStream 是一个字节数组输出流,它允许应用程序以字节的形式写入数据到一个字节数组缓冲区中。以下是对 ByteArrayOutputStream 的详细介绍,包括其构造方法、方法、使用示例以及运行结果。 一、ByteArrayOutputStream 概述 Byt…...
S3C2440中断处理
一、中断处理机制概述 中断是CPU在执行程序过程中,遇到急需处理的事件时,暂时停止当前程序的执行,转而执行处理该事件的中断服务程序,并在处理完毕后返回原程序继续执行的过程。S3C2440提供了丰富的中断源,包括内部中…...
《数据分析与知识发现》
《数据分析与知识发现》介绍 1 期刊定位 《数据分析与知识发现》(Data Analysis and Knowledge Discovery)是由中国科学院主管、中国科学院文献情报中心主办的学术性专业期刊。期刊创刊于2017年,由《现代图书情报技术》(1985-20…...
IaaS,PaaS,aPaaS,SaaS,FaaS,如何区分?
IaaS, PaaS,SaaS,aPaaS 还有一种 FaaS ,这几个都是云服务中常见的 5 大类型: IaaS:基础架构即服务,Infrastructure as a Service PaaS:平台即服务,Platform as a Service aPaaS&…...
软件测试工具分享
要想在测试中旗开得胜,趁手的“武器”那是相当重要(说人话,要保证测试质量和效率,测试工具也很重要)。现在,小酋打算亮一亮自己的武器库,希望不要闪瞎你的眼(天上在打雷,…...
word翻译工具有哪些?5个工具助你快速翻译Word文件
无论是商业沟通还是文化交流,都需要跨越语言障碍。而文档翻译则是这一过程中的重要环节之一。 想象一下,当你需要将一份重要的Word文档从一种语言翻译成另一种语言时,如果手动逐句翻译不仅耗时耗力,还可能因为文化差异导致误解。…...
【51单片机】ds18b20驱动,11.0592MHZ,使用DS18b20
文章目录 ds18b20.h #include <reg52.h> #include <intrins.h> #include <math.h>// 管脚定义 sbit DS18B20_DATA_PIN = P1 ^ 0; // DS18B20数据口定义/******************************************************************************* * 函 数 名 …...
Vue 导航条+滑块效果
目录 前言代码效果展示导航实现代码导航实现代码导航应用代码前言 总结一个最近开发的需求。设计稿里面有一个置顶的导航条,要求在激活的项目下面展示个下划线。我最先开始尝试的是使用 after 的伪类选择器,直接效果一样,但是展示的时候就会闪现变化,感觉不够自然,参考了一…...
Android:使用Gson常见问题(包含解决将Long型转化为科学计数法的问题)
一、解决将Long型转化为科学计数法的问题 1.1 场景 将一个对象转为Map类型时,调用Gson.fromJson发现,原来对象中的long类型的personId字段,被解析成了科学计数法,导致请求接口失败,报参数错误。 解决结果图 1.2、Exa…...
【Win开发环境搭建】Redis与可视化工具详细安装与配置过程
🎯导读:本文档提供了Redis的简介、安装指南、配置教程及常见操作方法。包括了安装包的选择与配置环境变量的过程,详细说明了如何通过修改配置文件来设置密码和端口等内容。同时,文档还介绍了如何使用命令行工具连接Redisÿ…...
Compose知识分享
前言 “Jetpack Compose 是一个适用于 Android 的新式声明性界面工具包。Compose 提供声明性 API,让您可在不以命令方式改变前端视图的情况下呈现应用界面,从而使编写和维护应用界面变得更加容易。” 以上是Compose官网中对于Compose这套全新的Androi…...
python-study-day5
urllib中handler的使用 import urllib.request url "http://www.baidu.com" headers {User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/122.0.0.0 Safari/537.36 Edg/122.0.0.0 } # 请求地址的定制 reques…...
Telegram mini app 本地开发配置
前言: 为了能在telegram里本地调试mini app,参考了网上很多方案,踩了不少坑。最后整了一个适合自己的方案,记录一下。 这个方案一定不是最好的,不过是目前适合我上手开发的方案了。 本文章适合需要在 telegram 本地…...
python发票查验接口助您拒绝做糊涂账、发票ocr
发票识别发票查验接口让发票真假立现。仅需一键上传发票图片,即可实现发票真伪的秒速、批量验证,操作简单方便,避免因人工核验失误所导致“错账”现象的发生,减轻财务工作负担,提升企业工作效率,降低因假票…...
【Linux】线程控制|POSIX线程库|多线程创建|线程终止|等待|线程分离|线程空间布局
目录 编辑 POSIX线程库 多线程创建 独立栈结构 获取线程ID pthread_self 线程终止 return终止线程 pthread_exit pthread_cancel 线程等待 退出码问题 线程分离 测试 线程ID及地址空间布局 编辑 POSIX线程库 pthread线程库是 POSIX线程库的一部分…...
JimuReport 积木报表 v1.8.0 版本发布,开源可视化报表
项目介绍 一款免费的数据可视化报表工具,含报表和大屏设计,像搭建积木一样在线设计报表!功能涵盖,数据报表、打印设计、图表报表、大屏设计等! Web 版报表设计器,类似于excel操作风格,通过拖拽完…...
性能优化理论篇 | swap area是个什么东西
我们知道每台计算机的内存(RAM)都是有限的,而我们的应用程序需要加载到内存才能被运行,如果一台机器运行多个应用程序时,内存可能会耗尽。Linux 系统中的“交换空间(也称为交换分区)”可以帮助缓…...
Photoshop (PS)下载安装win/mac版
目录 一、概述 下载 二、安装步骤 三、使用教程 四、快捷键汇总 一、概述 Adobe Photoshop,简称“PS”,是由Adobe Systems开发和发行的图像处理软件。它主要处理以像素所构成的数字图像,涵盖了诸多领域,如图像编辑、图像合成…...
初识redis:Set类型
Set有很多种含义,比如集合,比如设置(和get相对应)。 在这里我们说的set是指的redis中的集合,并且这里的集合是无序的,和之前的list是对应的。 List : [1,2,3] 和 [2,1,3] 是两个不同的listSe…...
Qt 设置QTableView的某列或某行只读
我的做法是实现一个委托(delegate),然后把它设给你要只读的列或行 class ReadOnlyDelegate: public QItemDelegate {public:ReadOnlyDelegate(QWidget *parent NULL):QItemDelegate(parent){}QWidget *createEditor(QWidget *parent, const…...
网站建设要费用多少/百度一下首页问问
1 JSON.stringify() 此方法用来将 JavaScript 对象转换为字符串。 1.1 语法 JSON.stringify(value[, replacer[, space]])1.2 参数说明 value: 必需, 要转换的 JavaScript 值(通常为对象或数组)。 replacer: 可选。用于转换结果的函数或数组…...
傻瓜式网站开发/网站建设策划书范文
一个典型的CPU由运算器,控制器,寄存器等器件组成 内部总线实现CPU内部各个器件之间的联系,外部总线就是地址总线,控制总线等的这些联系CPU和主板上其他器件的联系 8086CPU的所有寄存器是16位的 16位的CPU一次性最多可以处理16位的数据通用寄存器最大宽度为16位(状态寄存器这些…...
专业网站维护/服务营销的七个要素
点击上方“Java基基”,选择“设为星标”做积极的人,而不是积极废人!源码精品专栏 原创 | Java 2020 超神之路,很肝~中文详细注释的开源项目RPC 框架 Dubbo 源码解析网络应用框架 Netty 源码解析消息中间件 RocketMQ 源码解析数据库…...
织梦做导航网站/seo是网络优化吗
本文整理一下使用php和mysql向前端推送数据的过程。数据库部分:1.首先安装服务器,我选择xampp,安装可以选择任意地址。安装完成,打开xampp-control.exe 。选择开启Apache和MySQL:2.浏览器进去http://localhost/phpmyad…...
创新网站建设工作室/网站名称查询
计算属性 两个问题: 为什么计算属性写的时候是 函数,用的时候不需要加(),当属性使用?计算属性的缓存问题 计算属性computed里面,不仅有get方法,还有set方法 其本质是: // 计算属性computed:…...
wordpress登录页面图标/网页模板大全
一、SQL语言查询选修了全部课程的学生的学号和姓名。 两种解决途径: 第一种: 我们可以表示为在SC表中某个学生选修的课程数等于C表中课程总数。相应的SQL语言如下: select S#,SNAME from S where S# in (select S# from SC group by S# --根据Sno分组,统计每个学生选修了几…...