标签
排序
开源离线语音识别输入工具CapsWriter v1.0-支持无限时长语音+音视频文件转录字幕
CapsWriter(详情请戳 作者项目地址)是一款免费开源且可完全离线识别的语音输入工具,无需担心因在线版本识别带来的各种隐私泄露问题。支持win7及以上的系统,已经更新融合了语音输入以及音视...
史上最强大开源模型”的Llama3-本地完整视频部署教程
4月19日,Facebook母公司Meta重磅推出了Llama3。即便大家现在对于大厂和巨头频繁迭代AI模型的行为已经见怪不怪,Meta的Llama3仍旧显得与众不同,因为这是迄今最强大的开源AI模型。Meta推出了重...
人声分离本地离线版整合包,无需联网
这是一个极简的人声和背景音乐分离工具,本地化网页操作,无需连接外网,使用 2stems/4stems/5stems 模型。 将一首歌曲或者含有背景音乐的音视频文件,拖拽到本地网页中,即可将其中的人声和音...
视频硬字幕提取软件-轻松提取视频中的字幕
我想很多做自媒体、或者从事视频字幕翻译的小伙伴,或者喜欢追剧外剧的,想把视频中的字幕提取出来,翻译成其它语言之类的。正常如果是一些封装类视频如MKV,内嵌字幕的可以导出来,但是对于一...
【绿色版 DragGAN】图像流编辑 | 支持自定义图片 | 一键操作
在图片上设定关键点,AI自动补全,图片就可以按照你想要的意图去改变,你的心有多大,世界就有多大,一切变化都在你的想象之间。1.3版支持自定义图片上传! 如果你是一个喜欢拍照编辑图像的人,...
Step-Audio-EditX最新语音克隆-声音情绪调一键整合包
Step - Audio - EditX 是由阶跃星辰(StepFun)开发的全球首个开源 LLM 级音频编辑大模型,它基于 30 亿参数的 LLM 架构,凭借统一的 LLM 框架而非多模块拼接方案,实现文本驱动的音频创作,能...
IDM-VTON | AI一键完美换装,商用级效果,支持上衣,裤子,裙子多种替换!
IDM-VTON | AI一键完美换装,商用级效果,支持上衣,裤子,裙子多种替换!软件对电脑配置要求过高,只支持N卡,Windows系统,内存16G以上 IDM-VTON(Virtual Try-on)是一个基于深度学习的虚...
视频翻译配音轻松本地免费翻译字幕-支持多国语言【看片专用】
一键字幕生成+字幕翻译+创建配音+合成 = 带字幕和配音的新视频 自动视频翻译 集成faster/openai-whisper/支持自定义huggingface模型同时集成语音识别/文字配音/字幕翻译等众多小工具 多种识别/...











