Whisper-WebUI视频翻译字幕生成一键整合包

Whisper-WebUI视频翻译字幕生成一键整合包-逃课猫Deepfacelab|AI智能研究站
Whisper-WebUI视频翻译字幕生成一键整合包
此内容为付费资源,请付费后查看
会员专属资源
您暂无购买权限,请先开通会员
开通会员
QQ:3541716168
远程解决电脑问题
代下载任意视频资源
付费资源
已售 7860

Whisper-WebUI 是一款基于 OpenAI Whisper 语音识别模型的开源桌面应用。

它提供了一个图形化用户界面,旨在简化音视频内容的转录流程,能够自动生成带时间戳的字幕文件。 该工具支持多种输入源,包括本地音视频文件、YouTube 视频链接以及麦克风实时录音。

此外,它还集成了文本翻译和背景音乐分离等辅助功能,为用户提供了一套完整的音频处理解决方案。

图片[1]-Whisper-WebUI视频翻译字幕生成一键整合包-逃课猫Deepfacelab|AI智能研究站
图片[2]-Whisper-WebUI视频翻译字幕生成一键整合包-逃课猫Deepfacelab|AI智能研究站

文件(File):处理本地音视频文件。

YouTube:处理 YouTube 视频链接。

麦克风(Mic):进行实时语音录制与转录。

T2T 翻译(T2T Translation):翻译字幕文件。

BGM 分离(BGM Separation):分离音轨中的人声和背景音乐。

本地音视频转录文字(File)

点击上传区域,选择需要处理的音视频文件。 

在模型(Model)下拉菜单中选择转录模型(例如,V3 模型在准确性上表现更优)。 

在语言(Language)菜单中指定源文件的语言。 

选择期望的文件格式(File Format),如 SRT。 

点击生成字幕文件(GENERATE SUBTITLE FILE)。

任务完成后,可在左侧预览窗口查看结果,支持将字幕文件保存至本地。

YouTube 视频转录(YouTube)

将目标 YouTube 视频的 URL 粘贴到输入框中。 Whisper-WebUI 将自动识别视频的封面、题目和视频简介。

  1. 上传需要处理的音频文件。
  2. 根据硬件情况选择设备(Device),如使用 NVIDIA 显卡可选择 CUDA。 
  3. 选择分离模型,分段大小默认 。
  4. 点击分离背景音乐(SEPARATE BACKGROUNS MUSIC)。

处理完成后,可下载分离出的人声和背景音文件。

© 版权声明
THE END
喜欢就支持一下吧
点赞536 分享