最新发布第2页
排序
Step-Audio-EditX最新语音克隆-声音情绪调一键整合包
Step - Audio - EditX 是由阶跃星辰(StepFun)开发的全球首个开源 LLM 级音频编辑大模型,它基于 30 亿参数的 LLM 架构,凭借统一的 LLM 框架而非多模块拼接方案,实现文本驱动的音频创作,能...
z_image_turbo首发最新写实文生图整合包-本地版解锁NFSW
阿里通义实验室低调推出的新一代模型 Z-Image-Turbo 迅速成为焦点。数据显示,这张细节繁复的图像在 RTX 4090 显卡上仅耗时 2.3 秒即渲染完成,而显存占用指针稳稳地停在了 13GB。这一成绩让无...
Whisper-WebUI视频翻译字幕生成一键整合包
Whisper-WebUI 是一款基于 OpenAI Whisper 语音识别模型的开源桌面应用。 它提供了一个图形化用户界面,旨在简化音视频内容的转录流程,能够自动生成带时间戳的字幕文件。 该工具支持多种输入源...











