标签
排序
为文字或SRT字幕创建配音-一键整合包
随着人工智能的不断进步,文本转语音(TTS)技术已经成为我们日常生活中不可或缺的一部分。 从语音助手到有声读物,再到角色配音,TTS 的应用场景日益广泛。 然而,尽管市面上已有众多 TTS 模型...
DiffSynth-Studio视频风格转绘一键就能三渲二【带完整视频教程】
DiffSynth 是一个新的扩散引擎。我们重构了文本编码器、UNet、VAE等架构,保持与开源社区模型的兼容性,同时增强计算性能。该版本目前处于初始阶段,支持SD和SDXL架构。未来,我们计划基于这个...
Step-Audio-EditX最新语音克隆-声音情绪调一键整合包
Step - Audio - EditX 是由阶跃星辰(StepFun)开发的全球首个开源 LLM 级音频编辑大模型,它基于 30 亿参数的 LLM 架构,凭借统一的 LLM 框架而非多模块拼接方案,实现文本驱动的音频创作,能...




