Article

语音 音频 资源合集

标题分类备注
VibeVoice-ASR语音转文字听写/转录
VibeVoice-Realtime-0.5B实时文本转语音文本发音
sherpa-ncnn语音开发包ncnn(腾讯开源,轻量),ASR + TTS + VAD,极致轻量,适合资源极度受限的场景
sherpa-onnx语音开发包功能更全面,依赖ONNX Runtime,ASR + TTS + VAD + 说话人识别/验证/分离 + 关键词唤醒 + 语言识别 + 音频标签 + 语音增强 + 加标点
Supertonic语音工具包极致的端侧性能,跨平台 SDK,韩国公司开发
OmniVoice Studio
CosyVoice
DeLive录音录音转录工具
fish-speech音频生成语音标签情绪控制,4b模型,24GB显存