| 标题 | 分类 | 备注 |
|---|---|---|
| VibeVoice-ASR | 语音转文字 | 听写/转录 |
| VibeVoice-Realtime-0.5B | 实时文本转语音 | 文本发音 |
| sherpa-ncnn | 语音开发包 | ncnn(腾讯开源,轻量),ASR + TTS + VAD,极致轻量,适合资源极度受限的场景 |
| sherpa-onnx | 语音开发包 | 功能更全面,依赖ONNX Runtime,ASR + TTS + VAD + 说话人识别/验证/分离 + 关键词唤醒 + 语言识别 + 音频标签 + 语音增强 + 加标点 |
| Supertonic | 语音工具包 | 极致的端侧性能,跨平台 SDK,韩国公司开发 |
| OmniVoice Studio | ||
| CosyVoice | ||
| DeLive | 录音 | 录音转录工具 |
| fish-speech | 音频生成 | 语音标签情绪控制,4b模型,24GB显存 |