Article

語音 音頻 資源合集

標題分類備註
VibeVoice-ASR語音轉文字聽寫/轉錄
VibeVoice-Realtime-0.5B即時文字轉語音文字發音
sherpa-ncnn語音開發套件ncnn(騰訊開源,輕量),ASR + TTS + VAD,極致輕量,適合資源極度受限的場景
sherpa-onnx語音開發套件功能更全面,依賴ONNX Runtime,ASR + TTS + VAD + 說話人識別/驗證/分離 + 關鍵詞喚醒 + 語言識別 + 音頻標籤 + 語音增強 + 加標點
Supertonic語音工具包極致的端側性能,跨平台 SDK,韓國公司開發
OmniVoice Studio
CosyVoice
DeLive錄音錄音轉錄工具
fish-speech音頻生成語音標籤情緒控制,4b模型,24GB顯存