以原節點為基礎,添加支援聯發科的BreezyVoice BreezyVoice
- 比起原始的BreezyVoice模型邏輯,預設採用FP16載入,VRAM僅占2-3GB
- 會從HuggingFace自動下載、配置設定及模型,節點開箱即用,但Requirement須確實依說明安裝完成,如果你已經安裝過IndexTTS 只需要補上缺的需求項,其他全部都有了
- 1.0.1版開始支援Chunk,可直接以100字為單位進行完整的切段落,能直接處理長音檔
- 基礎設計邏輯請參考上面BreezyVoice的Github,需要有一個音聲檔案以及對應的字幕文本,音聲檔案可以任意節點載入,建議不要載入大於五秒鐘,會導致效能降低
- 增加語速設定,語速設定為0.8,可改善原有模型音檔過快狀況
- 這是個聯發科的聲音產生範例檔案,大概是今年二月的時候,聯發科發布了這個TTS的模型,新聞上提出它有比較好的台灣發音支援,也是國內少數開源的本土TTS,然而實際上測試起來如何呢,第一是它的速度不快,生成的時間比較長,所以實用性上沒有很好,第二是他的講話語速很奇特,但並沒有像之前有篇測試文章那樣提到,有初始的聲音採樣不夠的問題,不過個人認為這還是個很初代的模型,除了企業的發音非常正確之外,有些其他的細節、口音還是比較不自然,沒有像新一代的模型那樣,自然而且快速,我想我還是會用比較新的TTS,做為設定這些虛擬人物的基礎,無論如何我還是打磨了它一下,就把節點和修改過的檔案,放出來給大家參考測試,做為本土TTS參考。
- 初步支持了inspiremusic,还没有经过严格测试(推理时有问题可以尝试换模型)。相应的新增了依赖,同时需要安装flash-attention(不使用InspireMusic可以不装),windows系统的whl可以从这里下载:
https://huggingface.co/lldacing/flash-attention-windows-wheel/tree/main
https://github.com/bdashore3/flash-attention/releases
- 新增了是否自动下载模型的选项
- 新增了多音字替换功能,配置在
funaudio_utils/多音字纠正配置.txt。感谢https://github.com/touge/ComfyUI-NCE_CosyVoice/tree/main - 新增了3个CosyVoice2节点。
- 整理了节点组。
- 从官方更新了CosyVoice、SenseVoice、match。
- 补充了更新CosyVoice后新增的参数
text_frontend,作用应该是规范化文本,默认为True。 - 优化了Speaker模型的保存与加载。
- 因为CosyVoice2需要,采样率22050几乎全部改为了24000。
- 工作流详见示例workflow
- 建议自动下载模型,不熟悉的话容易重复下载(下载好之后强烈建议关闭自动下载)。
- 手动下载请参考官方CosyVoice、SenseVoice、InspireMusic。手动下载后需要将inspiremusic.yaml文件里的'../../pretrained_models'替换成自己的模型路径。
- Speaker模型默认存储在
/models/CosyVoice/Speaker - 当以Speaker模型做为输入时,保存模型依然生效,但是保存的模型应该没有数据。
Comfyui custom node for FunAudioLLM include CosyVoice and SenseVoice
- CosyVoice Version: 2024-10-04
- Support SFT,Zero-shot,Cross-lingual,Instruct
- Support CosyVoice-300M-25Hz in zero-shot and cross-lingual
- Support SFT's 25Hz(unoffical)
- SenseVoice Version: 2024-10-04
- Support SenseVoice-Small
apt update
apt install ffmpeg
## in ComfyUI/custom_nodes
git clone https://github.com/SpenserCai/ComfyUI-FunAudioLLM
cd ComfyUI-FunAudioLLM
pip install -r requirements.txt
In windows need use conda to install pynini
conda install -c conda-forge pynini=2.1.6
pip install -r requirements.txt
If meet error when you install
brew install openfst
export CPPFLAGS="-I/opt/homebrew/include"
export LDFLAGS="-L/opt/homebrew/lib"
pip install -r requirements.txtIf your network is unstable, you can pre-download the model from the following sources and place it in the appropriate directory.
- CosyVoice-300M ->
ComfyUI/models/CosyVoice/CosyVoice-300M - CosyVoice-300M-25Hz ->
ComfyUI/models/CosyVoice/CosyVoice-300M-25Hz - CosyVoice-300M-SFT ->
ComfyUI/models/CosyVoice/CosyVoice-300M-SFT - CosyVoice-300M-SFT-25Hz ->
ComfyUI/models/CosyVoice/CosyVoice-300M-SFT-25Hz - CosyVoice-300M-Instruct ->
ComfyUI/models/CosyVoice/CosyVoice-300M-Instruct - SenseVoiceSmall ->
ComfyUI/models/SenseVoice/SenseVoiceSmall





