Index-tts2 single or two person

세부 정보

파일 다운로드

모델 설명

2025년 12월까지 최고의 오픈소스 텍스트-스피치 프로젝트입니다.

워크플로에는 단일 인물 및 두 명의 TTS(텍스트-스피치)가 포함됩니다.

GPU 메모리 10GB가 필요합니다.

먼저, 다음 링크를 통해 ComfyUI를 통해 이 사용자 정의 노드를 설치하세요:

https://github.com/billwuhao/ComfyUI_IndexTTS

그런 다음 모델을 다운로드하세요:

V2 모델 다운로드: 모델을 ComfyUI\models\TTS 하위의 지정된 폴더에 수동으로 다운로드하세요:

https://hf-mirror.com/nvidia/bigvgan_v2_22khz_80band_256x/tree/main

https://hf-mirror.com/funasr/campplus/tree/main

https://hf-mirror.com/IndexTeam/IndexTTS-2/tree/main

https://hf-mirror.com/amphion/MaskGCT/tree/main/semantic_codec

https://hf-mirror.com/facebook/w2v-bert-2.0/tree/main

- bigvgan_v2_22khz_80band_256x
bigvgan_generator.pt
config.json

- campplus
campplus_cn_common.bin

- IndexTTS-2
│ .gitattributes
│ bpe.model
│ config.yaml
│ feat1.pt
│ feat2.pt
│ gpt.pth
│ README.md
│ s2mel.pth
│ wav2vec2bert_stats.pt

└─ qwen0.6bemo4-merge
added_tokens.json
chat_template.jinja
config.json
generation_config.json
merges.txt
model.safetensors
Modelfile
special_tokens_map.json
tokenizer.json
tokenizer_config.json
vocab.json

- MaskGCT
semantic_codec
model.safetensors

- w2v-bert-2.0
.gitattributes
config.json
conformer_shaw.pt model.safetensors
preprocessor_config.json
README.md


Windows 사용자는 Triton 및 SageAttention과 같은 wheel을 설치해야 할 수 있습니다.

ComfyUI가 이들을 설치하도록 요청하면, 다음 명령어를 실행하여 Triton을 설치하세요:

pip install -U "triton-windows<3.6"

SageAttention을 설치하려면 https://github.com/woct0rdho/SageAttention/releases 에 접속하여 사용 중인 Torch 및 CUDA 버전과 일치하는 wheel을 찾아 실행하세요. 예시:

pip install sageattention-2.2.0+cu130torch2.9.0andhigher.post4-cp39-abi3-win_amd64.whl

이 모델로 만든 이미지

이미지를 찾을 수 없습니다.