本文最后更新于12 天前,其中的信息可能已经过时,如有错误请发送邮件到likethedramaallthetime@gmail.com
Spark-TTS
SparkAudio/Spark-TTS: Spark-TTS Inference Code
介绍
Spark-TTS 是一种先进的文本到语音系统,它利用大型语言模型(LLM)的强大功能实现高度准确和自然的语音合成。该系统设计高效、灵活、功能强大,既可用于研究,也可用于生产。
安装
构建虚拟环境(两种方法
官方使用conda
- 下载 Miniconda 并安装它。
- 确保在安装过程中选中“Add Conda to PATH”。
创建 Conda 环境
conda create -n sparktts python=3.12 -y
conda activate sparktts
这将为 Spark-TTS 创建并激活 Python 3.12 环境。
本人使用pyenv构建local python
pyenv local 3.12.9
python -m venv .venv
安装依赖项
pip install -r requirements.txt
安装 PyTorch(自动检测 CUDA 或 CPU)
pip install torch torchvision torchaudio --index-url https://pytorch.org/get-started/previous-versions/
# OR Manually install a specific CUDA version (if needed)
# pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
# pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118 # Older GPUs
下载 Spark-TTS
您有两个选项来获取文件:
选项 1(建议用于 Windows):手动下载 ZIP
- 转到 Spark-TTS GitHub
- 单击“代码”>“下载 ZIP”,然后解压它。
选项 2:使用 Git(可选)
- 如果您更喜欢使用 Git,请安装 Git 并运行:
git clone https://github.com/SparkAudio/Spark-TTS.git
下载模型
有两种方法可以获取模型文件。选择一项:
选项 1(推荐):使用 Python
在 Spark-TTS 文件夹中创建一个名为download_model.py
的新文件,将其粘贴到其中,然后运行它:
from huggingface_hub import snapshot_download
import os
# Set download path
model_dir = "pretrained_models/Spark-TTS-0.5B"
# Check if model already exists
if os.path.exists(model_dir) and len(os.listdir(model_dir)) > 0:
print("Model files already exist. Skipping download.")
else:
print("Downloading model files...")
snapshot_download(
repo_id="SparkAudio/Spark-TTS-0.5B",
local_dir=model_dir,
resume_download=True # Resumes partial downloads
)
print("Download complete!")
然后运行它
python download_model.py
选项 2:使用 Git(如果已安装)
mkdir pretrained_models
git clone https://huggingface.co/SparkAudio/Spark-TTS-0.5B pretrained_models/Spark-TTS-0.5B
运行
python webui.py
报错与解决
case1:TypeError: argument of type 'bool' is not iterable
原因:Gradio
或 Gradio Client
版本之间出现了 兼容性问题。
解决方法:同步升级 Gradio
与 Gradio Client
pip install --upgrade gradio gradio_client
case2:ValueError: When localhost is not accessible, a shareable link must be created. Please set share=True or check your proxy settings to allow access to localhost.
原因:gradio
程序试图在本地启动 WebUI 时,无法访问 localhost
用 Gradio 提供的外部可访问链接(比如用于远程访问或部署测试),在 demo.launch()
中加上参数 share=True
:
demo.launch(share=True)