Spark-TTS
本文最后更新于12 天前,其中的信息可能已经过时,如有错误请发送邮件到likethedramaallthetime@gmail.com

Spark-TTS

SparkAudio/Spark-TTS: Spark-TTS Inference Code

介绍

Spark-TTS 是一种先进的文本到语音系统,它利用大型语言模型(LLM)的强大功能实现高度准确和自然的语音合成。该系统设计高效、灵活、功能强大,既可用于研究,也可用于生产。

安装

构建虚拟环境(两种方法

官方使用conda

  • 下载 Miniconda 并安装它。
  • 确保在安装过程中选中“Add Conda to PATH”。

创建 Conda 环境

conda create -n sparktts python=3.12 -y
conda activate sparktts

这将为 Spark-TTS 创建并激活 Python 3.12 环境。

本人使用pyenv构建local python

pyenv local 3.12.9
python -m venv .venv

安装依赖项

pip install -r requirements.txt

安装 PyTorch(自动检测 CUDA 或 CPU)

pip install torch torchvision torchaudio --index-url https://pytorch.org/get-started/previous-versions/

# OR Manually install a specific CUDA version (if needed)
# pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
# pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118  # Older GPUs

下载 Spark-TTS

您有两个选项来获取文件:

选项 1(建议用于 Windows):手动下载 ZIP

  • 转到 Spark-TTS GitHub
  • 单击“代码”>“下载 ZIP”,然后解压它。

选项 2:使用 Git(可选)

  • 如果您更喜欢使用 Git,请安装 Git 并运行:
git clone https://github.com/SparkAudio/Spark-TTS.git

下载模型

有两种方法可以获取模型文件。选择一项:

选项 1(推荐):使用 Python
在 Spark-TTS 文件夹中创建一个名为download_model.py的新文件,将其粘贴到其中,然后运行它:

from huggingface_hub import snapshot_download
import os

# Set download path
model_dir = "pretrained_models/Spark-TTS-0.5B"

# Check if model already exists
if os.path.exists(model_dir) and len(os.listdir(model_dir)) > 0:
    print("Model files already exist. Skipping download.")
else:
    print("Downloading model files...")
    snapshot_download(
        repo_id="SparkAudio/Spark-TTS-0.5B",
        local_dir=model_dir,
        resume_download=True  # Resumes partial downloads
    )
    print("Download complete!")

然后运行它

python download_model.py

选项 2:使用 Git(如果已安装)

mkdir pretrained_models
git clone https://huggingface.co/SparkAudio/Spark-TTS-0.5B pretrained_models/Spark-TTS-0.5B

运行

python webui.py

报错与解决

case1TypeError: argument of type 'bool' is not iterable

原因:GradioGradio Client 版本之间出现了 兼容性问题

解决方法:同步升级 GradioGradio Client

pip install --upgrade gradio gradio_client

case2ValueError: When localhost is not accessible, a shareable link must be created. Please set share=True or check your proxy settings to allow access to localhost.

原因:gradio 程序试图在本地启动 WebUI 时,无法访问 localhost

用 Gradio 提供的外部可访问链接(比如用于远程访问或部署测试),在 demo.launch() 中加上参数 share=True

demo.launch(share=True)

标题:Spark-TTS
作者:LovelyYy
暂无评论

发送评论 编辑评论


				
|´・ω・)ノ
ヾ(≧∇≦*)ゝ
(☆ω☆)
(╯‵□′)╯︵┴─┴
 ̄﹃ ̄
(/ω\)
∠( ᐛ 」∠)_
(๑•̀ㅁ•́ฅ)
→_→
୧(๑•̀⌄•́๑)૭
٩(ˊᗜˋ*)و
(ノ°ο°)ノ
(´இ皿இ`)
⌇●﹏●⌇
(ฅ´ω`ฅ)
(╯°A°)╯︵○○○
φ( ̄∇ ̄o)
ヾ(´・ ・`。)ノ"
( ง ᵒ̌皿ᵒ̌)ง⁼³₌₃
(ó﹏ò。)
Σ(っ °Д °;)っ
( ,,´・ω・)ノ"(´っω・`。)
╮(╯▽╰)╭
o(*////▽////*)q
>﹏<
( ๑´•ω•) "(ㆆᴗㆆ)
😂
😀
😅
😊
🙂
🙃
😌
😍
😘
😜
😝
😏
😒
🙄
😳
😡
😔
😫
😱
😭
💩
👻
🙌
🖕
👍
👫
👬
👭
🌚
🌝
🙈
💊
😶
🙏
🍦
🍉
😣
Source: github.com/k4yt3x/flowerhd
颜文字
Emoji
小恐龙
花!
上一篇