开始使用

约 657 字大约 2 分钟

开始使用

系统要求

操作系统：Windows 10/11
CPU 版本：最低 16GB 运行内存，最低要求Intel i5-12400/AMD R5600，推荐Intel i7-13700K/AMD R7 7800X3D及更高性能的CPU
GPU 版本：最低 16GB 运行内存，6GB 及以上显存的 Nvidia 显卡设备(最低要求GTX 1070或同等性能显卡；推荐RTX 3060/4060及更高性能的显卡)
存储空间：至少 12GB 可用空间（单个模型约 4GB，环境约 6GB）

下载与安装

方案一：直接下载可执行文件(推荐)

下载最新版本
- 从 GitHub Releases 页面下载最新版本的 Cyrene QwenTTS GUI
下载依赖列表文件
- 下载 requirements.txt 文件
- 将其与可执行文件放在同一目录中
运行应用
- 双击可执行文件启动应用程序

方案二：从源代码编译(不推荐)

克隆仓库
- 克隆 GitHub 仓库
安装依赖
- 要求：Python 3.10-3.12
- 运行：
```
pip install -r requirements.txt
```
运行应用
- 执行：
```
python package.py
```

首次启动

当您首次启动 Cyrene QwenTTS GUI 时，您将看到向导界面。根据向导完成初始设置，包括：

选择语言（英语或中文）
根据实际情况选择安装运行环境（GPU环境/CPU环境）

基本操作

语音生成(使用Qwen3-...-CustomVoice模型)

在主界面选择 "生成" 选项卡
选择合适的模型和说话人
输入要转换为语音的文本
点击 "生成" 按钮
预览生成的语音并保存

语音设计(使用Qwen3-...-CustomVoice模型)

在主界面选择 "设计" 选项卡
输入语音描述（例如："年轻女性声音，快乐的语调"）
输入要生成的文本
点击 "生成" 按钮
预览设计的语音并保存

语音克隆(使用Qwen3-...-Base模型)

在主界面选择 "克隆" 选项卡
选择参考音频文件
输入要克隆声音说出的文本（可选）
点击 "克隆" 按钮
预览克隆的语音并保存

音频浏览

在主界面选择 "音频浏览" 选项卡
浏览所有生成的音频文件
双击文件播放
点击 "打开文件夹" 按钮查看文件夹位置

设置

在 "设置" 选项卡中，您可以：

更改界面语言

常见问题

如果您遇到任何问题，请查看常见问题页面或访问 GitHub Issues 页面寻求帮助。

贡献者

星海昔涟

更新日志

2026/2/17 13:34

查看所有更新日志

de92c-我是傻逼于 2026/2/17