news 2026/4/17 8:29:41

Spring Boot 集成免费的 EdgeTTS 实现文本转语音

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Spring Boot 集成免费的 EdgeTTS 实现文本转语音

在需要文本转语音(TTS)的应用场景中(如语音助手、语音通知、内容播报等),Java生态缺少类似Python生态的Edge TTS 客户端库。不过没关系,现在可以通过 UnifiedTTS 提供的 API 来调用免费的 EdgeTTS 能力。同时,UnifiedTTS 还支持 Azure TTS、MiniMax TTS、Elevenlabs TTS 等多种模型,通过对请求接口的抽象封装,用户可以方便在不同模型与音色之间灵活切换。

下面我们以调用免费的EdgeTTS为目标,构建一个包含文本转语音功能的Spring Boot应用。

实战

1. 构建 Spring Boot 应用

通过 start.spring.io 或其他构建基础的Spring Boot工程,根据你构建应用的需要增加一些依赖,比如最后用接口提供服务的话,可以加入web模块:

<dependencies>

<dependency>

<groupId>org.springframework.boot</groupId>

<artifactId>spring-boot-starter-web</artifactId>

</dependency>

</dependencies>

2. 注册 UnifiedTTS,获取 API Key

前往 UnifiedTTS 官网注册账号(直接GitHub登录即可)

从左侧菜单进入“API密钥”页面,创建 API Key;

创建API Key

存好API Key,后续需要使用

3. 集成 UnifiedTTS API

下面根据API 文档:https://unifiedtts.com/zh/api-docs/tts-sync 实现一个可运行的参考实现,包括配置文件、请求模型、服务类与控制器。

3.1 配置文件(application.properties)

unified-tts.host=https://unifiedtts.com

unified-tts.api-key=your-api-key-here

这里unifiedtts.api-key参数记得替换成之前创建的ApiKey。

3.2 配置加载类

@Data

@ConfigurationProperties(prefix = "unified-tts")

public class UnifiedTtsProperties {

private String host;

private String apiKey;

}

3.3 请求封装和响应封装

@Data

@AllArgsConstructor

@NoArgsConstructor

public class UnifiedTtsRequest {

private String model;

private String voice;

private String text;

private Double speed;

private Double pitch;

private Double volume;

private String format;

}

@Data

@AllArgsConstructor

@NoArgsConstructor

public class UnifiedTtsResponse {

private boolean success;

private String message;

private long timestamp;

private UnifiedTtsResponseData data;

@Data

@AllArgsConstructor

@NoArgsConstructor

public static class UnifiedTtsResponseData {

@JsonProperty("request_id")

private String requestId;

@JsonProperty("audio_url")

private String audioUrl;

@JsonProperty("file_size")

private long fileSize;

}

}

UnifiedTTS 抽象了不同模型的请求,这样用户可以用同一套请求参数标准来实现对不同TTS模型的调用,这个非常方便。所以,为了简化TTS的客户端调用,非常推荐使用 UnifiedTTS。

3.3 服务实现(调用 UnifiedTTS)

使用 Spring Boot自带的RestClient HTTP客户端来实现UnifiedTTS的功能实现类,提供两个实现:

接收音频字节并返回。

@Service

public class UnifiedTtsService {

private final RestClient restClient;

private final UnifiedTtsProperties properties;

public UnifiedTtsService(RestClient restClient, UnifiedTtsProperties properties) {

this.restClient = restClient;

this.properties = properties;

}

/**

* 调用 UnifiedTTS 同步 TTS 接口,返回音频字节数据。

*

* <p>请求头:

* <ul>

* <li>Content-Type: application/json</li>

* <li>X-API-Key: 来自配置的 API Key</li>

* <li>Accept: 接受二进制流或常见 mp3/mpeg 音频类型</li>

* </ul>

*

* @param request 模型、音色、文本、速度/音调/音量、输出格式等参数

* @return 音频二进制字节(例如 mp3)

* @throws IllegalStateException 当服务端返回非 2xx 或无内容时抛出

*/

public byte[] synthesize(UnifiedTtsRequest request) {

ResponseEntity<byte[]> response = restClient

.post()

.uri("/api/v1/common/tts-sync")

.contentType(MediaType.APPLICATION_JSON)

.accept(MediaType.APPLICATION_OCTET_STREAM, MediaType.valueOf("audio/mpeg"), MediaType.valueOf("audio/mp3"))

.header("X-API-Key", properties.getApiKey())

.body(request)

.retrieve()

.toEntity(byte[].class);

if (response.getStatusCode().is2xxSuccessful() && response.getBody() != null) {

return response.getBody();

}

throw new IllegalStateException("UnifiedTTS synthesize failed: " + response.getStatusCode());

}

/**

* 调用合成并将音频写入指定文件。

*

* <p>若输出路径的父目录不存在,会自动创建;失败时抛出运行时异常。

*

* @param request TTS 请求参数

* @param outputPath 目标文件路径(例如 output.mp3)

* @return 实际写入的文件路径

*/

public Path synthesizeToFile(UnifiedTtsRequest request, Path outputPath) {

byte[] data = synthesize(request);

try {

if (outputPath.getParent() != null) {

Files.createDirectories(outputPath.getParent());

}

Files.write(outputPath, data);

return outputPath;

} catch (IOException e) {

throw new RuntimeException("Failed to write TTS output to file: " + outputPath, e);

}

}

}

3.4 单元测试

@SpringBootTest

class UnifiedTtsServiceTest {

@Autowired

private UnifiedTtsService unifiedTtsService;

@Test

void testRealSynthesizeAndDownloadToFile() throws Exception {

UnifiedTtsRequest req = new UnifiedTtsRequest(

"edge-tts",

"en-US-JennyNeural",

"Hello, this is a test of text to speech synthesis.",

1.0,

1.0,

1.0,

"mp3"

);

// 调用真实接口,断言返回结构

UnifiedTtsResponse resp = unifiedTtsService.synthesize(req);

assertNotNull(resp);

assertTrue(resp.isSuccess(), "Response should be success");

assertNotNull(resp.getData(), "Response data should not be null");

assertNotNull(resp.getData().getAudioUrl(), "audio_url should be present");

// 在当前工程目录下生成测试结果目录并写入文件

Path projectDir = Paths.get(System.getProperty("user.dir"));

Path resultDir = projectDir.resolve("test-result");

Files.createDirectories(resultDir);

Path out = resultDir.resolve(System.currentTimeMillis() + ".mp3");

Path written = unifiedTtsService.synthesizeToFile(req, out);

System.out.println("UnifiedTTS test output: " + written.toAbsolutePath());

assertTrue(Files.exists(written), "Output file should exist");

assertTrue(Files.size(written) > 0, "Output file size should be > 0");

}

}

4. 运行与验证

执行单元测试之后,可以在工程目录test-result下找到生成的音频文件:

5. 常用参数与音色选择

目前支持的常用参数如下图所示:

对于model和voice参数可以因为内容较多,可以前往API文档查看。

小结

本文展示了如何在 Spring Boot 中集成 UnifiedTTS 的 EdgeTTS 能力,实现文本转语音并输出为 mp3。UnifiedTTS 通过统一的 API 屏蔽了不同 TTS 模型的差异,使你无需维护多个 SDK,即可在成本与效果之间自由切换。根据业务需求,你可以进一步完善异常处理、缓存与并发控制,实现更可靠的生产级 TTS 服务。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 3:26:38

N_m3u8DL-CLI-SimpleG视频下载工具完全操作手册

N_m3u8DL-CLI-SimpleG视频下载工具完全操作手册 【免费下载链接】N_m3u8DL-CLI-SimpleG N_m3u8DL-CLIs simple GUI 项目地址: https://gitcode.com/gh_mirrors/nm3/N_m3u8DL-CLI-SimpleG 您是否经常遇到想要保存网络视频却无从下手的困扰&#xff1f;N_m3u8DL-CLI-Simpl…

作者头像 李华
网站建设 2026/4/18 3:31:55

视频翻译终极指南:用AI技术实现多语言视频本地化

视频翻译终极指南&#xff1a;用AI技术实现多语言视频本地化 【免费下载链接】pyvideotrans Translate the video from one language to another and add dubbing. 将视频从一种语言翻译为另一种语言&#xff0c;并添加配音 项目地址: https://gitcode.com/gh_mirrors/py/pyv…

作者头像 李华
网站建设 2026/4/18 3:29:33

T5-Small轻量级AI模型本地部署实战指南:零GPU实现高效文本生成

T5-Small轻量级AI模型本地部署实战指南&#xff1a;零GPU实现高效文本生成 【免费下载链接】t5_small T5-Small is the checkpoint with 60 million parameters. 项目地址: https://ai.gitcode.com/openMind/t5_small 引言&#xff1a;打破资源限制的智能文本处理方案 …

作者头像 李华
网站建设 2026/4/18 3:29:44

LaTeX论文排版革命:从零到精通的智能写作指南

LaTeX论文排版革命&#xff1a;从零到精通的智能写作指南 【免费下载链接】XMU-thesis A LaTeX template 项目地址: https://gitcode.com/gh_mirrors/xm/XMU-thesis 想要摆脱论文格式困扰&#xff0c;专注学术研究核心吗&#xff1f;这篇LaTeX论文排版完全指南将带你体…

作者头像 李华
网站建设 2026/4/18 3:27:30

springboot在线高校教材征订管理系统

课题背景随着高等教育规模的不断扩大和信息技术的快速发展&#xff0c;高校教材管理工作面临着诸多挑战。传统的教材征订模式通常依赖人工操作&#xff0c;包括纸质订单的填写、统计和汇总&#xff0c;这种方式效率低下且容易出错。尤其是在高校扩招的背景下&#xff0c;学生人…

作者头像 李华
网站建设 2026/4/18 0:07:15

RTOS设备请求http时无响应问题分析复盘

1. 问题说明1.1 系统需求某设备管理系统需兼容安卓智能设备与嵌入式RTOS设备&#xff0c;两类设备均支持 HTTP 和 TCP 协议。受现场物联网卡限制&#xff0c;所有设备只能通过单一地址和端口接入。系统使用 HAProxy 进行流量分发&#xff0c;对外统一暴露一个端口&#xff0c;内…

作者头像 李华