将文本转换为语音音频,默认使用流式传输(chunked)实时返回音频数据
使用 Bearer Token 进行认证,Token 为 API Key
要转换的文本(必需)
"Hello, this is a test message."
语音唯一标识符(必需)
"vl-xiaoxiao"
语言代码,ISO 639-1(可选)
"zh-CN"
音频格式(可选,默认: mp3)
mp3, wav, ogg, pcm, webm 采样率(可选,默认: 16000)
8000, 16000, 22050, 24000, 44100, 48000 比特率(kbps),仅对压缩格式有效(可选,默认: 128)
128
语速倍数,范围: 0.5 - 2.0,默认: 1.0(可选)
0.5 <= x <= 2音调偏移(半音),范围: -12 - 12,默认: 0(可选)
-12 <= x <= 12音量倍数,范围: 0.0 - 1.0,默认: 1.0(可选)
0 <= x <= 1是否使用SSML格式的text(可选,默认: false)
语音特定配置(可选,根据voice_id支持的配置项使用)
{
"style": "cheerful",
"role": "Girl",
"degree": 0.5
}成功返回音频流
The response is of type file.