WebSocket 实时语音转文本

curl --request GET \
  --url https://api.voxnexus.ai/v1/stt/realtime \
  --header 'Authorization: Bearer <token>'

{
  "error": "请求参数错误",
  "code": "INVALID_REQUEST",
  "details": "详细错误信息",
  "request_id": "req_1234567890"
}

stt

WebSocket 实时语音转文本

通过 WebSocket 连接进行实时语音转文本，支持双向流式通信。

连接方式：

使用 WebSocket 协议连接到 ws://host/v1/stt/realtime 或 wss://host/v1/stt/realtime（安全连接）
连接时需要通过 Authorization: Bearer YOUR_API_KEY header 进行认证

消息格式：所有消息均为 JSON 格式，包含 type 字段标识消息类型

客户端发送的消息类型：

服务端发送的消息类型：

ready: 连接就绪确认
- request_id: 请求ID
- language: 语言代码
- format: 音频格式
- sample_rate: 采样率
partial: 部分识别结果（流式输出，中间结果）
- text: 部分识别的文本
final: 最终识别结果（流式输出，最终结果）
- text: 最终识别的文本
- confidence: 置信度（如果启用）
- start_time_ms: 开始时间（毫秒）
- end_time_ms: 结束时间（毫秒）
- words: 词级别信息数组（如果启用）
- speakers: 说话人信息数组（如果启用说话人识别）
error: 错误消息
- error: 错误描述
- code: 错误代码
- request_id: 请求ID

详细说明请参考 API 设计文档

GET

stt

realtime

WebSocket 实时语音转文本

curl --request GET \
  --url https://api.voxnexus.ai/v1/stt/realtime \
  --header 'Authorization: Bearer <token>'

{
  "error": "请求参数错误",
  "code": "INVALID_REQUEST",
  "details": "详细错误信息",
  "request_id": "req_1234567890"
}

Authorization

string

header

required

使用 Bearer Token 进行认证，Token 为 API Key

协议升级为 WebSocket

⌘I