语音命令识别

最近更新时间:2023-07-07 11:28:15 前往 Coding 编辑

导出文档

1. 接口描述

接口请求域名:winner-api.neunit.com:18053

接口请求路径: POST /cloud/sc/v1/chunk

本接口支持对语音命令进行识别

  • 支持 pcm 格式的语音流,具体信息请参见下文说明。

2. 输入参数

以下请求参数列表仅列出了接口请求参数。

参数名称必选类型描述
audio_chunkString音频二进制流 base64 后的内容。

3. 输出参数

参数名称类型描述
ridString本次请求唯一 id
codeInteger状态码,成功为 0,错误为其他值
msgString状态信息,成功为 OK,错误为其他信息
dataObject返回数据,成功状态下有值,具体结构见下文

data 参数结构

参数名称类型描述
resultsArray匹配结果,具体参见下文 Result 参数结构。

Result 参数结构

参数名称类型描述
scoreFloat匹配分值。
labelString匹配标签。

4. 示例

示例1 成功返回匹配分值

用户通过上传一段 pcm 格式的录音经过 base64 编码后传入,成功返回匹配结果。

输入示例

POST / HTTP/1.1
Host: host
Content-Type: application/json
Path: /cloud/sc/v1/chunk

{
  "audio_chunk": "AAAAAAAAAAAAAAAAAAAAAAAAAADQ/z3/Hf8C/w//9/..."
}

输出示例

{
    "rid": "43b6700fc2d0c9203eaa35ff53dda7fa",
    "code": 0,
    "msg": "OK",
    "data": {
        "results": [
            {
                "score": 0.054281190037727356,
                "label": "off"
            },
            {
                "score": 0.05177304148674011,
                "label": "up"
            }
        ]
    }
}

5. 开发者资源

SDK

云 API 提供了配套的开发工具集(SDK),支持多种编程语言,能更方便的调用 API。

6. 错误码

以下仅列出了接口业务逻辑相关的错误码,其他错误码详见 公共错误码

错误码描述
10102001sc 转译失败,请稍后重试。