语音识别asr

最近更新时间:2023-06-07 17:59:19 前往 Coding 编辑

导出文档

欢迎使用语音识别产品

产品介绍

语音识别(Automatic Speech Recognition,ASR)为开发者提供语音转文字服务的最佳体验,支持录音文件识别,实时语音识别,满足不同类型开发者需求,具备识别准确率高、接入便捷、性能稳定等特点。

产品功能

实时语音识别

对实时音频流进行识别,达到“边说边出文字”的效果,可应用于实时语音输入场景

录音文件识别

对录音文件进行识别,达到识别较长的非实时语音的效果,可用于字幕生成、录音资料转写等场景

产品优势

支持多平台设备

提供 HTTP API 和 SDK,支持智能硬件、移动应用、网站、桌面客户端和物联网等多种设备终端。

噪声环境识别佳

语音识别模型鲁棒性佳,识别精度高,抗噪声的干扰能力强,能够识别来自嘈杂环境的音频信息,不需要客户进行降噪处理。

应用场景

语音输入法

智能语音输入,由实时语音识别实现,为用户节省输入时间、提升输入体验。

语音消息转写

将用户的语音信息转成文字信息,由一句话识别服务实现,提升用户阅读效率。

字幕生成

将直播和录播视频中的语音转换为文字,由录音文件识别服务实现,轻松便捷地生成字幕文件。

会议纪要

将会议、庭审、采访等场景的音频信息转换为文字,由实时语音识别服务实现,降低人工记录成本、提升效率。

电话质检

将坐席通话转成文字,由实时语音识别服务或录音文件识别服务实现,全面覆盖质检内容、提升质检效率