基于阿里云智能语音交互(ISI)Java SDK,实现了一句话实时语音识别功能。下载代码并配置环境变量后即可直接运行。

实现效果预览
在这里插入图片描述

希望能帮助到有这方面开发需求的朋友。

代码地址:https://github.com/ZhiJingWu/ASR

Java SDK 官方示例文档中,仅提供了“完整音频文件识别”的示例,即先完成录音,再进行识别处理。因此整体耗时 = 录音总时长 + 识别处理时间,存在明显等待过程。

而官方演示效果采用的是“边录音边识别”的流式处理方式:在开始录音的同时即启动识别服务,音频数据实时上传并进行解析,实现录音与识别并行处理,从而大幅降低整体等待时间,识别等待时间几乎无感。
在这里插入图片描述
Tips:如果是语音指令操控设备,固定的几种语音输入,可以在阿里云模型管理增加热词,以提高输出结果的适配。
在控制台-自学习平台-热词 处下载demo后修改上传即可
在这里插入图片描述

Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐