【ASR】阿里云智能语音交互(ISI)Java SDK
而官方演示效果采用的是“边录音边识别”的流式处理方式:在开始录音的同时即启动识别服务,音频数据实时上传并进行解析,实现录音与识别并行处理,从而大幅降低整体等待时间,识别等待时间几乎无感。中,仅提供了“完整音频文件识别”的示例,即先完成录音,再进行识别处理。因此整体耗时 = 录音总时长 + 识别处理时间,存在明显等待过程。基于阿里云智能语音交互(ISI)Java SDK,实现了一句话实时语音识别功能
·
基于阿里云智能语音交互(ISI)Java SDK,实现了一句话实时语音识别功能。下载代码并配置环境变量后即可直接运行。
实现效果预览
希望能帮助到有这方面开发需求的朋友。
代码地址:https://github.com/ZhiJingWu/ASR
在Java SDK 官方示例文档中,仅提供了“完整音频文件识别”的示例,即先完成录音,再进行识别处理。因此整体耗时 = 录音总时长 + 识别处理时间,存在明显等待过程。
而官方演示效果采用的是“边录音边识别”的流式处理方式:在开始录音的同时即启动识别服务,音频数据实时上传并进行解析,实现录音与识别并行处理,从而大幅降低整体等待时间,识别等待时间几乎无感。
Tips:如果是语音指令操控设备,固定的几种语音输入,可以在阿里云模型管理增加热词,以提高输出结果的适配。
在控制台-自学习平台-热词 处下载demo后修改上传即可
更多推荐
所有评论(0)