文章列表

低延迟流式语音识别技术在人机语音交互场景中的实践

正坤 鸿雨 李敏 飞飞 丁科 广鲁
美团语音交互部针对交互场景下的低延迟语音识别需求,提出了一种全新的低出字延迟流式语音识别方案。本方法将降低延迟问题转换成一个知识蒸馏过程,极大地简化了延迟优化的难度,仅通过一个正则项损失函数就使得模型在训练过程中自动降低出字延迟。在实验测试集上,本方法能够获得最高近 200 毫秒左右的平均出字延迟降低。 阅读全文

美团深度学习系统的工程实践

剑鹏
深度学习作为AI时代的核心技术,已经被广泛应用于多种场景。本文将介绍美团在实际工程中,如何设计和实践深度学习相关的NLU线上系统和语音识别训练系统。 阅读全文