博联开展《智能网联汽车中语音交互的全链路技术应用及未来发展趋势》主题讲座

发布时间:2022年09月02日 15:44:27 博士大讲堂

8月31日,由清华大学苏州汽车研究院、苏州博士联合会等联合主办的线上讲座《智能网联汽车中语音交互的全链路技术应用及未来发展趋势》成功举办。本次讲座主讲人为同济大学博士后、清华大学苏州汽车研究院智能座舱所技术专家姜彦吉博士。


微信图片_20221019103256.png

微信图片_20221019103308.png


讲座中,姜彦吉博士以生活中常见常用的语音交互服务案例开篇,将车载语音交互技术分为车载麦克风阵列、语音前端处理技术、语音识别、自然语言处理,最后到语音合成几个任务模块,全面介绍了智能语音交互的整条技术链路,并对未来车载语音助手的发展趋势做出分析。姜博士介绍了常见的几种车载麦克风阵列形式的特点,基于麦克风阵列进行回声消除,说话人定位,语音增强和语音分离的任务实现,这些语音前端处理技术是保障交互系统拾取语音信号清晰度和可懂度的关键。其次,随着语音识别技术在车载复杂噪声场景中性能的增进,也提升了交互系统的性能下限。语音信号中的声纹特征,情绪特征也使得交互助手能提供更具情感化的个性服务。再次,姜博士以生活中中文的多种表达方式为例,由浅入深地介绍了自然语言理解技术,在知识图谱的助理下,基于自然语言理解的对话管理策略设计,是打造品牌差异化语音助手的核心。然后将生成的语言回复进行韵律自然、富有情感的语音合成,即完成了整个交互链路的技术流程。


最后,姜博士对未来人车交互的发展趋势做出了总结和展望:“未来的人车交互将基于多种模态的感知处理,达到对客观世界的全面认知,基于多维数据的综合分析,提高AI决策精度,将向具有推理、可解释性的认知能力演进,最终实现情景自适应的知识推理和学习。”

最新资讯