机器人超脑—多模态交互模块

产品亮点:无需唤醒词,人脸唤醒率99%; 同波束人声噪音下识别准确率94%; 多人语音分离准确率91%; 适合高噪音场景下机器人交互。

展品介绍

视听融合的感知交互,融合了语音、视觉、语义等多个维度的信息定义了包含开启交互、交互保持、切换交互权和结束交互在内的机器人交互新范式。人脸、唇形与语音信号相融合的多模态降噪,使得机器人能够在嘈杂、高噪场景下精准拾音,利用语音大模型和超拟人合成来促使机器人聊天更有生命力,声音复刻和高表现力的语音合成能够提升机器人对话的感染力。

请扫描二维码关注大会官方微信

获取有关世界机器人大会的最新动态

中国电子学会 © 2015-2024 All rights reserved备案号:京ICP备12041980号-10