机器人超脑—多模态交互模块
产品亮点:无需唤醒词,人脸唤醒率99%; 同波束人声噪音下识别准确率94%; 多人语音分离准确率91%; 适合高噪音场景下机器人交互。
展品介绍
视听融合的感知交互,融合了语音、视觉、语义等多个维度的信息定义了包含开启交互、交互保持、切换交互权和结束交互在内的机器人交互新范式。人脸、唇形与语音信号相融合的多模态降噪,使得机器人能够在嘈杂、高噪场景下精准拾音,利用语音大模型和超拟人合成来促使机器人聊天更有生命力,声音复刻和高表现力的语音合成能够提升机器人对话的感染力。