思必驰多设备选择算法“直面唤醒”,处处皆C位!

在5G、物联网以及互联网家装等因素作用下,智能家居市场已经展现蓬勃发展态势。着眼日常生活,家电卖场琳琅满目皆是搭载智能语音的电器家电,一个家庭中或多或少都会有几款智能设备。

应用火热的背后,同一场景下多款智能设备如何实现优先唤醒变成了一个问题。当智能音箱、电视、空调等共用一个唤醒词时,多台智能设备可能会同时被唤醒,产生“一呼百应”的现象。为解决此类问题,思必驰最新推出基于多设备选择算法的直面唤醒方案,判断更精准、更符合用户的交互习惯。

直面唤醒,拒绝“一呼百应”

针对在全屋智能一体化家居场景或卖场场景下多设备的情况,思必驰新推出“直面唤醒”方案,可以帮助用户优先唤醒其中某一个设备,避免几个设备同时被唤醒。

“直面唤醒”依据设备麦克风数据,多维度参考信噪比,唤醒置信度、混响时间、频响分布特征、声源定位等信息,通过计算指向性空间统计量反映设备自身参数指标。当多台相同唤醒词的设备在同一家居环境下连接到同一局域网内,凭借分布式组网策略下的设备间通信,基于所有设备的指标选取出最佳的唯一设备进行响应,其余设备保持静默。

依照“优先朝向,结合距离”的原则,我们从两个简化示例了解“直面唤醒”应用场景的工作原理。

图一

距离相近,依据朝向:图一中,人声到设备A、B的距离接近,A、B设备麦克风均朝向中间声源位置,形成90度角,此时面向A设备呼喊唤醒词则唤醒A,面向B即唤醒B。

图二

朝向相近,距离优先:图二中,人声到设备A的距离和设备A到B的距离基本相等,设备A在前,B在后。设备A、B麦克风均朝向声源位置,且两设备均在相近朝向角度上。此时在距离A前方一定范围内任意呼喊唤醒词时,均为A设备唤醒。

多设备选择算法,精准定位

VR游戏中,我们发现3D音效可以使人感受到声音的远近和方位;演员用抖动耳朵来表现分辨声源......人类的神经系统通过对比同一个声源到达两耳之间的时间差以及强度差,判断出声源的位置。

“直面唤醒”多设备选择算法优势之一,就是模拟人耳的算法模型。在提升准确率的同时,有效保障不同环境不同设备以及不同环境差异下的算法鲁棒性,恶劣环境下(如人声朝向设备距离稍远于就近非朝向设备或空间混响大噪声强时)依旧可以达到较好效果。

优势二即模拟真人使用习惯,“优先朝向,结合距离”选择被唤醒的设备。多个将要被唤醒的设备在距离相近情况下,算法依据发音朝向判断;在朝向相同情况下,则依据距离差异判断“就近唤醒”,做到精确、优先唤醒。

另外,多设备选择算法支持双麦、四麦、六麦,线性/环形麦克风阵列,依靠设备麦克风数据,多维度参考直达声、混响能量、频响特征、声源定位等信息,计算出设备自身参数指标,多设备比较后选出最优设备。

分布式组网,唯一唤醒

直面唤醒自然的语音交互体验,除了依托多设备选择算法的技术优势外,还得益于分布式组网策略的加持。

智能家居应用中,不同智能设备使用不同操作系统、通信协议和标准的现状导致用户体验相对割裂。在同一家居空间内存在有多台相同唤醒词的设备连接到同一局域网内时、打开“直面唤醒”功能,用户发出唤醒指令后,触发唤醒设备间借助无线局域网进行快速通信,选取出最佳的唯一设备进行响应,其余设备保持静默。

例如用户发出“小驰,小驰”唤醒词后,直面唤醒在分布式组网支撑下,可以精确定位指令发出的位置,且只会有最佳位置的一个设备响应用户需求,消除用户一次唤醒所有同唤醒词设备的尴尬。

除此之外,“分布式组网策略”还加入防抖机制,避免唤醒声间隔太近产生干扰;跨系统平台支持常用Android、Linux、RTOS操作系统进行多维度互联,网络变化时快速响应,通断自如;正常网络和设备性能下,唯一唤醒成功率达到99%。

万物智联时代,家居场景构建开启加速模式。思必驰在源头创新技术上坚持产学研一体化。借助全屋智能风起之势,思必驰将同各大终端厂商携手推进产品升级,为用户创造更便捷、更智能的交互体验。

添加回复:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。