智能音箱都有什么硬科技?

麦克风阵列

eFashion Magazine - - 第一页 -

一个语音产品方案由三部分组成,硬件前端涵括麦克风阵列、降噪算法、芯片、硬件平台等,云端包括语音识别和语义理解、语音数据,内容合作有音乐、天气、短信、通话等应用工具。作为硬件前端,智能音箱非常重要,如果没有好的语音数据收集、降噪、输出,何谈语音识别和交互呢?

无论是Echo、google Home、叮咚还是最新的天猫精灵x1,通过拆解后都可以发现,智能音箱的硬件结构并不算复杂,均采用模块化设计,但它将声学设计、无线技术、语音识别、远场拾音、语义分析等众多技术融合在一起,要想获得比较满意的效果,需要各个模块结合外形设计、生产工艺、算法设计、产品体验等多个方面进行细致打磨,有时候甚至不得不痛苦折中。

外形、扬声器及音腔

作为现代智能家居生活的中枢,智能音箱的外形设计非常考究,不一定 都要获得“红点”大奖,但至少应该赏心悦目,形状、大小、灯效甚至重量等因素都要考虑到。同时,为实现更好的交互效果,还要通盘考虑和音腔设计(影响音效)、麦克风阵列方案的相互耦合以及音腔和扬声器之间的距离。

智能音箱本质上还是音箱,需要提供用户认可的音质— —即便去掉智能性成分,Echo同样是一款不错的音箱,和同价位的蓝牙音箱相比具备一定的可比性。但为支持全双工交互(语音反馈和监听同步进行,支持随时语音打断,对非相关语音拒识),扬声器的功率不能太大(最大音量降低),反之则降低了语音识别的灵敏度。

Echo采用封闭式扬声器设计,高低音单元上下并列,声音各方向对称,有利于前端信号处理,但音效受限。

这是智能音箱的核心部分,主要用于远场识音,由两个以上按一定几何结构(常用线形、环形)摆放的麦克风组成,用来对声场的空间特性进行采样并处理。在唤醒状态下,麦克风阵列会进行复杂的语音信号处理,实现噪声抑制、混响去除、人声干扰抑制、声源定位、声源跟踪、阵列增益等功能,进而提高语音信号处理质量,以提高真实环境下的语音识别率。

智能音箱多采用环状麦克风阵列,目前以6(+1)麦为主流方案,也有2、4和8麦的产品。虽然麦克风本身成本并不特别高,但增加麦克风数量需要配套增加采样等后续硬件的投入,会大大增加成本。

声源定位和波束成形

这是语音交互中很重要的两项技术,前者基于麦克风阵列计算声源的角度和位置,实现对目标说话人的跟踪以及后续的语音定向拾取,是人机交互、音视频会议等领域非常重要的前处理技术。后者基于麦克风阵列中各个麦克风接收的声音进行信号处理(如加权、时延求和等),形成朝向音源的一个小范围的拾音波束区域,同时抑制目标声音以外的声音(环境噪音和其他人声)干扰,它也是实现声源定位主要应用的一种技术。

在开启多轮对话后,语音交互系统一般会优先默认第一说话者为拾音主方向,同时抑制其他方向声音,以保证交互的顺利进行。这也是为何现在的智能音箱不能同时和多人进行交互的原因。

原声降噪

李开复说:“解决噪音麻烦,追求真实环境下更自然人机交互方案,提升远场语音识别率是当务之急,否则99%的语音识别项目会死掉。”这首先就涉及到声学处理前端的“降噪”问题,也就是我们常说的“原声降噪”(噪声抑制)。

从字面意义来讲,原声降噪就是在目标信号和干扰噪声中,保留目标声音,削弱周围的噪声,从而保证获取的目标声音信号相对清晰。智能音箱再结合云端相匹配的语音识别算法,实现有效识别理解。

那什么是“噪声”?原则上,除目标音源以外的声音都应该被称作噪声,包括背景噪声(通常不具有空间指向性,能量也不是特别大,不会掩盖正常的语音,但会影响语音的清晰度和可懂度)、混响、回声等,因此语音前端技术中的声源分离、抗混响、回声消除、语音增强等造就了原声降噪,从而帮助 远距离识音实现噪声分离,提取目标信号,并增强语音信号能量,最终提升语音识别效果。

智能音箱应用场景主要在室内,由于空间反射、衍射,使麦克风阵列接收到的信号除了音源直达信号外,还有多径叠加信号,造成严重干扰语音识别的混响(回声是混响的延伸概念,区别是前者的时延更长)问题,这也是麦克风阵列原声降噪的一个重点。目前,语音增强、波束成形、逆滤波等是抗混响的主要方法。

其他技术

智能音箱的主控板和手机等移动设备的主板在本质上并无差别,包括主板、CPU、存储器等。主控板的选择会在满足响应延迟的前提下,尽量压缩成本和功耗。

智能音箱是由Wi-fi音箱发展而来,因此wi-fi连接对语音交互非常重要,但实际应用中往往会出现延迟较大、切换较慢甚至掉线等问题。对此,工程师一般在硬件和协议上做些优化,或者采用一定的算法进行适配,因为大部分Wi-fi音频传递的都是解码后的音频流,这很容易造成丢帧现象。另外,随着智能音箱浮点运算能力的加强,也可以考虑传递编码的音频文件流,当编码的时候就针对Wi-fi的问题提前做出冗余,会大幅提高wi-fi方面的性能。

Newspapers in Chinese (Simplified)

Newspapers from China

© PressReader. All rights reserved.