20世纪40年代,“声纹”概念首次在Bell实验室被提出。1966年,美国法院采用“声纹”进行取证后,声纹技术开始在司法场景应用。伴随声纹技术在金融行业使用的标准颁布,声纹技术落地应用迎来了开篇。
声纹识别又称“说话人识别”,与语音识别同属于语音前端信号处理环节。若语音识别的重点在于“说了什么”,声纹识别则解决了“谁说的”问题。因其非接触式特性,声音成为补全人脸、指纹、虹膜等生物识别的一种新方式。
继“刷脸”、“刷指纹”之后,声纹识别走进寻常生活。
“登录银行APP”
用户说出随机验证码,进行验证登录,即可进行余额查询、转账服务。
“开启车门”
车门应声解锁
“打开空调”
空调识别出是A主人说话,将温度设置成他习惯的24℃。
以随身“ID”的特性,声纹技术在金融、汽车、家居等场景迎来落地,其是否具备可用性、长效稳定成为用户对AI技术信任的重要考量。
“逆流而上”的硬核科技——声纹识别
疫情之下,声纹识别技术填补了远程身份验证的市场需求,在银行数字化转型里大放异彩。思必驰在服务西南某银行实现数字化转型中,将声纹识别技术纳入了升级的范畴。
声纹技术为银行数字转型注入新力量。中国信通院《中国声纹识别产业发展白皮书2.0》报告显示,截至2020年下半年,30家银行机构采购了声纹识别技术产品,其中动态声纹密码登录成为第一大应用场景,用于账号登录、转账、找回密码等业务场景。微信、支付宝等主流的移动支付平台,也陆续上线了基于声纹动态口令登录的功能。
信息来源:《中国声纹识别产业发展白皮书》
窥一斑而知全豹,思必驰深研多年声纹技术有了落地生根的土壤。除了作为全新的身份认证“活密码”为金融安全保驾护航,更在出行场景中,有了新尝试。
运用于电动两轮车领域的声纹解锁方案由此诞生,基于固定文本+随机验证码认证,融合文本相关和文本半相关的声纹识别方案,获得了比固定文本更高的声纹识别率,且有效防止被提前录音,具备了更高的安全性。
文本相关声纹,识别准确率高,但易被提前录音;文本半相关声纹,有效防止录音,但识别准确率欠缺。
思必驰声纹解锁方案基于“固定文本+随机验证码”(你好小驰3751),用户语音通过多麦语音增强技术,先判断内容是否与系统发送的验证码一致,再通过声纹识别系统进行身份确认。通过内容验证+声纹验证双重认证才能成功解锁。
声纹技术让解锁骑行的方式更自由。
对抗攻击,防御自有奇招
在实际应用中,声纹识别系统在对抗攻击性下体现出的安全稳定至关重要,基于此,思必驰采取了一系列技术手段。
声纹仿冒攻击技术
思必驰通过声纹ID检测判断是否为本人说话,并通过仿冒攻击技术对抗录音与合成音的攻击,加强了智能电子设备的私人属性。基于文本相关和文本无关的声纹融合方案,保证声纹准确率达到99%的同时误判率低至千分之五甚至千分之一 ,有效防止录音攻击和合成音攻击。
在开放场景下,例如地铁、马路、商场等高噪声场景下,仍能达到很好的效果。思必驰声纹识别系统达到国家金融权威机构认证的声纹技术安全标准。并通过了中国信通院主持的声纹识别服务能力基础评估测试,展示出了高可信度的产品及服务。
声纹识别开启个性化交互
声纹识别技术在民生场景层下沉。例如在家居产品中,基于声纹识别技术智能终端可以给予用户个性化推荐;车载场景下声纹识别能够完成语音解锁;安防场景下还可应用于声纹门禁等等。
通过声纹的辨声识人能力,家里的智能音箱可以为老人推荐戏曲,为小孩播放诗词,声纹技术产生了与全家人生活连接的天然契合。思必驰声纹识别技术已在美的空调、海信电视等多款家居产品中应用,为用户提供个性化的推荐服务。
声纹可控制各类设备的访问权限。穿戴产品中,思必驰通过骨传导低功耗唤醒技能避免他人误唤醒,并融合声纹技术实现语音交互、低敏感度APP解锁等功能,现已赋能多家手机厂商、移动电子设备的落地。此前雅迪发布旗下城市高端品牌VFLY,多款车型均具备声纹解锁能力,让出行更自由。用户声纹库可离线保存,数据更安全。
声纹技术仍需回归理性。未来,声纹识别技术将朝着声纹+智能,及多模态识别的方向发展。思必驰将持续挖掘不同场景下的技术开发需求,在标准的正确引导和业界的共同努力下探索AI精神,拥有广阔应用场景的声纹识别技术,定能走进更多普通人的生活。