声智科技：用声音智能赋予万物生命

2020年2月2日，在疫情吃紧的时候，广州首次在确诊患者的门把手上检测出新型冠状病毒核酸，这给当时的疫情防护工作带来了巨大的挑战，但同时也进一步让民众知道了防护的重要性。

之后，广州市疾病预防控制中心副主任张周斌，在采访中就讲到，“如果病毒附着在物体表面，自己的手触摸到被污染物体表面后进食、揉眼睛等动作，可能会造成自己感染。”

但无论是需要接诊的医院，还是机场、车站、生活小区还是办公场所，都绕不开电梯这个交通工具，因此它成为了此次防疫的焦点。虽然各种民间的防疫办法层出不穷，抽纸、牙签、保鲜膜……但这些方法不仅隔离效果有限，还很容易因为回收不到位，造成二次污染。

这让我们不禁想问，针对电梯按键可能会出现病毒的情况，难道没有更高效的解决方法了吗？

为此北京声智科技有限公司（以下简称“声智科技”），给出让我们放心的答案，他们是如何做到的呢？

可视化AI语音电梯，解决乘梯难题

你乘坐电梯的时候，只需要喊出“小易，小易，上楼，下楼”，不用按键电梯就会到达你所在的楼层，进电梯后，再次呼叫小易，告知想去的楼层，这层楼的按键就会被点亮。声智科技的可视化AI语音电梯，帮我们实现了乘梯的“全程零接触”。

考虑到国内的方言情况，该系统不仅支持普通话，还支持四川话、河南话、粤语等8种方言，真正的做到了科幻小时候里的情节，只要你说句话就能带你去到目的地。

图片6.png

难得的是，智能科技把乘梯的五个细节，都考虑的很全面，让乘梯人无论是老人、儿童还是行动不方便的人士，都可以做到初次的无障碍使用。

1.搭乘电梯不需要按键，直接语音呼叫电梯就能到达你所在的楼层，第一次使用，还可以参考，他们准备的可视化交互引导使用，简单易学轻松上手。

2.考虑到电梯使用环境复杂，如果噪音太大会造成呼叫电梯的指令不清晰，声智科技就在电梯门按键板上，安装了拥有麦克风阵列技术的外呼语音系统，让电梯可以在复杂的声场环境中精准识音，控制电梯到达指定楼层。

3.上电梯后，电梯轿厢内的智能互动屏，也同样融合了图像技术、麦克风阵列技术、语音识别技术等，智能屏听到指令后，会自动进行语音识别并输出，乘梯人看到指令错误可以做出修改，保证自己被送达指定楼层。

4.此外，为了保证乘梯人安全，还安装了视频通话功能，在发生紧急情况时，乘梯人可以通过电梯智能屏直接对外呼叫，监控人员也可以第一时间展开紧急救援，并通过视频通话为乘梯人提供救援指导。

5.为了加强防疫工作，该AI语音电梯整体解决方案，还支持异常检测和声纹识别功能。异常检测可以让管理人员实时掌握电梯轿厢内的情况，做好第一时间的排查、防控和管理；声纹识别可以判断乘梯人身份，帮助该社区居民或办公楼做好疫情防控的数字化管理。

因此，满足了乘梯人使用的便捷度，安全性，以及在防疫中的可控性，更难得的是声智科技推出的这套AI语音整体解决方案，不需要更换电梯，还能兼容多种主流的电梯设备，可以快速的让防疫方案尽快落地。

截止3月2日，仅北京市海淀医院安装运行的首台可视化AI电梯，就已经完成了8000余次呼梯工作，让越来越多的用户实现了无接触乘梯。

据了解目该方案已落地全国11省市的商场、写字楼，全方位助力实现无接触防疫工作。更重要的是“AI语音电梯”研发的意义不仅仅是在抗疫中，在疫情结束之后，它还将推动电梯行业走向智能化，成为未来电梯使用常态。

用AI利器，改善战疫中的生活

除了AI语音电梯，声智科技还在AI医疗智能屏和AI外呼机器人助力医院和一线工作者。

疫情期间，很多医院因为援鄂出现人手短缺，出现了管理压力。为了减少因进出医院而被感染的几率，声智科技推出了AI医疗智能屏。医疗人员可以通过10寸的智能屏，用视频通话，实现远程问诊和测温提醒，以便及时发现疑似病人。

疫情初期，很多患者和普通民众急需心理辅导和咨询，苦于无处求助，但通过智能屏医生就可以进行在线疏导，及时给予民众更多的关怀，真正做到了，在疫情期间不仅要守住民众的生命，也要心理防线。

另外，从疫情开始，一线工作人员就超负荷工作，甚至有很多人因为过度劳累倒在了自己的岗位上，但疫情平稳婚后伴随着返程高峰、复工高峰的到来，成千上万奋斗在一线的工作者，不仅得不到休息，还会工作量会剧增。

例如疫情期间出现了，基层居委会的工作人员，全体8小时不间断拨打电话通知口罩预约登记信息，但最后统计每人每天也只能呼出不到200通电话。所以，为了节省社区人员的宝贵时间，口罩预约电话外呼的工作，就被声智科技AI抗疫外呼机器人就正式接管了。

它不仅可以实现同时拨打120通电话，还可以自动快捷呼叫，如果我们按照平均每通电话3分钟计算，一天打满10小时，呼叫量最高可达24000通，一天就可以节省120个社区工作人员的工作，上海市浦东新区培花三居委的社区就是试点，这里的居民就接到的口罩预约购买通知就都是AI抗议外呼机器人拨通的。

这类型的机器人除了外呼工作，还可以协助社区、机构工作人员进行居民信息采集，包括个人身份信息确认、近期活动区域、近期接触人群、提问情况、健康情况，并对居民说过的特定信息进行标记。

基层社区工作人员，就可以根据机器人自动生成的数据报告，在做好防护的基础上，上门走访系统标记过的重点防控对象，既缓解排查的工作压力，又有效避免交叉感染的风险，提升防疫工作的精准度与效率了。

同样的这种AI防疫外呼机器人，不仅仅适用于社区的疫情防控，声智科技还为它设置了多个话术模板，对于金融机构、电信运营商等企业的业务咨询、查询、办理等场景。

以银行为例，AI外呼机器人，不仅可以帮银行拓展线上业务，提升给用户提供金融服务的可能性外，尤其在个人信用卡逾期账单的缴收、保险到期的提醒等日常不太需要人工维护的业务有很大的优势。一方面可以短时间完成大量工作，节省人力成本；另一方面，可以同统一制定的标准话术中分析到用户的意愿，提高销售的成功率。

因此，无论是可视化AI语音电梯、AI智能医疗屏、AI外呼机器人，它们既是防疫期间的特殊需求，也是未来无接触服务的新趋势，这种趋势不会随着疫情的消失而消失，反而会进一步加深对这方面的需求。

声智科技就在我们身边

从智能音响、到机顶盒，这几年智能家居的概念其实早就越深入人心了。

图片7.png

但作为一个2016年刚刚成立的公司来说，声智科技在此次防疫中，能够突出重围，不仅因为他们拥有过强的底层技术，更是因为声智科技把底层技术，转化为产品，又找到家居、车载、游戏、安防四个场景，具体服务于金融企业、家电厂商和运营商，建立了自己的商业闭环。

技术上，声智科技是远场语音技术天然兼容近场语音。由于现实生活中空间物理特性，声信号会随着距离的增加快速衰减，，因此远场语音对声学处理技术要求更高。因此，想要获得优质的远场语音信号就需要对声学信号进行专业化处理，包括降噪、beamforming、去混响等。

此外，在语音交互深度学习模型训练时，想获得准确度较高的模型，优质的数据必不可少，而想要获得优质的数据则需要扎实的声学信号处理功底。

经过不断的研发，目前声智科技凭借在声学信号处理领域领先的技术优势成功研发出提供2-8麦克风阵列方案、单麦和双麦方案等。其中麦克风阵列集成了全方位唤醒、声源检测、定向拾音、噪音拟制、混响消除、回声抵消、声纹识别等多项技术。其中远场语音5m平均识别准确率达到95%。

除麦克风阵列硬件产品外，声智科技还提供融合远场语音交互和远场实时通话技术的智能语音交互系统SoundAI Azero，并且提供从端到云的智能语音交互技术和服务方案。

拥有了领先的技术后，声智科技就极力寻找智能语音产品落地的方式，最终找到了决定进军智能音响。但只要谈到人工智能技术落地，智能音箱Echo就是一个绕不开的存在，它给声智科技树立了很好的标杆。

详尽研究后，声智科技发现Echo的热销不在于功能上的创新，而在于语音交互从近场升级为远场，并把精度和速度打磨到非常优秀的程度。

这也正是声智科技的优势，于是通过使用最先进的麦克风阵列前端处理算法，对目标说话人的声音进行远场增强并匹配远场语音识别，使得即使距离麦克风5米远仍能准确识别语音指令，实现技术链条中最核心的一环。但对于如何解决传感器、芯片与麦克风阵列的不兼容性与不一致性，仍然面临巨大挑战。

同时，为了催熟市场，声智科技一边撰写了大量的技术文章，普及行业技术和战略认知差异，一边布局商业概念，想通过教育市场、形成商业闭环、打造经典案例的方式，推动产品的最终落地。

这样做就可以让更多的人认识到这个行业的前景，也能让其他人知道，自己在做什么，研发的技术能解决什么样的问题。但仅仅拥有了商业概念，产品没落地，就不能实现现金流入，打造商业闭环。为此声智科技通过不断优化底层OS平台体系架构使的麦克风阵列芯片能够兼容不同传感器与芯片。

声智科技为了克服这个困难，努力游说传感器厂商、芯片厂商进行产品升级，使得新一代传感器不会因为麦克风的不同而出现精度差异，从而提高产品质量。

最后，在2017年7月，声智科技于小米达成了合作，为小米AI音箱提供领先的环形6麦阵列和唤醒技术方案，名声大噪之后，又于百度、阿里巴巴、腾讯、华为、中国移动达成合作，提供基于麦克风阵列的软硬件一体化服务。

图片8.png

根据Canalys数据显示，今年以来智能音箱出货量1400万台，主要提供厂商为阿里巴巴、小米与百度，占比超80%，而这些厂商智能音箱的远场语音交互解决方案均有声智科技参与。

至此，基于典型案例打造，声智科技成功将产品跟全产业链条结合，实现了商业落地，得到社会及资本的认可。智能音响成功落地后，虽然受到了市场的欢迎，但声智科技判断，音响并不是智能家居生态控制中心的较好选择。

因为人接受信息的渠道81%来自于视觉，输出渠道90%来自于听觉。视觉和听觉的结合，是体感性更强的交互方式。因此人机交互才是用户更喜欢的图像结合语音方式。

相较于音箱来说，声智科技认为机顶盒能够释放更多维度的内容和想象力空间。百科、地图、购物等功能，更可以借助电视屏幕丰富人们的感知生活。更为重要的是因为机顶盒的销售最终会到C端，所以这也许会是声智科技的下一个机会。

可要做这个转变，声智科技就不得不挑战更大的技术难题。例如如何使得机顶盒的麦克风能够在电视机噪音的影响下，准确识别出用户的指令，这对声学处理具有较高要求。更难的是盒子的喇叭变得不重要，HDMI输出中的非常重要的技术Open AEC也需要重新去攻克。

其实从直观使用上我们就可以看出，原来盒子的界面都是基于遥控设计的，但声智的机顶盒完全是基于语音进行设计。为此，声智科技通过建立专业声学数学模型，不断测试麦克风阵列技术，针对智能机顶盒多维度的交互场景打造了定制优化的经过量产验证且成本可控的远场语音交互解决方案。

在机顶盒的专属远场语音唤醒、识别方面，声智科技推出了基于SoundAI Azero的回声抵消技术和垂直抗强噪识别等专属技术，大幅提高远场语音唤醒的准确率，实现全方位的精准唤醒，并减少无序唤醒干扰，兼顾误唤醒率。

最终声智科技于2018年5月份携手阿里巴巴研发出天猫魔盒，又率先实现产品落地，满足用户对更自然的人机交互的真实追求。

写在最后：

很多对这种只提供技术的发展方式提出了质疑，但声智科技表示，国内市场和国外不一样，国外是亚马逊垄断了所有的零售渠道，只有沃尔玛有线下竞争，但国内是典型的消费分级市场，差异化极大，而且国内市场可以划出是个层级，每个层级有1亿多人，就能有10个巨头。

中国的经济体量，足够支撑很多巨头公司诞生，而且随着国内改革的深入，还会释放出更多的红利，会有更多的公司需要专业的企业服务和更好的技术。因此对于，声智科技来说，未来to B服务是一个巨大的市场，会继续稳扎稳打、踏踏实实，专注地做好自己的事情。

声智科技：用声音智能赋予万物生命

相关推荐

评论