华为EMUI的小艺长大了——看下图,猜一猜这一次小艺又进化了什么能力?
天啦,语音操作下,你想插嘴打断就打断了?嘈杂环境下,怎么不被噪声干扰?
华为EMUI语音助手长大了,升级EMUI10后的智能语音多了这个功能,可识别主人声音,瞬间让智能语音好用很多。长按电源键1秒唤醒小艺:惊不惊喜,意不意外!这么“skr”的能力,让我们细细说来。
过滤掉噪声,扫除基础障碍
实现插嘴打断的第一步,是让小艺在嘈杂环境下,清楚地识别出人声。声音本质是携带信息的能量波,为了把你的声音从茫茫的噪声海中pick出来,小艺通过音频降噪和语音识别降噪,共同抑制噪声能量、增强人声能量。
如果说在嘈杂的背景声中选出人声属于众里寻他千百度,那旁边有人在大声说话、能量波强度也相似的干扰场景就属于真假美猴王了。对于这个问题,小艺使用华为特有的VAD和ASR识别机制来解决。
普通的VAD技术可以识别出噪声和人声。而华为特有的VAD结合ASR识别机制,可以区分出噪声、无效人声、有效人声。做到噪音和无效人声不识别,当前有效人声才能识别。
消除播报的回音,清扫第二只拦路虎
既然能在嘈杂环境下识别出你的声音,那随时打断小艺,也就是小意思了。但插嘴打断是在播报时候进行的,那就不可避免的会把手机语音播报的内容给收进去。理想的方案是回声消除法:即用原始音消除播报回声的能量。
现实中,因为器件和声音外放的原因,声音的波形会发生变化,实际的回声声波和原始声波不能成线性,说人话就是不能消除。
这就轮到华为独特的AI消噪技术上场了。它引入深度神经网络来训练智能的语音识别声学模型,消除变形的能量。
不是对我说的话,我绝不会误解
过滤掉这两种干扰后,当你在小艺播报过程中打断它时,它都能准确识别出你的声音、理解你的意图,并做出回应。或许你还有一个疑问:小艺播报时我跟旁人的对话,岂不是也会打断小艺?
不会的。小艺引入了强大的意图分类模型,通过把文字识别成意图,可以分辨出你是否在对它讲话,从而避免被干扰。
经历了九九八十一难,你的语音在各种干扰的情况下,经历了语音转换和语义识别,实现了嘈杂环境、人声干扰、播报回声干扰中的识别,最终成功插嘴打断。
成人的世界没有一件事是容易的。
不过再难,小艺也会与你一路同行,共同成长。
这么好用的语音助手黑科技哪里有呢?在装有EMUI10的全新Mate30系列手机上,快快体验一下吧!
欢迎关注 [ 华为手机功能教程] ,人人都做手机达人。
推荐阅读:云南之窗
-
上海这家餐厅茶点有特色,人均消费不足100元
上海这家餐厅茶点有特色,人均消费不足100元,好吃到撑解封了,上班了,一切都在回归的路上。中国加油!武汉加油!阳春三月,万物复苏,宅了这么久,是不是也想约上三五...
2020-03-18 -
我国重名最多的一座山,足足有19个相同名字,
如今我国在对一些新生儿起名字的时候,我国如今有很多人在给他们起名字的时候,有不少都是重复的,这已经不是什么新鲜事情了,而且在我国众多的一些景点中看,也是有不少重...
2020-03-18 -
北方的九寨沟,拥有华夏第一秀水,它是河南最值
我是旅图君,笔耕不辍,只为讲述旅途中更精彩的故事!一直挺喜欢河南这个地方,因为这里是中华文明的发祥地之一,从夏至宋,河南是华夏五千年政治、经济、文化的核心。因为...
2020-03-18 -
北方有这样的山水,开始我还不信,王维在这里“
河南景区,少林寺名气最大,不过被黑的不轻。单说风景漂不漂亮,在河南当属焦作云台山,《中国国家地理》曾经说过:太行山,把最美的一段给了河南。为什么这么说?因为水!...
2020-03-18 -
天下第一名山,道家追求仙境的理想之地,传说有
天下第一名山,道家追求仙境的理想之地,传说有个人得道飞升巍巍武当山,绵延八百里,它是世界文化遗产,也是集建筑、宗教、文化于一体的“天下第一名山”,吸引着世界各地...
2020-03-18 -
河南最受欢迎的人造景区,门票120元,游客络
最近几年期间,我国的经济得到了快速的发展,其不仅体现在人们的工资水平提升上,还体现在我们日常出行方式中。例如这几年的动车、高铁,已经是四通八达了,许多城市的镇里...
2020-03-18