人工智能是如何在嘈杂声中分辨特定声音的?

如题所述

人工智能是根据声源不同的声线和质地来区分的。实时分离多个声源,大大提高了自动语言识别的能力。人工智能设备已经能够处理独立个体的请求,但是和我们一样,在嘈杂的鸡尾酒会上或者几个人同时说话时,它们也会感到纠结。根据《新科学家》杂志官方网站最近的一篇文章,美国剑桥三菱电气研究实验室的研究人员开发的语音识别人工智能装置。


 这项技术首次在日本东京的先进技术展览会上公开展示。团队将其称为“深度聚类”机器学习,可以识别多个声源在“声纹”中的独特功能。然后,将每个说话者声音的不同特征组合在一起,允许它从多个声音中选择具有特定特征的声音,并最终重构每个说话者的语音。智能技术使用许多人说的英语进行培训和学习。即使说话者是日本人,也能轻松地分辨出来。


据介绍,传统的语音识别方法使用两个收音器模拟听者的两只耳朵的位置,只能达到51%的准确率。几十年来,“鸡尾酒会效应”困扰了AI研究几十年。新型智能系统能够成功分离两个人的声音,重构一个人声音的准确率高达90%。这项新技术可以帮助家庭和汽车更好地执行智能任务,一次可以分离多达五个人的声音,并可用于电梯、空调机组和家用产品的智能控制。


语音识别研究的目的就是让机器“听懂”人类口述的语言。包括两方面的含义:其一是逐字逐句听懂非转化成书面语言文字;其二是对口述语言中所包含的要求或询问加以理解,做出正确响应,而不拘泥于所有词的正确转换。语音识别系统从讲叙方式角度可分为孤立词、连接词和连续语音三种。从服务对象的角度可分为特定人与非特定人。即系统只针对一个用户或可用于任意用户。

温馨提示:答案为网友推荐,仅供参考
第1个回答  2019-11-18
人工智能通过提前输入特定的声音,然后就可以在嘈杂的声音中分辨出来。本回答被网友采纳
第2个回答  2019-11-19
这个是因为人工智能主要的编程是根据声源不同的声线和质地来区分的。
第3个回答  2019-11-19
因为每个声音的分贝都是不一样的,所以可以识别的
第4个回答  2019-11-18
我觉得可能还是因为他自己的系统的问题叭。