语音识别 内容详情
语音识别行业现状分析
 语音识别 2018-04-25 13:46:44

  随着机器学习和人工智能的热闹,国内语音行业也可谓是百花齐放,尤其是最近几年,不仅涌现了很多国内外的小公司,而且巨头们也开始加速语音识别行业的布局。以下对语音识别行业现状分析。

  在众多商业化应用中,输入法、车载语音、智能家居、教育测评是语音识别最为普遍的应用模式。其中,输入法是最为优质的数据入口,由讯飞、百度、搜狗三家独占;教育测评也是发展较成熟的一类,目前市场上各类外语教学、测评软件,都有不错的数据流量;而社交软件的流量则被腾讯抢占了,在这种情况下,新兴的语音识别公司不得不另辟蹊径。

  对于新崛起的科技公司,硬件搭配语音识别是一个很普遍的应用模式,例如云知声做智能家居,思必驰做智能车载语音系统,出门问问推出智能手表。由于智能家居、车载语音、手表本身的场景要求,其需要处理的语音复杂度较低,对于数据流量的要求也没那么苛刻。至此,数据流量几乎被全部抢占,后来者能参与的只是商业模式的复制和差异化。

  任何时候提到语音识别,都不能避过Nuance这家公司,这家公司曾经在语音领域一统江湖,世界上有超过80%的语音识别都用过Nuance识别引擎技术,其语音产品可以支持超过50种语言,在全球拥有超过20亿用户,几乎垄断了金融和电信行业。就算现在,仍旧是瘦死的骆驼比马大,Nuance依旧是全球最大的语音技术公司,掌握着全球最多的语音技术专利。苹果语音助手Siri、三星语音助手S-Voice、各大航空公司和顶级银行的自动呼叫中心,刚开始都是采用他们的语音识别引擎技术。Nuance已经登陆了纳斯达克,三星、苹果和百度都和它传过绯闻,传言多次收购,但是全都无疾而终。

  事实上,Nuance有点过于自大了,语音技术即便冠绝全球,但是在具体应用上,差距就没有那么大了。语音识别技术并非高不可攀,实际上一款用户体验较好的语音识别系统,很大程度上依靠数据和经验,专利和算法什么的并没有那么重要。聪明人自然很多,所以巨头们只需考虑挖到专业人士或者收购初创公司,自主研发出不逊于Nuance的语音识别技术也不是太难的事情,又何必花费巨资看Nuance脸色呢。

  语音识别主要有以下五个问题;⒈对自然语言的识别和理解。首先必须将连续的讲话分解为词、音素等单位,其次要建立一个理解语义的规则。⒉语音信息量大。语音模式不仅对不同的说话人不同,对同一说话人也是不同的,例如,一个说话人在随意说话和认真说话时的语音信息是不同的。一个人的说话方式随着时间变化。⒊语音的模糊性。说话者在讲话时,不同的词可能听起来是相似的。这在英语和汉语中常见。⒋单个字母或词、字的语音特性受上下文的影响,以致改变了重音、音调、音量和发音速度等。⒌环境噪声和干扰对语音识别有严重影响,致使识别率低。

  以上介绍了实现语音识别系统的各个方面的技术。这些技术在实际使用中达到了较好的效果,但如何克服影响语音的各种因素还需要更深入地分析。目前听写机系统还不能完全实用化以取代键盘的输入,但识别技术的成熟同时推动了更高层次的语音理解技术的研究。由于英语与汉语有着不同的特点,针对英语提出的技术在汉语中如何使用也是一个重要的研究课题,而四声等汉语本身特有的问题也有待解决。以上就是笔者对语音识别行业现状分析了。

热门推荐

相关资讯

更多

免费报告

更多
语音识别相关研究报告
语音识别相关研究报告
关于我们 帮助中心 联系我们 法律声明
京公网安备 11010502031895号
闽ICP备09008123号-21