综合考量国家政策目标与车企计划缘由
中药常识 2020年04月19日 浏览:3 次
百度研究出深度学习语音识别系统DeepSpeech,嘈杂环境下识别率超Google、苹果
不久前,百度的首席科学家吴恩达(Andrew Ng)在接受采访时曾谈到了百度最近人工智能项目的进展情况,强调了近期百度重点是攻关语音识别。现在他们已在这方面取得了突破。
这项成果的名字叫做Deep Speech,是一款采取深度学习技术的语音识别系统系统。其独特之处在于,它可以在饭店等喧闹环境下实现将近81%的辨识准确率。
81%的准确率听起来似乎不算高。但是同样环境下,其他的商业版语音辨认API,包括Bing、Google以及等的最高识别率也只有65%。相比之下这就算十分突出的表现了。而且依照吴恩达的说法,这样的结果依然低估了Deep Speech与其他语音辨认系统的准确率差异,由于Deep Speech进行比较时还把其他语音识别系统那些返回空白字符串的结果排除在外了。而且Deep Speech跟顶级的学术型语音识别模型(基于流行的数据集Hub5 00建模)相比也高出9个百分点
。
百度首席科学家吴恩达称尽管这还只是一项研究,但是公司正在斟酌将它集成到供智能和Baidu Eye之类的可穿戴设备使用的语音辨认软件当中。而且百度还在开发与Amazon Echo类似、集成有语音助手的家电产品,名字叫做CoolBox。除此以外,百度在开发的智能自行车固然也能利用Deep Speech技术。
Deep Speech的基础是某种递归神经络(RNN),这类递归神经络经常被用于语音识别和文本分析。
但是Deep Speech的成功主要得益于一个长达10万小时的语音数据训练集。这是百度人工智能实验室团队用新颖的办法在嘈杂环境下建立的。其过程大致是这样的。首先百度搜集了7000小时的语音会话数据,然后再将这些语音文件与包含有背景噪音的文件合成到一起,最后构成约10万小时的训练集。这些背景噪音包括了饭店、电视、自助餐厅和汽车内、火车内等场景。相比之下,Hub5 00的数据集总共只有2300小时。
固然,这么庞大的数据大多数系统都不知道如何去处理。吴恩达表示,Deep Speech的成功很大程度上要取决于百度范围庞大的基于GPU的深度学习基础设施。GPU(图形处理器)常常是偏数学型计算的首眩许多深度学习系统都采用GPU避免通信瓶颈(不过微软的深度学习系统Adam 却走了不同的线路),但是像百度这样大规模的设施却是少见的。
百度的另外一大改进,是对这个庞大的数据集采用了端到端的深度学习模型,而不是标准的、计算代价高昂的声学模型。传统上一般都会把语音识别分别为多个步骤,其中一步叫做语音调适,但是百度却不做这一步,而是给Deep Speech的算法提供大量的数据,然后让它去学习所有需要学习的东西。这类做法除了收获了准确率以外,还显著减少了代码库的规模。
这项研究是吴恩达领导的百度人工智能实验室多位研究人员的努力成果,论文发表在了康奈尔大学图书馆的站上,感兴趣的可到此处下载。
小孩健脾胃的药有哪些宝宝健脾胃什么药好孩子不消化怎么办汕头华丽医疗美容医院何斌
云南十佳妇科医院
双效希爱力和礼来希爱力的效果
益母颗粒怎样吃
脑梗塞用药可以吃通心络吗
小孩不消化发热怎么办
三亚癫痫病治疗费用一岁宝宝脸发黄是什么原因
月经后期咖啡色物怎么办

- 上一篇: p想要打造环保家居吗缘由
- 下一篇 超低排量轿车适合我国国情吗
-
幸福快乐国米天王国米一直是我的球队不知道自己的未依依不舍
2020-06-22
-
五穴位助你止秋咳
2019-07-11
-
四川绵阳市中医医院结对共建帮扶折弓乡
2019-07-11
-
鱼鹰骨的功效与作用
2019-07-07
-
染色体异常及免疫抗体的相关问题
2019-07-06
-
鸡血藤的功效与作用
2019-07-06