电子发烧友网 > 音视频及家电 > 正文

微软在智能语音领域实现了重大技术突破

2019年10月13日 09:13 次阅读

(文章来源:CSDN)

微软在30多年前开办微软研究院时,已开始投入大量的人力物力在语音和语言上。近几年来,微软在语音识别上首先取得突破,在2016年,语音识别的准确度已达到跟人相似的水平。2018年,在中英机器翻译上和人类做比较,发现机器翻译的质量跟专业翻译人员的结果完全可以相媲美。

2018年9月,微软首先发布了基于神经网络的语音合成产品服务,它与人声的自然度得分的比例达到98.6%,也就是说非常接近人声。

语音识别之路微软在语音识别的具体突破有哪些?语音识别主要核心指标是词错误率,就是词识别错误占多少比例。在SwitchBoard会话数据集上,语音识别错误率开始非常高,根本不能用,到2016年,微软取得了突破,达到5.9%的错误率,2017年进一步降低到5.1%的错误率,这个错误率跟专业人员转写录音的错误率是相当的。

大家听听这个数据集的例子:电话上有两个人在交流,语音具有不连续性、噪音、口音,所以识别难度对机器来讲是非常大的,微软使用10个神经网络技术,比如:CNN、ResNet、VGG等,多模型输出打分、多系统融合,得到了这个了不起的突破。

微软在智能语音领域实现了重大技术突破

机器翻译的里程碑从1980年的传统机器翻译,到1990年的统计机器翻译,再到2010年,深度学习机器翻译技术开始兴起。2018年,微软首度提出一个任务,把机器跟人在中英新闻翻译上做比较,让专业翻译人员和机器翻译同样的句子,翻译后请懂双语的老师和学生去对翻译结果用0-100分进行打分。

可以看到微软的Human Parity机器翻译系统已经超过或者接近专业人员的翻译水平。它的突破用到了新技术比如对偶学习,用大量无标注数据提高现有的翻译系统。还有推敲网络,先有一个初始翻译,再用另外一个网络进行再一次的修正,同时运用多系统融合技术,最终达到这个突破性的结果。

语音合成技术我们再看看语音合成技术,文字转语音这个技术也是非常悠久的语音AI技术。

最开始是基于人的发音原理的合成器,然后90 年代用拼接的方法,把一句话分成很小的单元,然后进行拼接,一开始的拼接是小语料库,自然度一般。在1999年左右,出现基于大语料库的拼接,这时需要收集到成千上万的句子,把它们切分开来,用一种选择策略去选择最合适的单元拼接在一起,自然度显著提升,但是带来新的问题,比如有些拼接不平滑。

2006年左右,基于HMM模型的合成技术兴起,它的好处是非常平滑,但是也带来负作用,就是声音过于平滑,让人听出来觉得不够具有表现力。深度学习的兴起在合成领域也得到了应用,最近两三年推出的神经网络TTS,是语音合成技术的突破。谷歌提出来Tacotron, WaveNet这些模型,把语音自然度提升新的水平。

微软在2018年,2019年提出了Transformer TTS、Fast Speech等高自然度神经网络TTS模型,并在2018年9月首度推出产品化接近人声的端到端Neural TTS。

下载发烧友APP

打造属于您的人脉电子圈

关注电子发烧友微信

有趣有料的资讯及技术干货

关注发烧友课堂

锁定最新课程活动及技术直播

电子发烧友观察

一线报道 · 深度观察 · 最新资讯
收藏 人收藏
分享:

评论

相关推荐

微软具有触觉反馈的VR系统

微软一直在不断推动增强现实(AR)和混合现实(MR)方面的发展,现在一项最新的专利为Microsof....
发表于 2019-10-13 09:18 0次阅读
微软具有触觉反馈的VR系统

科大讯飞已成为语音交互行业的先行者

在物联网领域,人机交互价值日趋重要,科大讯飞作为智能语音与人工智能领域的代表性企业,提出“平台+赛道....
发表于 2019-10-13 09:07 0次阅读
科大讯飞已成为语音交互行业的先行者

微软新专利展示Surface Duo部分细节,确...

微软最近正式发布了一款Surface Duo双屏智能手机,运行深度定制版的Android系统。而微软....
发表于 2019-10-12 15:05 106次阅读
微软新专利展示Surface Duo部分细节,确...

智能语音是智能家居的起点

绝大多数的云端识别都会在后台录音,相当于用户在家里不知不觉的情况下声音的隐私已经被侵犯,并上传到云端....
发表于 2019-10-11 11:26 158次阅读
智能语音是智能家居的起点

微软Surface Earbuds无线耳机支持任...

除了Surface Neo,Surface Duo和其他令人兴奋的Surface新品外,微软前几天还....
发表于 2019-10-11 11:07 47次阅读
微软Surface Earbuds无线耳机支持任...

Windows 10 19H2本月签署RTM正式...

按计划,Windows 10在今年下半年还会有一次正式版更新,即19H2。
发表于 2019-10-10 16:19 138次阅读
Windows 10 19H2本月签署RTM正式...

微软发布Windows 10 18999快速预览...

微软今天发布了Windows 10 18999(20H1)快速预览版,带来了一项令人兴奋的Windo....
发表于 2019-10-10 15:38 157次阅读
微软发布Windows 10 18999快速预览...

微软可追踪鼠标解决方案可在VR中直接操控鼠标

微软曾于2018年4月提交了一份名为“Constellation-Based Augmentatio....
发表于 2019-10-10 09:48 40次阅读
微软可追踪鼠标解决方案可在VR中直接操控鼠标

微软计划为更多偏远地区提供互联网接入服务

根据权威机构统计,截止至2018年,全球约有一半的人口已连接到互联网,仍有数十亿人无法访问任何形式的....
发表于 2019-10-09 15:55 265次阅读
微软计划为更多偏远地区提供互联网接入服务

微软Surface平板电脑配置东芝2230固态硬...

根据消息报道,至少有一款微软新推出的Surface平板电脑配置了一款东芝的超级小的2230固态硬盘,....
发表于 2019-10-09 15:43 170次阅读
微软Surface平板电脑配置东芝2230固态硬...

未来5年内平板电脑出货量下滑,微软Surface...

Digitimes Research在一份平板市场5年期预测报告中称,今年,平板电脑的整体出货量将大....
发表于 2019-10-09 15:34 613次阅读
未来5年内平板电脑出货量下滑,微软Surface...

微软推出ARM平台二合一平板电脑Surface ...

作为一款主打便携与手写的产品,Surface Pro X的键盘基本上是它的灵魂之一,而且更不用说全新....
发表于 2019-10-09 15:17 148次阅读
微软推出ARM平台二合一平板电脑Surface ...

微软朝软硬结合的路前进,把Surface电脑和D...

对于微软而言,想要创造属于自己的未来,就必须朝软硬结合的路继续前进,只是不知道前路究竟如何。
发表于 2019-10-09 15:10 306次阅读
微软朝软硬结合的路前进,把Surface电脑和D...

微软VR设备防撞新专利曝光,使得用户更加安全

现在很多VR设备都进入到了我们的家庭,但是带着VR头盔沉浸在虚拟世界里面难免就会“误伤”到家里面的家....
发表于 2019-10-09 14:48 1187次阅读
微软VR设备防撞新专利曝光,使得用户更加安全

AMD和微软宣布推出新15寸轻薄本微软®Surf...

凭借AMD 锐龙微软Surface版处理器,AMD为超薄笔记本创造出了前所未有的超强移动处理器。只有....
发表于 2019-10-09 12:06 270次阅读
AMD和微软宣布推出新15寸轻薄本微软®Surf...

微软和英特尔创建出了新的奖励代币系统

EEA是一个由超过450个企业成员组成的区块链联盟,其成员包括微软、摩根大通、桑坦德银行、埃森哲、I....
发表于 2019-10-09 10:55 129次阅读
微软和英特尔创建出了新的奖励代币系统

闻声识人——声纹识别如何走过规模商用前夜?

作为语音赛道一个重度垂直的领域,声纹识别终于从“等风来”,成为站在“风口”上的技术。随着新一波人工智....
发表于 2019-10-09 07:26 1215次阅读
闻声识人——声纹识别如何走过规模商用前夜?

微软新款Surface Pro 7将支持USB-...

Surface Pro 7是微软最新一代产品,搭载英特尔最新的第10代酷睿处理器,最高配备16GB内....
发表于 2019-10-08 17:29 89次阅读
微软新款Surface Pro 7将支持USB-...

智能语音技术将成为交互入口的新未来

智能语音助理融入我们生活之中已经很久,赋能各个行业已经成为了社会的共识。当电子地图可定制的语音包上线....
发表于 2019-10-08 16:26 65次阅读
智能语音技术将成为交互入口的新未来

微软发布两款尺寸的Surface Laptop ...

北京时间10月2号,微软在纽约举行新品发布会,正式发布了Surface Laptop 3分为13、1....
发表于 2019-10-08 16:20 643次阅读
微软发布两款尺寸的Surface Laptop ...

微软首款双屏设备Surface Neo将于202...

10月2消息,微软在纽约举行新品发布会,发布了期盼已久的双屏设备Surface Neo,将于2020....
发表于 2019-10-08 16:18 463次阅读
微软首款双屏设备Surface Neo将于202...

微软发布首款“X”型号的Surface Pro ...

10月2日消息,微软在纽约举行新品发布会,除了Surface Pro 7之外还另外发布了一款Surf....
发表于 2019-10-08 16:11 420次阅读
微软发布首款“X”型号的Surface Pro ...

微软新款Surface Slim Pen可用无线...

微软今天在其年度硬件盛会上推出了一款新的Surface Slim Pen,它可以插入Surface ....
发表于 2019-10-08 16:08 408次阅读
微软新款Surface Slim Pen可用无线...

微软推出全新微软Surface Pro 7,搭载...

10月2日晚上,微软正式发布了全新的微软Surface Pro 7,搭载了英特尔最新的10代酷睿处理....
发表于 2019-10-08 15:47 495次阅读
微软推出全新微软Surface Pro 7,搭载...

微软发布Surface Duo双屏设备,预装An...

长假期间,微软发布了Surface Duo双屏设备,两块5.6英寸显示屏展开后为8.3英寸,铰链支持....
发表于 2019-10-08 15:08 221次阅读
微软发布Surface Duo双屏设备,预装An...

对话人工智能,体验最新科技产品

参观完成后他们被分为两队,前往各部门进行学徒培训及接受挑战任务。两队分别需要完成收集15种语言样本,....
发表于 2019-10-08 14:26 384次阅读
对话人工智能,体验最新科技产品

微软Surface Laptop 3将搭载AMD...

微软定于10月2日在纽约举办Surface新品发布会,几乎全线消费级产品都将更新,比如15英寸Sur....
发表于 2019-10-08 14:20 42次阅读
微软Surface Laptop 3将搭载AMD...

微软折叠屏手机SurfaceDuo的体验到底如何

走进微软安排的会议室,才发现原定的Surface负责人Panos Panoy专访被取消了。取而代之的....
发表于 2019-10-08 11:43 661次阅读
微软折叠屏手机SurfaceDuo的体验到底如何

微软SurfaceProX正式亮相 迄今最轻薄重...

除了常规升级的Surface Laptop 3、Surface Pro 7,微软今天还意外拿出了一款....
发表于 2019-10-08 11:40 621次阅读
微软SurfaceProX正式亮相 迄今最轻薄重...

快速看完微软2019秋季新品发布会

10月2日晚,微软在纽约举行新品发布会,一口气带来了Surface Neo双屏电脑、Surface ....
发表于 2019-10-08 11:34 479次阅读
快速看完微软2019秋季新品发布会

微软折叠屏手机SurfaceDuo正式亮相 内置...

Surface发布会上,微软带来最大的惊喜莫过于首款双屏电脑Surface Neo以及折叠屏手机Su....
发表于 2019-10-08 11:29 156次阅读
微软折叠屏手机SurfaceDuo正式亮相 内置...

SurfacePro7开启预售 起售价为5788...

纽约新品发布会上,微软正式发布了全新一代Surface,包括Surface Pro 7、Surfac....
发表于 2019-10-08 11:14 279次阅读
SurfacePro7开启预售 起售价为5788...

Windows10X开始菜单曝光

10月8日消息,据媒体报道,微软在公布Surface Neo时,全新的Windows 10 X引发外....
发表于 2019-10-08 08:45 247次阅读
Windows10X开始菜单曝光

微软大举招聘芯片设计工程师 满足定制芯片需求

就在展示新款Surface系列产品中部分定制处理器的当天,微软还在尝试招聘更多芯片设计师,为其日趋增....
发表于 2019-10-07 08:01 312次阅读
微软大举招聘芯片设计工程师 满足定制芯片需求

微软为加速Bing的智能化而采用了英特尔的FPG...

微软一直在稳步提升Bing的功能,并将“智能答案”纳入搜索引擎的搜索结果中。它不会将用户转移到可能包....
发表于 2019-10-02 15:16 261次阅读
微软为加速Bing的智能化而采用了英特尔的FPG...

微软并没有选择英特尔作为数据中心来提供FPGA

早在2014年,微软首先宣布他们正在探索在数据中心使用FPGA来加速Bing的某些任务的可能性。 2....
发表于 2019-10-02 13:28 444次阅读
微软并没有选择英特尔作为数据中心来提供FPGA

微软或将准备研发投影触摸屏的相关技术

微软旗下的Surface系列产品想必大家并不陌生,从最初带触控屏幕的概念咖啡桌到概念触控显示屏,再到....
发表于 2019-10-02 12:09 53次阅读
微软或将准备研发投影触摸屏的相关技术

微软推出 Xbox One X 1TB超时空特别...

来自微软官方商城的消息,微软将在中国商城推出 Xbox One X 1TB 超时空特别版,10月8日....
发表于 2019-09-30 14:34 371次阅读
微软推出 Xbox One X 1TB超时空特别...

微软正在开发两个新滚动功能,改进谷歌浏览器中的网...

继谷歌之后,微软已成为开源平台和Chromium社区的最大贡献者之一。作为改进Chromium(也为....
发表于 2019-09-30 14:30 299次阅读
微软正在开发两个新滚动功能,改进谷歌浏览器中的网...

2020年的物联网有什么趋势

物联网正在定义即将在不同行业中发展的技术的未来。无线连接使新的物联网发明能够朝着前进的方向迈出下一步....
发表于 2019-09-30 09:53 226次阅读
2020年的物联网有什么趋势

微软预热Surface新品发布会,有望推出可折叠...

日前微软已经向多家媒体发出邀请函,敲定于下周(10月2日)在纽约市召开“Surface Event”....
发表于 2019-09-29 14:59 358次阅读
微软预热Surface新品发布会,有望推出可折叠...

语音技术将开启人工智能的新天地

随着互联网技术的高速发展,语音技术逐渐渗透到我们的日常生活中。在经过多年的键盘输入和点击手机屏幕之后....
发表于 2019-09-27 16:56 89次阅读
语音技术将开启人工智能的新天地

智能语音将成为未来商业变革的核心技术

过去几年,谷歌、微软、亚马逊、百度等全球科技巨头纷纷押注语音赛道,投影在人们面前的是接踵而至的明星语....
发表于 2019-09-27 16:46 284次阅读
智能语音将成为未来商业变革的核心技术

百度与亚马逊合作将打造全球最优智能语音服务

亚马逊联合全球领先的科技公司发起了全新语音互操作性计划(the Voice Interoperabi....
发表于 2019-09-27 10:39 59次阅读
百度与亚马逊合作将打造全球最优智能语音服务

FreeNeb进军语音界主攻声纹+语音新战场

近年来,全球智能语音市场呈现连年增长的趋势,预计到2020年,全球市场规模将达到191.7亿美元——....
发表于 2019-09-25 16:40 147次阅读
FreeNeb进军语音界主攻声纹+语音新战场

微软9月固件更新修护Surface Pro 6的...

先前曾有Surface用户报告称自己的Surface Pro 6在关机状态下耗电量过多的问题,而微软....
发表于 2019-09-25 16:29 438次阅读
微软9月固件更新修护Surface Pro 6的...

预计Surface Laptop 3将搭载AMD...

微软10月份的Surface新品活动即将来临,关于Surface新设备的越来越多详细信息开始在网上出....
发表于 2019-09-25 16:27 1710次阅读
预计Surface Laptop 3将搭载AMD...

高斯贝尔中选中移物联网“和目智能门铃生产采购项目...

公司称此次中选将进一步巩固与中国移动的合作伙伴关系,有利于公司数字电视产业和业态有效升级,完善公司产....
发表于 2019-09-25 16:09 436次阅读
高斯贝尔中选中移物联网“和目智能门铃生产采购项目...

阅文集团与微软合作,开启AI赋能网络文学“IP唤...

据介绍,上述计划旨在强化IP角色与用户的双向互动与情感联结。基于阅文集团旗下100部小说原著和主人公....
发表于 2019-09-25 15:52 295次阅读
阅文集团与微软合作,开启AI赋能网络文学“IP唤...

Windows 10的全球活跃安装量超过9亿台

在让Windows 7加速离场这件事上,微软还在不停的努力,而Windows 10也越来越强势。
发表于 2019-09-25 15:05 222次阅读
Windows 10的全球活跃安装量超过9亿台

微软OneDrive扩容计划开放购买,有多种价格...

日前,微软OneDrive云盘负责人在推特上宣布,OneDrive扩容计划正式开放购买,全新计划允许....
发表于 2019-09-25 15:01 254次阅读
微软OneDrive扩容计划开放购买,有多种价格...

微软发布Windows Terminal工具的最...

今天微软发布了Windows Terminal工具的最新预览版,将命令行、PowerShell(包括....
发表于 2019-09-25 14:55 357次阅读
微软发布Windows Terminal工具的最...

国美推出70英寸大屏4K电视,支持智能语音控制

近日国美发布了一款70英寸大屏4K电视——国美70GM5399U,官方售价4999元。据介绍,国美7....
发表于 2019-09-25 14:34 735次阅读
国美推出70英寸大屏4K电视,支持智能语音控制

智能语音鼠标实现语音识别新技术的创新

随着科技的发展,AI智能时代已经到来,智能语音也已经深入生活的方方面面。如今,快鼠智能语音鼠标采用科....
发表于 2019-09-25 10:39 98次阅读
智能语音鼠标实现语音识别新技术的创新

端侧AI语音SoC开始起量,细分化加剧!

在近期的这一波智能语音芯片中,对于降低开发成本、缩短开发周期、快速对接客户需求等方面卡位非常精准。为....
发表于 2019-09-25 08:49 1132次阅读
端侧AI语音SoC开始起量,细分化加剧!

微软六款15英寸Surface Laptop3的...

微软将在10月2日的活动中推出一款15英寸Surface Laptop 3,这款15英寸机型将采用A....
发表于 2019-09-24 14:53 1520次阅读
微软六款15英寸Surface Laptop3的...

智能家居怎样在老年市场风生水起

随着物联网技术的不断发展,智能家居作为一股潮流率先在年轻消费群体获得一大批忠实拥趸。智能门锁、智能开....
发表于 2019-09-24 10:26 223次阅读
智能家居怎样在老年市场风生水起

创业8年来,我一直在努力把公司变成别人的公司!

发表于 2019-09-23 22:37 70次阅读
创业8年来,我一直在努力把公司变成别人的公司!

人工智能通过语音技术来听懂人类的语言

你可能发现这样的场景,当你坐在沙发上说一声“打开电视机”,不需要遥控器,你就可以尽情观赏电视节目;跟....
发表于 2019-09-23 10:48 86次阅读
人工智能通过语音技术来听懂人类的语言

微软通过股票回购计划提高自己的股价

北京时间9月19日消息,周三盘后微软公司表示根据新的股票回购计划,将回购多达400亿美元的股票;该公....
发表于 2019-09-21 09:47 1011次阅读
微软通过股票回购计划提高自己的股价

什么是智能语音楼宇对讲系统?

随着房地产的高速发展,智能家居需求的增长,楼宇对讲系统的市场可谓是直线上升。从语音对讲到可视对讲,从黑白可视对...
发表于 2019-09-17 08:14 91次阅读
什么是智能语音楼宇对讲系统?

WinCE启动为什么会频繁死机?

WindowsCE是微软公司嵌入式、移动计算平台的基础,它是一个开放的、可升级的32位嵌入式操作系统,是基于掌上型电脑...
发表于 2019-08-21 06:31 82次阅读
WinCE启动为什么会频繁死机?

为什么微软雅黑48*48字体会显示失败

大家好,想显示微软雅黑48*48字体,结果是乱码。32*32宋体成功,24*24微软雅黑成功。 难道emWin显示汉字最大就32*32...
发表于 2019-07-24 03:35 127次阅读
为什么微软雅黑48*48字体会显示失败

公共UDDI的挑战

据国外媒体报道,由微软与IBM等大公司力推的网络服务目录UDDI计划迟迟不见起色,厂商不仅要克服技术障碍,还得...
发表于 2019-07-19 08:22 130次阅读
公共UDDI的挑战

微软SMS2003软件的部署

SMS2003又是微软的一个令人兴奋的软件,微软非常巧妙的将SMS 2003与AD进行了整合,非常方便的实现了对域环境下...
发表于 2019-07-19 06:19 128次阅读
微软SMS2003软件的部署

SMS2003+SP3中文版的安装过程

Systems Management Server 2003又是微软非常巧妙的将SMS 2003与AD进行了整合,非常方便的实现了对域环境下资...
发表于 2019-07-17 08:13 119次阅读
SMS2003+SP3中文版的安装过程

登录管理工具LimitLogin

LimitLogin是一款于2005年面世的登录管理工具,由一名微软合作伙伴技术专家和一名应用程序开发顾问合力开发。Limit...
发表于 2019-07-16 06:27 123次阅读
登录管理工具LimitLogin

请问WiFi智能语音音响该怎么做?

rt,我想自己diy一个WiFi 智能语音音响来学习wifi,类似小爱音响那种,请教下可以怎么做啊...
发表于 2019-07-12 04:35 230次阅读
请问WiFi智能语音音响该怎么做?

微软基于FPGA提升数据中心服务器的效能

    微软(Microsoft)正探索将现场可编程闸阵列(FPGA)导入其资料中心伺服器的可能性。虽然目前这还只是...
发表于 2019-06-20 07:23 159次阅读
微软基于FPGA提升数据中心服务器的效能

微软Surface Book i7 windows 10 DocNav文本非常小

使用DocNav和许可证管理器时,文本非常小,无法使用。 有任何想法吗? 以上来自于谷歌翻译 以下为原文 W...
发表于 2019-04-24 13:37 166次阅读
微软Surface Book i7 windows 10 DocNav文本非常小