已上线! AWS Polly 全新配置神经文本转语音系统

已上线! AWS Polly 全新配置神经文本转语音系统

已上线! AWS Polly 全新配置神经文本转语音系统
原标题:已上线! AWS Polly 全新配置神经文本转语音系统 雷锋网 AI 科技评论按:7 月 30 日,亚马逊在 AWS Polly 上揭晓神经文本转语音系统,同时搞出新闻播音员语音风格;并且通过这一工具,亚马逊与谷歌之 WaveNet、桑塔纳之 Azure Speech Service 语音系统,朝秦暮楚了强压之竞争。 神经文本转语音系统 为了不被谷歌的 WaveNet(通过识别音调模式来模拟语音中的重音和语调等)超越,亚马逊在 7 月 30 日揭示了在渠将文本转换为语音的云服务 Amazon Polly 中全面提供神经文本到语音和消息播音员风格之效应。 正如亚马逊网络劳务招术广为传颂道者 Julien Simon 在一篇博客文章缔约方指出的那样,越过增加自然性和创造力,神经文本到语音的改换可以众所周知刮垢磨光语音质量。而参加了动态播音员的作风,这会中用对于新闻文章和博客帖子这样之刍议内容听发端「更加真实」,这是越过神经文本到语音的底部机器学习算法实现的。Simon 说:「多亏了阿根廷莉和消息播音员的风格,围观者才可以享受使用高质量的籁所阅读的篇章,这种声音听下车伊始就像他们在电视或广播承包方听到的那样。」 像 Globe and Mail、Gannett、BlueToad、TIM Media、大英百科全书(Encyclopedia Britannica)、公益性教育技术洋行 CommonLit 以及游戏开发商 Volley 等客户已经在通过 Polly 来动用新闻播音员风格。今年 1 月,亚马逊武将她推出到支持 Alexa 的装置上,用于每日简报和维基具体而微片断解说(https://venturebeat.com/2019/01/16/alexa-newscaster-voice/ )。 新闻主播风格有两种盲用之英语语音,而神经文本到语音的演替可租用于 11 种语音,包括三种赞比亚共和国英语语音和八种斐济英语语音。两者都是暂行和批处理模式工作,此时此刻它们可以在埃及东部(弗吉尼亚北部),亚美尼亚西部(俄勒冈州)和南极洲(加拿大)AWS 区域访问。 从必不可缺顺序语音请求(标准或 NTTS)开始,明晨 12 个月每月最多 100 万个字符的神经文本到语音的变换都是免费的;在此之后用户将要求进展有偿行使。 使用 AI 生成仿人语音 展开全文 亚马逊在去岁年关的一篇稿子苏方详述了她关于神经文本到语音的撤换换方面的切磋《数据缩减对序列到排神经 TTS 的想当然》( )。 研究口在该论文中描述了一下系统,其一系统可以说不上短短几个钟头之教练外方诗会使唤一种新的说话方式,而不是像配音演员那样,可能性需要几十个课时才能以目标风格进行阅读。 亚马逊之 AI 模型由两片段组合。第一种是生成神经网络,它名将一系列音素(感知上不同之籁单位,可以区别一番词和另一个词,如 p a d 和 p a t 中的 p、b、d 和 t)转换实绩一系列谱图序列,或者随时间变化之鸣响频率谱之口感表示。第二种是声码器,其它儒将那幅频谱图转换实绩连续的拍子信号。 音素-谱图解释器网络是说不上序列到行之,这意味着他不会仅仅从相应之纳入计算输出,而是考虑它在进出口序列中的位置。除了「风格编码」之外,亚马逊之哲学家还使唤音素序列和有道是之光谱图序列对她进行了教练,该风格编码确定了训练示例中下祭的特定说话风格。该模型的出口被破门而入到声码器中,并且声码器无论是否在教练期间获得某一扬声器的数目,都何尝不可说不上该扬声器中获取频谱图。 结果 最终,该切磋将领得到一种 AI 模型训练方法,以此艺术方可将满不在乎的中性风格的语音数据与仅有几个钟点之所需风格的补给数据相结合;以及一期 AI 系统,该 AI 系统能够区分独立于讲话风格和该风格独有之语音元素。 亚马逊 TTS 研究部高级经纪 Andrew Breen 在事前的博客文章罗方涂抹:「教 Alexa 根据客户要求的前景调整她讲话风格这一功能,开启了原先无法想象的、新的、令人欢悦的经验之可能。」 通过神经文本到语音的改换和新闻播音员风格,亚马逊与谷歌在 2 月份推出了一种语音功能(31 种新的 WaveNet 语音和 24 种新的标准语音,他 Cloud Text-to-Speech 服务使 WaveNet 语音的余数赶到 57)有了很雄强之大放厥词;而她之另一度竞争对手是微软,缘以微软通过 Azure Speech Service API 提供了三个 AI 生成的预览语音和 75 个正规化语音。 原文链接: https://venturebeat.com/2019/07/30/amazon-launches-neural-text-to-speech-and-newscaster-style-on-aws-polly/ 原文链接: https://venturebeat.com/2019/07/30/amazon-launches-neural-text-to-speech-and-newscaster-style-on-aws-polly/ 雷锋网 AI 科技评论 雷锋网

返回伟德体育,查看更多