首页 > 软件下载 > 系统工具 > Windows微软语音合成助手 V1.5

Windows微软语音合成助手V1.5

软件大小:19.26 MB

软件语言:简体中文

软件授权:免费版

软件类别:系统工具

更新时间:2023-04-28 14:44:21

软件类型:国产软件

应用平台:WinAll

软件等级:★★★☆☆

0

0

  • 软件介绍
  • 软件截图
  • 其他版本
  • 下载地址

微软语音合成助手1.5是一款基于微软语音引擎开发的语音合成工具,用户可以通过这款软件完成txt文本的内容的语音翻译播放,而且软件的翻译十细致,可以将标点符号的停顿以及断句表达清晰,让用户有非常舒适的使用体验,而且软件还支持多种语音风格切换,用户可以根据自己的喜好切换不同的人声,有需求的用户赶快来下载体验吧!

微软语音合成助手软件特色

1.说话打字

可以直接将普通话转换为多种语言的文字。

2.文件转译

能够对文件进行转译,文件直接化转译,不需要用户打字。

3.语音控制

语音合成能够对风格和语速进行设定。

微软语音合成助手主要功能

软件调用官方接口,全部支持ssml,将文字转语音大部分功能都给集成了

虽然用的都是免费接口,原本有字数限制

但合成助手会自动分段提交文字进行转换,目前可以绕过这个限制

同时也支持配置正版key,非常赞!

接口切换

不少小伙伴找不到设置选项,在主界面中也没有任何提示

其实右键点击任务栏托盘图标,便可以看到软件设置了

在这里支持切换语音合成及图像识别引擎、更新语音列表、配置Key等等,比较方便

发言人

工具切换为不同语音引擎后,程序界面颜色会有变化,同时它们的发言人也是不同的

微软引擎发言人有24位,效果其实是最好的,有多种语音风格,语气也比较自然

不过免费接口1分钟内不能超过5次提交,在大段文字转换上会有些问题

Edge引擎发言人有19位,类型与效果上与微软差不多,但没什么限制,比较适合大段文字识别

火山引擎有39位发言人,包含相当多的国内特色声音,比较有趣

阿里引擎则仅有14位发言人,语气比较生硬,不过转换速度倒是挺快的

总的来说在转换速度上:Edge>阿里>火山>微软

效果则是:微软>Edge>火山>阿里

大家可以按需选择使用

语音风格

默认风格其实还差些意思,如果想让声音听起来更生动、更加适合不同情景

可以选择不同的语音风格

像生气、开心、不满、害怕等语气风格,助理、聊天、客服、新闻等情景风格,都可以让我们的配音更加自然真实

不过只有微软与Edge引擎可以配置语音风格,另外两款只有默认的~

SSML多人语音混合编辑

如果能实现多人物、多语气的情景对话效果,是不是就更完美了~

这就需要用到SSML语音合成标记语言来进行编辑了,它可以为每段话都设置不同的配音员及语音风格

微软语音合成助手软件亮点

1、支持超过50种语言,有120多个声音。

2、支持表情符号

3、可通过用户词典轻松定制发音。

4、可定制朗读速度和音调。

5、可设置数字和标点朗读偏好。

6、可以进行自定义多种设置,让TTS阅读起来更为的人性化

语音合成是什么

语音合成,又称文语转换(Text to Speech)技术,能将任意文字信息实时转化为标准流畅的语音朗读出来,相当于给机器装上了人工嘴巴。它涉及声学、语言学、数字信号处理、计算机科学等多个学科技术,是中文信息处理领域的一项前沿技术,解决的主要问题就是如何将文字信息转化为可听的声音信息,也即让机器像人一样开口说话。我们所说的“让机器像人一样开口说话”与传统的声音回放设备(系统)有着本质的区别。传统的声音回放设备(系统),如磁带录音机,是通过预先录制声音然后回放来实现“让机器说话”的。这种方式无论是在内容、存储、传输或者方便性、及时性等方面都存在很大的限制。而通过计算机语音合成则可以在任何时候将任意文本转换成具有高自然度的语音,从而真正实现让机器“像人一样开口说话”。

更新日志

v1.5

1、新增火山配音引擎、阿里配音引擎、全部对接支持ssml功能,接口不同略有差异

2、修复微软免费试用接口,删除失效谷歌翻译接口

3、软件对接微软、火山、阿里正版接口,输入申请的key即可使用正版模式,反之不输入试用模式

4、升级本地图文识别引擎,添加阿里图文识别接口

5、托盘菜单添加切换引擎快捷菜单,方便切换使用

6、微软试用接口和火山试用接口暂时未对接批量转换,后期加上

v1.4

1、新增Edge配音接口

2、新增软件设置界面,方便开关软件各项功能和切换接口使用(设置界面在任务栏右下角图标鼠标右键菜单里)

3、解除字数限制,采用分段下载合并方式解决2500字数限制问题

4、新增字幕功能,保存音频同时在音频目录生成SRT字幕文件(字幕根据字数以及音频时常计算单字占用时间方式,在默认语速、音调,音量,EDGE接口,无停顿情况下精确度非常高,此功能在设置界面开启)

5、批量转换新增边合成边播放功能,点击批量合成时会提示是否开启播放功能。

6、新增自定义截图快捷键功能。

7、优化软件启动速度等等。

注:Edge接口只支持文本转音频,不支持SSML。小于300字略快于免费接口。

v1.3

1、语音列表重新排版

2、配音员列表支持用户自己一键更新(一键更新工具见data目录)

3、新增简、繁、英版本系统支持

4、新增自定义敏感词

5、优化软件启动速度

6、对只能下载10分钟文件进行优化处理

软件截图