微软TTS语音合成工具 免费文字转语音软件

微软TTS语音合成工具 免费文字转语音软件

2022年12月11日晚间,国家网信办等三部门发布《互联网信息服务深度合成管理规定》,且将于2023年1月10日施行,规定对深度合成技术界定如下: 深度合成技术,是指利用深度学习、虚拟现实等生成合成类算法制作文本、图像、音频、视频、虚拟场景等网络信息的技术,包...
资源下载
下载价格为5金币,VIP免费升级VIP
立即购买

2022年12月11日晚间,国家网信办等三部门发布《互联网信息服务深度合成管理规定》,且将于2023年1月10日施行,规定对深度合成技术界定如下:

深度合成技术,是指利用深度学习、虚拟现实等生成合成类算法制作文本、图像、音频、视频、虚拟场景等网络信息的技术,包括但不限于:

(一)篇章生成、文本风格转换、问答对话等生成或者编辑文本内容的技术;

(二)文本转语音、语音转换、语音属性编辑等生成或者编辑语音内容的技术;

(三)音乐生成、场景声编辑等生成或者编辑非语音内容的技术;

(四)人脸生成、人脸替换、人物属性编辑、人脸操控、姿态操控等生成或者编辑图像、视频内容中生物特征的技术;

(五)图像生成、图像增强、图像修复等生成或者编辑图像、视频内容中非生物特征的技术;

(六)三维重建、数字仿真等生成或者编辑数字人物、虚拟场景的技术。

深度合成服务提供者,是指提供深度合成服务的组织、个人。

深度合成服务技术支持者,是指为深度合成服务提供技术支持的组织、个人。

深度合成服务使用者,是指使用深度合成服务制作、复制、发布、传播信息的组织、个人。

训练数据,是指被用于训练机器学习模型的标注或者基准数据集。

沉浸式拟真场景,是指应用深度合成技术生成或者编辑的、可供参与者体验或者互动的、具有高度真实感的虚拟场景。

通过定义可以明确看到,文本转语音榜上有名,而本站应该属于上述定义中的“深度合成服务技术支持者”,而大家应该就是“使用者”了,遗憾的是,本站无法具备规定中对于“技术支持者”所必需的各项要求。

既然不能满足新规要求,且作为守法公民,在此只能遗憾宣布:
为响应《互联网信息服务深度合成管理规定》,本站所有语音合成工具,将会在2022年12月31日全面关停,届时,本站将不再提供任何文本转语音服务,再次感谢大家一直以来的支持与厚爱!

前言

MS-TTS工具经过N个版本更新,该实现的功能都已经一点点肝出来了,称它为全网最强免费TTS文本语音合成工具应该不为过,所以,接下来可能在很长一段时间内,除去发现重大bug外,应该都不会再进行大的更新了。

当前版本:v1.9.5

更新内容:

1.9.5

  • 1、界面大小可自行调整;
  • 2、Edge接口数据汉化;
  • 3、角色数量增加到20个;
  • 4、恢复强制更新。(原因请自行理解)
  • 5、其它bug修复

    1.9.5.1

  • 稳定性修复

    1.9.5.2

  • 微软接口wav格式无法合并bug修复

    1.9.5.3

  • 修复“Invalid characters in file name”

正文

微软TTS文本转语音引擎的确是非常NB,合成语音非常接近真人,应该是当前同类产品中体验最好的,官网有提供在线语音合成,但不提供合成后的音频文件下载,使用时会比较麻烦,所以写成工具。

注意:
1、记得先解压,然后使用管理员模式运行程序!
2、简单模式-超长文本:导入的txt文件编码必须为utf-8,文件大小不要超过5MB;
3、试听功能:试听范围为主体内容前150字符;
4、SSML模式:试听模式主体内容长度不得超过150字符,合成模式主体内容长度不得超过2500字符;

视频教程https://www.bilibili.com/video/BV1wg411k7SH/

界面说明

左侧最上方为合成语音质量选项,目前软件支持两种格式,分别为MP3和WAV,每种格式分别有四种质量,请根据实际需求设置调整;

左侧中间有Proxy选项(由于TTS服务器在国外,网络非常不稳定,所以增加了这个选项,有条件就用,如果没条件且又很卡的话,那就换个时间再试,实测:在下半夜及上午时间段,使用效果更好!)

左侧下方为需要配音角色选项,及添加角色按钮,既缩小了界面尺寸,又可以添加更多的角色(最多6个角色),使用方法也很简单,如果你不需要多角色,那么直接在角色里调整好就可以试听合成了,如果是多角色,那么先需要设置好角色选项,然后添加角色,每个角色都需要相同操作,在所有角色添加完成后,右侧文本区选择文本,鼠标右键–设置角色–选择对应的角色即可;

右侧是文本内容区域,以及试听合成停止保存配置功能按钮。
注:保存配置无法保存添加的角色信息,后续版本可能会改进

不设置角色时,软件默认使用左侧角色设置。

新角色

注意,新角色微软官方定义为测试角色,所以并不是完全开放,如果你选择使用这两个角色,下方出现如下图的提示,则说明当前微软未开放,以后再试吧。

多音字

MS-TTS运行后会自动在程序目录生成“dict.txt”词典文件,

将需要自动替换的内容按照:
原始内容,替换内容
的格式一行一条,写入“dict.txt”词典文件保存即可,如下:

语音合成

前提工作准备好就可以点击右侧上方的试听合成按钮,开始进行语音试听或合成

注意:文本内容越多,合成所需时间越长!

中小文本合成完成后,音频在工具目录下的“audio日期时间子目录”中,如下:

超长文本语音合成完成后,音频在工具目录下的“audio文本文件名称”文件夹中,如下

语音合成完成后,将自动调用ffmpeg进行合并。

语音合成完成后自动合并

解决时长限制

软件报病毒

软件有加密保护,会被部分杀软误报,不放心请勿使用,谢谢合作。

资源下载
下载价格5 金币

解说席原文链接:https://www.jieshuoxi.com/131.html,转载请注明出处。

评论0

没有账号?注册  忘记密码?