🗣️aspeak 是一款基于微软 Azure TTS 语音合成 DEMO 页面的命令行工具,可以直接处理 .txt 文本文件,并导出 .wav 文件。@Appinn
手搓大佬的主要问题是,就喜欢自己手搓。比如这次是 @KXXT 大佬,在前几天推荐的 Azure Speech Download – 免费的文字转语音,基于微软语音合成[油猴脚本] 一文中,言简意赅的留言:
而这一切的缘由,都在于更早之前,“有同学给青小蛙推荐了一个 Windows 下野生的文字转语音工具:Read Aloud by asup – 基于微软自然语音的文本转语音工具,使用效果优异,但主要问题是大量杀毒软件报毒。而评论区从来不缺大神,就有同学根据完全相同的原理制作出来原生的油猴脚本,可以继续免费的「文字转语音」。”
🗣️aspeak
安装
这是一个用 python 编写的程序,安装简单:
pip install --upgrade aspeak
这里默认会用命令行的用户已经安装 pip 或者已知如何安装 pip。
使用
使用也很简单:
aspeak -t "你好,世界!" -l zh-CN
自定义语音:
aspeak -t "你好,世界!" -v zh-CN-YunjianNeural
列出所有的中文语音:
aspeak -L -l zh-CN
批量
只需要把文字保存在 .txt 文本文件中:
aspeak -f input.txt -l zh-CN -o t.wav
总之,连网页都不用打开了。
获取
所以现在还剩下最后一个问题,就是 Auzre 什么时候不让用这个 DEMO 了 😂
原文:https://www.appinn.com/aspeak-azure-tts/
话说,你们会不会每段录音后面都有个噪声?我怀疑这个是来做 demo 的标记用的。
我觉得可能是转换的时候出现了一些偏差
这通常是网络不好,断断续续的
看大家的需求,好像集中在MCN视频,或者网店旁白类应用。我反而是着迷写短剧,感觉很上头。
页面里支持简单的SSML,所以在一个大的speak下,可以用voice标签来套不同的角色对话,还可以带上不同的风格和语调。
不知道有没有成熟的SSML编辑器,感觉中文需求还可以再细化来做。
比如说最简单的,像加粗一样进行个别词的加重;还有一些基于经验的内容,比如填充词和语气词。
以及像给领导准备稿子一样,一些多音字特别改写为意义不对,但发音唯一的字(比如“L卡口相机”的“卡”会读成qia,会故意写成“咔”)。
话说最近这么多基于微软语音的项目,只能玩玩吧,或者个人小项目,用多了不会被封杀么
楼主,你这个环境实在windows安装还是linux呢,我用了这个,但是一直都是报各种错
我在window下,远啦api模式能跑,但是命令行模式跑不了,报错
linux就更难搞了,两种都不行
配置好 python 和 pip 就可以了。无所谓平台的
python和pip都是没有问题的,所以就比较奇怪。跑了不少python项目的了
有一种东西叫错误日志。
1.对python版本有要求
2.在linux环境下,对环境要求很高,很多东西要配置来支持微软的那个库。至今未解决。
如果有小伙伴能在linux环境下的配置跑起来,我这边可以付费,技术我还是菜了些,惭愧