如何使用Python实现文字转语音并生成wav文件

  介绍

这篇文章给大家分享的是有关如何使用Python实现文字转语音并生成wav文件的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。

<强>步骤如下,

1。使用百度语音实现TTS(语音),生成mp3文件;

2。使用pydub和ffmpeg实现mp3转wav格式。

<强>下面,先上简单的示例代码,然后对代码作简单的分析。

# !/usr/bin/python  tt   #,- *安康;编码:utf-8  - * -   得到aip  import  AipSpeech   得到pydub  import  AudioSegment   ,   1 #,Step  Using  baidu  AI 用generate  mp3  file 得到文本   # input  your  APP_ID/API_KEY/SECRET_KEY   时间=APP_ID  & # 39; Your_APP_ID& # 39;,   时间=API_KEY  & # 39; Your_API_KEY& # 39;,   时间=SECRET_KEY  & # 39; Your_Secret_Key& # 39;,   ,   时间=client  AipSpeech (APP_ID, API_KEY, SECRET_KEY),   result =, client.synthesis(& # 39;你好百度,,good 上午# 39;,,& # 39;zh型# 39;,,1,,{,& # 39;卷# 39;:,5日& # 39;每# 39;:4,}),   ,   if  not  isinstance(因此,dict):,   ,with 开放(& # 39;test.mp3& # 39;,, & # 39; wb # 39;), as  f:,   f.write才能(结果)   ,   #,Step  2、, convert 从而mp3  file 用wav 文件   时间=sound  AudioSegment.from_mp3 (& # 39; test.mp3& # 39;)   sound.export (“test.wav",格式=皐av")

运行上面python的代码,就会生成test.mp3和测试。wav,使用命令“aplay test.wav”,可以测试播放声音。

<强>下面对代码做解析,

1。在运行之前,需要安装下面的库,

1.1安装百度AI模块,安装命令“pip安装baidu-aip”

1.2安装pydub, pydub是python的一个音频处理库处理,能对wav格式的音频直接进行处理,安装命令“pip安装pydub”

1.3安装ffmpeg,可以实现对mp3格式的处理,安装命令“sudo apt-get安装ffmpeg”

2。需要注册百度的应用开发者账户,

用户可以自行去下面的网站去注册语音合成——百度AIai.baidu.com,注册百度云之后,去控制台创建应用,过程比较简单。

大家可以对上述代码进行进一步的优化,以实现自己想要的功能。

<强>下面是完整的python代码,大家可以拿来使用,

# !/usr/bin/python  tt   #,- *安康;编码:utf-8  - * -   “““   ,模块:baiduVoiceGenerate   ,平台:Linux   描述:大敌;Generate  Speech 得到文本,以及convert 从而audio 用wav 文件。   前提:大敌;Please  install  below  module  before  run 却;能够progrom,   ,,,,1只pip  install  baidu-aip   ,,,,2只pip  install  pydub   ,,,,3只sudo  apt-get  install  ffmpeg   造物主:大敌;Guangwei 江   ,create 时间:2018-11-21   “““   得到aip  import  AipSpeech   得到pydub  import  AudioSegment   import 时间   ,   # input  your  own  APP_ID/API_KEY/SECRET_KEY   时间=APP_ID  & # 39; 14891501 & # 39;,   时间=API_KEY  & # 39; EIm2iXtvDSplvR5cyHU8dAeM& # 39;,   时间=SECRET_KEY  & # 39; 4 kkggztq2gvrbeyplxxweeioyll1f6zt  & # 39;,   ,   打印(“baiduVoiceGenerate: V1.0, by  Guanagwei_Jiang,, 20181121“)   时间=str  raw_input(“请输入要转成语音的文字:,“)   时间=client  AipSpeech (APP_ID, API_KEY, SECRET_KEY),   result =, client.synthesis (str, & # 39; zh型# 39;,,1,,{,& # 39;卷# 39;:,5日& # 39;每# 39;:4,}),   ,   if  not  isinstance(因此,dict):,   ,with 开放(& # 39;temp.mp3& # 39;,, & # 39; wb # 39;), as  f:,   f.write才能(结果)   ,   时间=sound  AudioSegment.from_mp3 (& # 39; temp.mp3& # 39;)   sound.export (time.strftime (“% Y % m % d_ % H % m % S",, time.localtime ()) +“.wav",,格式=皐av")

感谢各位的阅读!关于“如何使用Python实现文字转语音并生成wav文件”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,让大家可以学到更多知识,如果觉得文章不错,可以把它分享出去让更多的人看到吧!

如何使用Python实现文字转语音并生成wav文件