Python|Python 人工智能 5秒钟偷走你的声音 Python人工智能5秒钟偷走你的声

介绍
Python 深度学习AI - 声音克隆、声音模仿，是一个三阶段的深度学习框架，允许从几秒钟的音频中创建语音的数字表示，并用它来调节文本到语音模型，该模型经过培训，可以概括到新的声音。
环境准备与安装
原始英文版地址：
https://github.com/CorentinJ/...
中文二次开发版（本文使用该版本）：
https://github.com/babysor/Mo...
pycharm环境下载：
https://www.jetbrains.com/pyc...
conda虚拟环境：
https://www.anaconda.com/prod...
FFmpeg ：
https://github.com/BtbN/FFmpe...
模型文件：
https://pan.baidu.com/s/1PI-h... 提取码 2021
在电脑系统上安装 FFmpeg 工具
下载zip压缩包连接为：https://github.com/BtbN/FFmpe...
下载完成后将其解压到一个目录后在系统的环境变量中添加该目录

文章图片

打开新的cmd中查看是否安装成功
ffmpeg -version

文章图片

使用打开项目目录后，创建时使用conda的Python 3.9虚拟环境

文章图片

创建完成后，在cmd中查看现有的虚拟环境，并进入刚刚创建的虚拟环境
conda env list
activate pythonProject1

文章图片

进入环境后在进行安装pip所需依赖，并使用国内源进行安装实现下载加速
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.ed...

文章图片

在虚拟环境下安装pytorch
pip install torch-i https://pypi.tuna.tsinghua.ed...

文章图片

回到pycharm中，将模型导入到项目目录下，把目录复制黏贴到项目中

文章图片

修改一行代码，在 synthesizer/utils/symbols.py 文件中

修改为： _characters = 'ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz12340!'(),-.:; ? '

文章图片

之后在terminal中启动工具箱

文章图片

使用音频合成工具箱

文章图片

文章图片

Linux运维交流社区
Linux运维交流社区，互联网新闻以及技术交流。
【Python|Python 人工智能 5秒钟偷走你的声音】48篇原创内容
公众号

文章图片

https://blog.csdn.net/qq_3392...
https://my.oschina.net/u/3981543
https://www.zhihu.com/people/...
https://segmentfault.com/u/hp...
https://juejin.cn/user/331578...
https://space.bilibili.com/35...
https://cloud.tencent.com/dev...
知乎、CSDN、开源中国、思否、掘金、哔哩哔哩、腾讯云