语音识别|ubuntu上安装ESPnet

ESPnet是一个端到端的语音处理工具,主要侧重于端到端语音识别和端到端语音合成。ESPnet使用chainer和pytorch为主深度学习引擎,同时也遵循Kaldi风格的数据处理、特征提取格式。
机器环境:
Ubuntu16.04 GPU GeForce RTX 2080 CUDA 10.0版本
1.安装ESPnet
【语音识别|ubuntu上安装ESPnet】由于数据处理部分主要依赖于kaldi,先安装好kaldi(这里安装步骤不再细说)。
下载ESPnet git clone https://github.com/espnet/espnet。
$ cd espnet-root/tools
$ make KALDI=/root/asr/kaldi/(kaldi安装目录)
这里默认python版本为3.7.3,pytorch为1.0.1语音识别|ubuntu上安装ESPnet
文章图片

我这里用python版本为3.7.3版本安装ESPnet没有成功,有个包安装冲突要求python低于3.7,我改成3.6.10就可以了,
尝试用pytorch 1.4.0版本没有安装成功,在cuda那里各种报错,最终改成pytorch 1.0.1。
检查下安装 python check_install.py,安装完成。语音识别|ubuntu上安装ESPnet
文章图片

ESPnet里面的demo跟kaldi很类似,demo都是放在egs里面。语音识别|ubuntu上安装ESPnet
文章图片

更多详情参考
https://espnet.github.io/espnet/installation.html里面的安装。

    推荐阅读