ESPnet是一个端到端的语音处理工具,主要侧重于端到端语音识别和端到端语音合成。ESPnet使用chainer和pytorch为主深度学习引擎,同时也遵循Kaldi风格的数据处理、特征提取格式。
机器环境:
Ubuntu16.04 GPU GeForce RTX 2080 CUDA 10.0版本
1.安装ESPnet
【语音识别|ubuntu上安装ESPnet】由于数据处理部分主要依赖于kaldi,先安装好kaldi(这里安装步骤不再细说)。
下载ESPnet git clone https://github.com/espnet/espnet。
$ cd espnet-root/tools
$ make KALDI=/root/asr/kaldi/(kaldi安装目录)
这里默认python版本为3.7.3,pytorch为1.0.1
文章图片
我这里用python版本为3.7.3版本安装ESPnet没有成功,有个包安装冲突要求python低于3.7,我改成3.6.10就可以了,
尝试用pytorch 1.4.0版本没有安装成功,在cuda那里各种报错,最终改成pytorch 1.0.1。
检查下安装 python check_install.py,安装完成。
文章图片
ESPnet里面的demo跟kaldi很类似,demo都是放在egs里面。
文章图片
更多详情参考
https://espnet.github.io/espnet/installation.html里面的安装。
推荐阅读
- 机器学习|TensorBoard快速入门(Pytorch使用TensorBoard)
- 机器学习|Pytorch中DataLoader和Dataset的基本用法
- 人脸识别|使用Opencv+树莓派实现人脸识别(二)人脸识别和PyQt界面整合
- python|(2022.4)Win10最新Anaconda安装Pytorch GPU环境(CUDA)教程(极其适合初学者)
- pytorch-gpu|Linux-Anaconda虚拟环境 安装配置GPU版本Pytorch 流程+遇到与解决问题小结
- Pytorch|Linux下Anaconda中指定的环境中安装Pytorch-GPU
- Deep|《动手学深度学习》(二)-- 多层感知机
- 深度学习|Softmax 回归(PyTorch)
- pytorch|Pytorch梯度理解+自定义损失函数