恒源云(Gpushare)_JupyterLab/TensorBoard使用问题(技巧大放送4!)

文章来源 | 恒源云社区
原文地址 | 【小技巧-工具篇】
1、JupyterLab/TensorBoard 如何使用? 可参考JupyterLab文档、TensorBoard文档。
2、JupyterLab打不开或者响应慢怎么办? 如果遇到JupyterLab页面响应特别缓慢或者打不开的情况,可登录实例后通过以下命令来重启JupyterLab

supervisorctl restart jupyterlab

不建议通过JupyterLab页面直接运行较消耗资源的程序,因为该程序很可能会导致JupyterLab无响应或者运行缓慢问题,可通过tmux工具放置在实例后台运行。
3、tensorboard打不开或者响应慢怎么办? 如果遇到tensorboard页面响应特别缓慢或者打不开的情况,可登录实例后通过以下命令来重启tensorboard
supervisorctl restart tensorboard

4、自定义镜像如何安装jupyterlab? 自定义镜像登录实例后,执行如下命令,即可完成安装jupyterlab,安装完成后,可通过控制台打开jupyterlab页面
curl -OL "https://download.gpushare.com/download/custom_install" chmod u+x ./custom_install ./custom_install jupyterlab

5、自定义镜像如何安装tensorboard? 自定义镜像登录实例后,执行如下命令,即可完成安装tensorboard,安装完成后,可通过控制台打开tensorboard页面
curl -OL "https://download.gpushare.com/download/custom_install" chmod u+x ./custom_install ./custom_install tensorboard

6、JupyterLab 要输入密码怎么办? 通过终端执行 jupyter server list 命令可以得到 JupyterLab 的登陆 Token。
如下可以从执行结果内获得 Token 为 3fq593blw4afqjtqgdp3ldk5。
root@I15b96311d0280127d:~# jupyter server list Currently running servers: http://0.0.0.0:8888/?token=3fq593blw4afqjtqgdp3ldk5 :: /

7、TensorFlow 训练报 ptxas fatal 错误 当在 RTX 3000 系列显卡上使用 TensorFlow 2.4 For CUDA 11.0 时,训练会出现下列警告。
W tensorflow/stream_executor/gpu/asm_compiler.cc:235] Your CUDA software stack is old. We fallback to the NVIDIA driver for some compilation. Update your CUDA version to get the best performance. The ptxas error was: ptxas fatal : Value 'sm_86' is not defined for option 'gpu-name'

原因是该版本的 PTX compiler 不支持 8.6 compute capability。此报错为警告,不影响正常训练。
该警告可以通过 os.environ[‘TF_CPP_MIN_LOG_LEVEL’] = “2” 关闭。
【恒源云(Gpushare)_JupyterLab/TensorBoard使用问题(技巧大放送4!)】此问题虽然不影响训练但性能上会降低,推荐创建 TensorFlow 2.5 For CUDA 11.2 的镜像,不会存在此问题。

    推荐阅读