前言 入坑了深度学习,作为一个小白,我想开始做笔记,一则记录学习生活,二来写点东西可以消解一下我的独处时光。手持MacBook奈何没有GPU,只能选择远程ssh连接我们机房的“图形工作站”,老说3090多强,都没机会试一试,到手打开一看还是个Windows系统,给同学都整笑了,于是我开始操作起来
基于Windows系统的ssh 【笔记|深度学习环境搭建】我直接公布答案吧,Windows系统是不支持作为“远端服务器”用pycharm和vscode远程ssh连接的,折腾了半天,用了各种方法, 到了半夜还是睡不着觉,用Google一查,pycharm官方工作人员给出了权威答案,如图,我看到去年也有人问这个问提,依然是not yet。
文章图片
基于Linux系统的ssh 我决定在组会上哭穷,师兄告诉我可以把楼下那台吃了许久灰的2070搬来用,泪目。而且直接一步到位就是Ubuntu,我狂喜。直接ifconfig查ip地址,没能如愿查到ip,提示的是net啥东西没安装,需要sudo install一下,装上后重新在终端ifconfig就能查到ip了,有个疑问,好像出来了三个网络服务,对应着2-3组ip,我选择的是192开头的那一组,这地方还涉及到内网和公网的问题,有需要的可以搜索“内网穿透”,我这次用不到,先不说了。满怀期待地用我的mac终端再输入一串神秘代码,ssh username@ip_address
里面的关键词懂得都懂吧,可是connect confused还是拒绝来着?总之就是没连上,Windows好歹还能从终端看看文件,Linux反而不行了?于是找了资料,发现可能是Linux的ssh服务没有开启。
Ubuntu开启ssh服务 这就引出了新的问题,不是Linux系统默认开启ssh吗?终端测试一下dpkg -l |grep ssh
果然啊找不到服务,那就安装吧sudo apt-get install openssh-server
给我报错,找不到软件包,此时的我濒临吐血,频频爆粗,拿到新机器的新鲜感全没了。强行给自己下机,第二天再搞。第二天我信心满满,一定要搞定这ssh,接着昨天的思路,找不到软件包怎么办呢?查了很多资料,两种解决方式:1.sudo apt upgrade
;2.Linux换源,换成国内的。经过我的测试,第一种方法对我的Linux无效,第二个方法把“找不到软件包”的问题解决了,我还顺带学了一手终端文件夹的操作指令,wq q q!
之类的。而且又出了新的问题,他跟我说依赖冲突“无法修正错误,因为您要求某些软件保持现状…”???我要求?我要求啥了?再找资料吧,我一度以为要重装系统了,但是我还是找到了一个办法,再次输入神秘代码sudo apt-get install openssh-server -ce=(version也就是上面的报错)
哎嘿,终于让我安装上了!!这里我没有改端口,我在mac上测试输入密码后成功被Welcome了,芜湖。
文章图片
Nvidia-smi失败 远程连接才仅仅是个开始而已,我想看看我的显存使用情况,听说需要这么个代码?nvidia-smi您猜怎么着?又又又出问题,这次的错误是“failed to initialize NVML…”绝了,我连个显卡信息都不配看?再查资料,说是驱动版本与内核版本不一致导致的。跳到下一步。
更新显卡驱动 既然驱动版本不一致,那就让他们一致吧,我先卸载现在的驱动
sudo apt-get purge nvidia*
然后再查找这台电脑的内核版本
cat /proc/driver/nvidia/version
这台是470的大版本,装470版本的显卡驱动。
sudo apt-get install nvidia-driver-470 nvidia-settings nvidia-prime
还是让我给整明白了吧?成功看到显卡状态,可以看到是8G的显存,至此硬件部分应该都调教完毕了。
文章图片
安装cuda+torch 接下来要跑程序,我忽然意识到一个问题,我的程序能调用GPU吗,或者说我的torch是GPU版本的吗?虚拟环境啥的对我来说已经太熟练了(辛酸)在虚拟环境里装torch,安装代码可以在官网获取,cuda版本对照表在下面链接。GPU的torch大约1个G多点吧,等一会就装好了。用那个什么available的命令输出true就OK了,至此,硬件部分已经全部搭载完成,接下来就是技术问题了,我要开始另一段旅程了(背影)。
Release Notes :: CUDA Toolkit Documentation
p.s.多讲一句 smi输出的process里面的type,我还以为是代表GPU还是CPU,但其实是别的意思,官方文档如下图。
文章图片
我还找了个通俗点的解释,这样就懂了吧。
文章图片
还是忍不住多说一句,来到新的环境大概有半年的时间了吧,可能跟我的性格有关,总感觉在这里我只是个来往匆匆的行人,习惯性地跟别人说起,还是习惯性的“你们学校/这个学校“这样的话,其实我蛮喜欢这里的环境的,我分配到的办公楼门口是一个带着小亭子的水塘,虽然夏天在两边经过经常会被“天外来物”偷袭,但也是一种人鸟和谐的状态了,最近天气很好,我常在下午去晒一晒太阳。我对我的导师、同门、同学很满意,我很庆幸我不会为经费不足、横向工作繁重而苦恼。这半年唯一让我苦恼的就是我自己,我质疑自己,包括能力、背景和其他的什么东西,我也学会了走向成年最重要的是要独立,这包括我要有独当一面的能力和勇气,自己规划人生,然后承担自己规划的后果。最重要的,我要学会不依靠父母家庭,即使他们总会给我帮助的。人生是一个需要终生学习的过程,我要学着不那么古板,我学滑板、去live house、多采纳别人的观点,还有很多…我不想因为要不断获取知识和研究领域的局限而变得盲目而狭隘,我想给人生以色彩,不白来一趟人间。还有什么要说的呢?哦,对了,这段时间对这些设备的探索,让我发现钻研还是会有收获的,算是让我重拾了一部分信心吧。我现在的研究方向是“基于弱监督学习的点云数据智能处理”,如果有同仁对这一领域有所了解,我很希望可以共同学习。
O Captain! My Captain! 那就先做自己的船长吧。
文章图片
推荐阅读
- python|聊聊我的 Pandas 学习经历及动手实践
- 深度学习|PyTorch 安装过程总结(2022-03-06)
- 每周学习|【多模态学习】本周学习历程,附链接
- 新手安装Liunx出现的一些问题
- 历史上的今天|【历史上的今天】3 月 6 日(Unix 版权争夺战;豆瓣网上线;谷歌推出了 Google Play)
- 后端|大名鼎鼎的 Linux —— 进程,线程,协程
- Linux操作系统——进程管理
- Linux|深入Linux内核架构——锁与进程间通信
- Linux|【Linux篇】第四篇——Linux环境下的工具(二)(make/Makefile+进度条小程序)