简单记录配置深度学习环境
安装INVIDIA显卡驱动
Ubuntu推荐安装 :
1、查看ubuntu驱动:ubuntu-drivers devices
2、安装Ubuntu推荐的显卡驱动:sudo apt install nvidia-driver-545
3、重启机器:reboot
4、验证安装结果:nvidia-smi
INVIDIA第三方安装 :
1、查看显卡型号:lspci -vnn | grep NVIDIA
2、去英伟达官网下载相应驱动:英伟达显卡驱动
3、禁用虚拟机自带的显卡驱动:
执行:sudo vim /etc/modprobe.d/blacklist.conf
添加:blacklist nouveauoptions
和nouveau modeset=0
更新内核:sudo update -initramfs -u
4、安装显卡驱动:sh 英伟达显卡驱动.run
5、重启机器:reboot
需要注意的点:
注意点:一般VMware Workstation创建出来的Ubuntu虚拟机是无法使用主机显卡的,一般的解决方案就是GPU直通和使用VGPU技术,对于这两种解决方案来说,都需要使用VMware vSphere,尤其是使用VGPU的话,还需要去安装VMware的英伟达驱动,很麻烦,据了解还需要有相应的license才最终能实现使用。
安装cuda
- 获取cude版本 :
1、查看最高支持的cuda版本:nvidia-smi
2、下载cuda:https://developer.nvidia.com/cuda-toolkit-archive
3、安装cuda:sh cuda安装包.run --override
4、图像化安装,在最后一步,第一项驱动不选,第二项选上,其他可选。
5、配置环境变量:sudo vim ~/.brashrc
添加:export PATH="/usr/local/cuda-11.3/bin:$PATH"
以及export LD_LIBRARY_PATH="/usr/local/cuda-11.3/lib64:$LD_LIBRARY_PATH"
执行:source ~/.bashrc
5、验证安装:nvcc -V
- 需要注意的点
1、注意安装完成以后需要配置环境变量,否则运行不了
2、版本需要选择正确,否则也会失败
3、分用户使用的话最好不要装在/root下面
安装anaconda
- 下载anaconda :https://www.anaconda.com/download#downloads
- 安装anaconda :执行:
sh anaconda安装包.run
- 需要注意的点:加入用root用户安装的话最好更改安装路径,否则其他普通用户用不了
- conda常见的命令:
1、查看当前具有的环境:conda info -e
2、创建新环境:conda create -n环境名称 python=x.x
3、进入环境:source activate 环境名称
4、退出环境:conda deactivate
5、删除环境:conda remove --name 环境名称 --all
注意:有时候conda比较慢的时候可能需要更换镜像源
安装pytorch
- 下载pytorch :https://pytorch.org/
- 安装pytorch :一般是根据pytorch官网给出的命令去安装,前提最好更换成国内的镜像源
- 验证安装结果:
import torch
+print(torch.cuda.is_available())
;结果为报错,且返回TRUE,说明GPU版本安装成功。(进入python中执行,不是shell命令) - 需要注意的点:更换国内镜像源,根据项目要求的pytorch版本去安装;看清楚是GPU版本还是CPU版本
导出虚拟机
- 导出步骤
1、关闭虚拟机
2、文件导出为OVF文件(文件比较大,一共有四个) - 需要注意的点
导出以后一定要考虑虚拟机的兼容性配置
总结
1、安装这一套环境一定需要注意版本之间的对应关系
2、要注意区分是root安装还是普通用户安装
3、配置环境变量的时候也需要注意是全局的还是所属用户的
4、虚拟机迁移一定要考虑兼容性配置
5、pip换源以及conda换源要考虑备份,如果换源失败还能会退回来
6、创建或者运行项目最好在独立的虚拟环境中,这样迁移环境会比较方便