摘要:云主机环境配置检查设备识别表示识别为表示为获取网络源,并配置官方源地址安装在安装前请检测当前内核版本,然后确保对应版本的包已经安装,否则无法正常编译驱动。
1. 检查GPU设备识别
$ sudo lspci | grep NVIDIA
3D controller: NVIDIA Corporation GK210GL [Tesla K80] 表示识别为K80
3D controller: NVIDIA Corporation GP102GL [Tesla P40] (rev a1) 表示为P40
2. 获取cuda网络源,并配置
NVidia官方源地址http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1404/x86_64/
$ wget http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1404/x86_64/cuda-repo-ubuntu1404_8.0.44-1_amd64.deb
$ sudo dpkg -i cuda-repo-ubuntu1404_8.0.44-1_amd64.deb
$ sudo apt-get update
3. 安装cuda 8.0
在安装前请uname -a 检测当前内核版本,然后确保对应版本的kernel-header包已经安装,否则无法正常编译驱动。
$ uname -a
$ Linux X-X-X-X 3.13.0-123-generic #172-Ubuntu SMP Mon
$ sudo apt search 3.13.0-123-generic
$ p linux-cloud-tools-3.13.0-123-generic - Linux kernel version specific cloud tools for version 3.13.0-123
$ p linux-headers-3.13.0-123-generic - Linux kernel headers for version 3.13.0 on 64 bit x86 SMP
$ p linux-headers-3.13.0-123-generic:i386 - Linux kernel headers for version 3.13.0 on 32 bit x86 SMP
$ sudo apt-get install linux-headers-3.13.0-123-generic
安装cuda
$ sudo apt-get install cuda-8.0
3.1 查看驱动状态
$ sudo nvidia-smi
看到如下输出表示GPU驱动正常:
4. 测试GPU基本功能(可选)
4.1 增加LD path
$ export LD_LIBRARY_PATH="/usr/local/cuda-7.5/lib64:/usr/lib64/:$LD_LIBRARY_PATH"
4.2 安装cuda examples
$ cd /usr/local/cuda/bin
$ sh cuda-install-samples-8.0.sh ~/cuda-test/
$ cd ~/cuda-test/NVIDIA_CUDA-8.0_Samples
$ make
$ ./bin/x86_64/linux/release/deviceQuery 获取设备状态
$ ./bin/x86_64/linux/release/bandwidthTest 测试设备带宽
如果编译过程发现lnvcuvid的错误,可以执行:
$ find . -type f -execdir sed -i s/UBUNTU_PKG_NAME = "nvidia-367"/UBUNTU_PKG_NAME = "nvidia-375"/g {}
其中nvidia-375是当前安装的驱动的版本
5. 安装cudnn
选装,注:不同AI框架对cudnn的版本支持不同
5.1 下载cudnn软件包
https://developer.nvidia.com/cudnn ,需要注册nvidia账号后才能下载
5.2 安装
案例使用cudnn5.1 因为TensorFlow目前仅支持5.1
ubuntu 可以选择 cuDNN v5.1 Runtime Library for Ubuntu14.04 (Deb)
$ sudo dpkg -i libcudnn5_5.1.10-1+cuda8.0_amd64.deb
6. 关闭ubuntu自动更新内核及NVidia Tools
建议操作
$ sudo vim /etc/apt/apt.conf.d/10periodic
将 APT::Periodic::Update-Package-Lists "1"; 修改为 APT::Periodic::Update-Package-Lists "0"; 以禁止ubuntu自动更新软件包
FAQ
这个问题是系统读取gpu状态信息不准确导致,执行下列命令可更正,让系统读取命令正确。
# nvidia-smi -pm 1
可提交工单,或联系工作人员,获得UCloud制作的包含GPU驱动和Cuda环境的镜像,节省人工安装的时间。
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。
转载请注明本文地址:https://www.ucloud.cn/yun/126103.html
摘要:除自行安装外,是否有其它可获得驱动镜像的方法可提交工单,或联系工作人员,获得制作的包含驱动和环境的镜像,节省人工安装的时间。实时文档欢迎访问GPU云主机UHost Ubuntu 16.04 环境配置1. 检查GPU设备识别 $ sudo lspci | grep NVIDIA 3D controller: NVIDIA Corporation GK210GL [Tesla K80] 表...
摘要:云主机环境配置检查设备识别表示识别为表示为屏蔽开源驱动编辑如下文件写入下列内容更新并重启控制台镜像的内核为,该版本在官方已无法下载状态,此为安装驱动所必需,建议先升级内核至后续版本。GPU云主机UHost Ubuntu 18.04 环境配置1. 检查GPU设备识别 $ sudo lspci | grep NVIDIA 3D controller: NVIDIA Corporation ...
摘要:注意下载安装案例使用因为目前仅支持解压的路径可以自由选择,一般是下面,这边假设为发现使用率,为什么这个问题是系统读取状态信息不准确导致,执行下列命令可更正,让系统读取命令正确。GPU云主机UHost CentOS 7环境配置1. 检查GPU设备识别 $ yum install pciutils $ sudo lspci | grep NVIDIA 3D controller: NV...
摘要:概览概览产品简介产品优势机型与性能深度学习指南驱动安装指南环境配置环境配置环境配置环境配置 概览产品简介产品优势机型与性能深度学习指南驱动安装指南CentOS7环境配置Ubuntu14.04环境配置Ubuntu16.04环境配置Ubuntu18.04环境配置
摘要:概览概览产品简介产品优势机型与性能深度学习指南驱动安装指南环境配置环境配置环境配置环境配置 概览产品简介产品优势机型与性能深度学习指南驱动安装指南CentOS7环境配置Ubuntu14.04环境配置Ubuntu16.04环境配置Ubuntu18.04环境配置
阅读 3473·2023-04-25 20:09
阅读 3684·2022-06-28 19:00
阅读 2994·2022-06-28 19:00
阅读 2995·2022-06-28 19:00
阅读 3048·2022-06-28 19:00
阅读 2834·2022-06-28 19:00
阅读 2969·2022-06-28 19:00
阅读 2578·2022-06-28 19:00