资讯专栏INFORMATION COLUMN

【GPU云主机 UHost】驱动安装指南:Ubuntu 18.04 环境配置之检查GPU设备识别、屏

Tecode / 2604人阅读

摘要:云主机环境配置检查设备识别表示识别为表示为屏蔽开源驱动编辑如下文件写入下列内容更新并重启控制台镜像的内核为,该版本在官方已无法下载状态,此为安装驱动所必需,建议先升级内核至后续版本。

GPU云主机UHost Ubuntu 18.04 环境配置

1. 检查GPU设备识别

  $ sudo lspci | grep NVIDIA
  3D controller: NVIDIA Corporation GK210GL [Tesla K80] 表示识别为K80
  3D controller: NVIDIA Corporation GP102GL [Tesla P40] (rev a1) 表示为P40

2. 屏蔽开源驱动nouveau

编辑如下文件:

sudo vim /etc/modprobe.d/blacklist-nouveau.conf

写入下列内容:

blacklist nouveau
blacklist lbm-nouveau
options nouveau modeset=0
alias nouveau off
alias lbm-nouveau off

更新并重启:

sudo update-initramfs -u
sudo reboot
sudo apt-get install build-essential pkg-config

控制台Ubuntu 18.04镜像的内核为4.15.0-68-generic,该版本 linux-headers-4.15.0-68在Ubuntu官方已无法下载(状态deleted),此为安装驱动所必需,建议先升级内核至后续版本。

可从官方 https://kernel.ubuntu.com/~kernel-ppa/mainline/ 下载内核,例如4.15.1

也可从UFile下载,速度更快

http://gpu.cn-bj.ufileos.com/linux-headers-4.15.1-041501-generic_4.15.1-041501.201802031831_amd64.deb
http://gpu.cn-bj.ufileos.com/linux-headers-4.15.1-041501_4.15.1-041501.201802031831_all.deb
http://gpu.cn-bj.ufileos.com/linux-image-4.15.1-041501-generic_4.15.1-041501.201802031831_amd64.deb

安装内核,重启并查看版本:

sudo dpkg -i *.deb
sudo reboot
uname -r

3. 安装nvidia驱动

3.1 下载

到nvidia官网下载合适的驱动(目前版本418.126.02),地址https://www.nvidia.com/Download/index.aspx?lang=en-us

也可从UFile下载,速度更快 http://gpu.cn-bj.ufileos.com/NVIDIA-Linux-x86_64-418.126.02.run

3.2 安装

sudo chmod +x NVIDIA-Linux-x86_64-418.126.02.run
sudo ./NVIDIA-Linux-x86_64-418.126.02.run

3.3 查看驱动状态

$ sudo nvidia-smi

看到如下输出表示GPU驱动正常:

image.png

4. 安装cuda库

4.1 网络安装

sudo wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/cuda-ubuntu1804.pin

sudo mv cuda-ubuntu1804.pin /etc/apt/preferences.d/cuda-repository-pin-600

sudo apt-key adv --fetch-keys http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/7fa2af80.pub

sudo add-apt-repository "deb http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/ /"

sudo apt-get update

sudo apt-get -y install cuda

4.2 本地安装

wget http://developer.download.nvidia.com/compute/cuda/10.2/Prod/local_installers/cuda_10.2.89_440.33.01_linux.run
sudo sh cuda_10.2.89_440.33.01_linux.run

FAQ

  1. nvidia-smi 发现 GPU使用率100%,为什么?

这个问题是系统读取gpu状态信息不准确导致,执行下列命令可更正,让系统读取命令正确。

#sudo nvidia-smi -pm 1
  1. 除自行安装外,是否有其它可获得驱动镜像的方法?

可提交工单,或联系工作人员,获得UCloud制作的包含GPU驱动和Cuda环境的镜像,节省人工安装的时间。

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/126110.html

相关文章

  • GPU主机 UHost驱动安装指南Ubuntu 16.04 环境配置检查GPU设备识别

    摘要:除自行安装外,是否有其它可获得驱动镜像的方法可提交工单,或联系工作人员,获得制作的包含驱动和环境的镜像,节省人工安装的时间。实时文档欢迎访问GPU云主机UHost Ubuntu 16.04 环境配置1. 检查GPU设备识别 $ sudo lspci | grep NVIDIA 3D controller: NVIDIA Corporation GK210GL [Tesla K80] 表...

    Tecode 评论0 收藏0
  • GPU主机 UHost驱动安装指南Ubuntu 14.04 环境配置检查GPU设备识别、获

    摘要:云主机环境配置检查设备识别表示识别为表示为获取网络源,并配置官方源地址安装在安装前请检测当前内核版本,然后确保对应版本的包已经安装,否则无法正常编译驱动。GPU云主机UHost Ubuntu 14.04 环境配置1. 检查GPU设备识别 $ sudo lspci | grep NVIDIA 3D controller: NVIDIA Corporation GK210GL [Tesla...

    Tecode 评论0 收藏0
  • GPU主机 UHost驱动安装指南:CentOS 7 环境配置检查GPU设备识别、获取cud

    摘要:注意下载安装案例使用因为目前仅支持解压的路径可以自由选择,一般是下面,这边假设为发现使用率,为什么这个问题是系统读取状态信息不准确导致,执行下列命令可更正,让系统读取命令正确。GPU云主机UHost CentOS 7环境配置1. 检查GPU设备识别 $ yum install pciutils $ sudo lspci | grep NVIDIA 3D controller: NV...

    Tecode 评论0 收藏0
  • 概览 GPU主机 UHost

    摘要:概览概览产品简介产品优势机型与性能深度学习指南驱动安装指南环境配置环境配置环境配置环境配置 概览产品简介产品优势机型与性能深度学习指南驱动安装指南CentOS7环境配置Ubuntu14.04环境配置Ubuntu16.04环境配置Ubuntu18.04环境配置

    ernest.wang 评论0 收藏2568
  • 概览 GPU主机 UHost

    摘要:概览概览产品简介产品优势机型与性能深度学习指南驱动安装指南环境配置环境配置环境配置环境配置 概览产品简介产品优势机型与性能深度学习指南驱动安装指南CentOS7环境配置Ubuntu14.04环境配置Ubuntu16.04环境配置Ubuntu18.04环境配置

    ernest.wang 评论0 收藏2541

发表评论

0条评论

最新活动
阅读需要支付1元查看
<