概述
序言:
过去安装系统,总是从互联网看看别人如何装,照猫画虎就稀里糊涂地装上了。但是并不知道版本之间的关系,以至于下次安装依然临时拍脑决定,这样安装的坏处是,以后运行时可能遇到莫名的错误。如今安装服务器,发现再不可随意安装了事,需要步步有依据,规范安装,因此记录全过程,作为以后安装的范本。
buntu安装NVIDIA显卡驱动
第一章 安装Linux环境
在百度搜索“清华镜像源”找到国内开源镜像。下载ubuntu18.04的server版,然后制作启动盘。
- 安装服务器,其中更新升级路径提示处,选择阿里云镜像:http://mirrors.aliyun.com/ubuntu
- 继续安装,到服务选择表格处,什么也不选。
安装成功,键入:
sudo uname --m
查看是否64位:i686是32位;x86-64是64位。
第二章 Linux环境检测
这次安装的是深度学习训练服务器,因为要跑的项目是安装tensorflow1的项目,因而需要CUDA,cuDNN这些版本互相匹配,如果匹配不成功,会相当麻烦。查表 tensorflow和cuda的配合表,显示如下内容:
tf版本 | python版本 | c编译器 | ?? | cuDNN | CUDA |
tensorflow-2.0.0 | 2.7、3.3-3.7 | GCC 7.3.1 | Bazel 0.26.1 | 7.4 | 10.0 |
tensorflow_gpu-1.15.0 | 2.7、3.3-3.7 | GCC 7.3.1 | Bazel 0.26.1 | 7.4 | 10.0 |
tensorflow_gpu-1.14.0 | 2.7、3.3-3.7 | GCC 4.8 | Bazel 0.24.1 | 7.4 | 10.0 |
tensorflow_gpu-1.13.1 | 2.7、3.3-3.7 | GCC 4.8 | Bazel 0.19.2 | 7.4 | 10.0 |
因此,确定的版本信息是:
- tensorflow_gpu-1.15.0(如采用编译安装,因为tensorflow_gpu-1.14.0的GCC编译器是4.8,而ubuntu18.04的默认的是7.3,因此不选tensorflow_gpu-1.14.0。如果是不编译安装(不用GCC编译器),两个版本均可)
- cuda10.0
- cuDNN7.4
安装之前,首先要安装ubuntu18.0.4.在Ubuntu操作系统下,
键入命令: lspci 也可以是: lspci | grep -i nvidia
该命令将所有主板pci插件全部信息显露出来。其中必然包括类似信息: GeForce GTX 1080 Ti
其意义是:知道如下信息,便于下载驱动。
产品类型:GeForce 产品系列:GeForce 10 series 【此处10就是指1080的10】 产品: GeForce GTX 1080 Ti 操作系统:Linux64-bitg
但是,该网卡是否与操作系统配套,需要检查:
键入命令:ubuntu-drivers devices
该命令直接告诉你,当前的Ubuntu和当前显卡的组合下,需要什么样的显卡驱动,推荐哪一种。在Ubuntu18.04下,可以安装【418,450,460】,推荐的是460驱动程序。若是在Ubuntu18.04下,查到版本号要低,这是nouveau版本的制约。参考图:
再次查表CUDA和驱动对照表,看驱动程序与CUDA是否配套。g
CUDA 版本 | linux驱动程序最低版本 | windows驱动程序最低版本 |
CUDA 10.2.89 | >= 440.33 | >= 441.22 |
CUDA 10.1 (10.1.105 general release, and updates) | >= 418.39 | >= 418.96 |
CUDA 10.0.130 | >= 410.48 | >= 411.31 |
CUDA 9.2 (9.2.148 Update 1) | >= 396.37 | >= 398.26 |
该表中指出,cuda10.0需要410以上的驱动程序支持,因此这个条件自然是满足的。
第三章 显卡驱动程序获取
下载显卡驱动程序,进入网址:https://www.nvidia.cn/geforce/drivers/ 。将第一章获得的产品信息填入表格(如下图)
将第一章所得信息输入,按键”提交“结果如下:
上述红线画住的全是版本号,下载任意一个都可以安装在当前操作系统中。不过,我们这里尚不能随意选择,因为还有tensorflow版本的制约,应该先停下,去查询tensorflow的版本,再回来下载正确的驱动程序版本。
驱动程序查看表:官方网站
Nvidia显卡驱动和CUDA的对照表:官方网站
第四章 显卡驱动程序的选择
4.1 关于nouveau的概念g
是一个旨在为nvidia的GPU建立高质量的,免费自由的开源驱动项目,nouveau"[nuvo]"与new谐音, 是Linux KMS驱动的一部份,最新的版本在Linux内核中支持nvidia的帕斯卡构架
nouveau是一个自由开放源代码CPU驱动程序,是为AMD的CPU所编写,也可用于属于系统芯片的高通系列,此驱动程序是由一群独立的软件工程师所编写,Nvidia的员工也提供了些微的帮助,微软也提供了很大的帮助,谷歌也不甘示弱地提供了尽可能多的帮助。
要说nvidia的驱动程序,是分为两段的,见下图
也就是说,linux内核有nouveau才能支持Nvidia,没有就不能支持。
4.2 安装Nvidia的显卡驱动
安装指令推荐:
sudo ubuntu-drivers autoinstall
这里仅仅一条指令就干脆利索地安装好了,推荐的原因是:许多依赖的模块(如gcc)能够全部一次安装完成。(第二章中下载的驱动程序也不需要了!)
不要忘了:
sudo reboot
第五章 桌面和中文输入
也许本章有些多余,但是为了操作方便,也需要安装,这里一并写出。
5.1安装桌面
安装桌面方法很多,这里推荐较为简单,且不易出错的方法
sudo apt-get update
sudo apt-get upgrade -y
sudo apt-get install tasksel -y
sudo tasksel
出现一个表格,用上下键移动,用空格选中 ubuntu desktop 项目,用tab键选中“OK”键后,装入桌面。
5.2 安装汉字输入
sudo apt-get install ibus-pinyin
sudo ibus-setup
然后,打开面板的“system setting”,选中汉字拼音就可以了。参考帖子.
第六章 安装CUDA和cuDNN
6.1 选择版本
cuda的版本,受限于tensorflow,见第二章。因此这里选择的cuda是10.0版本,对应的cuDNN是7.4.
cuda下载地址:https://developer.nvidia.com/cuda-toolkit-archive
g
在以上版本中点击,进入下面下载页面
、
下载CUDA,如果有补丁,也下载下来。
通过XXXXXXX下载cuDNN7.4
cuda和cuDNN的对照表:官方地址:cuDNN Archive | NVIDIA Developer
cuda历史版本:官方地址
6.2 安装CUDA和cuDNN
1)cuda是啥?g
CUDA是NVIDIA推出的用于自家GPU的并行计算框架,也就是说CUDA只能在NVIDIA的GPU上运行,而且只有当要解决的计算问题是可以大量并行计算的时候才能发挥CUDA的作用。
2)cuDNN是啥?
NVIDIA cuDNN是用于深度神经网络的GPU加速库。它强调性能、易用性和低内存开销。NVIDIA cuDNN可以集成到更高级别的机器学习框架中,如谷歌的Tensorflow、加州大学伯克利分校的流行caffe软件。简单的插入式设计可以让开发人员专注于设计和实现神经网络模型,而不是简单调整性能,同时还可以在GPU上实现高性能现代并行计算。
3)安 装cuda指令
sudo sh cuda_***_linux.run (你下载的runfile安装包名字)
4)安装cuDNN
CuDNN与Cuda存在对应关系,表格地址为:cuDNN Archive | NVIDIA Developer,从中找到相应的CuDNN,并注册账号才能下载。
严格来说,cuDNN不是叫安装,叫拷贝,只要将cuDNN解压后,将解压后目录对应内容拷贝到CUDA10
参考文章:https://www.jb51.net/article/171959.htm
ubuntu18.04 安装cuDNN:Ubuntu18.04下安装Nvidia驱动和CUDA10.1+CUDNN7.6.5_leisp的博客-CSDN博客
第七章 安装Anaconda
7.1 版本选择
选择tf版本是tensorflow_gpu-1.15.0,所要求的python是3.3-3.7,我们选择3.6版本。查下面表格,可以确定我们需要的版本是anaconda3.5.2。
选择anaconda和python的对应表: https://repo.anaconda.com/archive/
7.2 安装anaconda
安装指令
bash Anaconda3-5.2.0-Linux-x86_64.sh //运行安装包
一般地,anaconda将被安装到/usr/local路径下。
第八章 安装tensorflow
先查看能安装的tensorflow版本号。
conda search tensorflow
以上可以列出全部的tensorflow版本,这里通过查表:tensorflow和cuda的配合表,不难确定用tensorflow1.14版本安装。
pip3 install tensorflow-gpu-1.14.0
至此,tensorflow安装成功。
第九章 安装pytorch
安装pytorch需要知道它的版本和cuda版本对应关系,网上没有整理出来的版本信息,不过,在该下载地址https://download.pytorch.org/whl/torch_stable.html 打开后,安装文件的名称能够反映出cuda版本、python版本,和pytorch对应关系,如:
和
下载后安装就可以了。
参考文档:
深度学习环境配置:Ubuntu16.04安装GTX1080Ti+CUDA9.0+cuDNN7.0完整安装教程(多链接多参考文章)
Ubuntu下安装CUDA10.0遇到的问题(一定要注意自己版本)
Ubuntu 18.04 LTS+GTX1080Ti+CUDA10.0 深度学习主机环境搭建 - 知乎 (zhihu.com)
最后
以上就是慈祥大炮为你收集整理的2021-04-17 安装Ubuntu18.0.4 的深度学习训练服务器 序言:第一章 安装Linux环境第二章 Linux环境检测第三章 显卡驱动程序获取第四章 显卡驱动程序的选择第五章 桌面和中文输入第六章 安装CUDA和cuDNN第七章 安装Anaconda第八章 安装tensorflow第九章 安装pytorch的全部内容,希望文章能够帮你解决2021-04-17 安装Ubuntu18.0.4 的深度学习训练服务器 序言:第一章 安装Linux环境第二章 Linux环境检测第三章 显卡驱动程序获取第四章 显卡驱动程序的选择第五章 桌面和中文输入第六章 安装CUDA和cuDNN第七章 安装Anaconda第八章 安装tensorflow第九章 安装pytorch所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复