我是靠谱客的博主 慈祥大炮,最近开发中收集的这篇文章主要介绍2021-04-17 安装Ubuntu18.0.4 的深度学习训练服务器 序言:第一章  安装Linux环境第二章 Linux环境检测第三章 显卡驱动程序获取第四章 显卡驱动程序的选择第五章 桌面和中文输入第六章 安装CUDA和cuDNN第七章 安装Anaconda第八章 安装tensorflow第九章 安装pytorch,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

 序言:

过去安装系统,总是从互联网看看别人如何装,照猫画虎就稀里糊涂地装上了。但是并不知道版本之间的关系,以至于下次安装依然临时拍脑决定,这样安装的坏处是,以后运行时可能遇到莫名的错误。如今安装服务器,发现再不可随意安装了事,需要步步有依据,规范安装,因此记录全过程,作为以后安装的范本。

buntu安装NVIDIA显卡驱动

第一章  安装Linux环境

在百度搜索“清华镜像源”找到国内开源镜像。下载ubuntu18.04的server版,然后制作启动盘。

  • 安装服务器,其中更新升级路径提示处,选择阿里云镜像:http://mirrors.aliyun.com/ubuntu
  • 继续安装,到服务选择表格处,什么也不选。

安装成功,键入:

sudo uname --m

查看是否64位:i686是32位;x86-64是64位。

第二章 Linux环境检测

这次安装的是深度学习训练服务器,因为要跑的项目是安装tensorflow1的项目,因而需要CUDA,cuDNN这些版本互相匹配,如果匹配不成功,会相当麻烦。查表 tensorflow和cuda的配合表,显示如下内容:    

 tf版本  python版本c编译器??cuDNNCUDA  
tensorflow-2.0.02.7、3.3-3.7GCC 7.3.1Bazel 0.26.17.410.0
tensorflow_gpu-1.15.02.7、3.3-3.7GCC 7.3.1Bazel 0.26.17.410.0
tensorflow_gpu-1.14.02.7、3.3-3.7GCC 4.8Bazel 0.24.17.410.0
tensorflow_gpu-1.13.12.7、3.3-3.7GCC 4.8Bazel 0.19.27.410.0

因此,确定的版本信息是: 

  • tensorflow_gpu-1.15.0(如采用编译安装,因为tensorflow_gpu-1.14.0的GCC编译器是4.8,而ubuntu18.04的默认的是7.3,因此不选tensorflow_gpu-1.14.0。如果是不编译安装(不用GCC编译器),两个版本均可)
  • cuda10.0
  • cuDNN7.4

安装之前,首先要安装ubuntu18.0.4.在Ubuntu操作系统下,

键入命令:  lspci                       也可以是:            lspci  | grep  -i nvidia

该命令将所有主板pci插件全部信息显露出来。其中必然包括类似信息:     GeForce GTX 1080 Ti

其意义是:知道如下信息,便于下载驱动。

产品类型:GeForce
产品系列:GeForce 10 series  【此处10就是指1080的10】
产品:   GeForce GTX 1080 Ti
操作系统:Linux64-bitg

但是,该网卡是否与操作系统配套,需要检查:

键入命令:ubuntu-drivers devices

该命令直接告诉你,当前的Ubuntu和当前显卡的组合下,需要什么样的显卡驱动,推荐哪一种。在Ubuntu18.04下,可以安装【418,450,460】,推荐的是460驱动程序。若是在Ubuntu18.04下,查到版本号要低,这是nouveau版本的制约。参考图:

再次查表CUDA和驱动对照表,看驱动程序与CUDA是否配套。g

CUDA 版本linux驱动程序最低版本windows驱动程序最低版本
CUDA 10.2.89>= 440.33>= 441.22
CUDA 10.1 (10.1.105 general release, and updates)>= 418.39>= 418.96
CUDA 10.0.130>= 410.48>= 411.31
CUDA 9.2 (9.2.148 Update 1)>= 396.37>= 398.26

该表中指出,cuda10.0需要410以上的驱动程序支持,因此这个条件自然是满足的。 

第三章 显卡驱动程序获取

下载显卡驱动程序,进入网址:https://www.nvidia.cn/geforce/drivers/ 。将第一章获得的产品信息填入表格(如下图)

将第一章所得信息输入,按键”提交“结果如下:

上述红线画住的全是版本号,下载任意一个都可以安装在当前操作系统中。不过,我们这里尚不能随意选择,因为还有tensorflow版本的制约,应该先停下,去查询tensorflow的版本,再回来下载正确的驱动程序版本。

驱动程序查看表:官方网站

Nvidia显卡驱动和CUDA的对照表:官方网站

第四章 显卡驱动程序的选择

4.1 关于nouveau的概念g

是一个旨在为nvidia的GPU建立高质量的,免费自由的开源驱动项目,nouveau"[nuvo]"与new谐音, 是Linux KMS驱动的一部份,最新的版本在Linux内核中支持nvidia的帕斯卡构架

nouveau是一个自由开放源代码CPU驱动程序,是为AMD的CPU所编写,也可用于属于系统芯片的高通系列,此驱动程序是由一群独立的软件工程师所编写,Nvidia的员工也提供了些微的帮助,微软也提供了很大的帮助,谷歌也不甘示弱地提供了尽可能多的帮助。

要说nvidia的驱动程序,是分为两段的,见下图

也就是说,linux内核有nouveau才能支持Nvidia,没有就不能支持。

4.2 安装Nvidia的显卡驱动

安装指令推荐:

sudo ubuntu-drivers autoinstall

这里仅仅一条指令就干脆利索地安装好了,推荐的原因是:许多依赖的模块(如gcc)能够全部一次安装完成。(第二章中下载的驱动程序也不需要了!)

不要忘了:

sudo reboot

第五章 桌面和中文输入

也许本章有些多余,但是为了操作方便,也需要安装,这里一并写出。

5.1安装桌面

安装桌面方法很多,这里推荐较为简单,且不易出错的方法

sudo apt-get update

sudo apt-get upgrade -y

sudo apt-get install tasksel -y

sudo tasksel

出现一个表格,用上下键移动,用空格选中 ubuntu desktop 项目,用tab键选中“OK”键后,装入桌面。

5.2 安装汉字输入

sudo apt-get install ibus-pinyin

sudo ibus-setup

然后,打开面板的“system setting”,选中汉字拼音就可以了。参考帖子.

第六章 安装CUDA和cuDNN

6.1 选择版本

cuda的版本,受限于tensorflow,见第二章。因此这里选择的cuda是10.0版本,对应的cuDNN是7.4.

cuda下载地址:https://developer.nvidia.com/cuda-toolkit-archive

g

在以上版本中点击,进入下面下载页面

下载CUDA,如果有补丁,也下载下来。

通过XXXXXXX下载cuDNN7.4

cuda和cuDNN的对照表:官方地址:cuDNN Archive | NVIDIA Developer

cuda历史版本:官方地址

6.2 安装CUDA和cuDNN

1)cuda是啥?g

CUDA是NVIDIA推出的用于自家GPU的并行计算框架,也就是说CUDA只能在NVIDIA的GPU上运行,而且只有当要解决的计算问题是可以大量并行计算的时候才能发挥CUDA的作用。

2)cuDNN是啥?

NVIDIA cuDNN是用于深度神经网络的GPU加速库。它强调性能、易用性和低内存开销。NVIDIA cuDNN可以集成到更高级别的机器学习框架中,如谷歌的Tensorflow、加州大学伯克利分校的流行caffe软件。简单的插入式设计可以让开发人员专注于设计和实现神经网络模型,而不是简单调整性能,同时还可以在GPU上实现高性能现代并行计算。

3)安 装cuda指令

sudo sh cuda_***_linux.run       (你下载的runfile安装包名字)

4)安装cuDNN

CuDNN与Cuda存在对应关系,表格地址为:cuDNN Archive | NVIDIA Developer,从中找到相应的CuDNN,并注册账号才能下载。

严格来说,cuDNN不是叫安装,叫拷贝,只要将cuDNN解压后,将解压后目录对应内容拷贝到CUDA10

参考文章:https://www.jb51.net/article/171959.htm

ubuntu18.04 安装cuDNN:Ubuntu18.04下安装Nvidia驱动和CUDA10.1+CUDNN7.6.5_leisp的博客-CSDN博客

第七章 安装Anaconda

7.1 版本选择

选择tf版本是tensorflow_gpu-1.15.0,所要求的python是3.3-3.7,我们选择3.6版本。查下面表格,可以确定我们需要的版本是anaconda3.5.2。

选择anaconda和python的对应表: https://repo.anaconda.com/archive/

7.2 安装anaconda

安装指令

bash  Anaconda3-5.2.0-Linux-x86_64.sh         //运行安装包

一般地,anaconda将被安装到/usr/local路径下。

第八章 安装tensorflow

先查看能安装的tensorflow版本号。

conda search tensorflow 

以上可以列出全部的tensorflow版本,这里通过查表:tensorflow和cuda的配合表,不难确定用tensorflow1.14版本安装。

pip3 install  tensorflow-gpu-1.14.0 

至此,tensorflow安装成功。

第九章 安装pytorch

安装pytorch需要知道它的版本和cuda版本对应关系,网上没有整理出来的版本信息,不过,在该下载地址https://download.pytorch.org/whl/torch_stable.html 打开后,安装文件的名称能够反映出cuda版本、python版本,和pytorch对应关系,如:

下载后安装就可以了。

参考文档:

深度学习环境配置:Ubuntu16.04安装GTX1080Ti+CUDA9.0+cuDNN7.0完整安装教程(多链接多参考文章)

Ubuntu下安装CUDA10.0遇到的问题(一定要注意自己版本)

Ubuntu 18.04 LTS+GTX1080Ti+CUDA10.0 深度学习主机环境搭建 - 知乎 (zhihu.com)

最后

以上就是慈祥大炮为你收集整理的2021-04-17 安装Ubuntu18.0.4 的深度学习训练服务器 序言:第一章  安装Linux环境第二章 Linux环境检测第三章 显卡驱动程序获取第四章 显卡驱动程序的选择第五章 桌面和中文输入第六章 安装CUDA和cuDNN第七章 安装Anaconda第八章 安装tensorflow第九章 安装pytorch的全部内容,希望文章能够帮你解决2021-04-17 安装Ubuntu18.0.4 的深度学习训练服务器 序言:第一章  安装Linux环境第二章 Linux环境检测第三章 显卡驱动程序获取第四章 显卡驱动程序的选择第五章 桌面和中文输入第六章 安装CUDA和cuDNN第七章 安装Anaconda第八章 安装tensorflow第九章 安装pytorch所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(55)

评论列表共有 0 条评论

立即
投稿
返回
顶部