我是靠谱客的博主 热情马里奥,最近开发中收集的这篇文章主要介绍记一次在ubuntu16.04上安装tensorflow-gpu的过程,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

前言:
tensorflow已经安装了很多遍了,也填平了好多坑了。XX说过:“世界上本来没有大牛,爬的坑多了就有了大牛”。

这是一篇安装类的文章,这类文章的时效性非常高。注意我安装的时间是2018-01-05。这个时候这个世界的snapshot是:ubuntu17.04, tensorflow-gpu 1.5.0, cuda9.1, cudnn7.1都已经有了。但是我这次安装是在阿里云上安装的,在阿里云的pypi镜像上只有1.4.1的所以我也只安装1.4.1的。(pip配置http://mirrors.aliyun.com/pypi/simple/tensorflow-gpu/)

因此我本次安装的是:ubuntu16.04 + tensorflow1.4.1 + cuda8.0 + cudnn6.0 .
硬件是 NVIDIA Corporation GM200GL [Tesla M40] (rev a1)。 阿里云上最便宜的gn4。

主要思路是参考:https://tensorflow.google.cn/install/install_linux。无非三部:一,cuda,二cudnn,三tensorflow

1 安装cuda8.0

大而全的无用的完全安装手册: http://docs.nvidia.com/cuda/cuda-installation-guide-linux/index.html#post-installation-actions
这个手册太复杂了,简直不能看。万不得已,不要看。
1.1 下载软件
https://developer.nvidia.com/cuda-80-ga2-download-archive
这里点开直接给出了8.0的下载地址。参考下面的图选择安装方式。我选择的是deb(local)。网上也有很多教程是runfile的。

注意我们都在linux下面了,直接用wget命令下载,不用什么浏览器打开吧。
1.2 local deb方式
wget "https://developer.nvidia.com//compute/cuda/8.0/prod/local_installers/cuda-repo-ubuntu1604-8-0-local_8.0.44-1_amd64-deb" -O cuda-repo-ubuntu1604-8-0-local_8.0.44-1_amd64.deb
然后根据图上的命令执行:
  1. `sudo dpkg -i cuda-repo-ubuntu1604-8-0-local-ga2_8.0.61-1_amd64.deb`
  2. `sudo apt-get update`
  3. `sudo apt-get install cuda`坑王在此,他坑退避。这样执行的话,直接安装了最新版本(当前是9.1,而tensorflow1.4.1不支持,所以这如果安装错误,那么得卸载重装)。所以这里一定执行sudo apt-get install cuda-8-0。更详细的描述见https://devtalk.nvidia.com/default/topic/1024342/cuda-setup-and-installation/unable-to-uninstall-cuda-9-0-completely-and-install-8-0-instead/
1.3 deb(network) 这里是和1.2并列的。按照1.2安装,这里可以跳过了。
wget "http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1604/x86_64/cuda-repo-ubuntu1604_8.0.44-1_amd64.deb" -O "cuda-repo-ubuntu1604_8.0.44-1_amd64.deb" 这里只给出命令,后续步骤和1.2中类似。
NOTE:怎么得到各个版本的下载地址呢?每个版本点击右键有惊喜。
1.4 检查安装是否成功
能正常运行nvidia-smi即可
1.5设置环境变量
export PATH=/usr/local/cuda-9.1/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64:$LD_LIBRARY_PATH #有一个坑。nvidia的安装说明中没说要这个,但是你要自己设置。

1.6 卸载命令
NOTE:千万不要顺序执行到这里
sudo apt-get --purge remove cuda
sudo apt autoremove
sudo apt-get clean

2 安装cudnn 6.0
网上各种中文教程,但是nvidia的教程是最权威,又最简单的
http://docs.nvidia.com/deeplearning/sdk/cudnn-install/index.html。参见2.3.1章节
2.1 下载软件
https://developer.nvidia.com/rdp/cudnn-download

2 安装软件
参考http://docs.nvidia.com/deeplearning/sdk/cudnn-install/index.html。参见2.3.1章节
Navigate to your <cudnnpath> directory containing the cuDNN Tar file. Unzip the cuDNN package.
$ tar -xzvf cudnn-9.0-linux-x64-v7.tgz
Copy the following files into the CUDA Toolkit directory.
$ sudo cp cuda/include/cudnn.h /usr/local/cuda/include
$ sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
$ sudo chmod a+r /usr/local/cuda/include/cudnn.h
/usr/local/cuda/lib64/libcudnn*
3 安装tensorflow-gpu版本
最简单了,直接执行:
pip install tensorflow-gpu
注意1: 墙高无法翻越,需要设置pip源。自行baidu。
注意2:可以指定tensorflow版本 pip install tensorflow-gpu==1.4.1

4 运行测试程序保证安装成功





最后

以上就是热情马里奥为你收集整理的记一次在ubuntu16.04上安装tensorflow-gpu的过程的全部内容,希望文章能够帮你解决记一次在ubuntu16.04上安装tensorflow-gpu的过程所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(40)

评论列表共有 0 条评论

立即
投稿
返回
顶部