我是靠谱客的博主 包容奇异果,最近开发中收集的这篇文章主要介绍基于AMD-ROCm和tensorflow机器学习加速平台的部署方法,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

截至到发文时间,ROCm版本已经更新到V3.1.0。
官方文档地址:https://rocm-documentation.readthedocs.io/en/latest/Current_Release_Notes/Current-Release-Notes.html

新版本V3.1.0增加了AMD GPU版的SLURM,这是一个开源的大型计算结点集群的管理器和作业调度系统。同时增加了对Vega7nmGPU的适配。

本文的实践步骤基于ROCmV3.0,V3.1.0版本的安装步骤与其一样。
在安装之前不要安装AMD显卡驱动,否则会有错误。同样安装之后,也不需要AMD显卡驱动。

实验环境:

  • OS:Ubuntu 18.04.3LTS
  • 内核:5.3.0-40-generic

安装步骤如下:

1、更新软件源

sudo apt update

sudo apt dist-upgrade

sudo apt install libnuma-dev

sudo reboot

2、在系统中加入APT软件源

wget -q0 –http://repo.radeon.com/rocm/apt/debian/rocm.gpg.key |

sudo apt-key add -echo 'deb [arch=amd64] http://repo.radeon.com/rocm/apt/debian/ xenial main' |

sudo tee /etc/apt/sources.list.d/rocm.list

3、安装ROCm

sudo apt update

sudo apt install rocm-dkms

4、将现有用户加入videogroup,这样才可使用GPU资源。

sudo usermod -a -G video $LOGNAME

如果想在默认情况下,将所有将来添加的用户添加到videogroup。

echo 'ADD_EXTRA_GROUPS=1'
sudo tee -a /etc/adduser.conf

echo 'EXTRA_GROUPS=video'
sudo tee -a /etc/adduser.conf

5、到此系统ROCm环境已经基本安装完成,重启系统生效。

6、测试安装是否成功。

/opt/rocm/bin/rocminfo
/opt/rocm/opencl/bin/x86_64/clinfo

如果安装成功则返回系统相关信息;否则,报错。

另外,要执行ROCm的应用程序,还必须在系统上安装完整的ROCm驱动程序堆栈。

sudo apt update
sudo apt install rocm-dev

最后,在python环境便可以安装ROCm版本的tensorflow。

pip install tensorflow-rocm

之后可以获得最新版本的tensorflow,目前tensorflow可以适配V2.1.0。经过验证,ROCm版本的tensorflow最低支持V0.0.1。具体可以根据自己项目中的实际需要来配置。
详细可参考Pypi官方信息:https://pypi.org/project/tensorflow-rocm/#history

以上参考于ROCm官方文档。

最后

以上就是包容奇异果为你收集整理的基于AMD-ROCm和tensorflow机器学习加速平台的部署方法的全部内容,希望文章能够帮你解决基于AMD-ROCm和tensorflow机器学习加速平台的部署方法所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(57)

评论列表共有 0 条评论

立即
投稿
返回
顶部