AMD显卡Ubuntu20.4系统下部署stable diffusion

[复制链接]
查看750 | 回复0 | 2023-8-11 15:51:50 | 显示全部楼层 |阅读模式
今天来给大家做一个AMD显卡使用stable diffusion的小白(硬核)教程。最近这段时间AI特别火,很多小伙伴看到各种大佬用AI画的老婆非常精美(色情),弄的人心痒痒,自己也想画一个心仪的老婆(画作)。

                         太露骨的图片不能放,你们懂得!!
  
但是很多小伙伴用的是AMD的独立显卡,而自从矿潮以来,显卡价格就居高不下,特别是英伟达的显卡,虽然它用AI作图有优势,但是贵的吓人,从哥布林洞窟里解救出来的RTX3070也还要2000多,简直离谱。本教程呢适用于只有一张amd的显卡,不想换英伟达显卡(穷),又想玩stable diffusion的小伙伴。

  
那么今天呢我用的是ubuntu 20.4.5桌面版系统部署stable diffusion的教程,保证你能顺利跑起stable diffusion,因为我是从一个完全不懂linux系统的小白找教程一步一步部署下来的,你也能行!

  
要部署stable diffusion的话需要满足下面三个条件:

  
第一,要有一个128G以上的硬盘空间,用于安装ubuntu系统。

  
第二,最好要有一个科学上网的环境。

  
第三,要有成功部署的决心,遇到什么问题呢就解决什么问题,不要随便放弃,跟着我一步一步来。

  
本次的部署环境呢,是AMD的独立显卡RX6600。下图呢是支持AMD显卡部署stable diffusion的型号,从470到580、vega56、64、duo、五千以及六千系列,几乎涵盖了主流的AMD显卡型号。

                         
首先,我们需要安装Ubuntu20.4.5桌面版系统的安装我就不详细讲了,很基础,大概十分钟就能装好。为什么需要大家安装新系统呢,因为已有的ubuntu系统会因为我们装的一些软件会产生奇奇怪怪的问题。

  
本次部署呢,分为以下三个部分:

  
第一,python3.10.6的安装。

  
第二,安装ROCM与pytorch

  
第三,安装stable-diffusion

  

  第一部分:安装python3.10.6

  
我们进入系统以后呢,需要安装python3.10.6,因为ubuntu20.4.5呢自带的是python3.8.10。本次安装的stable diffusion需要跑在python3.10.6环境下,当然更高版本的也能跑,只是我没试过。

  

  
1.安装依赖 如果出现选择,输入Y。

  

  sudo -i
  sudo apt-get update
  sudo apt-get upgrade
  
sudo apt install build-essential zlib1g-dev libncurses5-dev libgdbm-dev libnss3-dev libssl-dev libreadline-dev libffi-dev libsqlite3-dev wget libbz2-dev

  

  
2.从官网下载源文件

  

  
wget https://www.python.org/ftp/python/3.10.6/Python-3.10.6.tgz

  

  
3.解压缩Python3.10文件

  

  
①先通过find命令找到Python-3.10.6.tgz的下载在哪里了:

  find / -name Python-3.10.6.tgz
  
②接着转换路径至home:

  cd /home/
  
③将python3.10从/root/Python-3.10.6.tgz(第①步找到的路径,红色的是我的路径)的文件复制到home文件夹下:

  cp /root/Python-3.10.6.tgz /home/
  
④然后将文件解压至home文件夹下:tar -zvxf Python-3.10.6.tgz

  
tar -zvxf Python-3.10.6.tgz

  

  
4.开始安装python3.10.6

  

  
cd Python-3.10.6/

  
./configure --enable-optimizations

  

  
5.编译:make(没有安装make命令的安装一下)

  
  
make

  
  
6.安装sudo make install

  
  
sudo make install

  

  
这样python3.10就安装完成了。

  

  
最后,我们需要更新一下python让python默认指向为python3.10

  
1.更新python默认指向有以下两个方法:

  
(下面这两个方法是或的关系,不是且的关系!当然,你也可以都做一遍。)

  
①建立软连接

  
首先,删除原有链接

  

  
rm /usr/bin/python

  

  
其次,找到python3的安装路径(我的是在/usr/local/bin/python3)

  

  
which python3

  

  
然后,找到的路径建立新链接

  

  
ln -s /usr/local/bin/python3 /usr/bin/python

  

  
这样输入python就可以了。

  

  
②设置python的环境变量(需要搜索vim编辑器的用法)

  
首先,编辑.bashrc文件

  

  
vim ~/.bashrc

  

  
在这里写入自己刚刚安装python3.10的路径:

  

  
alias python='/usr/local/bin/python3'

  
然后:

  

  
source ~/.bashrc

  
python

  

  
这样就可以了!

  

  
2.更新pip默认指向

  
pip指向pip3也是如上的两个办法。

  
这里只展示方法①(如果新装的系统就直接用我的命令):

  

  
which pip3

  
ln -s /usr/local/bin/pip3 /usr/bin/pip

  
pip

  

  
到这里,小伙伴们可以愉快的使用python3.10了!

  
我们回到主界面,输入 python -V 返回python 3.10.6 就说明部署成功了。

  

  

  第二部分:安装ROCM与pytorch

  

  
1.ROCM的简介

  
ROCM和NVDIA的CUDA类似,ROCM是AMD发布的一个用于加速GPU计算的软件平台。而该平台从面世至今仅支持Linux系统,因此本文的一切操作都将在Linux系统下进行。

  
2.ROCm的配置

  
2.1 查看显卡型号

  
由于AMD每更新一次ROCm就抛弃一批老型号显卡支持的不做人行为,安装前确认自己的显卡是否能支持就变成了一件很重要的事。

  
上表包括了大部分常见的A卡型号,以世代分类。 不在表中的可以去这里输入自己显卡的型号,找到Graphics/Compute这一列会有说明。

                         
  
2.2 ROCm环境的准备

  
2.2.1 软件包安装

  
首先安装AMD显卡驱动:

  

  
sudo apt-get update

  
wget https://repo.radeon.com/amdgpu-install/5.3/ubuntu/focal/amdgpu-install_5.3.50300-1_all.deb

  
sudo apt-get install ./amdgpu-install_5.3.50300-1_all.deb

  

  
执行安装操作:

  

  
sudo amdgpu-install --usecase=hiplibsdk,rocm --no-dkms

  

  
如有另外安装显卡驱动的需求,就删去后面的 --no-dkms

  
…漫长的等待…(大概需要一个小时左右,和网络状况关系很大)

  
如果顺利的话基本不会出现报错,本着warnings不用管的原则直接进入下一步即可。

  
真报错了原因一般是Linux内核版本不一致造成部分编译不通过,可以查看AMD的官方文档来确定所需的Linux内核版本。

  
查看系统内核版本:终端输入 uname -r

  
以楼主安装的ROCM5.3.0为例,对应的内核版本是5.15.0-46-generic,实际系统中是5.15.0-50-generic,安装时未出现报错。

  

  
2.2.2 后续配置

  
添加用户组:

  

  
sudo usermod -a -G video $LOGNAME

  
sudo usermod -a -G render $LOGNAME

  

  
配置环境变量:

  

  
echo 'export PATH=$PATH:/opt/rocm-5.3.0/bin:/opt/rocm-5.3.0/opencl/bin'

  
export LD_LIBRARY_PATH=/opt/rocm-5.3.0/lib:/opt/rocm-5.3.0/lib64

  

  
安装完成后重启:

  
sudo reboot

  

  

  
2.2.3 测试

  
打开终端输入rocminfo或rocm-smi,会出现当前设备信息和状态。

  
设备信息里出现GPU,且能正常显示显卡状态,即代表ROCM环境安装成功。

  

  
3 .运行库的补充及pytorch的安装

  
安装完成后仍需补充一些额外的运行库以免报错,测试时按照提示缺什么补什么即可,一般情况下需要补的有这些:

  

  
sudo apt install git python3 python3-pip python3-venv rocm-libs miopen-hip rccl libtinfo5 libopenmpi3 libopenblas-dev

  

  
pytorch安装,直接去官网下最新的就行

  

  pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/rocm5.4.2
  

  
4 .环境配置综合测试(本条可以不做!!!已经试过出错好像也没问题)

  
这里使用 https://github.com/xuhuisheng/rocm-build 提供的检查程序,可以clone或直接下载下来。

  

  
找到里面的check文件夹,终端下运行check.sh和另外3个py:

  

  
sh check.sh

  

  
python test-pytorch-device.py

  

  
python test-pytorch-fc.py

  

  
python test-pytorch-rocblas.py

  

  
运行不报错即可认为ROCm、pytorch环境配置正确。

  

  

  第三部分:stable-diffusion的本地部署

  
把stable diffusion软件本体clone下来,参照官方文档说明部署即可。

  
因为已经在之前的步骤中安装了pytorch,此处可不用安装。

  

  
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui

  
cd stable-diffusion-webui

  
python -m venv venv

  
source ./venv/bin/activate

  
python -m pip install --upgrade pip wheel

  
python launch.py --precision full --no-half

  

  可能发生的错误:
  
  错误1:torch unable to use gpu....
  解决办法:
  #打开launch.py找到这句代码
  安装vim编辑器(已经安装过的可以不用管)
  
  apt-get install vim
  
  进入软件目录
  
  cd /root/stable-diffusion-webui
  编辑launch.py
  
  vim launch.py
  
  按“i”修改文件:
  将
  commandline_args = os.environ.get('COMMANDLINE_ARGS', "")
  #改成
  commandline_args = os.environ.get('COMMANDLINE_ARGS', "--skip-torch-cuda-test")
  按ESC然后输入 :wq回车保存
  
  错误2:No module named ‘_lzma‘
  
  解决办法:
  打开python3
  cd /usr/local/lib/python3.10
  安装
  apt-get install liblzma-dev -y
  
  pip3 install backports.lzma
  
  环境中修改lzma.py位置依自己的环境路径而定,新装系统和我的路径是一样的不用改
  然后
  cd /usr/local/lib/python3.10
  编辑
  vim lzma.py
  
按“i”修改文件,如下的部分:

  
   from _lzma import *
   from _lzma import _encode_filter_properties, _decode_filter_properties
  修改成如下:
  
  try:
   from _lzma import *
   from _lzma import _encode_filter_properties, _decode_filter_properties
  except ImportError:
   from backports.lzma import *
   from backports.lzma import _encode_filter_properties, _decode_filter_properties
  按ESC然后输入 :wq回车保存
  错误3:No module named 'backports'
  
  pip3 install backports.lzma
  apt-get update
  apt-get upgrade
  
  重新启动一下 stable diffusion
  
  cd stable-diffusion-webui
  source ./venv/bin/activate
  python launch.py --precision full --no-half
  
  cd /usr/local/lib/python3.10
  cd ..
  python
  import lzma
  然后就可以退出了
  
  
首次运行时会安装依赖包,所以依旧是漫长的等待…

  
模型文件需放置在stable-diffusion-webui/models/Stable-diffusion/ 文件夹下。可以提前放置,不放也可以,只是第一次回下载默认模型包有点慢。

  
跑完出现127.0.0.1:7860即代表部署成功,浏览器中输入127.0.0.1:7860可打开webUI。

  

  
stable-diffusion的运行,及常用参数

  
后续运行只需要输入:

  
cd /root/stable-diffusion-webui

  
HSA_OVERRIDE_GFX_VERSION=10.3.0 python launch.py --precision full --no-half

  
如果第一次运行显卡不工作,是CPU在跑图,则需要重启下电脑。然后取得root权限再运行,即:

  sudo -i
  输入密码就可以了
  
  
浏览器中输入 127.0.0.1:7860 即可打开webUI。

  
然后就可以愉快的玩耍啦!!!

  
------------------------------------------------------------------------------------------------

  
分割线

  
常用参数:

  

  
--precision full 和 --no-half:强制双精度浮点运算(据说在N卡上可以减少绿屏bug出现的几率,A卡上不知道有啥用)

  

  
--medvram 和 --lowvram:降低显存占用量,视自己显卡水平加不加。

  

  
--opt-split-attention-v1:性能优化,进一步降低显存占用量。

  

  
至于具体能降低多少,楼主之前在只有4G显存的R9 nano上运行时使用了--medvram和--opt-split-attention-v1,显存占用大概25%的样子。

  

  
--disable-safe-unpickle:加载模型前有一步unpickle(原理不明,类似于哈希校验)的过程,部分用户在这里可能报错中止,加上这个参数跳过这一步可继续运行。

  

  
详细参数表见AUTOMATIC1111的文档说明。

  
视频教程地址:

  https://www.bilibili.com/video/BV1gs4y1H7Uq/?spm_id_from=333.999.0.0&vd_source=798c720594d31bfcbf5d2a56af4707f4
  
  
https://www.youtube.com/watch?v=FLOtfHvX8NE

  


来源:https://blog.csdn.net/volcanoyincan618/article/details/129603178
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则