Bark(Suno AI) 搭建及利用

[复制链接]
查看1087 | 回复0 | 2023-8-23 12:03:29 | 显示全部楼层 |阅读模式
前言
Bark 是由Suno AI创建的基于转换器的文本到音频模子。Bark 可以生成高度逼真的多语言语音以及其他音频 - 包括音乐、背景噪音和简单的音效。该模子还可以产生非语言交换,如大笑、叹息和哭泣。
1: 环境
win10
rtx 3060TI
bark 下载地点 https://github.com/suno-ai/bark
conda 及 pytorch
可以按照 segment-anything本地摆设利用
2:安装
官方安装分析
git clone https://github.com/suno-ai/bark
cd bark && pip install .


3:修改缓存目录
下载的东西太大了
HF_HOME 模子下载模子
XDG_CACHE_HOME suno torch …



3:测试
1>测试脚本
由于GPU 是 rtx 3060TI VARM 只有8G ,以是必须利用小模子
test.py
  1. import os
  2. os.environ["CUDA_VISIBLE_DEVICES"] = "0"
  3. os.environ["SUNO_USE_SMALL_MODELS"] = "1"
  4. from bark import SAMPLE_RATE, generate_audio, preload_models
  5. from scipy.io.wavfile import write as write_wav
  6. from IPython.display import Audio
  7. # download and load all models
  8. preload_models()
  9. # generate audio from text
  10. text_prompt = """
  11. Hello, my name is Suno. And, uh — and I like pizza. [laughs]
  12. But I also have other interests such as playing tic tac toe.
  13. """
  14. audio_array = generate_audio(text_prompt)
  15. # save audio to disk
  16. write_wav("bark_generation.wav", SAMPLE_RATE, audio_array)
  17. # play text in notebook
  18. Audio(audio_array, rate=SAMPLE_RATE)
复制代码
2> 结果

4:大概碰到的题目
假如提示 找不到 IPyhton 模块 直接安装 pip install -U IPython
假如以为有用,贫困点个赞,加个收藏

来源:https://blog.csdn.net/yunteng521/article/details/130844809
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则