pytorch Nvidia Tesla T4上的真实ESRGAN性能

zxlwwiss  于 2023-06-06  发布在  其他
关注(0)|答案(1)|浏览(394)

我正在运行一个谷歌云平台(GCP)计算引擎与2x NVidia特斯拉T4,运行2个单独的线程的图像放大4倍。
我有以下shell脚本:

python ~/Real-ESRGAN/inference_realesrgan.py -i ~/lowres/ -o ~/upscaled/  -dn 0 -t 512 -g 0

我的升级器是基于this repository构建的。
性能是好的,但我有一个很长的等待队列的图像(他们正在动态上传那里。
有什么方法可以提高处理速度吗?
我已经添加了-t 512(瓷砖= 512)参数,因为Nvidia Tesla无法一次将整个图像放大到2048 x2048 px,它会出现内存错误。
我能以某种方式调整我的脚本吗?我不能停止整个升级和实验的时间测量,但在全球范围内,降低瓷砖的大小将有所帮助?或者还有其他参数可以加速升级?
我有2个GPU,它们通过利用2个单独的shell脚本使用两个不同的文件夹。我最初的目标是通过为一个图像使用两个GPU来进行升级,但它不起作用,但是参数的帮助告诉它可以使用。
所以我的主要问题是,增加或减少瓷砖大小将提高速度,另外一个问题是,是否有一些额外的参数可以加快处理速度。
谢谢你提前回答!

jexiocij

jexiocij1#

您可以在optimizing gpus上找到此文档 它指出要进行优化,您可以在使用NVIDIA A100、T4、L4或V100 GPU的虚拟机上使用更高的网络带宽速度。关于你关于增加或减少图块大小是否会提高速度的问题,这取决于图像大小和GPU内存。如果您有足够的GPU内存,则可以增加图块大小以减少图块数量并加快处理速度。否则,您可以减小平铺大小以适应GPU内存并避免内存不足错误。

相关问题