Pytorch 2.0编译器在执行过程中是如何运行的?

lkaoscv7  于 2023-10-20  发布在  其他
关注(0)|答案(1)|浏览(141)

我是机器学习的新手,刚刚阅读了官方的Pytorch 2.0概述。我有一些关于后端TorchInductor的问题。“TorchInductor使用pythonic的define-by-run循环级IR来自动将PyTorch模型Map到GPU上生成的Triton代码和CPU上的C++/OpenMP。”“生成代码”实际上是什么意思?
在cpu的情况下,这是否意味着IR被Map到显式和可读的c代码,然后由某个c编译器编译为机器代码以供执行?或者IR只是简单地Map到编译库中的一些c++编写的函数?
那GPU的案子呢?用python编写的Triton代码会被Trition的内置编译器编译成gpu机器码吗?

bvjxkvbb

bvjxkvbb1#

是的C代码或Triton代码是从TorchInductor生成的。本机C编译器或Triton编译器将进一步将生成的代码编译为本机CPU或GPU代码。

相关问题