如果有一个8 G-RAM GPU,并且加载了一个占用所有8 G RAM的模型,是否可以并行运行多个模型预测/推理?或者只能在同一时间段运行预测
ql3eal8s1#
如果您的单个模型使用了全部8gb的RAM,那么就不可能使用相同的资源并行运行另一个模型。您必须分配更多的内存或安排第二个模型在以后运行。
1条答案
按热度按时间ql3eal8s1#
如果您的单个模型使用了全部8gb的RAM,那么就不可能使用相同的资源并行运行另一个模型。您必须分配更多的内存或安排第二个模型在以后运行。