PaddleHub2.0与1.8是否大大的不兼容?

0sgqnhkj  于 5个月前  发布在  其他
关注(0)|答案(4)|浏览(136)

我的入门是使用PaddleHub1.8,里面使用到了BaseCVDataset等类。
现在使用开发套件PaddleClas,需要是PaddleHub2.0进行serving部署。
当我切换到2.0后,发现以前的程序都不能使用了,很多库都换了。
请问PaddleHub2.0与1.8是否大大的不兼容?
有什么好的建议?

6ie5vjzr

6ie5vjzr1#

在过去的1.8版本中,模块可以直接用于预测。在2.0版本上,这个功能是可以正常运行的。然而,在微调任务上,两者之间的差异较大。在2.0版本中,已经废弃了task等功能。在使用数据集时,也不再使用BaseCVDataset。如果想要使用自定义数据集,可以参考https://github.com/PaddlePaddle/PaddleHub/blob/release/v2.0.0-beta/docs/docs_ch/tutorial/how_to_load_data.md。

7d7tgy0s

7d7tgy0s2#

收到你的回复。

在查看 https://github.com/PaddlePaddle/PaddleHub/blob/release/v2.0.0-beta/docs/docs_ch/tutorial/how_to_finetune.md 时,那里有提到“加载图像类自定义数据集。用户只需要继承基类 BaseCVDataset,修改数据集存放地址即可,具体可以参考如下代码。”

from paddlehub.dataset.base_cv_dataset import BaseCVDataset

class DemoDataset(BaseCVDataset):
    def __init__(self):
        # 数据集存放位置
        self.dataset_dir = "/test/data"
        super(DemoDataset, self).__init__(
            base_path=self.dataset_dir,
            train_list_file="train_list.txt", # 训练集存放地址
            validate_list_file="validate_list.txt", # 验证集存放地址
            test_list_file="test_list.txt", # 测试集存放地址
            predict_file="predict_list.txt", # 预测集存放地址
            label_list_file="label_list.txt", # 数据集类别文件所在地址
            # 如果您的数据集类别较少,可以不用定义label_list.txt,可以在最后设置label_list=["数据集所有类别"]。
        )

dataset = DemoDataset()

所以这个是文档写的问题了吧?而且 V2.0 是不是也没有 hub.reader 了?劳烦提供一下正确的 finetuning 方法以及 API 示例吧。

qojgxg4l

qojgxg4l3#

自定义数据集2.0版本参考 https://github.com/PaddlePaddle/PaddleHub/blob/release/v2.0.0-beta/docs/docs_ch/tutorial/how_to_load_data.md。
您提到的文档在近期会更新,近期也会发版新的paddlehub,主要更新nlp方向,感谢您的建议。

相关问题