PaddleOCR在训练DBnet_r50_vd_db的时候，无法复现精度

8fq7wneg 于 5个月前发布在其他

关注(0)|答案(4)|浏览(47)

文档链接&描述 Document Links & Description

训练环境：GPU A100，paddlepaddle 2.4
操作系统：ubuntu 18
paddleocr版本：2.6
问题描述：实际跑出来的三个精度指标无法到达官方标称的结果，config链接的配置和提供的日志文件的config也有差异
通过增加eval次数也无法达到精度结果；

使用配置文件：configs/det/det_r50_vd_db.yml，
连接 https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.6/configs/det/det_r50_vd_db.yml
启动训练命令：
python3 -m paddle.distributed.launch --gpus '0,1,2,3,4,5,6,7' tools/train.py -c configs/det/det_r50_vd_db.yml

实测GPU精度结果：
[2023/06/05 09:50:35] ppocr INFO: best metric, hmean: 0.7859162169108198, is_float16: False, precision: 0.8428886438809261, recall: 0.7361579200770342, fps: 33.370472597937706, best_epoch: 1000
官方给出的日志精度结果：
[2020/11/26 20:53:46] root INFO: best metirc, recall: 0.7871930669234473, best_epoch: 1062, fps: 24.92656319259578, precision: 0.8641649048625792, hmean: 0.8238851095993953

官方给出的config：
https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.6/configs/det/det_r50_vd_db.yml
官方给出的日志配置：
https://paddleocr.bj.bcebos.com/dygraph_v2.0/en/det_r50_vd_db_v2.0_train.tar
其中主要差异在预训练文件和backbone

请提出你的建议 Please give your suggestion

复现训练精度结果，更新推荐的配置文件

Paddle

来源：https://github.com/PaddlePaddle/Paddle/issues/54589

4条答案

按热度按时间

zf9nrax11#

查看了一下训练log与提供配置，有几个地方可能会影响模型精度：

预训练模型，可以check下是否使用相同的 ResNet50_vd_ssld_pretrained
训练时的数据采样，log中使用了 0.5的采样比例，可以同步修改下：

label_file_list:
      - ./train_data/icdar2015/text_localization/train_icdar2015_label.txt
    ratio_list: [0.5]

如果以上修改后仍不能达到目标精度，可以发送训练log，我们同步对比一下

赞(0）回复(0）举报 5个月前

oyjwcjzk2#

我们做了两次验证，一个是按照官方readme推荐的config，另一个是按照日志中的config 均无法复现精度，这里附上了按照官方训练日志中的config验证的日志…

------------------ 原始邮件 ------------------ 发件人: "PaddlePaddle/Paddle" ***@***.***>; 发送时间: 2023年6月13日(星期二) 中午11:21 ***@***.***>; ***@***.******@***.***>; 主题: Re: [PaddlePaddle/Paddle] PaddleOCR在训练DBnet_r50_vd_db的时候，无法复现精度 (Issue #54589) 查看了一下训练log与提供配置，有几个地方可能会影响模型精度：预训练模型，可以check下是否使用相同的 ResNet50_vd_ssld_pretrained 训练时的数据采样，log中使用了 0.5的采样比例，可以同步修改下： label_file_list: - ./train_data/icdar2015/text_localization/train_icdar2015_label.txt ratio_list: [0.5] 如果以上修改后仍不能达到目标精度，可以发送训练log，我们同步对比一下 — Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you authored the thread.Message ID: ***@***.***>

赞(0）回复(0）举报 5个月前

dfuffjeb3#

查看了一下训练log与提供配置，有几个地方可能会影响模型精度：

预训练模型，可以check下是否使用相同的 ResNet50_vd_ssld_pretrained
训练时的数据采样，log中使用了 0.5的采样比例，可以同步修改下：

label_file_list:
      - ./train_data/icdar2015/text_localization/train_icdar2015_label.txt
    ratio_list: [0.5]

如果以上修改后仍不能达到目标精度，可以发送训练log，我们同步对比一下

请问可以复现精度结果吗，是否可以同步一下配置信息

赞(0）回复(0）举报 5个月前

6fe3ivhb4#

查看了一下训练log与提供配置，有几个地方可能会影响模型精度：

预训练模型，可以check下是否使用相同的 ResNet50_vd_ssld_pretrained
训练时的数据采样，log中使用了 0.5的采样比例，可以同步修改下：

label_file_list:
      - ./train_data/icdar2015/text_localization/train_icdar2015_label.txt
    ratio_list: [0.5]

如果以上修改后仍不能达到目标精度，可以发送训练log，我们同步对比一下

train_gpu.log

赞(0）回复(0）举报 5个月前

我来回答

PaddleOCR在训练DBnet_r50_vd_db的时候，无法复现精度

文档链接&描述 Document Links & Description

请提出你的建议 Please give your suggestion

4条答案

相关问题

热门标签

最新问答