PaddleOCR在训练DBnet_r50_vd_db的时候,无法复现精度

8fq7wneg  于 2个月前  发布在  其他
关注(0)|答案(4)|浏览(27)

训练环境:GPU A100,paddlepaddle 2.4
操作系统:ubuntu 18
paddleocr版本:2.6
问题描述:实际跑出来的三个精度指标无法到达官方标称的结果,config链接的配置和提供的日志文件的config也有差异
通过增加eval次数也无法达到精度结果;

使用配置文件:configs/det/det_r50_vd_db.yml,
连接 https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.6/configs/det/det_r50_vd_db.yml
启动训练命令:
python3 -m paddle.distributed.launch --gpus '0,1,2,3,4,5,6,7' tools/train.py -c configs/det/det_r50_vd_db.yml

实测GPU精度结果:
[2023/06/05 09:50:35] ppocr INFO: best metric, hmean: 0.7859162169108198, is_float16: False, precision: 0.8428886438809261, recall: 0.7361579200770342, fps: 33.370472597937706, best_epoch: 1000
官方给出的日志精度结果:
[2020/11/26 20:53:46] root INFO: best metirc, recall: 0.7871930669234473, best_epoch: 1062, fps: 24.92656319259578, precision: 0.8641649048625792, hmean: 0.8238851095993953

官方给出的config:
https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.6/configs/det/det_r50_vd_db.yml
官方给出的日志配置:
https://paddleocr.bj.bcebos.com/dygraph_v2.0/en/det_r50_vd_db_v2.0_train.tar
其中主要差异在预训练文件和backbone

请提出你的建议 Please give your suggestion

复现训练精度结果,更新推荐的配置文件

zf9nrax1

zf9nrax11#

查看了一下训练log与提供配置,有几个地方可能会影响模型精度:

  1. 预训练模型,可以check下是否使用相同的 ResNet50_vd_ssld_pretrained
  2. 训练时的数据采样,log中使用了 0.5的采样比例,可以同步修改下:
label_file_list:
      - ./train_data/icdar2015/text_localization/train_icdar2015_label.txt
    ratio_list: [0.5]

如果以上修改后仍不能达到目标精度,可以发送训练log,我们同步对比一下

oyjwcjzk

oyjwcjzk2#

我们做了两次验证,一个是按照官方readme推荐的config,另一个是按照日志中的config 均无法复现精度,这里附上了按照官方训练日志中的config验证的日志…

------------------ 原始邮件 ------------------ 发件人: "PaddlePaddle/Paddle" ***@***.***>; 发送时间: 2023年6月13日(星期二) 中午11:21 ***@***.***>; ***@***.******@***.***>; 主题: Re: [PaddlePaddle/Paddle] PaddleOCR在训练DBnet_r50_vd_db的时候,无法复现精度 (Issue #54589) 查看了一下训练log与提供配置,有几个地方可能会影响模型精度: 预训练模型,可以check下是否使用相同的 ResNet50_vd_ssld_pretrained 训练时的数据采样,log中使用了 0.5的采样比例,可以同步修改下: label_file_list: - ./train_data/icdar2015/text_localization/train_icdar2015_label.txt ratio_list: [0.5] 如果以上修改后仍不能达到目标精度,可以发送训练log,我们同步对比一下 — Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you authored the thread.Message ID: ***@***.***>

dfuffjeb

dfuffjeb3#

查看了一下训练log与提供配置,有几个地方可能会影响模型精度:

  1. 预训练模型,可以check下是否使用相同的 ResNet50_vd_ssld_pretrained
  2. 训练时的数据采样,log中使用了 0.5的采样比例,可以同步修改下:
label_file_list:
      - ./train_data/icdar2015/text_localization/train_icdar2015_label.txt
    ratio_list: [0.5]

如果以上修改后仍不能达到目标精度,可以发送训练log,我们同步对比一下

请问可以复现精度结果吗,是否可以同步一下配置信息

6fe3ivhb

6fe3ivhb4#

查看了一下训练log与提供配置,有几个地方可能会影响模型精度:

  1. 预训练模型,可以check下是否使用相同的 ResNet50_vd_ssld_pretrained
  2. 训练时的数据采样,log中使用了 0.5的采样比例,可以同步修改下:
label_file_list:
      - ./train_data/icdar2015/text_localization/train_icdar2015_label.txt
    ratio_list: [0.5]

如果以上修改后仍不能达到目标精度,可以发送训练log,我们同步对比一下

train_gpu.log

相关问题