我已经成功地训练了一个模型,大约有16 k个步骤,产生了很多检查点,保存在我的training
文件夹中。我想确保我没有遇到过拟合问题,所以我想用我的测试数据评估每个检查点。
我使用的是来自官方Tensorflow 2 Object Detection repository的以下命令:
PIPELINE_CONFIG_PATH={path to pipeline config file}
MODEL_DIR={path to model directory}
CHECKPOINT_DIR=${MODEL_DIR}
python object_detection/model_main_tf2.py \
--pipeline_config_path=${PIPELINE_CONFIG_PATH} \
--model_dir=${MODEL_DIR} \
--checkpoint_dir=${CHECKPOINT_DIR} \
--alsologtostderr
MODEL_DIR
和CHECKPOINT_DIR
都指向我的training
文件夹。
我现在遇到的问题是,这只评估最新的检查点,但我想一次评估所有检查点。
理想情况下,我希望在TensorBoard中看到结果,它以图形的形式显示不同检查点的瓦尔_accuracy(mAP)-它已经这样做了,但只是针对一个检查点。
1条答案
按热度按时间jhkqcmku1#
截至2022年2月
“验证”过程应与“培训”过程同时运行,以便在保存新检查点时,“验证”过程会立即加载检查点并开始验证。
请看我的其他answer在这方面。