作为用户,我希望能够在指标资源管理器中通过步数/周期数过滤运行。
我有很多运行,其中一些只有几个步骤,因为我只是在调试脚本。所以忽略步数少于X的运行会很有帮助。
在指标资源管理器的过滤器中输入类似(run.steps > 100)的内容,只查看持续时间超过该值的运行
(run.steps > 100)
在我的特殊情况下,替代方案是选择所有执行步数少于100步的运行,并一次性删除(归档)它们。感谢考虑!
fnx2tebb1#
@avkudr 感谢打开这个问题,它似乎非常有用🙌我认为如果在训练过程中将步骤计数存储在运行元数据中(与其他运行属性一起),它将使从资源管理器和通过SDK编程方式搜索运行的步骤计数成为可能。但问题是通常指标具有不同的长度,例如训练损失比验证损失有更多的步骤。因此,我认为建议的查询语法可以稍作修改。例如:run["loss", {"subset": "train"}].steps > 100。还可以启用按指标最后一步进行搜索,例如run["loss", {"subset": "train"}].value.last <= 0.001。然而,我认为上述语法过于复杂(而且丑陋:D)。@avkudr @roubkar @alberttorosyan @mahnerak 是否有更好的替代方案?
run["loss", {"subset": "train"}].steps > 100
run["loss", {"subset": "train"}].value.last <= 0.001
uelo1irk2#
我有一个建议。由于metric在查询上下文中指的是一个唯一的度量序列,可以将其作为度量的属性添加步数。因此,语法如下:
metric
metric.steps > 100
还有一件事需要澄清。由于度量是稀疏的,我们应该取最后一步还是跟踪值的数量?
2条答案
按热度按时间fnx2tebb1#
@avkudr 感谢打开这个问题,它似乎非常有用🙌
我认为如果在训练过程中将步骤计数存储在运行元数据中(与其他运行属性一起),它将使从资源管理器和通过SDK编程方式搜索运行的步骤计数成为可能。
但问题是通常指标具有不同的长度,例如训练损失比验证损失有更多的步骤。
因此,我认为建议的查询语法可以稍作修改。例如:
run["loss", {"subset": "train"}].steps > 100
。还可以启用按指标最后一步进行搜索,例如
run["loss", {"subset": "train"}].value.last <= 0.001
。然而,我认为上述语法过于复杂(而且丑陋:D)。
@avkudr @roubkar @alberttorosyan @mahnerak 是否有更好的替代方案?
uelo1irk2#
我有一个建议。由于
metric
在查询上下文中指的是一个唯一的度量序列,可以将其作为度量的属性添加步数。因此,语法如下:还有一件事需要澄清。由于度量是稀疏的,我们应该取最后一步还是跟踪值的数量?