我在xml文件中有注解,比如下面这个,它遵循PASCAL VOC约定:
<annotation>
<folder>training</folder>
<filename>chanel1.jpg</filename>
<source>
<database>synthetic initialization</database>
<annotation>PASCAL VOC2007</annotation>
<image>synthetic</image>
<flickrid>none</flickrid>
</source>
<owner>
<flickrid>none</flickrid>
<name>none</name>
</owner>
<size>
<width>640</width>
<height>427</height>
<depth>3</depth>
</size>
<segmented>0</segmented>
<object>
<name>chanel</name>
<pose>Unspecified</pose>
<truncated>0</truncated>
<difficult>0</difficult>
<bndbox>
<xmin>344</xmin>
<ymin>10</ymin>
<xmax>422</xmax>
<ymax>83</ymax>
</bndbox>
</object>
<object>
<name>chanel</name>
<pose>Unspecified</pose>
<truncated>0</truncated>
<difficult>0</difficult>
<bndbox>
<xmin>355</xmin>
<ymin>165</ymin>
<xmax>443</xmax>
<ymax>206</ymax>
</bndbox>
</object>
</annotation>
例如,在Python中检索字段filename
和bndbox
的最简洁的方法是什么?
我尝试使用ElementTree,这似乎是Python的官方解决方案,但我无法让它工作。
我的代码到目前为止:
from xml.etree import ElementTree as ET
tree = ET.parse("data/all/annotations/" + file)
fn = tree.find('filename').text
boxes = tree.findall('bndbox')
这就产生了
fn == 'chanel1.jpg'
boxes == []
因此,它成功地提取了filename
字段,但没有提取bndbox
字段。
3条答案
按热度按时间voj3qocg1#
对于你的问题,这是一个非常简单的解决方案:
这将返回嵌套列表中的框坐标[xmin,ymin,xmax,ymax]和文件名有一次我与bndbox标签斗争,其中混合了(ymin,xmin,...)或任何其他奇怪的组合,所以这段代码读取标签不仅是位置。
最后我更新了代码。感谢craq和Pritesh Gohil,你是完全正确的。
希望能有所帮助...
d5vmydt92#
另一种选择是使用标准的
xmldict
库加载python指令中的VOC XML。oknwwptz3#
我的尝试,比公认的答案更具可读性,提供了转换为基于0的像素坐标的选项,并将对象的名称而不是文件的名称与每个框的坐标配对。
输出示例: