我想使用g.io(<name file>).read().iterate()
加载两个文件:nodes.xml
和edges.xml
中的一个或多个。nodes.xml
文件包含我想要上传的图表的节点,其内容如下:
<?xml version='1.0' encoding='utf-8'?>
<graphml xmlns="http://graphml.graphdrawing.org/xmlns" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://graphml.graphdrawing.org/xmlns http://graphml.graphdrawing.org/xmlns/1.0/graphml.xsd">
<key id="labelV" for="node" attr.name="labelV" attr.type="string" />
<key id="name" for="node" attr.name="name" attr.type="string" />
<key id="age" for="node" attr.name="age" attr.type="int" />
<graph id="G" edgedefault="directed">
<node id="1">
<data key="labelV">person</data>
<data key="name">marko</data>
<data key="age">29</data>
</node>
<node id="2">
<data key="labelV">person</data>
<data key="name">vadas</data>
<data key="age">27</data>
</node>
</graph>
</graphml>
edges.xml
文件包含我想要上传的图形的边,其内容如下:
<?xml version='1.0' encoding='utf-8'?>
<graphml xmlns="http://graphml.graphdrawing.org/xmlns" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://graphml.graphdrawing.org/xmlns http://graphml.graphdrawing.org/xmlns/1.0/graphml.xsd">
<key id="labelE" for="edge" attr.name="labelE" attr.type="string" />
<key id="weight" for="edge" attr.name="weight" attr.type="double" />
<graph id="G" edgedefault="directed">
<edge id="7" source="1" target="2">
<data key="labelE">knows</data>
<data key="weight">0.5</data>
</edge>
</graph>
</graphml>
我想通过运行g.io('nodes.xml').read().iterate()
先上传节点,然后通过运行g.io('edges.xml').read().iterate()
上传边。但是当我上传edges.xml
时,它创建了新的节点,而不是向以前创建的节点添加边。
在Gremlin中使用类似的命令,可以轻松地先加载节点,然后在单独的查询中加载边。我知道这可以通过复杂的查询来实现,这些查询涉及通过用户查询阅读和创建edges.xml
文件中的边,但我想知道是否有更简单的方法。而且,我不想上传一个包含所有节点和边的文件。
1条答案
按热度按时间w46czmvw1#
恐怕
GraphMLReader
不是这样工作的,它不是设计来读取现有的图的,我真的不记得这是不是有目的的。这段代码并不太复杂。你可以根据自己的需要修改它。你可以在这里看到代码检查
id
的顶点缓存的地方。第二次执行时,这个缓存是空的,因为它只通过添加新的顶点来填充--它不会记住你第一次运行的任何顶点,也不会在第二次运行时直接从图形中读取。只需将其更改为逻辑,以更好地满足您的需求。