我正在寻找一种方法来加载和打印scala中.tar.gz存档的.n3文件中的数据。或者我应该提取它?如果您想下载该文件,它位于http://wiki.knoesis.org/index.php/linkedsensordata谁能描述一下我如何使用scala在屏幕上打印这个存档文件中的数据?
xfb7svmp1#
你正在处理的文件很大。因此,我建议您将其导入某种rdf存储,而不是自己尝试解析它。你可以使用graphdb,blazegraph,virtuso等等。搜索rdf存储应该会提供许多其他选项。然后可以使用sparql查询rdf存储(这类似于关系数据库的sql)。要找到一个可以访问rdf数据的scala库,您可以看到这个相关的so问题,尽管它看起来并不乐观。我建议您看看apachejena,一个java库。您可能还想看看dbpedia提取框架,在该框架中,他们从wikipedia提取数据,并使用scala将其存储为rdf数据。这当然不是您想要做的,但是它可以让您深入了解他们用于从scala生成rdf的工具以及相关问题。
1条答案
按热度按时间xfb7svmp1#
你正在处理的文件很大。因此,我建议您将其导入某种rdf存储,而不是自己尝试解析它。你可以使用graphdb,blazegraph,virtuso等等。搜索rdf存储应该会提供许多其他选项。然后可以使用sparql查询rdf存储(这类似于关系数据库的sql)。
要找到一个可以访问rdf数据的scala库,您可以看到这个相关的so问题,尽管它看起来并不乐观。我建议您看看apachejena,一个java库。
您可能还想看看dbpedia提取框架,在该框架中,他们从wikipedia提取数据,并使用scala将其存储为rdf数据。这当然不是您想要做的,但是它可以让您深入了解他们用于从scala生成rdf的工具以及相关问题。