如何在scala flink中显示rdf存档中的数据

g6baxovj  于 2021-06-21  发布在  Flink
关注(0)|答案(1)|浏览(411)

我正在寻找一种方法来加载和打印scala中.tar.gz存档的.n3文件中的数据。或者我应该提取它?
如果您想下载该文件,它位于http://wiki.knoesis.org/index.php/linkedsensordata
谁能描述一下我如何使用scala在屏幕上打印这个存档文件中的数据?

xfb7svmp

xfb7svmp1#

你正在处理的文件很大。因此,我建议您将其导入某种rdf存储,而不是自己尝试解析它。你可以使用graphdb,blazegraph,virtuso等等。搜索rdf存储应该会提供许多其他选项。然后可以使用sparql查询rdf存储(这类似于关系数据库的sql)。
要找到一个可以访问rdf数据的scala库,您可以看到这个相关的so问题,尽管它看起来并不乐观。我建议您看看apachejena,一个java库。
您可能还想看看dbpedia提取框架,在该框架中,他们从wikipedia提取数据,并使用scala将其存储为rdf数据。这当然不是您想要做的,但是它可以让您深入了解他们用于从scala生成rdf的工具以及相关问题。

相关问题