我打算使用solr的数据导入处理程序从rdbms记录创建文档。rdbms列之一是pdf/word文件路径。我想做的是用tika解析文件,并将结果保存在上述文档的另一个字段中。我的最终文档应在同一文档中包含rdbms和tika导入的数据。
例如
数据库中的文档字段:作者、发布年份、电子邮件
tika中的文档字段:纯文本
这是否可以作为数据导入处理程序中的一种配置,或者我应该单独导入数据处理程序(sql和tika作为单独的文档类型),然后从查询中进行连接?
我打算使用solr的数据导入处理程序从rdbms记录创建文档。rdbms列之一是pdf/word文件路径。我想做的是用tika解析文件,并将结果保存在上述文档的另一个字段中。我的最终文档应在同一文档中包含rdbms和tika导入的数据。
例如
数据库中的文档字段:作者、发布年份、电子邮件
tika中的文档字段:纯文本
这是否可以作为数据导入处理程序中的一种配置,或者我应该单独导入数据处理程序(sql和tika作为单独的文档类型),然后从查询中进行连接?
暂无答案!
目前还没有任何答案,快来回答吧!