solr导入csv文件

x33g5p2x  于2021-12-20 转载在 其他  
字(1.0k)|赞(0)|评价(0)|浏览(556)

1  概述

大多数的应用程序将数据存储在关系数据库、xml文件中。对这样的数据进行搜索是很常见的应用。所谓的DataImportHandler提供一种可配置 的方式向solr导入数据,可以一次全部导入,也可以增量导入。  

能够读取关系数据库中的数据。 

通过可配置的方式,能够将数据库中多列、多表的数据生成solr文档   

能够通过solr文档更新solr 

提供 通过配置文件就能够导入所有数据的能力 

能够配置 “完全导入”和“增量导入”的时间 

让读取xml文件,并建立索引成为可配置。 

能够将 其他的数据源(例如:ftp,scp,etc)或者其他格式的文档(Json,csv)以插件的形式集成到项目中。

2.2     导入csv文件

2.2.1   配置导入字段

修改managed-schema文件,新增:

<field name="id" type="string" stored="true" indexed="true"/>  
<field name="title" type="string" stored="true" indexed="true"/>  
<field name="content" type="string" stored="true" indexed="true"/>

2.2.2   编辑导入文件

2.2.3   导入

导入方式有多种,以下列出两种方式导入,

1、 命令方式导入:

dos进入solr\bin目录执行

java -Dtype=text/csv-Durl=http://localhost:8983/solr/solr_test/update -jar post.jar   xxx.csv

2、浏览器http方式导入:

在浏览器访问核心core,其中solr_file为core名称:

http://localhost:8983/solr/solr_file/update/csv?commit=true&stream.file=E:/application.csv&stream.contentType=text/plain;charset=GB2312

执行完成后可以查询已导入的数据;

相关文章