关闭。这个问题需要更加突出重点。它目前不接受答案。**想改进这个问题吗?**通过编辑这篇文章更新这个问题,使它只关注一个问题。
四年前关门了。改进这个问题我正在尝试转换为缩略图的pdf图像,并保存到solr的数据,如果可能的话,请帮助我们?
xfb7svmp1#
但为什么是mapreduce。您需要先使用tika提取pdf,请参阅下面的链接http://www.tutorialspoint.com/tika/tika_extracting_pdf.htm获取metedata名称及其值并创建json。像这样的pdftitle:two statesauthor:chetan bhagat至{“pdftitle”:“两个国家”,“作者”:“chetan bhagat”}
1条答案
按热度按时间xfb7svmp1#
但为什么是mapreduce。您需要先使用tika提取pdf,请参阅下面的链接
http://www.tutorialspoint.com/tika/tika_extracting_pdf.htm
获取metedata名称及其值并创建json。像这样的
pdftitle:two states
author:chetan bhagat
至
{“pdftitle”:“两个国家”,“作者”:“chetan bhagat”}