**已关闭。**此问题正在寻求书籍、工具、软件库等的建议。它不符合Stack Overflow guidelines。它目前不接受回答。
我们不允许问题寻求书籍、工具、软件库等的推荐。您可以编辑问题,以便用事实和引用来回答问题。
六年前就关门了。
Improve this question
我必须在PDF文件中搜索一个即将到来的(ASP.NETMVC)共享托管环境中的项目。最好的解决方案是什么?第三方产品?
**已关闭。**此问题正在寻求书籍、工具、软件库等的建议。它不符合Stack Overflow guidelines。它目前不接受回答。
我们不允许问题寻求书籍、工具、软件库等的推荐。您可以编辑问题,以便用事实和引用来回答问题。
六年前就关门了。
Improve this question
我必须在PDF文件中搜索一个即将到来的(ASP.NETMVC)共享托管环境中的项目。最好的解决方案是什么?第三方产品?
3条答案
按热度按时间1yjd4xko1#
Lucene是一个受欢迎的选择。请参阅Lucene FAQ关于搜索PDF。
umuewwlo2#
Lucene是一个不错的选择--对于ASP.NET,使用Lucene.NET是最好的选择。Lucene只是一个索引引擎,这意味着你必须提供PDF中的文本。如果您可以访问Web服务器,您可以为此安装IFilter(我推荐Foxit's PDF过滤器)。否则,您将不得不在您的网站上使用一些代码来解析和过滤PDF。
tcbh2hod3#
Docotic.Pdf library可以帮助完成这样的任务。
该库可以用于extract text(有或没有格式化)。提取的文本可用于创建索引。如果你只是想知道一个PDF文件是否包含给定的文本,你甚至可以使用
String.IndexOf
方法。该库也可以retrieve a collection of words与他们的边界矩形从PDF。如果你需要知道文本在文件中的确切位置,这可能很有用。
免责声明:我为图书馆的供应商工作。