asp.net 如何在PDF文件中搜索[已关闭]

wfveoks0  于 2023-10-21  发布在  .NET
关注(0)|答案(3)|浏览(133)

**已关闭。**此问题正在寻求书籍、工具、软件库等的建议。它不符合Stack Overflow guidelines。它目前不接受回答。

我们不允许问题寻求书籍、工具、软件库等的推荐。您可以编辑问题,以便用事实和引用来回答问题。
六年前就关门了。
Improve this question
我必须在PDF文件中搜索一个即将到来的(ASP.NETMVC)共享托管环境中的项目。最好的解决方案是什么?第三方产品?

1yjd4xko

1yjd4xko1#

Lucene是一个受欢迎的选择。请参阅Lucene FAQ关于搜索PDF。

umuewwlo

umuewwlo2#

Lucene是一个不错的选择--对于ASP.NET,使用Lucene.NET是最好的选择。Lucene只是一个索引引擎,这意味着你必须提供PDF中的文本。如果您可以访问Web服务器,您可以为此安装IFilter(我推荐Foxit's PDF过滤器)。否则,您将不得不在您的网站上使用一些代码来解析和过滤PDF。

tcbh2hod

tcbh2hod3#

Docotic.Pdf library可以帮助完成这样的任务。
该库可以用于extract text(有或没有格式化)。提取的文本可用于创建索引。如果你只是想知道一个PDF文件是否包含给定的文本,你甚至可以使用String.IndexOf方法。
该库也可以retrieve a collection of words与他们的边界矩形从PDF。如果你需要知道文本在文件中的确切位置,这可能很有用。
免责声明:我为图书馆的供应商工作。

相关问题