如何在ASP.NETc #中查找上传的PDF文件中的文本

xlpyo6sf  于 2023-01-27  发布在  .NET
关注(0)|答案(1)|浏览(141)

我想知道是否有文本存在于ASP.NETc #中上传的PDF文件中。

using (MemoryStream str = new MemoryStream(this.docUploadField.FileBytes))
{
                    using (StreamReader sr = new StreamReader(str, Encoding.UTF8))
                    {                       
                        string line = sr.ReadToEnd();
                    }
}

当我阅读文件内容时,我得到了以下文件内容。

请帮我一下

j2qf4p5b

j2qf4p5b1#

你肯定需要一些PDF阅读库。最有名的是
IText(ITextSharp为谁记得它):https://github.com/itext/itext7-dotnet
清晰度:https://github.com/empira/PDFsharp
以及许多其他免费选项。
有了这些,你打开PDF文件,阅读它,并采取你需要的文本。通常他们给予你一个PDF元素的集合(段落,图像等,你循环通过他们或使用搜索功能来寻找你需要的)

相关问题