我想知道是否有文本存在于ASP.NETc #中上传的PDF文件中。
using (MemoryStream str = new MemoryStream(this.docUploadField.FileBytes))
{
using (StreamReader sr = new StreamReader(str, Encoding.UTF8))
{
string line = sr.ReadToEnd();
}
}
当我阅读文件内容时,我得到了以下文件内容。
请帮我一下
1条答案
按热度按时间j2qf4p5b1#
你肯定需要一些PDF阅读库。最有名的是
IText(ITextSharp为谁记得它):https://github.com/itext/itext7-dotnet
清晰度:https://github.com/empira/PDFsharp
以及许多其他免费选项。
有了这些,你打开PDF文件,阅读它,并采取你需要的文本。通常他们给予你一个PDF元素的集合(段落,图像等,你循环通过他们或使用搜索功能来寻找你需要的)