已关闭,该问题需要details or clarity,目前不接受回答。
**想要改进此问题?**通过editing this post添加详细信息并澄清问题。
10小时前关闭。
Improve this question
Seek方法将一个或多个PDF文件转换为文本语料库,用于上游自然语言处理。PyTorch框架。
已关闭,该问题需要details or clarity,目前不接受回答。
**想要改进此问题?**通过editing this post添加详细信息并澄清问题。
10小时前关闭。
Improve this question
Seek方法将一个或多个PDF文件转换为文本语料库,用于上游自然语言处理。PyTorch框架。
1条答案
按热度按时间umuewwlo1#
如果我正确理解了你的问题,你正在寻找一种从PDF中提取文本的方法。你可以使用PyPDF2来做到这一点。下面是他们的documentation的一个例子: