django I need a starting point to code an app to extract text from pdf to excel [关闭]

1l5u6lss  于 11个月前  发布在  Go
关注(0)|答案(2)|浏览(117)

已关闭。此问题需要更多focused。目前不接受回答。
**要改进此问题吗?**更新此问题,使其仅针对editing this post的一个问题。

11天前关闭。
Improve this question
首先,我只想说明我是一名电气工程师,具有编程的基本知识。
我的要求如下:

  • 我想创建一个应用程序,我可以加载和查看包含表格的PDF文件。
  • 这些PDF文件的表格是不规则的形状,并在每一页上的不同位置。(这就是为什么工具,如表格不能帮助我)
  • 每个表格条目都是多行的,并且尺寸不规则(我不能一次选择一整行,它必须是每个元素。简单地将行复制到Excel也不行,因为它需要大量的格式)
  • 因此,我希望能够从表格中单独选择每个表格条目(如所需文本上的选择或裁剪框),如果文本中有新行,则删除新行,并保留空格。
  • 生成的Excel(或Access数据库,我真的不介意任何)应该是可查看和可保存的(如果这些甚至是单词XD)。

我有一个很好的Python知识和Django的一个非常基本的知识,我正在寻找一些Maven谁可以告诉我什么我真的需要学习(如果可能的话,在哪里学习它)来执行我的项目。
如果我每周能投入10个小时,我需要多少钱来执行这样一个项目。

pkln4tw6

pkln4tw61#

不要使用Python,使用Word。打开PDF,然后逐步通过表格集合收集数据并将其放入Excel。

8qgya5xd

8qgya5xd2#

以下是我可以提供给你的建议:首先,问互联网的问题:
https://lmddgtfy.net/?q=python%20library%20tabular%20pdf
->卡米洛特,这是提到多次似乎是相关的
对于excel表的使用,我向您介绍了最着名的DataFrame操作库之一:Pandas您可以在互联网上使用小型课程,这将为您提供快速管理项目的能力。
对于应用程序,你可以很容易地在youtube课程上找到一个图书馆,有人会向你解释如何做一个基本的应用程序.它可以为你提供你正在谈论的切入点.然后,你可以只是想知道你还需要什么,或者只是想让它更好.
对于所需的时间,这取决于你需要多少时间来了解基础知识,你花了多少时间来有更深的理解。我认为在一个星期内,在你的空闲时间带着真实的兴趣工作,它可能是工作(不完美,但工作,这是一个好的开始)

相关问题