有没有办法把这样的文本从pdf转换成Dataframe?文本:
比较成本优势理论是由马歇尔、李嘉图、陶西格和海伯勒提出的
李嘉图的比较成本理论是基于以下哪种假设:a)共同市场b)同等成本c)垄断d)自由贸易
预期df:
The theory of comparative cost advantage theory was Introduced by----- Alfred Marshall David Ricardo Taussig Heberler
The Ricardo’s comparative cost theory is based on which of the following assumption Common Market Equal cost Monopoly Free Trade
2条答案
按热度按时间oxf4rvwz1#
逐行用换行符分隔
按正则表达式逐列拆分
输出
012340比较成本优势理论是由李嘉图·马歇尔·李嘉图·托塔西格伯勒提出的,李嘉图的比较成本理论是基于以下哪一个假设:共同市场平等成本垄断自由贸易
kulphzqa2#
假设您能够从pdf中提取文本,每个句子/问题之间用新行隔开,您可以像这样使用regex: