我有一个docx文件,我在PyCharm中使用textract打开了它。docx包含了一个有多个段落的文本。我想做的是检测每个段落的中断,并把每个段落放在一个单独的变量中,或者作为一个字符串列表,以便以后使用?在Python 3中如何实现这一点?救命啊!我没有同样的东西。
kr98yfug1#
您可以通过从docx使用Document来实现这一点
docx
Document
from docx import Document document = Document('path/to/your/file.docx') paragraphs = [para.text for para in document.paragraphs]
1条答案
按热度按时间kr98yfug1#
您可以通过从
docx
使用Document
来实现这一点