要读取Word文档,可以使用Python的第三方库python-docx。首先需要安装python-docx库,可以使用以下命令进行安装:
pip install python-docx然后可以使用以下代码读取Word文档:
from docx import Document# 打开Word文档doc = Document('example.docx')# 读取文档中的所有段落内容for para in doc.paragraphs: print(para.text)# 读取文档中的所有表格内容for table in doc.tables: for row in table.rows: for cell in row.cells: print(cell.text)以上代码会打开名为example.docx的Word文档,并读取文档中的所有段落和表格内容。可以根据需要对读取到的内容进行进一步处理和分析。


