python python-docxを使ってWordファイルのテキストを取得する

python python-docxを使ってWordファイルのテキストを取得する

pythonで、ライブラリpython-docxのparagraphsを使用して、Wordファイルのテキストを取得するサンプルコードを記述してます。pythonのバージョンは3.8.5を使用してます。

環境

  • OS windows10 pro 64bit
  • python 3.8.5

python-docxインストール

python-docxをインストールされていない方は、pipでインストールしておきます。

paragraphs使い方

paragraphsを使用すると、Wordファイルのテキストを取得することが可能です。

以下は、「sample.docx」内にあるテキストデータを全て取得して表示するサンプルコードとなります。

sample.docx

ソースコード