python Mecabを利用する

python Mecabを利用する

pythonでオープンソースの形態素解析であるMecabを使用するまで手順を記述してます。

環境

  • OS CentOS 7.9.2009 (Core)
  • Mecab 0.996
  • Python 3.6.8

mecab-python3インストール

pipを使用してインストールを行います。

sudo pip3 install mecab-python3

Mecab利用

インストールが終わればmecabを利用することが可能です。
※ここでは辞書に「mecab-ipadic-neologd」を使用してます。

「mecab.py」という名前で、以下の内容でコードを記述します。

# coding: UTF-8
import MeCab

text = "mecabのテストを行います。"

mecab_obj = MeCab.Tagger("-Ochasen -d /usr/lib64/mecab/dic/mecab-ipadic-neologd/ -t UTF8")
node = mecab_obj.parseToNode(text)
while node:
  print(node.feature)
  node = node.next

実行してみます。

python3 mecab.py

実行結果

BOS/EOS,*,*,*,*,*,*,*,*
名詞,固有名詞,一般,*,*,*,MeCab,メカブ,メカブ
助詞,連体化,*,*,*,*,の,ノ,ノ
名詞,サ変接続,*,*,*,*,テスト,テスト,テスト
助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
動詞,自立,*,*,五段・ワ行促音便,連用形,行う,オコナイ,オコナイ
助動詞,*,*,*,特殊・マス,基本形,ます,マス,マス
記号,句点,*,*,*,*,。,。,。
BOS/EOS,*,*,*,*,*,*,*,*

以上で完了となります。