python Mecabを利用する
pythonでオープンソースの形態素解析であるMecabを使用するまで手順を記述してます。
環境
- OS CentOS 7.9.2009 (Core)
- Mecab 0.996
- Python 3.6.8
mecab-python3インストール
pipを使用してインストールを行います。
sudo pip3 install mecab-python3
Mecab利用
インストールが終わればmecabを利用することが可能です。
※ここでは辞書に「mecab-ipadic-neologd」を使用してます。
「mecab.py」という名前で、以下の内容でコードを記述します。
# coding: UTF-8
import MeCab
text = "mecabのテストを行います。"
mecab_obj = MeCab.Tagger("-Ochasen -d /usr/lib64/mecab/dic/mecab-ipadic-neologd/ -t UTF8")
node = mecab_obj.parseToNode(text)
while node:
print(node.feature)
node = node.next
実行してみます。
python3 mecab.py
実行結果
BOS/EOS,*,*,*,*,*,*,*,*
名詞,固有名詞,一般,*,*,*,MeCab,メカブ,メカブ
助詞,連体化,*,*,*,*,の,ノ,ノ
名詞,サ変接続,*,*,*,*,テスト,テスト,テスト
助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
動詞,自立,*,*,五段・ワ行促音便,連用形,行う,オコナイ,オコナイ
助動詞,*,*,*,特殊・マス,基本形,ます,マス,マス
記号,句点,*,*,*,*,。,。,。
BOS/EOS,*,*,*,*,*,*,*,*
以上で完了となります。
-
前の記事
javascript 要素が生成されてからの経過時間を取得する 2021.11.12
-
次の記事
nextcloud dockerで構築時にエラー「Error while trying to initialise the database: 」が発生した場合の対処法 2021.11.12
コメントを書く