Ubuntu20.10 形態素解析エンジンMecabを使用する

Ubuntu20.10 形態素解析エンジンMecabを使用する

Ubuntu20.10に自然言語処理の形態素解析ができる「Mecab」を使用するまでの手順を記述してます。CentOSのバージョンは7.9.2009となります。

環境

  • OS CentOS 7.9.2009 (Core)
  • Mecab 0.996

Mecabインストール

aptでインストールします。

sudo apt install mecab libmecab-dev mecab-ipadic-utf8

バージョンを確認してみます。

mecab -v

<出力結果>
mecab of 0.996

mecab-ipadic-NEologdダウンロード

Mecabの辞書である「mecab-ipadic-NEologd」をダウンロードしておきます。こちらはgitより取得することが可能です。

git clone https://github.com/neologd/mecab-ipadic-neologd.git

インストールを行います。

sudo bin/install-mecab-ipadic-neologd

mecab実行

mecabを実行してみます。

mecab -d /usr/lib/x86_64-linux-gnu/mecab/dic/mecab-ipadic-neologd
mecabを使用してみます。

<出力結果>
mecab   名詞,固有名詞,一般,*,*,*,MeCab,メカブ,メカブ
を      助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
使用    名詞,サ変接続,*,*,*,*,使用,シヨウ,シヨー
し      動詞,自立,*,*,サ変・スル,連用形,する,シ,シ
て      助詞,接続助詞,*,*,*,*,て,テ,テ
み      動詞,非自立,*,*,一段,連用形,みる,ミ,ミ
ます    助動詞,*,*,*,特殊・マス,基本形,ます,マス,マス
。      記号,句点,*,*,*,*,。,。,。
EOS

echoを使用しても結果は同じです。

echo 'mecabを使用してみます。' | mecab -d /usr/lib/x86_64-linux-gnu/mecab/dic/mecab-ipadic-neologd
mecab   名詞,固有名詞,一般,*,*,*,MeCab,メカブ,メカブ
を      助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
使用    名詞,サ変接続,*,*,*,*,使用,シヨウ,シヨー
し      動詞,自立,*,*,サ変・スル,連用形,する,シ,シ
て      助詞,接続助詞,*,*,*,*,て,テ,テ
み      動詞,非自立,*,*,一段,連用形,みる,ミ,ミ
ます    助動詞,*,*,*,特殊・マス,基本形,ます,マス,マス
。      記号,句点,*,*,*,*,。,。,。
EOS