centos7でMecabをインストールして使用する

centos7でMecabをインストールして使用する

centos7で自然言語処理の形態素解析ができる「Mecab」をインストールして使用するまでの手順を記述してます。CentOSのバージョンは7.9.2009となります。

環境

  • OS CentOS 7.9.2009 (Core)
  • Mecab 0.996

Mecabインストール

まずは、リポジトリを追加します。

sudo yum install --nogpgcheck -y https://packages.groonga.org/centos/groonga-release-latest.noarch.rpm

Mecabをインストールします。

sudo yum -y install mecab mecab-ipadic mecab-devel patch --nogpgcheck

バージョンを確認してみます。

mecab -v

<出力結果>
mecab of 0.996

mecab-ipadic-NEologdダウンロード

Mecabの辞書である「mecab-ipadic-NEologd」をダウンロードしておきます。こちらはgitより取得することが可能です。

git clone --depth 1 https://github.com/neologd/mecab-ipadic-neologd.git

インストールを行います。

cd mecab-ipadic-neologd
./bin/install-mecab-ipadic-neologd -n -a

mecab実行

mecabを実行してみます。

mecab -d /usr/lib64/mecab/dic/mecab-ipadic-neologd/
mecabを使用してみます。

<出力結果>
mecab   名詞,固有名詞,一般,*,*,*,MeCab,メカブ,メカブ
を      助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
使用    名詞,サ変接続,*,*,*,*,使用,シヨウ,シヨー
し      動詞,自立,*,*,サ変・スル,連用形,する,シ,シ
て      助詞,接続助詞,*,*,*,*,て,テ,テ
み      動詞,非自立,*,*,一段,連用形,みる,ミ,ミ
ます    助動詞,*,*,*,特殊・マス,基本形,ます,マス,マス
。      記号,句点,*,*,*,*,。,。,。
EOS