Ubuntu20.10 形態素解析エンジンMecabを使用する
- 作成日 2021.02.28
- Mecab ubuntu
- ubuntu20.10

Ubuntu20.10に自然言語処理の形態素解析ができる「Mecab」を使用するまでの手順を記述してます。CentOSのバージョンは7.9.2009となります。
環境
- OS CentOS 7.9.2009 (Core)
- Mecab 0.996
Mecabインストール
aptでインストールします。
sudo apt install mecab libmecab-dev mecab-ipadic-utf8
バージョンを確認してみます。
mecab -v
<出力結果>
mecab of 0.996
mecab-ipadic-NEologdダウンロード
Mecabの辞書である「mecab-ipadic-NEologd」をダウンロードしておきます。こちらはgitより取得することが可能です。
git clone https://github.com/neologd/mecab-ipadic-neologd.git
インストールを行います。
sudo bin/install-mecab-ipadic-neologd
mecab実行
mecabを実行してみます。
mecab -d /usr/lib/x86_64-linux-gnu/mecab/dic/mecab-ipadic-neologd
mecabを使用してみます。
<出力結果>
mecab 名詞,固有名詞,一般,*,*,*,MeCab,メカブ,メカブ
を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
使用 名詞,サ変接続,*,*,*,*,使用,シヨウ,シヨー
し 動詞,自立,*,*,サ変・スル,連用形,する,シ,シ
て 助詞,接続助詞,*,*,*,*,て,テ,テ
み 動詞,非自立,*,*,一段,連用形,みる,ミ,ミ
ます 助動詞,*,*,*,特殊・マス,基本形,ます,マス,マス
。 記号,句点,*,*,*,*,。,。,。
EOS
echoを使用しても結果は同じです。
echo 'mecabを使用してみます。' | mecab -d /usr/lib/x86_64-linux-gnu/mecab/dic/mecab-ipadic-neologd
mecab 名詞,固有名詞,一般,*,*,*,MeCab,メカブ,メカブ
を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
使用 名詞,サ変接続,*,*,*,*,使用,シヨウ,シヨー
し 動詞,自立,*,*,サ変・スル,連用形,する,シ,シ
て 助詞,接続助詞,*,*,*,*,て,テ,テ
み 動詞,非自立,*,*,一段,連用形,みる,ミ,ミ
ます 助動詞,*,*,*,特殊・マス,基本形,ます,マス,マス
。 記号,句点,*,*,*,*,。,。,。
EOS
-
前の記事
Active Directoryで外部のNTPサーバを使用する 2021.02.28
-
次の記事
javascript サイトのmeta keywordsを取得する 2021.03.01
コメントを書く