windows Mecabの辞書「mecab-ipadic-NEologd」を使用する

windows Mecabの辞書「mecab-ipadic-NEologd」を使用する

windows環境で、Mecabの辞書である「mecab-ipadic-NEologd」を使用するまでの手順を記述してます。

環境

  • OS windows10 pro 64bit
  • mecab 0.996

mecab-ipadic-NEologd使用

ここでは「WSL」で「Ubuntu」を使用します。

windowsでubuntuの使用方法はこちら

次に「mecab」と必要パッケージをインストールします。

sudo apt install mecab mecab-ipadic-utf8 libmecab-dev git make curl xz-utils file

適当なフォルダにgitからcloneしてきます。
※ここでは「/mnt/c/mecab」にしてます。

sudo git clone --depth 1 https://github.com/neologd/mecab-ipadic-neologd.git

移動します。

cd mecab-ipadic-neologd

コンパイルを行います。

sudo ./bin/install-mecab-ipadic-neologd -n

あとは任意のフォルダに、辞書をコピーします。

cp /usr/lib/x86_64-linux-gnu/mecab/dic/mecab-ipadic-neologd/* /mnt/c/dic

pythonで使用

pythonで使用する場合は、以下のように利用できます。

import MeCab
 
m = MeCab.Tagger('-d C:\dic')
str = "めざましテレビにいた"
print( m.parse(str) )

<出力結果>
めざましテレビ  名詞,固有名詞,一般,*,*,*,めざましテレビ,メザマシテレビ,メザマシテレビ
に      助詞,格助詞,一般,*,*,*,に,ニ,ニ
い      動詞,自立,*,*,一段,連用形,いる,イ,イ
た      助動詞,*,*,*,特殊・タ,基本形,た,タ,タ