2012-07-25から1日間の記事一覧

rubyから使えるようにする

さて、ここからが本番。 導入した形態素解析をrubyから使えるようにしなければならない。 MecabからMecab-rubyを利用しているMecabのバージョンに合わせてダウンロード。 後は MeCab および MeCab-Ruby をインストールする と MacにMecabとmecab-rubyをイン…

各辞書の印象

ニュースの本文を使って試してみたところ、単語の細分化度合いはNAIST 例: NAIST 太平洋戦争 名詞,固有名詞,一般,*,*,*,太平洋戦争,タイヘイヨウセンソウ,タイヘイヨーセンソー,, 慰霊祭 名詞,一般,*,*,*,*,慰霊祭,イレイサイ,イレイサイ,,IPA 太平洋戦争 …

他の辞書も入れる

で、今回は幾つかの辞書を試してどれが最適化を試したいので、他の辞書も入れる。 NAIST辞書 NAIST Japanese Dictionary 落としてきて以下でインストール utf-8に対応させるオプション付き。 ./configure --with-charset=utf-8 make sudo make install /usr/…

Mecabのインストール

$brew install mecab 現状はデフォルトで最新バージョンが入る。 IPA辞書のインストール $brew install mecab-ipadic 標準のIPA辞書を入れてみる。brewで簡単。 これで一応分かち書きの機能は使える。 $ mecab 試しに文章を分かち書きにする試し 名詞,一般,*…

rubyとMecabで形態素解析(分かち書き)出来るようにする。

今作ろうとしてる機能で形態素解析が必須なので導入します。