オープンソースこねこね

Webプログラミングなどについてあれこれ。

MeCabのインストール手順

先日ベイジアンフィルタを実装した際にCentOSMeCab(形態素解析エンジン)をインストールしたので、そのへんの手順をメモしておきます。ソース直で入れるのは好きではないので、checkinstallでrpmにしてからインストールしています。

checkinstallをインストールする

以前に記事を書いたのでそちらを参照。

http://kohkimakimoto.hatenablog.com/entry/2012/04/15/140128

MeCabをダウンロードしてビルドする

# cd /var/tmp
# wget http://mecab.googlecode.com/files/mecab-0.993.tar.gz
# tar xvzf mecab-0.993.tar.gz
# cd mecab-0.993
# ./configure
# make

※なおMeCabの最新は以下から確認

http://mecab.googlecode.com/svn/trunk/mecab/doc/index.html

MeCabcheckinstallでRPM化してインストール

# cd /var/tmp/mecab-0.993
# checkinstall --install=no
# rpm -ivh /root/rpmbuild/RPMS/i386/mecaitb-0.993-1.i386.rpm

IPA辞書(ipadic)をダウンロードしてビルドする

# cd /var/tmp
# wget http://mecab.googlecode.com/files/mecab-ipadic-2.7.0-20070801.tar.gz
# tar xvzf mecab-ipadic-2.7.0-20070801.tar.gz
# cd mecab-ipadic-2.7.0-20070801
# ./configure --with-charset=utf-8
# make

IPA辞書(ipadic)をcheckinstallでRPM化してインストール

# cd /var/tmp/mecab-ipadic-2.7.0-20070801
# checkinstall --install=no

パッケージ情報を修正。Nameにバージョン番号などが入ってしまっているので以下のようにする。

----------------------
1 -  Summary: [ Package created with checkinstall 1.6.3 ]
2 -  Name:    [ mecab-ipadic ]
3 -  Version: [ 2.7.0 ]
4 -  Release: [ 20070801 ]
5 -  License: [ GPL ]
6 -  Group:   [ Applications/System ]
7 -  Architecture: [ i386 ]
8 -  Source location: [ mecab-ipadic-2.7.0-20070801 ]
9 -  Alternate source location: [  ]
10 - Requires: [  ]
11 - Provides: [ mecab-ipadic-2.7.0 ]
----------------------

# rpm -ivh /root/rpmbuild/RPMS/i386/mecab-ipadic-2.7.0-20070801.i386.rpm

PHPからMeCabを使う場合はphp_mecabをインストールする

pecl.opendogs.org をチャンネルに追加。

# pear channel-discover pecl.opendogs.org
# pear remote-list -c opendogs
# pear install opendogs/mecab-beta

PHPの設定を行う

# echo "extension=mecab.so" > /etc/php.d/mecab.ini