オープンソースこねこね

Webプログラミングなどについてあれこれ。

機械学習 - PHPとMeCabとMySQLでベイジアンフィルタを実装してみた。

PHPMeCabMySQLを使ってベイジアンフィルタを実装してみました。ひとまず動くようにはなったので公開します。機械学習によってテキストドキュメントの自動分類ができます。

高校数学すら忘れてしまっていたので、ついでに条件付き確率などを基礎から勉強してみたが、残念ながらあんまり理解していないです。

さて、実装したベイジアンフィルタですが、機械学習やカテゴリ推定のアルゴリズム部分はPHPで書いて、学習データはMySQLに保存するようにしてあります。ソースはgithubに置きました

https://github.com/kohkimakimoto/BayesClassifier 

使い方など

あとで書きます。。。

あと、カテゴリ推定のサンプルなども書く。。。

2012/04/20 - 追記

サービス作ってみました。

http://kohkimakimoto.hatenablog.com/entry/2012/04/20/125341

参考にしたサイトなど

http://gihyo.jp/dev/serial/01/machine-learning/0003

上記のサイトの他に、以前購入したWeb DB Press総集編に収録されている伊藤直也氏による記事も参考にしました(Vol56のアルゴリズムの連載記事)。というかアルゴリズムの部分は、ほとんどこの記事にあったPerlのコードをPHPに置き換えた感じです。