機械学習 - PHPとMeCabとMySQLでベイジアンフィルタを実装してみた。
PHPとMeCabとMySQLを使ってベイジアンフィルタを実装してみました。ひとまず動くようにはなったので公開します。機械学習によってテキストドキュメントの自動分類ができます。
高校数学すら忘れてしまっていたので、ついでに条件付き確率などを基礎から勉強してみたが、残念ながらあんまり理解していないです。
さて、実装したベイジアンフィルタですが、機械学習やカテゴリ推定のアルゴリズム部分はPHPで書いて、学習データはMySQLに保存するようにしてあります。ソースはgithubに置きました
https://github.com/kohkimakimoto/BayesClassifier
使い方など
あとで書きます。。。
あと、カテゴリ推定のサンプルなども書く。。。
2012/04/20 - 追記
サービス作ってみました。
http://kohkimakimoto.hatenablog.com/entry/2012/04/20/125341
参考にしたサイトなど
http://gihyo.jp/dev/serial/01/machine-learning/0003
上記のサイトの他に、以前購入したWeb DB Press総集編に収録されている伊藤直也氏による記事も参考にしました(Vol56のアルゴリズムの連載記事)。というかアルゴリズムの部分は、ほとんどこの記事にあったPerlのコードをPHPに置き換えた感じです。