Pythonでベイズ定理



Divmod Reverendを下記URLからダウンロードしてきます。


http://divmod.org/trac/wiki/DivmodReverend





$ sudo apt-get install python-setuptools


$ tar zxvf Reverend-0.4.tar.gz


$ cd Reverend-0.4


$ sudo python setup.py install



Pythonコードです。



import os


from reverend.thomas import Bayes



esong = ""


bsong = ""



for line in open('8mile.txt','r'):


    line = line.rstrip()


    esong = esong + line



for line in open('allihavetogive.txt', 'r'):


    line = line.rstrip()


    bsong = bsong + line



guesser = Bayes()


guesser.train('eminem', esong)


guesser.train('bsb', bsong)


classify = guesser.guess('Now this looks like a job for me So everybody, just foollow me Cause we need a little, controversy Cause it feels so empty, without me I said this looks like a job for me So everybody, just follow me Cause we need a little, controversy Cause it feels so empty, without me')



print classify




■実行結果



[('eminem', 0.79676292256054282), ('bsb', 0.49495961371107255)]




より大きな数字が”より”それ”らしい”ということなので、


今回はeminemの曲”らしい”と言う結果に・・・



余裕がある時に、nltkを試してみて報告したいと思います。


http://www.nltk.org/


http://nltk.googlecode.com/svn/trunk/doc/api/nltk.classify-module.html