(ついに本気を出して絶賛修論執筆中だけど)ahokaiiの設計を少し修正した
これまでsqlite3のデータベースファイルを db_ngrams, db_postsという2つのファイルにしていたけど
db というファイル1つにまとめました。
理由は、特に2つに分ける意味は無かったからです。
commit 54以降のバージョンにアップデートするには、
db_postsの方にクロールした元twitterアカウントのデータが入っているので、それは消さずにdbにリネームして、n-gramのテーブルを追加すると良いですよ
mv db_posts db
rm db_ngrams
ruby migrate_ngrams.rb up
ruby make3gram.rb
忘れずにmake3gramし直す。
あと、ついでにBuzztterから検索してpostを構築する機能が付けてみた。
面白くなるかはわからないけど。
マルコフ連鎖でのpost構築は、今まで頭側から行っていたけど左右両方向へ伸ばすようにしたので
これで検索機能が付けられた
ruby post3gram.rb リナカフェ
「リナカフェ」を含むpostが作られる
make post with ‘リナカフェ’
リナ カフェ が 1
—search left 3-grams—
=” リナ カフェ 1
m =” リナ 1
‘ m =” 1
e ‘ m 1
– e ‘ 1
(h)ruby – e 1
—search right 3-grams—
カフェ が オススメ 1
が オススメ ! 1(t)
ruby-e’m=”リナカフェがオススメ!
一定確率でbuzztterのRSSを取ってきて、名詞を抽出して、検索機能にかける。
確率の指定方法はsample.config.yamlに書いてあります
必要無い人は、0を指定してください。
何も設定しないとデフォルト3割ぐらいでばずるけど、この値は変わるかもしれない
ばずっているところ
search buzztter…
fetch http://buzztter.com/ja/rss
make post with ‘最近’
を 最近 作っ 1
—search left 3-grams—
もの を 最近 1
な もの を 1
みたい な もの 1
github みたい な 1
の github みたい 1
版 の github 1
ケータイ 版 の 1
(h)wassr ケータイ 版 1
—search right 3-grams—
最近 作っ て 1
作っ て パラレル 1
て パラレル twitter 1
パラレル twitter ワールド 1
twitter ワールド に 1
ワールド に する 1(t)
に する 方法 1
wassrケータイ版のgithubみたいなものを最近作ってパラレルtwitterワールドにする方法