著作一覧 |
20日にHeroku Meetupに参加したのだが、そこで全文検索エンジンのプラグインの紹介があった。
で、プラグインそのものよりも、日本語形態素解析(と書いてはいるもののよくわかっていない。トークンの切り出しをしてくれるマシン程度の認識なわけだが)のkuromojiに興味を持った。
ソースを見てみたら、Javaで書かれている。
ということは、Rubyで簡単に利用できるってことだ。
で、お試しにちょろいcgi(rjbはそれなりの速度で起動するから、cgiでもそこそこ動く)を作ってみた。
(21日にほぼ動いていたのだが、eachを実装するのに手間取った。なので、日記の日付は21日。でも後進しているのは23日)
面倒なのでcssも何もなし。htmlのフォームに日本語のテキストを入れてやって、submitすると、kuromojiを呼び出して切り出した結果を表示する。
用語や固有名詞を入れると、さすがにユーザー辞書を指定しないとおかしな切り方になるけど、それはそういうものだろう。
ArrayListをeachでアクセスしたかったので、rjbは1.4.0を作ることになった。
ジェズイットを見習え |