のんびり読書日記

日々の記録をつらつらと

新納浩幸『Rで学ぶクラスタ解析』

すっかりご無沙汰になってしまった読書日記…。
読んだ本を結構貯まってしまったので、全部まとめて日記に書くのは辛いので、とりあえず細かく書いていくことにする。

で、最近読んでいるのがこの本。

Rで学ぶクラスタ解析

Rで学ぶクラスタ解析

クラスタリングが必要になってきたので、勉強用に買ってみた。とりあえずは集合知プログラミングとかを見ながら、kmeans, 階層型クラスタリングを実装してたんだけど、もう少し色々知りたくなったので。というか研究室でも勉強してたはずなんだけど、この辺はもうすっかり忘れたな…。

Rは全然知らなかったんだけど、機能が充実しててなかなか面白い。kmeans, EMもすぐ使えるし、プラグインを入れれば大抵のものは使えそう。大量のデータを実時間で解析できるものなのかはよく分からないので、サービスで使えるかどうかは分からないけど、とりあえずいろいろな手法を試すにはすごくいいと思う。

本では、階層的クラスタリングやkmeansから、PLSI、ファジィクラスタリングとかも書いてある。しかもRの例付きなのでありがたい。PLSIは名前しか聞いたことなかったので、これ読んで勉強しよう。

せっかくなので週末あたり、wikipediaのデータでも使って手法を試してみよっと。