のんびり読書日記

日々の記録をつらつらと

Programming

WikipediaのキーワードリンクをDBMに保存する

データマイニングの手法を試してみるときは、Wikipediaのデータが量もたくさんあって使いやすいと思うけど、配布されているテキストファイルのままではちょっと扱いが面倒。DBに入れておければプログラムからも使いやすくていいんだけど、MySQLとかのリレー…

k-means++を試し中

http://d.hatena.ne.jp/kaiseh/20090113/1231864089上の記事を見て、k-means++が面白そうだったので、ちょっとだけ試してみた。k-meansは初期値に大きく依存するところが嫌い。初期値への依存度を軽減するために、初期値を変えて何回か試行してその中で一番…