toddler’s diary

以前は研究にあまり関係ない雑談・2023年4月から本を通じた自分の振り返りやってます

林俊克「Excel で学ぶテキストマイニング入門」オーム社 2002

この本は私の書棚にある Excel に関する唯一の本かもしれません.研究で Excel を使ったことは一度もありませんが,地質関係の方々だと,Excel で分析というような話はしょっちゅう聞きますし,ガチの Excel 使いの方に下手なことを言うとまずいという話もあるようです.どんな道具でも使い方を極めれば大丈夫だという話だと思います.ただ,Excel のすごわざが出てくる本というわけではなく,この本を読んで R や python で処理するということだって普通にできそうです.

 

この本で本格的に使うのは茶筅という形態素解析のソフトで,現在どうなっているかわかりませんが,私もテキストデータ解析で少し使ったことがあります.この当時はいろいろな形態素解析のソフトが開発されていて,奈良先端大とかがそのメッカだったような印象があります.前にも書いたように,このころはまだ計数にいた富岡さんの話とかでひたすら自然言語処理がNP問題みたいな認識だったので,まじめに自分の研究としてやろうという気はありませんでした.

 

この本ではデータダウンロードが web でダウンロードできるということで,オーム社のHPにアクセスするとちゃんとアクセスできます.ただ,こういう情報がいつまで残っているかというのが web と本の連携では危うい気がしていて,昔の本であれば何百年経っても価値は失われませんが,最近の情報というのは賞味期限が短いというのはちょっと心配になります.そんなことは誰も気にしていないのかもしれませんが.