toddler’s diary

以前は研究にあまり関係ない雑談・2023年4月から本を通じた自分の振り返りやってます

福田剛志,森本康彦,徳山豪「データマイニング」共立出版 2001

著者の徳山先生は,以前にもとりあげたように私が伊理研の時に数学科から来られていて,こちらが一方的に知っているという関係です.

 

データマイニングという言葉も昨今あまり聞かなくなりました.いわゆる頻出マイニングのようなアルゴリズムがだいたい落ち着いて,そこから先は機械学習とかの話になってくるので分野として融合されてしまったということでしょうか.データマイニングはもともとデータベース研究から発した言葉ですが,目的そのものはデータベースというよりは機械学習に近い感じもします.

 

ECMLPKDD はまさに機械学習データマイニングがくっついた会議で,何回か参加しました.一度は 2009 年だと思いますがスロベニアのブレッドで,これはドイツのミュンスターであった CAIP に村田さんや藤木さん,日野さんと村田研の学生さんと一緒に参加したついでにはしごして長距離電車移動したときです.その後イギリスのブリストルであったときは,神嶌さんが公平性の話を発表して,それが Test of time award 受賞のきっかけとなったものになります.イギリスの西の方の会議というのは珍しいと思うのですが,温泉遺跡のバースやストーンヘンジなんかもあって,知り合いの方がバースの大学に留学すると聞いたときに懐かしく思い出しました.

 

 

R. Szeliski「コンピュータビジョン ―アルゴリズムと応用」 共立出版 2013

コンピュータビジョンの決定版的な教科書っぽいということで買ってみましたが、大きくて重い辞書サイズの本なのでなかなか手に取って読むということはなかなかありません。

 

監訳者の玉木さんは以前スパースモデリングの翻訳もされていましたが、これ以外にもオンラインの講義とかもかなり初期の頃から取り組まれていてやたらとアクティブな人だなあと思っていました。研究上の接点はあまりないのでそれほど交流することはありませんが。

 

コンピュータビジョン分野だと井宮先生とはいろいろな接点がありました。もちろんお名前は知っていたのですが、私が最初に科研費審査委員になったときに、その合議の場でお会いしたのがちゃんとした出会いでした。その後も国際会議などでよくお会いしましたが、私と違って豪快なタイプの先生ですが、それなりに目をかけていただきました。

 

 

 

J.メイナード-スミス「進化とゲーム理論 ー闘争の論理ー」産業図書 1985

この本もGA関係の勉強をしていたときに買った本です。ゲーム理論の基本(ナッシュ均衡とか)は計数の学部で少しやったと思いますが、どんな講義の中だったかは完全に忘れました。このずっと後にゲーム論的確率論みたいな話も出てくるわけですが、この頃は全くそういう発想はありませんでした。

 

ここ数年間、つくばサイエンスエッジという世界の中高生の自由研究コンテストの審査委員を務めています。産総研の違う分野のあまり接点のない方からなんとなく頼まれてなんとなく引き受けて今に至っています。世界中といっても、だいたい常連の学校は決まっていて、それでも数百件という規模で応募があります。海外特に台湾とかだと日本に観光がてら出してくるというようなのもあります。これの委員長が江崎玲於奈先生で、いつもリモートでご挨拶されるので直接お会いすることはできていませんが、99歳になられてまだお元気というのがすごいです。高校生の熱量もすさまじくて、つくば国際会議場は熱気に包まれます。まあ審査委員の年寄りのことなんてほとんど目に入っていないとは思いますが、研究者を志す子供が一人でも増えたらと思い、今後も協力するつもりです。まあこんなボランティアを引き受けてくれる代わりの人が当分見つかりそうにもないというのもありますが。

 

 

J.S.Liu "Monte Carlo Strategies in Scientific Computing" Springer 2001

単純なモンテカルロ法は学部生でも習ったと思いますが,MCMC に到達するには結構な年月がかかりました.この本はコンパクトにモンテカルロ法MCMCに関するオーバービューができる良書だと思います.ただ,HMC=hybrid/Hamilton Monte Carlo とか,呼び方が複数ある場合は,どちらかしか載ってなかったりするので辞書的に使うのにはちょっと向いていないかもしれません.

 

ところで,産総研では発足時から20年にわたってグループ長という役目を務めさせていただきましたが,自分の人生の中で「長」と名の付くものにはほとんど縁がありません.まあたいていの人には「向いていない」という風に言われます.実際グループ長時代は,自分がリーダーとして引っ張っていくわけでも,部下に指示を出すわけでもなく,自分がやったことといえば上からの理不尽なタスクをできるだけバリアすることくらいでした.

 

前も書きましたが,小中学校のときは児童会・生徒会の役員に先生から言われて立候補してものの落選.小学校の時に一度だけクラスの学級委員をやったのが「長」の中では一番上だったかなと思います.なので,やったこともない「長」の人たちに文句を言うのは筋違いかなという気もしますが,私が経験したほとんどの上司の人たちは大したことない人たちでした.

 

研究部門長は,研究に寄りすぎて政治的に弱くなったり,政治に走りすぎて部門の研究モチベーションを下げたりと,あまりバランスが取れた人がいなかったように思います.その中では,持丸さんは当初思っていたよりは基礎研究に理解がある感じがしました.とはいえ分野も若干違うこともあり,よくわからないプロジェクトに担ぎ出されて表面的にご一緒することはありましたが,研究の場でまともに議論する機会はありませんでした.

 

P. Larranaga, J.A.Lozano (eds) "Estimation of Distribution Algorithm" Kluwer 2002

電総研に入ってしばらく勉強した GA の長所や欠点もだいたいわかってきたところで,確率モデルを学習しながら最適化も行うアプローチに興味がわいてきました.当初はまだ EDA という名前はなかったと思います.しかも最近は EDA という言葉を聞くことはほとんどなくなった気がします.手法自体がなくなったわけではなく,ベイズ最適化とかも基本的にはこの流れの上にあると思います.

 

企業との共同研究で最適化という話が出てきたときに,ベイズ最適化なのかMCMCなのかという選択に迫られることがあります.いろいろ使い分ける基準はありますが,そもそもEDA的なアプローチとMCMCのようなモデルフリーなアプローチの中間的な方法があってもよいかなとは思います.たぶんそれらもいろいろ研究されているのでしょうが,あまりメジャーにならないのは,そういうハイブリッドな方法というのは余程インパクトがある結果を出さないと残っていかないと思います.

 

分野も EDA を研究している計算機科学系の人と,MCMC を研究している物理・統計系の人とは分断されているような気がします.2006 年の ibis で確率モデルと集団最適化というオーガナイズドセッションを企画しました.まあこの手のセッションはやりっぱなしであまりその後の発展はありませんでしたが,確か福島さん(レプリカ交換法の発案者)がセッション後にコメントしにきてくださった記憶があります.

 

C.G.Small, D.L.McLeish "Hilbert space methods in probability & statistical inference" Wiley-interscience 1994

タイトルからすると再生核とかその辺を期待して買った本でしたが,中身はセミパラとかの本でした.ちょうどこのころ川鍋さん・甘利先生と金谷先生とのバトルもあり,関心事ではあったのですが,あまり議論の本質を理解しきれてはいませんでした.Bickel とか Godambe の本に比べるとぱっと見は読みやすそうなので少しずつ読み解いていこうと思います.

 

子供のころからなりたい職業は少しずつ変わっていった話は前に書きましたが,研究者というのは修士に入るまではあまり想像していませんでした.成績も特によかったわけではなかったですし,何かすごくこだわりをもった研究対象があったわけでもありませんでした.ただ,甘利研にいて,甘利先生をはじめとして研究者の方々が生き生きとしている様子,ほとんど遊びながら仕事をしている様子なんかをみて,自分にもできるのではないかというちょっとした錯覚が起きてこの道に進んだのかなと思います.

 

今は博士の試験に落ちたというと意外な顔をされることも多いですが,当時は確かに狭き門でした.計数の博士の数学の試験は3時間くらいで何問かある問題のうち数問選んで解くという形式でした.その頃実は結婚も決まっていて,博士に行って親の世話になるというのは考えられなかったのもあって,特に博士のための勉強はしませんでした.

 

しかし,そんな中途半端な態度で問題が解けるはずもなく,完全に解けた問題はほとんどなかった気がします.電総研に入ったときに,伏見研のM2の人に私が受けた問題について聞かれて解いてみた時にはそんなに苦労なく解けたので,やはり気持ちの問題と,試験の場での空気というのもあったのかもしれません.

 

黒田 耕嗣, 樋口 保成「統計力学: 相転移の数理」 培風館 2006

この確率論教程シリーズは伊庭さんに教えてもらったシリーズだったと思いますが,その第6巻がこの本です.確率論というのはこの本のように物理学に近くて,一方統計学は文系の学問という感じがします.このように近いものが意外に離れているということはよく起きます.

 

産総研の中でもAI応用とかやっている人よりは脳科学とかサイエンス寄りの人にシンパシーを感じます.基礎という価値観を共有できているということかもしれません.研究所のトップ層の人たちはそういう考えはないようですが.

 

あと,物理学者はこの本にある相転移という現象が好きだなという印象です.確かに連続的にだらだらと変化していく様子は驚きがないので,研究に驚き度という軸を取れば,相転移のような現象は確かに高い数値となることは納得できます.