toddler’s diary

以前は研究にあまり関係ない雑談・2023年4月から本を通じた自分の振り返りやってます

Emanuel Parzen, Kunio Tanabe, Genshiro Kitagawa (eds) "Selected Papers of Hirotugu Akaike", Springer 1998

甘利研にいた時代には赤池先生の仕事についてはあまりよく知りませんでしたし、甘利先生自身の赤池先生に対する評価もそれほどすごいという感じではなかった気がします。ただしその後統数研の方々とつきあっていくと、赤池先生はすごい人だったというような話を聞くようになりました。まあ結局のところ直接の面識はなく、こうした伝聞でしか判断できないの正確なところは全く分かりません。

 

この本を買ったのはとりあえず AIC 関連でよく引用されていたのでとりあえず買ってみたというような本で、コレクション的な意味合いが強く、特に中身を読むような性質の本ではないかなと思います。

 

気になっているのは編者の方々で、田邊先生と北川先生は面識もありますし入っていて当然だと思うのですが、筆頭編者が Parzen というのがちょっと意外でした。

 

もちろん統計関係の人間関係ほとんど知らないので私が無知なだけですが、いわゆる変数選択からワンパラメータの正則化の方に興味が移ってノンパラに行った私からすると、赤池先生と Parzen の関係というのがちょっと不思議な感じがします。まあ機械学習分野で全くアプローチ違うけど親しいみたいなのはよくある話なので、そういうことなのかもしれません。

 

永田 靖「サンプルサイズの決め方」朝倉書店 2003

機械学習や統計の話をしたり、共同研究なんかでよく出てくる質問の一つがサンプルサイズをどれくらいとればよいかということで、この本を買ってみました。

 

実際問題に対してこの質問に明確に答えるのは極めて難しいと思います。ディープラーニングだともはや絶望的な話ですし。

 

とはいえ、この本に書いてあるようながっつりとした統計的仮説検定の枠組みだとある程度サンプルサイズ設定について知っているのは有用かなと思います。

 

そもそも自分は実用性はともかく数学的におもしろい構造してれば興味が出てくるので、サンプルサイズに限らず統計学の手法の実用性と数理のバランスは、個人的にはわりとうまくつきあえているかなと思います。

 

菊地文雄,岡部政之「有限要素システム入門」日科技連 1986

有限要素法の原理を計数の専門の最初の方で勉強した記憶はかすかにあるのですが,何の授業のどの先生だったか全く覚えていません.ともかくこうして教科書も持っているわけですが,たいして読んだ形跡もありません.有限要素法はかなり高度ですが,微分積分の離散近似で,できるだけ離散化誤差が小さくなるようにいろいろ工夫するのは計算していて面白かった記憶があります.

 

中のプログラムが BASIC で書かれているのも時代を感じます.いまや BASIC に関する本をコンピュータ書籍の中から見つけるのは大変ですが,昔は(特にパソコン少年にとって)一般向けの言語として BASIC がもっともポピュラーでした. FORTRAN とか COBOL はむしろそんなのが世の中にはあるらしいくらいのイメージでした.

 

なお,この本にも書いてあるように,有限要素法自体の研究をすることが主眼というよりは,それを適用可能な応用事例を探索することに主な関心事があるように思います.統計学の先生とかも,数理統計のがちがちに理論的なところに興味のある人はむしろ少数派で,世の中から統計的な問題を抽出して実用的な解決を目指すという人が多数派だということを知ったのは実は結構最近のことです.

 

 

Evarist Gine, Richard Nickl "Mathematical Foundations of Infinite-Dimensional Statistical Models" Cambridge University Press 2016

この本はかなり以前に鈴木大慈さんがツイッターとかで言及されているのを見て思わず買った本です。まあ想像通り中身も外見もハードな本で、高齢研究者が一人で読む類の本ではありませんでした。

 

現在私は鈴木さんの理研のラボの客員にさせてもらっていますが、鈴木さんは数理統計と機械学習のスーパースター的な存在だと思います。しかも人格者でもあり、優秀な研究者にありがちな攻撃性もほとんどないと思います。もちろん研究には厳しいところはあると思いますが。

 

鈴木さんのような方を見ていると、自分みたいな人間が研究者やっていて大丈夫かなと不安になることもしばしばですが、まあどんな研究者でも自分なりに模索すれば何かしらは残せるものがあるという風に信じてやっていくしかないですね。研究者は勝負の世界ではなくて、研究者全員で知識の壁を切り開いていくものだと思いますので。

 

 

間瀬 茂, 武田 純「空間データモデリング: 空間統計学の応用」共立出版 2001

データ解析の主な対象である実数値ベクトルというのはそもそも空間データですし、画像も高次元の空間データと言えると思います。それゆえ、空間データモデリングという 2Dからせいぜい 4D くらいまでのデータ分析をするという感覚がいまいちわかっていませんでした。

 

ですが、画像という対象でやまほど研究があるように、問題領域を特殊化するとそれに特化したいろいろな研究が山ほどあることがわかります。特に空間データモデリングが対象としている比較的低次元の空間ならではの問題、たとえば密度推定とか非線形手法なんかが実用的に使える世界となります。

 

そもそも研究者をはじめたころはそんなに応用領域に興味がなかったですし、いまでも地学とかの応用領域に興味はありますが、それは数理とかそういうのとは別モードでの興味であるとは思います。

 

なお、この本は Amazon で購入した履歴が残っていて、かつて Amazon で立て替え払いができた古き良き時代の名残りです。今は産総研直結のネット調達で微妙に納期や在庫不足で苦労する時代になりました。

 

 

武田 圭史「Java使いへの道」ソフトバンク 1996

オランダに滞在していた前後に world wide web という言葉を聞くようになり,インターネットに革命が起きるというような雰囲気でした.ただそのころはまだ電総研がネットニュースを電話回線(uucp)で筑波大と通信しあうみたいな時代で,ネットのキャパがどうなっているのかに懐疑的でした.

 

その一方,個人のホームページ作ったりするのは楽しくて,当時作ったホームページも基本的には30年近くたった今でも同じものを使い続けています.

 

cgi とか web アプリなんかも面白い技術で,いろいろ手作りスクリプト書いていましたが,Java という言語が出てきてかなり本格的になった感じがありました.この本の対象プラットフォームは Windows95/NT, SPARC/Solaris という若い人だとよく知らないワードも入っているかもしれませんが,Windows PC ベースのものとワークステーションベースのものが同じに動くというのも魅力的でした.

 

Java で EM アルゴリズムアプレットを作って公開したら結構海外の人にも見に来てもらえるようになりました.そのほかにも電総研にならんでる車の写真とかのページとかも作って遊んでいました.

 

ただし,そんなよい時代は長くは続かず,産総研のセキュリティ関連の方針から,ホームページに無駄なものを置かないこととか web アプリみたいなのは基本的に禁止になって,公式にはつまらないページだけが残りました.

 

まあ公私の区別をつけるというのは重要なことなので,それはそれでいろいろ整理しましたが,今のようなセキュリティガチガチではないゆるくていろいろ遊べた頃が懐古主義的ではありますが懐かしく思われます.

 

F. Chollet「PythonとKerasによるディープラーニング」マイナビ出版 2018

今の深層学習は Pytorch とか tensoflow とかのフレームワークをベースに python でプログラムを書くというのがほぼすべてだと思いますが、当然昔は自分でバックプロパゲーション込みでCで書くというのが当たり前でした。

 

私の場合、ディープラーニングブームになってから自分で本格的にプログラムを作るということがほとんどなくなったので、最近のプログラミング事情に完全に乗り遅れていました。

 

ICA の研究をやっていたころに知り合った Simone Fiori というイタリア人から数年前にイタリア人修士の学生のインターンみたいなのを頼まれて受け入れました。そのときに、やはり若い人たちは深層学習だろうと思って教科書も勉強してもらいつつ、tensorflow でプログラムを書いてもらいました。そのからみで私も少しこういったフレームワークの使い方も少し勉強しました。

 

イタリア人の学生は二人いて、一人は典型的なステレオタイプのイタリア人という感じで、歓迎会の飲み屋のお姉さんと早速 LINE 交換したりハグしたりとか当たり前にやっていて、日本人研究者が全員羨望のまなざしで見ていました。彼はコロナが落ち着いた後も日本にやってきましたが、私が担当できるテーマがなかったので、産総研の別の研究室に滞在していました。彼のような積極性は私にはあまりない特質だと思います。