toddler’s diary

以前は研究にあまり関係ない雑談・2023年4月から本を通じた自分の振り返りやってます

Bradley Efron, Trevor Hastie 「大規模計算時代の統計推論」共立出版 2020

統数研とのクロアポになって改めて統計と機械学習の関係について考えさせられることが多いですが、この本はまさにその問題を象徴するような本です。前にも書いたかもしれませんが、私個人の意見としては内容的な差異は実質なくて、学会やコミュニティが異なっているということかと思います。私は統計学会に入っていませんし、そもそも機械学習の学会とは何かを言うのも難しいところがあります。

 

本書の原著者の Efron と Hastie はどちらも統計寄りとはいえ、それぞれの分野で知名度や位置づけはちがっていますし、監訳者である藤澤さん、井手さんも同じような関係にあります。序文ではそれぞれ統計学研究者と機械学習研究者を代表して書かれていて興味深いです。特に井手さんの出だしの文はストレートにみんなが感じているもやもやを表現してくれています。序文で原著者が「機械学習という言葉は、宣伝用の見出し文句のようで鼻につく」と書いていて、そのあたりも井手さんの文と呼応しているように思います。

 

井手さんとは深いつきあいはありませんが、カーネル多変量解析の書評のうちでもっとも巧みにほめてくださっています。藤澤さんとは名前は存じ上げていたものの極最近まで面識がないほどの関係でしたが、統数研のクロアポの件ではもっともお世話になった方の一人で、私や産総研のわがままでいろいろ振り回してしまいました。統数研に着任後もいろいろ気にかけていただいていて、感謝の気持ちでいっぱいです。

 

統計学は歴史がある学問である一方、頻度主義 vs ベイズのような第3者から見るとよくわからない対立があったり、用語なんかも謎のものが多くて学生時代は、難しいというよりも古臭くて見通しの悪い学問という印象でした。講義でも「自由度」とかがほとんど何の説明もなく出てきて、これについてはその後相当長い間気持ち悪さを抱いていました。

 

実問題と結びついているというのも学生にとってはロマンがなくてつまらなさの一端でしたし、仮説検定の解釈をうるさく言ったりするのも学問として本質的ではないような気がしていました。長年つきあってそのあたりの印象はだいぶ薄らいではきました。