toddler’s diary

以前は研究にあまり関係ない雑談・2023年4月から本を通じた自分の振り返りやってます

2023-11-20から1日間の記事一覧

M.L.Puterman "Markov Decision Processes: discrete stochastic dynamic programming" Wiley 1994

強化学習という言葉は修士の頃から少しずつ耳にする言葉でしたが,最初は部分情報だけ与えられる半教師あり学習の親戚のようなものだと思っていました.その後 Sutton なんかの本を読んでやっとなんかすごい枠組みだと思うようになって,その基礎であるマル…