StanとRでベイズ統計モデリング
: 松浦 健太郎/石田 基広/市川 太祐/高橋 康介/高柳 慎一/福島 真太朗
近年,確率分布を使った数理モデルをデータにあてはめることで現象の理解と予測を促す「統計モデリング」が注目されている。既存の手法と比べた時の利点は解釈のしやすさと予測のよさの両立である。解釈がしやすいので,モデルに含まれる値を推定した後で次のアクションにつなげやすい。このため現実のデータ解析に極めて有効な手法と評価されている。
背景には,コンピュータの計算速度の向上,大規模のデータが入手しやすくなったこと,モデリングの試行錯誤を極めて簡単にする確率的プログラミング言語の進歩がある。こうした言語の中から,本書ではフリーソフトであるStanを紹介する。Stanは優れたアルゴリズムを搭載し開発も急速に進んでいるパッケージであるが,R用のパッケージであるRStanが並行して公開されているためRから手軽に利用することができる。Stanの記述力は高く,階層モデルや状態空間モデルをわずか30行ほどで書くことができ,推定計算も自動で行なわれる。さらに解析者の問題にあわせたオーダーメイドの拡張が簡単に可能だ。
一般にベイズ統計を扱う書籍は初歩的な内容にとどまるものか,難解な数式が多く実際の問題への応用が難しいものが多い。しかし,本書はこれらの書籍とは一線を画し,現実のデータ解析を念頭に置いて非常に実践的な内容に仕上げた。本書でStanとRを介して身につけた統計モデリングの考え方は,Stanの文法が変化しても,他の統計モデリングツールを扱う場合にも,大いに役に立つと確信している。
レビュー(6件)
ぜひ次を
Stanでの書き方含め丁寧に解説した本。 訳本はどうしても原文の表現に依存するため、理解の難しさが増してしまう。 そのため、日本人の日本人による日本人のための本書はとてもありがたい。 ぜひ著者には、某書のように、現在主流の統計手法をStanで書くとどうなるか、 (欲を言えば、分布以外の説明で極力数式を使わずに) 解説する次の書籍を希望したい。
Stanの入門書として最適
Stanプロジェクトが開発したStanは高速統計プログラミング言語である。パッケージRstanを介してRスクリプトに実装して利用できる。中級者以上であれば、ネットから検索できる情報を集めれば初期設定、実装やプログラミングは、それほど難しくはない。本書は、分かりやすく説明されているので初級者には良書です。強力なエンジンが必要なベイズ解析にStanを利用した物が増えてきた。詳細は、CRANホームページのTask Viewsにあります。本書は、そうした環境の中でまとめられたタイムリーな入門書である。