多様なデータ分析手法の原理を、線形代数学のほか、数理最適化、確率を含む統計学的な観点から理解することを目的とする教科書。
データサイエンスには多様な手法が存在する。データ分析を考えるうえでは、単に与えられたデータに,ウェブ記事などで紹介された手法に従って既存ライブラリを適用しても意味がない。これでは、そのデータを発生させている根本的原因を理解することはできないからである。データ分析者には、それぞれの分析手法の原理を理解して、求める情報を得るのに適した分析手法を選び、適用結果を読み解く力が求められる。
本書は、多様な分析手法の使い方だけでなく、各手法の数学的な原理をイメージしながら理解することを目的とする。そのため各手法について、数学的観点から分析手法の定式化を示し、どのような計算によってデータから求める情報を抽出するのか、なぜその計算によってうまく求める情報が抽出できるのかも示す。
各手法の原理は線形代数学のほか、数理最適化、および確率を含む統計学に基づいている。分析手法の定式化を理解するためにはこれらの知識が必要である。そのため本書では、原理を説明するのに必要な線形代数学・数理最適化・統計学分野の関連知識についても同時に学べるようにする。各分析手法を説明する章より先に、必要な各分野の関連知識を説明する章を設けている。
第1章 ベクトル
第2章 要約統計量と相関
第3章 無相関検定
第4章 協調フィルタリング
第5章 クラスター分析
第6章 最適化問題と求解法
第7章 行列 -1次変換,特に直交変換ー
第8章 Gram-Schmidtの直交化技法と直交分解
第9章 非負値行列分解
第10章 行列式
第11章 回帰分析
第12章 固有値と固有ベクトル
第13章 主成分分析
第14章 因子分析
第15章 PageRankアルゴリズム
第16章 判別分析
第17章 林の数量化理論と数量化I類
第18章 数量化II類
第19章 数量化III類
第20章 数量化IV類
第21章 確率変数による記述
第22章 機械学習の概要
第23章 決定木と集団学習
第24章 ロジスティック回帰
第25章 混合Gaussモデルによるクラスタリング
第26章 ニューラルネットワーク
第27章 不等式制約付き問題の最適性
第28章 サポートベクトルマシン
第29章 隠れマルコフモデル
参考文献
索引
レビュー(0件)