akon2.00βのよっぱらいの戯言

色しょく是食、食しょく是色 当サイトではアフィリエイトプログラムを利用して商品を紹介しています。

データ分析のための数理モデル入門 本質をとらえた分析のために

 

数理モデル

数学的な手段を用いて記述された、対象のデータ生成ルールを模倣したもの

 

目次

目次
まえがき
第一部 数理モデルとは
第1章 データ分析と数理モデル
1.1 データを分析するということ
■人間の認知限界とデータ分析

■対象をデータ生成システムとして捉える

 ■データ分析における限界

 ■2つのアプローチ
1.2 数理モデルの役割
■データを眺める以上の分析が必要なら数理モデルの出番

数理モデルは「仮定」 である
第1章のまとめ

第2章 数理モデルの構成要素・ 種類
2.1 変数・数理構造・パラメータ
数理モデルを構成する要素

■まずは変数で表すことから
■数理構造=「数理モデルの骨組み」

■パラメータは数理モデルを 「動かす」
2.2 数理モデルと自然科学の基礎理論

■確立した数理モデルは基礎理論に

境界条件と計算の難易度
2.3 理解志向型モデリングと応用志向型モデリング
■目的によってモデリングは大きく異なる

■モデルの複雑さと理解のしや すさ
2.4 理解志向型モデリング

■理解志向型モデリングの方法

■(1) 数理構造から説明する方法

■(2)推定したパラメータの値から説明する方法
■(3)推定された潜在変数や内部表現を使って次の解析を行う方法

■(4)数理モデルのパラメータを変化させた状況をシミュレートする方法
2.5 応用志向型モデリング
数理モデルのデータ生成能力を活用する

■予測モデルの例1:値の予測(回帰)

■予測モデルの例2: 分類問題

■生成モデルを使った応用
2.6 数理モデルの限界と適用範囲
■「正しい」数理モデル?

■良い数理モデルも,いつも正しいとは限らない
第2章のまとめ
第一部のまとめ

第二部 基礎的な数理モデル
第3章 少数の方程式によるモデル
3.1 線形モデル
■変数の間の関係を等式で表現する

■線形モデル

■線形モデルを求めるには

■最小二乗法
3.2 実験式・カーブフィッティング

BMI数理モデル

べき乗則による特徴づけ

■対数プロットでべき乗則を探す

■実験式

3.3 最適化問題
■目的の量をコントロールする

■大域的最適と局所的最適

■パラメータ 調整も最適化

■最適化を難しくする要素
第3章のまとめ

 

第4章 少数の微分方程式によるモデル
4.1 解ける微分方程式モデル
微分方程式で時間変化を表す

マルサスによる個体数モデル

■マルサ スモデルの解の振る舞い

■個体数は、 爆発的に増え続けたりしない

■簡単な連立線形微分方程式

■2本の連立微分方程式

■連立1階線形常微分方程式

■「固有値」の値によって解の性質が決まる
4.2 非線形微分方程式モデル

非線形な項を含む微分方程式モデル

■ロトカ・ヴォルテラ方程式

■「定常」な状態について考える

■定常解の 「安定性」

■安定性を実際に評価する

微分方程式の線形化による解析

■数値シミュレーション
4.3 解けるモデル・解けないモデル
■解ける微分方程式は少ない

■線形の微分方程式

■1変数の非線形微分方程式

偏微分方程式

■分析ソフトウェアの利用
4.4 制御理論
■入力変数に対してシステムがどう応答するか

微分方程式を解くための便利な道具

微分方程式ラプラス変換で解く

微分方程式に制御項を入れてみる

■目的の値を達成するためのフィードバック系を考える

■古典制御理論と現代制御理論、その後
第4章のまとめ


第5章 確率モデル
5.1 確率過程

■確率的な状況を考える

■確率分布は確率の情報をひとまとめにしたもの

■連続変数の確率分布

■連続変数の確率分布: 確率密度関数

■何度もサ イコロを振ってみる
5.2 マルコフ過程
マルコフ過程は、 過去の状態を振り返らない

■ランチの決め方
■どれくらいの割合でラーメンを食べることになるか

■状態確率の方程式を立てる
■時間が十分経過した後の話


5.3 待ち行列理論
■窓口の行列を確率的に表現する

■平均的な振る舞いに基づいた推測
■ランダムに利用者が到着することを表現するポワソン過程

■増えたり 減ったりを表現する出生死滅過程

■行列の長さを確率的に捉える

■定常 状態の分析

■確率分布がわかったら、期待値が求まる

■確率モデルの強みと限界

■数値的な解析は比較的容易

■マルコフ近似
第5章のまとめ

第6章 統計モデル
6.1 正規分布
■双六(すごろく)の結果

正規分布は確率分布の親玉

正規分布の定義

■異なる正規分布同士の足し算も正規分布

正規分布の二乗の足し算は?
6.2 統計的検定

■ばらつきについて考える

■偶然の確率

■平均に関する検定

■統計検定は万能ではない

■第一種過誤と第二種過誤

■統計検定の実施
6.3回帰分析

■線形モデルの妥当性

■同じ線形モデルでも・ ・・

■ピアソン相関係数による評価

■当てはまりの良さだけで結論していい?

■変数の数が増えた場合は重回帰分析

■ 線形でないモデル

第6章のまとめ

第二部のまとめ

 

第三部 高度な数理モデル
第7章 時系列モデル
7.1 時系列データを構成する構造
■さまざまな時系列

■いろいろなアプローチ

■トレンド + 周期成分+ノ イズ

■周波数成分

■特定の非線形構造がある場合

■時系列が定常かど うか

■時間を説明変数にして普通に統計検定を行なってはいけない
7.2 観測変数を使ったモデル
■予測に使えるモデルたち

■ARモデル

■ARMAモデル

■ARIMAモデル
■SARIMAモデル

7.3 状態空間モデル
■状態変数を含むモデル

■状態空間モデルの一般的な表現

■離散時間・線形・ガウス型モデル

■その他の場合の状態空間モデル

7.4 その他の時系列分析法いろいろ

■自己相関で時間構造を特徴づける

■異常拡散による特徴づけ

フーリエ変換による周波数解析

■カオス・非線形時系列解析

■2つ以上の時系列から因果関係を調べる

第7章のまとめ

 

第8章 機械学習モデル
8.1 機械学習で扱われるモデル・問題の特徴

機械学習の基本的な考え方

■複雑な問題、複雑なモデル

■モデルの自由度とオーバーフィッティング

機械学習モデルを使った分析の実施

8.2 分類 回帰問題・
■分類と回帰

■決定木

■ランダムフォレスト

サポートベクターマシン

ニューラルネットワーク

8.3 クラスタリング
クラスタリングでデータを解釈

■k-means法混合分布モデル

■階階層的クラスタリング手法
8.4 次元削減

■次元削減とは

■主成分分析

独立成分分析

非線形な次元削減法
8.5 深層学習
■深層学習とは

■畳み込みニューラルネットワーク

■リカレントニューラルネットワーク

■オートエンコーダ

■敵対的生成ネットワーク
第8章のまとめ

 

第9章 強化学習モデル
9.1 行動モデルとしての強化学習
■強化と学習

■ギャンブル課題

■行動選択を含める

■モデルのバリ エーションと発展

■行動モデルとして使う

9.2 機械学習としての強化学習
機械学習としての強化学習

■価値関数の性質を決める

■価値関数の更新

■深層学習を使ったQ学習

■Q学習以外の方法

第9章のまとめ

 

第10章 多体系モデル(エージェントベースモデル)

10.1 ミクロからマクロへ

■多体系モデル(エージェントベースモデル)とは

■モデルの構成要素
■時間・空間の離散化

■マクロな変数によってシステムの振る舞いを特徴づける

■モデルの分析の仕方
10.2 さまざまな集団現象モデル

■群れのモデル

■同期現象のモデル

■人間行動・意思決定のモデル

 

10.3 相互作用のネットワーク

■ネットワーク構造で問題を眺める
■どれくらい他のノードとつながって いるか

■類は友を呼ぶ?

■ネットワークの上の移動のしやすさを特徴づ ける

■「中心性」で重要なノードを特徴づける

■「友達の友達」は友達か

■ランダムなネットワークを作る

スケールフリーネットワークの基本モデル

コンフィギュレーションモデル

第10章のまとめ

第三部のまとめ

 

第四部 数理モデルを作る

第11章 モデルを決めるための要素
11.1 数理モデルの性質・
数理モデルの目的

モデリングは試行錯誤

決定論的モデル vs 確率モ デル・統計モデル

■利用可能なモデルの検討
11.2 理解志向型モデリングのポイント
■理解しやすいモデルとは

■簡単なモデルなら何でもいいわけではない

■理解したい深さとモデリング手法

数理モデルと演繹

■モデルで指定したメカニズムのレベルよりも根源的なことは説明できない
11.3 応用志向型モデリングのポイント
■問題を定義する

■性能を重視したモデル選び

■データの性質

第11章のまとめ

 

第12章 モデルを設計する
12.1 変数の選択・
■含めるべき変数・そうでない変数

■変数の解釈性

■無関係な変数は外す

■特徴量エンジニアリング

■離散値変数・連続値変数
12.2 データの取得・実験計画
■着目する変数の影響をコントロールしながらデータを取得する

■フィッシャーの三原則

■フィッシャーの三原則はデータの偏りに気を付けるためのヒント

12.3 数理構造 パラメータの選択
■目的に応じた数理構造の選択

■目的変数のばらつきが無視できない場合
■ばらつきを考えなくていい場合

■パラメータの値の範囲
12.4 間違ったモデリングをしないために
■既存の体系との整合性・比較

■ハンマーしか持っていない人にはすべてが釘に見える

■データは適切に前処理しておく
第12章のまとめ

 

第13章 パラメータを推定する

■動かせるパラメータと動かせないパラメータ

■パラメータの点推定

■変数の振る舞いを定量的にデータと合わせたい場合

■単に誤差の大きさを平均する

■対数尤度

■確率分布間の「差」を最小化する指標

■交差エントロピー
13.2 パラメータ推定における目的関数の最小化

■目的関数を最小化するには

■解析的に解く

■パラメータをスウィーブ する

最急降下法

■局所解に陥らないために

過学習を防ぐ目的

■目的関数最小化の実施
13.3 ベイズ推定 ベイズモデリング

■パラメータの分布を考えるのがベイズ推定

■パラメータの確率分布 ?

■推定された分布を特徴づける

マルコフ連鎖モンテカルロ

メトロポリス

第13章のまとめ

 

第14章 モデルを評価する

14.1 「いいモデル」とは

■目的に応じたモデルの評価

■メカニズム理解を目的としたモデルの評価

■統計的推論を行うためのモデルの評価

■応用志向型モデリングにおける モデルの評価

14.2 分類精度の指標

■当てはまりの良さ・性能を測る

■正解率・再現率・特異度・適合率・F値

ROC 曲線とAUC

14.3 情報量規準
■モデルが複雑ならば適合度は上がる

赤池情報量規準AIC

ベイズ情報量規準BIC

■その他の情報量規準

14.4 ヌルモデルとの比較・尤度比検定
■モデルに入れた要素に意味があるか

■尤度比検定/統計検定とヌルモデル
14.5 交差検証
■実際にモデルの性能を未知データで試す

■リーケージに気を付ける

■モデルの信憑性と未知のデータ
第14章のまとめ
第四部のまとめ
あとがき
索引
著者紹介: