著者:あかば
ページ数:60
¥498 → ¥0
Pythonによる主成分分析のチュートリアルです。
データ分析者の初心者から実務者を対象とした、実務で役立つ内容を目指した本です。
データ分析者の初心者から実務者を対象とした、実務で役立つ内容を目指した本です。
主成分分析(Principal Component Analysis: PCA)は多変量解析の分野で標準的に使用される手法です。
特徴として、高次元のデータをより少ない変数で表現し、次元削減を可能とします。
高次元データも、主成分分析で得られた主成分を用いて可視化することが可能となることから、データセット理解の観点からもデータ分析者に頻繁に使われる手法です。
本書の特徴は以下の3項目の習得を目指す点です。
1. 直感的な理解
2. Pythonでの実践
3. 数学的背景の理解
項目2の分析の例題では、scikit-learnに含まれる分類データセットを用いて、分析の一連の流れを紹介します。高次元データを主成分分析で次元削減し、可視化することで分類可能であることがみれます。
詳細は、下記の目次を参照してみてください。
——————————————-
目次
はじめに
主成分分析とは
コードの表記方法について
実行環境
主成分分析の直感的理解
主成分分析の実践
データセットの読込
ヒストグラム描画
標準化
主成分分析(PCA)
2次元の散布図
3次元の散布図
コード全体
数学的な定式化
基本統計量
平均(mean)
分散(variance)
共分散(covariance)
標準化(standardization)
定式化
シリーズ一覧
- 同シリーズの電子書籍はありませんでした。
Kindle Unlimitedは、現在30日間無料体験キャンペーンを行っています!
この期間中は料金が980円→0円となるため、この記事で紹介している電子書籍は、すべてこのKindle Unlimited無料体験で読むことが可能です。