|
タイトル |
スモールデータ解析と機械学習(スモールデータカイセキトキカイガクシュウ) |
|
スモールなデータの解析手法・ノウハウが身につく!
人工知能によるビッグデータ解析が近年、広く注目されています。しかし、製造メーカなどのほとんどの一般企業においてはデータ量が少なかったり偏っていたりする、スモールデータがデータの中心です。本書はそのようなスモールデータの解析手法を解説するものです。
Webデータや気象データに代表されるようなビッグデータが注目される一方で、機械の故障データのように発生自体がまれであったり、臨床データのように倫理的な問題からデータ収集が困難、あるいはラベリングが専門家以外困難で教師データが集まらなかったりするスモールなデータ、すなわちスモールデータが存在します。
これらのデータは測定されている変数の数に比べて統計モデリングに必要なデータが不足していたり、正負双方のサンプルが必要となる分析において、その取得が困難といったような問題があり、そのままビッグデータの考え方を適用するのは適当ではありません。
本書は、はじめにスモールデータとは何かから、データの作り方となる次元削減と回帰分析の手法、つづいてスパースなデータのモデリング、クラスタリング、不均衡なデータの解析手法、異常検出を述べていきます。そして最後にスモールデータの解析においてのポイント・考え方を述べて、読者がスモールデータを有効に解析できるようになるようまとめました。
第1章 スモールデータとは
第2章 相関関係と主成分分析
第3章 回帰分析と部分的最小二乗法
第4章 線形回帰モデルにおける入力変数選択
第5章 分類問題と不均衡データ問題
第6章 異常検知問題
第7章 データ収集や解析の心構え