この講義では、データ解析の基礎を学ぶ。データを入手してから、前処理、可視化を行い、目的とデータに応じた基本的な統計解析手法を適用するまでの、各段階において必要となる知識、理論について解説する。また、統計解析ソフトウェアRの利用方法についても説明し、これを用いて演習を行う。
科目一覧
Data Analysis
R言語でデータの前処理・可視化・分析を実践する
データ解析
担当講師 | 藤野 友和(福岡女子大学) |
---|---|
分類 | 演習 |
授業形態 | VOD |
授業形態詳細 | 任意の時間にパソコンからインターネット接続にて(自宅や職場などから)受講します。 |
時数 | 8コマ |
時間数 | 12時間 |
到達目標 | 統計解析ソフトウェアを利用して、与えられたデータに基本的な統計解析手法が適用できるようになること。また、結果を適切に解釈できるようになること。 |
難易度 | ★★★ |
分野別難易度 | 数学:★ プログラミング:★★ (一部演習あり) |
履修上の注意 | ・高校程度の数学の知識、およびプログラミングの経験があることが望ましい。 ・演習を行うためのPCを準備しておく(OSは問わない)。 |
授業計画 ・内容 |
1. Introduction 講義の概要と目的/ データの尺度水準について/ 統計解析環境Rの概要・セットアップ・基本文法 2. データの前処理と可視化 dplyrパッケージを利用したデータの前処理 ggplot2パッケージを利用したデータの可視化 3. 確率変数と確率分布 確率変数と確率分布/正規分布と二項分布/ 標本分布と統計的推測/乱数を用いた理論の確認 4. 予測手法(1) 回帰分析 単回帰分析/重回帰分析/重回帰分析における変数選択 5. 予測手法(2) ロジスティック回帰分析と決定木 6. 分類手法 クラスター分析 階層型クラスター分析/非階層型クラスター分析 7. 要約手法 主成分分析 線形代数の復習/主成分分析 8. まとめとその他の手法の概要 ニューラルネット/テキスト分析/統計モデリング |
事前・事後学習 の内容 |
毎回の講義で課題を与える |
成績評価の 方法 |
提出された課題により評価する |
教科書 ・参考書等 |
・独自の資料を提供する ・「Rによるデータマイニング入門」:山本・藤野・久保田[著] オーム社 |
キーワード | データ解析、可視化、予測、分類、データマイニング |
日程 |