大規模なデータベースから有用な「規則や知識」を発見することの重要性が高まっている。そしてデータベースからの知識発見において中心的な役割を演じているのがデータマイニングである。データマイニングの主要なテーマである教師あり学習(決定木学習、ナイーブベイズ学習、サポートベクトルマシン、ランダムフォレスト)、教師無し学習(クラスタリング)、パターンマイニング(相関ルール)について学ぶ。
最後に,得られた知識を評価する方法である交差確認について学ぶ。
科目一覧
Fundamentals of Data Mining
データマイニングに必要な数理的な基礎を学ぶ
データマイニング基礎
担当講師 | 黒木 進(広島市立大学) |
---|---|
分類 | 講義 |
授業形態 | VOD |
授業形態詳細 | 任意の時間にパソコンからインターネット接続にて(自宅や職場などから)受講します。 |
時数 | 8コマ |
時間数 | 12時間 |
到達目標 | データマイニングに必要な数理的な基礎を身に付ける |
難易度 | ★★★ |
分野別難易度 | 数学:★★ |
履修上の注意 | 大学初年時に学ぶ解析、線形代数、確率統計に関する知識があることが望ましい。 |
授業計画 ・内容 |
1. 決定木学習 2. ナイーブベイズ学習 3. 階層的クラスタリング 4. 非階層的クラスタリング 5. サポートベクトルマシン 6. 相関ルール 7. ランダムフォレスト 8. 交差確認 |
事前・事後学習 の内容 |
・授業の前に教科書等をよく読み、不明な点を明確にする。 ・関連するニュースや新聞記事などを読み、幅広く知識を身に付ける。 ・コンピュータを使ってデータマイニングを実際に行ってみる。 |
成績評価の 方法 |
課題提出(100%) 以下の項目を評価基準とし、その達成度合いに応じて評価する。 ・データマイニングの基礎概念について説明できること ・データマイニングの技法を用いて問題を分析できること |
教科書 ・参考書等 |
【教科書】 ・北上・黒木・田村(著)「データベースと知識発見」(コロナ社),2013. 【参考書】 ・元田・津本・山口・沼尾(著)「IT Text データマイニングの基礎」情報処理学会編集(オーム社),2006. |
キーワード | 教師あり学習、教師なし学習、パターンマイニング |
日程 |