世界を体験しよう!

何事も挑戦して、新しい経験や発見して、世界で人生を謳歌したいと思っています。

AIと機械学習の簡単な概要

はじめに私の気づきをまとめます。

  • 機械学習は手段であって、目的を忘れてはならないこと
  • 機械学習は用途の合わせて3つの種類やさらに様々なアルゴリズムがあって、どのモデルを使えば正解なのか分からないこと
  • データサイエンティストになるためには、機械学習人材に必須のスキルとほとんど同じこと

機械学習とは

コンピューターが大量のデータを学習し、分類や予測などのタスクを遂行するアルゴリズムやモデルを自動的に構築する技術

データの規則性をある関数にフィットさせて、評価関数でその関数とデータの誤差を小さくしていく仕組みである。

そこで、できた学習モデルは、データの特性を数式で表したもの

必要な2つのステップ

  1. 学習(テストの答え合わせをしながら、勉強するイメージ)
  2. 推論(学習後の新しい未知のデータで出力されるものに対して、精度の確認)

機械学習の3大トピック

  1. 教師あり学習(回帰・分類)
  2. 教師なし学習(分類で使われるクラスタリング・主成分分析(次元削減))
  3. 強化学習(ある「環境」の中で、目的として設定された「報酬」を最大化するための行動を学習)

AIブームの理由

  1. IoTで収集できるデータ量増加
  2. ディープラーニングの登場
  3. ハードウェアの進展
  4. OSS*1フレームワークの登場

機械学習活用の全体プロセス

  1. 企画(目的を決める)
  2. 環境構築
  3. データ収集
  4. 目標値作成
  5. 前処理
  6. モデル作成(機械学習アルゴリズム
  7. デプロイ(学習済みモデルを組み込む)
  8. 再学習(用途に合わせて)

機械学習人材に必要な4つのスキル

  • ビジネス(本質的な課題を見抜く力)
  • サイエンス力(問題設定に応じた評価)
  • エンジニアリング(組み込んでオンプレミス)
  • 橋渡し力(3つのスキルの重なる部分)

AIにできること・できないこと

できること

  • 大量データ処理
  • ルールベース処理

できないこと

  • 人間でも判断できない予測
  • ノイズデータの処理
注意点
  1. 課題設定が不適切にならないようにする(手段が目的ではない)
  2. 運用段階まで加味しない
  3. 外部開発会社に丸投げしない

用語集

  • 特徴量エンジニアリング:既存の特徴量を組み合わせて新しい特徴を生み出すこと。

  • セマンティックセグメンテーション:対象の画像の領域を影にする技術

*1:Open Source Software):ネットに公開されているソースコード