データサイエンス&サイバーセキュリティ備忘録

Python, Data Science, Kaggle, Cyber Security, CTF, などなど

AIオンラインLT#0全員リモート!?トライアル開催に参加しました

2020年4月16日、Deep Learning Labが主催したAIオンラインLT#0全員リモート!?トライアル開催というイベントに参加しました。

dllab.connpass.com

このイベントはタイトルにもある通り、オンライン(Microsoft Teams)での開催でした。

参加人数は100人以上で、LTのイベントとしては大規模なオンラインイベントかと思いますが、スムーズに進行していて普段のLTと特に変わりなかったです。

また、このイベントのコンセプトは"家にいよう"であり、新型コロナウイルスに感染していても無症状であるため、気付かずに外出して自分が感染源になってしまうことを防ぐ目的で、主催者の方々もオンラインで集まるというイベントでした。

イベントの会場でだけでなく、会場に向かうときに使用する電車などの公共交通機関でも感染のリスクがあるため、とても良い取り組みだと思います。

聞いていて内容が面白かったので、このイベントのLTを発表者ごとに内容をまとめたいと思います。

林 昌弘 さん (ノバシステム株式会社)

タイトル

あるSIerのAI取組報告

内容
  • AIで何かやれと言われても、上層部を納得/理解させないといけない
  • いざ、案件でAIを使用しようとしても...

   1. 課題(目的、データ)がない
   2. データがあるとしても、自由に使えない
   3. 課題を仮定しても、解決したいことが曖昧
   4. BtoBなので、お客さんごとに課題とデータのフォーマットが違う
   5. データ分析に詳しい人がいない

  • やってきたこと

 1. 社内業務改善
   オフィス受付の自動化
    ・はじめはPepperが受付⇒Webアプリ化
    ・顔検知、音声案内ができる
   ドアセキュリティ
    ・入退室の解錠デバイスを顔認証に切り替えるために作成中
 2. 社内案件への活用
   社内パッケージのデータを活用
    ・飲食店向けパッケージには、注文データが蓄積されている
    ・店舗ごとにデータの質が違うが、それを活かして店舗ごとの解析はできそう
    ・データ分析用にデータを蓄積していないので、必要な情報が欠落している
 3. 社内教育
   データサイエンティストの育成
    ・自社のノウハウを教材としてアウトプット
    ・AIやデータ解析が分かる人を増やす

www.slideshare.net

スマホで見ている方はこちらからどうぞ↓
https://www.slideshare.net/MasahiroHayashi6/sierai-232143086?ref=https://dllab.connpass.com/event/173273/presentation/

増井 隆治さん (株式会社HACARUS)

タイトル

Deep Learningとスパースモデリング

内容

  ・Deep Learning機械学習で学習しているもの = 関数
  ・予測値をどのように求めるかをデータから学習している

  ・スパース=少ない、疎という意味
  ・どのような要因によって得られたかを求める

  ・Lassoによる特徴量選択
  ・MRIの高速撮影高精細化
  ・ブラックホール撮像での応用

  ・レントゲン撮像で本当に骨の部分だけを写す

  ・VAE(Variational Autoencoder)のlatent codeをスパースにすることで、
   解釈性が高く再利用のしやすいlatent codeになる
  ・過学習を防ぐことができる
  ・latent codeは、データの一部が変化しても変化した箇所以外の値は
   変わらないというように、人間のような解釈をすることができる

speakerdeck.com

スマホで見ている方はこちらからどうぞ↓
https://speakerdeck.com/hacarus/deep-learning-and-sparse-modelling

女部田 啓太さん (日本マイクロソフト株式会社)

タイトル

Data Drift によるモデル管理

内容
  • 時間が経つにつれ、機械学習の精度がどんどん低くなる

  理由:
   新しいデータに追従できていない
  ⇒モデルの再構築が必要

  • データドリフト = モデルにインプットするデータの変化 *1
  • 運用中のモデル精度が分からないとき、データドリフトを見る
  • データドリフトが発生するとき

   1. データ計測方法の変更
   2. データ品質の劣化
   3. 季節性などの自然な変化
   4. 設備の劣化、嗜好の変化

  • Azure Machine Learningでデータドリフトをチェックできる

  Azure Machine Learningとは...
   ・Python やRのコードを複数種類の環境で書ける
   ・scikit-learnやTensorFlow、Pytorchなどのライブラリが揃っている

  • Azure Machine LearningでのData Driftの仕組み

   1. 学習データと推論データを調べて、ドリフト検知
   2. 検知したら、可視化してアラートを出す
   3. 使用者がデータを見て、自分でモデルを改修して精度を上げる

  • データドリフトの大きさや、特徴量ごとのドリフトへの影響を確認することができる

www.slideshare.net

スマホで見ている方はこちらからどうぞ↓
https://www.slideshare.net/keitaonabuta/datadrift-in-azure-machine-learning

まとめ

今回のLTでは、AIに関する業務の取り組みや手法、特徴量の変化の確認とモデルの管理方法を学びました。

実務に活かせそうな内容ばかりだったので、非常に為になりました。