AI全般
日本統計学会公式認定 統計検定データサイエンス発展対応 データサイエンス発展演習を学習した際の不明点のメモ.
「倫理・AIに関する基礎的な事項」のAI全般について.
AIの活用領域
1. 物流
物流拠点への人員配置に数理最適化手法が用いられている.
2024問題に対し,シフトの最適化によってドライバーの休憩時間と輸送量を確保する取り組みが検討されたそう.
2. マーケティング
Marketing Automation(MA)に用いられる.どの顧客にいつ,何を販売するのかを決定し,マーケティングキャンペーンを自動化する.
自動化の対象は,
- マーケティング対象者の選定
- 宣伝する商品の選定
- 送信するメッセージの作成
- メール配信のタイミング
- SNS発信
Enterprise Resource Planning(ERP)は,販売・配送・納品のプロセスの自動化を担う
3.医療ー電子カルテ
患者の医療記録を電子データにしてDBで管理する.マイナンバーを利用して,すべての医療施設でのカルテの共有を目指している.
4.地図
地図上にデータを可視化する際には,データソースの信頼性が重要で,現実世界を正しく反映し,有益な情報を提供できるようにすることが大事.
- ベクタデータ:地点,線,多角形で表現. Shapefile, GeoJSON形式
正確さ,複雑な表現
高度な操作(プログラミング等),時間がかかる
- ラスタデータ:地表をピクセルで分割し,各ピクセルに値をあてることで表現.csv形式
地理上の隣接関係が分かりやすい
正確さに欠ける
AI系の用語
汎用AI(AGI)
あらゆるタスクに対応できる,人間のような汎用的な知能を持ったAI
Convolutional Neural Network(CNN-畳み込みニューラルネットワーク)
画像データをメインとして,特徴抽出を行うニューラルネット.画像のピクセルから部分の特徴を抽出する畳み込み層,畳み込みを行った画像の次元を減らすプーリング層を中心に構成し,最後に各ピクセルを関数に入力することで出力を得る全結合層からなる
Recurrent Neural Network(RNN):時系列データを扱えるニューラルネット.自然言語処理や音声認識にも使われる.長期,短期の記憶を扱えるように忘却と選択を導入したLong Short Term Memory(LSTM)も存在する
Generative Adverserial Networks(GAN-敵対的生成ネットワーク):生成されたものの「本物らしさ」を学習しながら,高品質なデータ生成を実現
Generatorは受け取った乱数をもとにデータを生成する.
Discriminatorは本物(データセットに含まれている)に近いなら0,偽物であれば1を出力する.
###Transformer:自然言語処理において,Attentionを用いて単語間の関係性を抽出し次の単語を予測する深層学習モデル
参考文献
[1]日本統計学会. データサイエンス発展演習. 東京図書株式会社,2024