統計
データを集めて傾向を割り出すもの
・平均値:各データの合計をデータの個数で割って求めた値
・メジアン:小さい順に並べて中央に位置する値
・モード:出現頻度の最も高い値
・レンジ:データの最大値と最小値
・分散:平均値からのばらつきを表す。平均値との差(偏差値)の2乗の平均値で求める
・相関:お互いの要素が関連している(○○が増えれば□□も増える)
・因果:原因と結果(○○が原因で□□が起こる)
・仮説検定:とある仮説が正しいか統計学的に検証すること
→帰無仮説:仮説検定で検証したい仮説のこと
→対立仮設:仮説とは逆の仮設のこと
正規分布
平均値を中心とした左右対称の釣り鐘型の分布
・歪度:正規分布からどれだけ左右に歪んでいるか
歪度>0=左に歪んでいる 歪度<0=右に歪んでいる
・尖度:正規分布からどれだけ尖っているか
尖度>0=尖っている 尖度<0=つぶれている
AI
・データ活用の流れ
①データ収集:目的に応じて情報を収取
→一次データ(調査者が特定の目的で収集)
→二次データ(第三者がほかの目的で収集(外部から入手できるデータ/内部(自社内)から入手できるデータ))
→データレイク:生データ保管場所
②データ加工・分析:収集したデータを活用しやすい形に整える。
→データクレンジング:不要なデータを取り除く※制度の向上
→データウェアハウス:クレンジング後データの保管場所
③統計的手法を用いた分析:データからいえる事は何か。何を意味するのかを把握
④可視化し活用:データ分析結果を目的に応じて図表やグラフで表現
機械学習
大量のデータ(ビッグデータ)をコンピュータに解析させ予測や判断が出来る様に学習させること
・教師あり学習:正解のあるデータをインプット
→回帰モデル:連続する数値や傾向をもとに予測を行う(連続する数値データ)
→分類モデル:データを分類分けをする
・教師無し学習:正解のないデータをインプット
→クラスタリング:特徴が類似するものをグループに分類しまとめる
→ 次元削減:重要なデータを抜き出し、重要でないデータを削減(2次元から1次元に)
・強化学習:機械学習自身の行動とその結果をインプット
UI/UXデザイン
・UI:ユーザーと製品をつなぐ接点
4つの原則
①説明が無くても操作ができる
②操作しやすい配置
③レスポンスの時間が適切
④デザインに一貫性を持たせる
・UX:サービスを通じて得られる体験や経験
・GUI:画面上のアイコンやボタンなどマウスで操作する視覚的なインターフェース
→トグルボタン:ON/OFFの切り替え
→ホバー:カーソルを合わせた時に色や大きさが変わる
ソフトウェア
・ローコードツール:最小限のソースコードで開発するツール
・ノーコードツール:ソースコードを記述することなく開発するツール
・DevOps:開発チームと運用チームが密接に連携して柔軟かつスピーディーにシステム開発を行う手法
・MLOps:機械学習チーム、開発チームと運用チームが連携して機械学習のライフサイクル全体を効率的に行う手法
データベース
・バックワードリカバリ:ロールバック(エラー発生時、更新前に戻すこと)
・フォワードリカバリ:ロールフォワード(更新後の状態にやり直すこと)
・NUI:人が普段行っている自然な動作(音声やジェスチャーなど)で入力を行うインターフェース