はじめてQiitaで記事を書きます。生暖かい目で読んでください。
はじめに
私はバリバリの文系ですが、
仕事上、データは近くにあるもののそれを活かす知識もなく、
知識や経験があればできたこともあったのにと悔しく思うことも何回かあり、データ周りの勉強をしたいと思っておりました。
そんな風に考えてた頃、2022年の冬自分の人生でTOP3に入るつらいことがあり、
「この1年すごくつらかったな」という気持ちで終わりたくなかったので、
心機一転なんか人生変わることをしてみようと思い、
会社企画の勉強会に参加し、データサイエンスの勉強、Kaggleへの挑戦をすることに決めました。
そして、2023年年初めからKaggleの挑戦に向けてpythonを学び、あるコンペでメダルを獲得した後は、よりデータ周りの勉強に取り組んでいこうと思い、日々トライを続けております。
プログラミング未経験の方々や、文系職で身近のデータをどうこうしてみたいと思う方々の参考になればと思い、今回は自分の学んだ振り返りと私がこれからトライしたいことをしたためております。
自己紹介
~今まで コマースの編成&企画を少し経験したものの、大半はIT業界の総務職
▼直近の出来事
年月 | 出来事 |
---|---|
2021年 | 出産&育休 |
2022年 | 復職し、会社企画のAI勉強会へ参加&独学でG検定取得&出産&育休 |
2023年1月 | Kaggleに挑戦するため、データサイエンスの勉強を始める |
2023年6月 | Kaggle金メダル獲得 |
2023年9月 | データラーニングギルドのコミュニティに参加 |
現在~ | Kaggleとは少し距離を置き、以下記載する方面の勉強に手を広げている |
▼プライベート
1,2歳の男児二人を育てつつ(夫の多大なるサポートあり)、働きながら勉強しています
趣味はドラマ・映画・動画鑑賞で特にホラー・ミステリーが好み
※ただ怖がらせるものではなくて、意味がある怖さが好きです
Kaggle金メダル獲得まで
本題の内容ではなく、かつデータラーニングギルドの講義でお話した内容と重複するので、簡単に記載していきたいと思います。
2023年1月~3月
- 会社企画のkaggle勉強会に参加
- ハンズオンしながら、pythonでデータ分析する仕方を学ぶ
- 機械学習について学ぶ
2023年4月~6月
- kaggleに関する実践的な内容を学ぶ
- パーキンソン病すくみ足歩行検出コンペで金メダル獲得
Kaggleメダル獲得後、業務でどう活かすか
自分の中ではKaggleでメダル獲得を目指すのは、pythonを使ってデータ分析を学ぶためでもあったので、そのままKaggleを挑戦していこうと思ったのですが、Kaggleのテーマに左右されず、直接的に自分がやりたい勉強をしてみたく、今はKaggleを少しお休みして以下に着手中です。
自然言語処理
自然言語処理って検索結果、ランキングで使うイメージが主だったので、自分の業務に活かすイメージがなかったのですが、アンケートなどで使えると有識者に伺ったところから始めました。
アンケート(自由記述)>テキストマイニング
アンケートの分析で何が使えるのか?と調べてからテキストマイニング(※)に行き当たりました。
いままで自由記述のコメントは目で見てピックアップするのみだったので、そのような分析手段があるのか!と感動して、pythonでトライしている最中です。
- 形態素解析
- 自然言語処理(NLP)の一つで、文章や言葉を最小単位である品詞に分解し、意味を割り出すこと
- テキストマイニングの事前処理として活用
- ワードクラウド
- テキストデータの中の単語を出現頻度に合わせて大小をつけて視覚化する手法
- 最近は、pythonで書かなくてもExcel、フリーツールなどいろいろありそう
- センチメント解析
- 文章内の言葉から「感情」を分析する手法(ポジネガ(ポジティブ/ネガティブ)分析など)
- 顧客やユーザーの感情、Twitterなどのつぶやきの分析などを行うことが多い
- コレスポンデンス分析
- 複数の設問をかけ合わせたクロス集計の結果や、集計前のローデータなどを「散布図」であらわす手法
※文章(テキスト)に含まれていながら表出されにくい情報を引き出す技術
BIツール
もうひとつはBIツールの習得。BIツールとは企業が蓄積するさまざまなデータを集約してビジュアル化(可視化)し、分析し、インサイトを得ることで、データにもとづいた意思決定や課題解決を支援するツールです。tableau、Looker Studio、Microsoft PowerBIなどありますが、私はそのうちのtableauを勉強しようと思っています。
tableau
習得方法
スキルベルトから始めていますが、データセーバーは力になると聞いたので、そちらも年末年始から始めていこうと思います。
- スキルベルト
tableau社が提唱しているスキルベルト(社内段位プログラム)
https://www.youtube.com/watch?v=YnrQ8S03QeA - データセーバー
https://datasaber.world/
業務でデータを活用するための修行
Kaggleをやってて思うのですが、データはあるし、課題もあるし、それに対する知見を共有する仕組み(対プロ)もあるしと、かなり最高の環境じゃないですか。
しかし、現実の会社では、部内でデータ活用の知識に富んでいる人はいないし、データは集めるところからで、まずKaggleのような環境を整える知識も経験もないな…と思って有識者にいろいろ聞いて回っている状態です。
データ分析の前の話
そんな風に頭を抱えていたときに、とある社内の動画で紹介されていた本がまさに探し求めていた内容だったので紹介します。
データ分析するまでの課程、設計図の作成フローがしっかりしており、データ初心者の方でも入りやすく、ワークショップ形式だったので、なお取り組み安かったです。
本物のデータ分析力が身に付く本
https://amzn.asia/d/ef5yJz1
本では模造紙と付箋をと書かれておりましたが、ペンを持つことに慣れていない私は、前半付箋、(挫折して)後半Miroを使用しました。断然、Miroのほうがやりやすかったです。
実際のデータ分析
pythonを触ってないと怠けていきそうなので、まず身近にあるデータでEDA(探索的データ分析)をしております。回帰モデル、カテゴリ分類、相関など。↑の内容が終わりましたら、本格的にtableauと合わせて進めていく予定です。
おしまい(今後どうしたいか展望含め)
こんな感じで私は何もない道を進んだり戻ったり止まったりしながら、日々格闘しています。
そもそも今後も勉強を続けていきたい理由を書いてなかったですね。(今?)
率直にデータサイエンスの勉強が面白かったので、今後も業務として携わっていきたいと思っています。しかし、現在の職ではそれが主の業務ではないですし、データサイエンス業界で転職、副業をしたいといっても、実績が必要という応募条件ばかり…。
そのため、総務職にいるときに、どう業務に活かせるか?というところに至りました。
もし、この記事を見てアドバイスや突っ込みが浮かんだ方は、ぜひコメントでもDMでもご連絡をお待ちしております!
おやすみなさい。