1. はじめに
私は理系大学の学部4年生で主に機械学習について研究・学習しています。この記事では、2023年5月から参加しているCA Tech Loungeについての体験を共有したいと思います。
2. CATLの概要
CA Tech Loungeは、Cyber Agentが運営を行なっているエンジニア志望者向けの学習コミュニティスペースです。
特徴
- 切磋琢磨できるコミュニティ:共通の目標を持つメンバー
- 学習サポート:CyberAgent社員によるサポートがあり、2週間に1度の面談と月1回のランチなどを通じて学習プランついて相談ができる
- 学習設備:施設内には社員が選定した技術書ライブラリが設置されており、自由に使用できる
私は2023年5月に [ML/DS]一期生として入会して約半年間、機械学習やデータサイエンスにについて学習してきました。
参加した理由
- 機械学習やデータサイエンスに関する技術や知見を深めたかった
- コミュニティを広げたかった
- 第一線で活躍している人たちの生の話を聞きたかった
3. 活動内容
半年間の取り組み
- 技術書ベースに 機械学習モデルの実装 & 論文survey
- SIGNATEのコンペティションに参加 ×3
- アプリケーション開発
- LT会での発表
3.1 技術書ベースに 機械学習モデルの実装 & 論文survey
PyTorchによる発展ディープラーニング
主に以下を実装
- 画像認識(CNN)
- 画像生成(DCGAN)
-
自然言語の感情分析(BERT)
データ前処理、モデルの作成・評価など一連の工程について学習しました。
実装と同時に元論文や解説記事を読んで理解を深めていきました。
推薦システム実践入門
内容ベースフィルタリングや協調フィルタリングなど、推薦アルゴリズムについて学習中です。
読み終わったら、推薦系のコンペに参加したり、推薦アプリを作りたいな~
3.2 SIGNATEのコンペティションに参加
SIGNATEのデータ分析コンペに3回程参加しました。
データの前処理 → EDA → 特徴良エンジニアリング → モデルの選択 → モデルの作成 → モデルの評価・改善を行いました。
特にEDAでデータに対して考察し、データの前処理を変更したり、新しい特徴量を作ったりする過程が個人的には好きです。まあ、自分の思い通りには精度は上がりませんが...
3.3 アプリケーション開発
現在CA Tech Loungeの会員メンバーと共同開発を行なっています。音声合成(TTS) と リップシンクを組み合わせて、CA Tech Lounge室長アバターのようなものを作っています。
モデルの選択に際して、関連する論文を調査し、各モデルの精度や学習速度・推論速度、必要な学習データ数について検証しました。
3.4 LT会への参加
LT(ライトニングトーク)会での発表は、自分の活動内容整理し、他のメンバーに発表することで良いアウトプットの機会になります。また、他のメンバーの発表を聞くことで、異なる分野の最新技術や研究、面白いプロダクトに触れることができ、とても刺激になります。これによって、自分の活動にフィードバックが得られたり、視野が広がり新しい発想が生まれたりするのでとてもいい経験になっています。
4. 参加してよかったこと
開発経験
機械学習やデータサイエンスの工程を学びました。実際に共同開発を行うことで理論だけでなくニーズや課題についてもディスカッションを行い、協力してプロジェクトを進めるスキルやチームワークを身につける良い機会でした。また、技術選定を行う際に、論文を積極的に読んだり最新技術に動向についても追うようになりました。
メンバーからの刺激
CATLのメンバーはみんな非常に積極的で凄まじい行動力を持っています。自分より技術力や能力が遥かに優れている人が沢山いて、自分と比較して落ち込んだこともあります。かなりメンタル鍛えられました...(笑)
今では、自分自身を高めるモチベーションに繋がっています!!
美味しいランチ
メンターさんや他の社員さんとのランチでは、仕事以外のリラックスした雰囲気での交流でき、現場の生の声を聞くことができて学生の自分にとっては非常に貴重な経験でした。
5. さいごに
CA Tech Loungeでの半年間は、私にとって非常に充実したものでした。成長と学びの場となり、将来のキャリアにおいても大きな影響を与えるものとなると思います。CATLのコミュニティとみなさんと共に、これからも成長していきたいと思っています。