私たちの業界では、デジタルトランスフォーメーションの3本柱である「人」「プロセス」「テクノロジー」の重要性について、何十年も議論されてきました。しかし、ほとんどの組織は、実際にはこの3本柱を逆の順番で実装しています。つまり、新しい技術の実装を優先するのです。たとえ、その技術がどのように使われるのか、組織にどのような影響を与えるのか、まだ確信が持てなくてもです。企業データベース、パーソナルコンピュータ、スプレッドシート、3層アーキテクチャ、ビジネスインテリジェンスレポート、インターネット、モバイルコンピューティング、ビッグデータ、データマイニング、クラウドコンピューティング、セルフサービスビジネスインテリジェンス、AutoML、AI、そして生成AIなどが挙げられます。
新しい技術が登場するまでの間、時間があればプロセスを更新しますが、技術的な側面ばかりに気をとられ、ビジネスの結果を十分に考慮できていないことが多いです。例えば、データガバナンスのポリシーを更新する場合、セキュリティや品質の向上、データへのアクセス権の拡大などの技術的な側面にばかり重点を置き、ビジネス上の目標を達成するために必要なデータ活用を十分に実現できていない場合もあります。また、データ分類を更新する場合、個人情報や金融情報などの新しいデータタイプに対応する一方で、既存のデータの分類が適切でない場合もあります。
次の技術が登場するまでにまだ少し時間があれば、人材を育成しますが、そのタイミングが遅いため、イノベーションのコストが上がってしまっているという問題があります。これは、新しい技術を導入する際に、従業員がその技術を十分に理解していないために、導入や運用に時間やコストがかかってしまうためです。
デジタルトランスフォーメーションの3本柱の技術の柱には、「技術負債」という概念があります。これは、短期的には簡単で迅速なソリューションを導入することで、将来的により良いソリューションにアップグレードするためのコストが増加してしまうことを指します。例えば、データベースに大量のストアドプロシージャを導入した場合、将来的に新しいデータベースに移行する際に、ストアドプロシージャをすべて移植する必要があるため、コストがかかる可能性があります。
長い間、人々に対して簡単な方法をとってきたことで、将来のスキルアップのコストを上昇させる「データカルチャー債」が蓄積されてきました。データ分類とガバナンスがその一例です。従業員が個人情報(PII)、PCI、および個人医療情報(PHI)の取り扱い方を理解していない場合、将来、セルフサービスの先進的な分析を採用するコストが高くなります。
組織はAIを最大限に活用するために、データカルチャーの負債を減らすべきである
現在一般的に使用されている3つのデータカルチャー開発プログラムは、データリテラシー、シチズンデータサイエンティストプログラム、データメッシュです。それぞれのプログラムの実施方法について、以下に主な詳細を紹介します。
データリテラシー・プログラム
データリテラシーは、通常、最初に行われるデータカルチャープログラムです。自然言語リテラシーと同様に、従業員にデータの読み書き、理解、説明を教えます。中規模から大規模の企業で、意思決定を改善するための機密データを大量に保有している企業に最適です。成功したプログラムの重要な要素には、プログラムのブランディング、ピアツーピアのメンタリング、ハッカソン、エグゼクティブ向けのイマージョンワークショップ、ビジネスバリューの創造と個人の成功を祝うための社内カンファレンスなどがあります。
データリテラシー研修プログラムのコストを左右する2つの要因は、コース教材の開発方法と、研修を受ける従業員の数です。コストを削減するために、YouTube、Coursera、Khan AcademyやDataikuのACADEMYなどの無料コンテンツを使用し、何千人もの従業員が利用できるようにする企業もあれば、すでにカスタマイズ可能な汎用教材を備えているコンサルタントを利用する企業もあります。また、データリテラシーを企業価値の5%に相当する戦略的優位性と捉え、自社独自の教材を開発するために時間と労力を費やす企業もあります。
2つ目のコストドライバーは、どれだけの人々を巻き込むかです。ほとんどの企業はこれを過小評価しています。なぜなら、データリテラシーはカルチャーの変革であり、カルチャーは測定が難しいからです。持続可能なコミュニティを開発することで、変化を定着させるために十分な人数が必要です。一般的なビジネス変革では、McKinseyの調査によると、参加率が7%未満の場合、ROIはマイナスになり、25%以上の場合が理想的です。ただし、これにより、従業員の4分の1がSQLやPythonプログラマーになるとは限りません。データリテラシーは、特定のツールやスキルではなく、より高度な概念に焦点を当てており、多くのノーコード環境が利用可能です。
シチズンデータサイエンティストのアップスキリング
データサイエンスのアップスキリングは、データリテラシーの次の段階であり、チームにグラフや表を超えたデータの操作と理解のためのスキルを提供します。今日の企業が持つデータの膨大な量、速度、多様性から、ますます必要とされています。10,000件の保証請求PDFファイルや、製造プロセスの50,000の変数をExcelやTableauで分析することを想像できますか?動作しません。新しい方法が必要であり、それがデータサイエンス、AI、機械学習(ML)が提供するものです。市民データサイエンスアップスキリングの成功の要素がデータリテラシーと同じであることは、驚くべきことではありません。ブランディング、メンタリング、ハッカソン、エグゼクティブ向けのイマージョンワークショップ、社内カンファレンスなどです。多くの組織では、キャップストーンプロジェクトも追加しています。
シチズンデータサイエンスのスキルアッププログラムは、すでにデータウェアハウスやデータレイクに大量のデータを持っている組織に適しています。半導体製造、石油ガス、製薬、会計など、多くの業界や業種でうまく機能していることがわかっています。12歳の子供がDataikuの教育プラットフォームで認定を取得した例もあります。
データサイエンス・プログラムの労力と期間は、組織の文化によって大きく異なります。私たちは、週2時間の6週間(合計12時間)から週6時間の1年間(約35労働日)まで、あらゆるものを見てきました。
データメッシュ社会技術アーキテクチャ
データ品質の悪さは、企業の収益を20%も奪う可能性があります。多くの企業は、データを過度にクリーニングしたり、AIイノベーションを阻害する厳しいガバナンスプロセスを課したりすることで、過剰に反応してしまいます。バランスをとるための証明された方法は、データ品質の所有権を組織の末端に、データを最もよく理解しているドメインエキスパートに押し出すことです。データメッシュがまさにこれを行うのです。データプロダクトの所有権をデータエキスパートからドメインエキスパートに移します。しかし、ほとんどの組織にとって、これは過小評価すべきでない難しい文化的変化です。トム・ダベンポートの言葉を借りれば、データとAIがビジネスを変えると思うなら、変化は避けられません。この見方をとらない組織は、AIで価値を生み出すことに失敗する可能性が高いでしょう。
データメッシュは、成熟したデータとAIのプラクティスを備えており、学際的なコラボレーションを重視する組織に最適です。3つのデータカルチャープログラムの中で最も新しく、ベストプラクティスはまだ確立されていません。これまでのところ、メンタリング、ハッカソン、エグゼクティブ向けのイマージョンワークショップ、社内カンファレンスなどが含まれているようです。しかし、私たちはデータメッシュを成功裏に実装した多くの組織と協働してきました。また、うまく機能している追加的なプラクティスには、いくつかの厳選されたデータプロダクトでメッシュをシードすること、小さく始めて反復すること、ドメイン間のメンタリング、セルフサービスデータフロー、セルフサービス分析、ポリシーアズコード、柔軟なデータオブザーバビリティとガバナンスなどがあります。
データカルチャーの負債を解消するための3つのポイント
AI技術は過去数年間で大きく変化しており、生成AIがまったく新しいクラスのビジネスモデルを提供しているため、現在スピーーディに変化しています。データとMLガバナンス(MLOps)を中心に、いくつかのプロセスはペースを保ってきました。しかし、人々、プロセス、テクノロジーの3本柱のうち、”人々”の部分は遅れをとっており、組織にデータカルチャー債を蓄積させています。これは、新しいAI技術から価値を得る能力を妨げています。これを防ぐために、私たちは成功した組織が3つのレベルのデータカルチャ開発プログラムを実施していることに着目しました。
1: 一般的な知識と民主化のためのデータリテラシー
2: スキルアップと責任あるAIのためのシチズンデータサイエンス
3: オーナーシップ、アカウンタビリティ、分散化のためのデータメッシュ
Dataikuは、お客様がこれらのプログラムを開発および実行するのを支援する豊富な経験を持っています。ぜひお問い合わせください。
採用とスキルアップをさらに進める
データ・AI人材の採用やスキルアップに苦労していませんか?アナリティクスやAIのプロセスに多くの人材を導入しているDataikuのお客様の実例 をご紹介します。
原文:Reduce Your Data Culture Debt With People Treble: Data Literacy, Citizen Data Science, and Data Mesh