7
4

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

分析するデータがない?なら創ればいい。GIFTechで「何もない」ところから現実を変えていく、データサイエンティストのリアル

7
Last updated at Posted at 2026-01-15

image.png

*こちらの記事は、英語から日本語へ翻訳をしています。

English Original Text

I am Anshika Kankane, who joined GIFTech as a Data Scientist. Today I would like to talk about my overall experience working here in GIFTech and how it is different.

When people hear the term “data scientist,” they usually imagine someone sitting in front of clean datasets, building models, and creating dashboards.

Working as a Data Scientist at GIFTech is… not that.

At GIFTech, most of the time, the data doesn’t exist. There is no ready-made dataset. No structured table waiting in a warehouse. No perfect CSV file to plug into a model.

So I build it. From scratch.
And honestly, that’s the best part.

Creating Data, Not Just Using It

GIFTech is built on the philosophy of N1 Engineering — designing deeply for one specific person instead of vaguely for “everyone.” That mindset changes everything, including how we think about data.

Instead of starting with, “What data do we have?”
We start with, “Who is the one person we are creating for, and what do we need to understand about them?”

Very often, the answer is: we don’t know yet. So my job is to find out.

Talking to the N1: Where Data Becomes Human

One of the most interesting parts of my work is something people don’t usually associate with data science: interviews.

At GIFTech, we often begin by directly talking to the N1 client — the one person we are building the product for. These are not rigid surveys or checkbox forms. They are real conversations.

We talk about their frustrations, their routines, what excites them, what confuses them, and sometimes what they can’t even clearly articulate but deeply feel.

I treat these conversations as raw data.
I listen carefully, take notes, look for patterns, extract themes, and pay close attention to emotional signals.

Sometimes, one honest sentence from an N1 interview is more valuable than a thousand rows in a dataset. This is where data stops being abstract and starts becoming human.

From Curiosity to Collection

After interviews, I usually move into exploration mode. This means searching everywhere — websites, social platforms, marketplaces, blogs, reviews, forums, and sometimes very obscure corners of the internet.

A lot of my time is spent simply understanding where people talk about this topic, how they express value, what language they use, and what kind of images or references they naturally gravitate toward.

Once I know where the signals are, I start scraping. Every platform behaves differently, so there’s no “one script fits all.” I write custom logic, extract what matters, and slowly build datasets that didn’t exist before.

It’s messy. It’s imperfect. But it’s real. And that’s what matters.

Turning Chaos into Structure

Raw data is always ugly. Always.

Text is inconsistent. Images are unlabelled. Prices are formatted differently. Meanings are hidden in slang, emotion, and context.

So a big part of my role is turning chaos into structure. I clean, normalize, deduplicate, and design schemas that actually make sense for the business.

Sometimes I even create new taxonomies from scratch because existing ones don’t fit what we’re trying to do. That’s when data science starts to feel a lot like product design — not just analysis, but shaping how information itself is understood.

When Scraping Isn’t Enough

In many of our projects, especially in heritage, craftsmanship, or niche cultural spaces, scraping alone is not enough. Sometimes the data online is too shallow, too fragmented, or simply not there.

That’s when we go directly to people.

We design and run real surveys with our target audiences. Not generic ones, but carefully crafted questions that explore perception, emotional response, demographic behavior, cultural resonance, and unmet needs.

I design the structure, analyze the results, and look for patterns that can guide both product direction and AI behavior. These surveys become a critical bridge between what we assume and what people actually feel.

When Even Reality Is Too Small

Even after interviews, scraping, and surveys, sometimes the domain is still too small. Too new. Too niche. Too unexplored.

That’s where synthetic data generation comes in.

Using AI, we create context-aware hypothetical data based on domain knowledge, patterns we’ve observed, and constraints defined by experts. But this is not random generation. We validate it with humans. We review it with stakeholders. We check if it feels real.

It’s less about faking data and more about simulating possibilities.
This allows us to test ideas without risking real resources.

Where All This Data Goes

All of this — interviews, scraped content, survey results, synthetic samples — eventually feeds into our systems.

It becomes part of RAG pipelines, agent workflows, concept generation, design support, and market analysis models.

My role is to make sure the AI is not operating in a vacuum. That it is grounded. That it reflects real people, real culture, and real intent.

Because without good data, AI is just guessing.

How Data Shapes What We Build

At GIFTech, data is not something we look at after decisions are made.
It is part of making the decision. It influences which ideas we pursue, which concepts we kill early, which narratives we strengthen, and where we invest time and energy.

Sometimes data confirms intuition. Sometimes it completely challenges it.

Both are equally valuable.

What This Role Actually Feels Like

Being a Data Scientist at GIFTech does not feel like sitting in a backend role. It feels like being inside the creative process.

I’m not just analyzing what exists.
I’m helping define what should exist.

I move between people, culture, technology, and business strategy — sometimes all in the same day.

It’s chaotic. It’s intense. It’s deeply creative. And I like that.

Why I Enjoy Working This Way

I joined GIFTech because it treats technology as a way to amplify human intention, not replace it. Here, data is not cold. It’s emotional. It carries stories, frustrations, hopes, and ambitions.

Being able to turn those into structure, direction, and real products is incredibly meaningful to me.

This is not just data science. This is creation.

If you resonated with my story by far, be sure to check out our youtube videos below about our latest N1 engineering challenge using AI.

Part 1 : クラファンで1円も集まらなかった!? 伝統工芸を救う職人×最新AIエージェント | 前編【GIFTech】

Part 2: クラファンで1円も集まらなかった!? 伝統工芸を救う職人×最新AIエージェント | 後編【GIFTech】

Closing

Being a Data Scientist at GIFTech means talking to people, building data from nothing, shaping intelligence into systems, and watching ideas become reality.

It’s not clean. It’s not predictable. But it is very, very real.

And I wouldn’t trade it for a perfect dataset.

こんにちは、GIFTechでデータサイエンティストとして働いているAnshika Kankaneです。今回は、私がGIFTechに入社してからの経験や、ここでの働き方がどれほどユニークかについてお話ししたいと思います。

「データサイエンティスト」と聞くと、多くの人は整ったデータセットを前に、モデルを作ったり、ダッシュボードを作ったりしている姿を想像すると思います。

でも、GIFTechでのデータサイエンティストの仕事は……正直に言うと、全然そんな感じじゃありません。

GIFTechでは、ほとんどの場合、データが存在しません。 すぐに使えるデータセットもなければ、データウェアハウスに整ったテーブルが用意されているわけでもない。モデルにそのまま突っ込める完璧なCSVファイルなんて、まずありません。

だから私は、自分で作ります。ゼロから。
そして正直、それが一番面白いところです。

データを「使う」のではなく、「つくる」仕事

GIFTechは N1エンジニアリング という思想を大切にしています。「みんなのため」ではなく、「たった一人のため」に深く設計するという考え方です。この考え方は、データの扱い方も根本から変えます。

「どんなデータがあるか?」から始めるのではなく、「私たちは誰のために作っているのか?その人の何を理解する必要があるのか?」 から始まります。

そして多くの場合、その答えは「まだ分からない」。
だからこそ、それを探しにいくのが私の仕事です。

N1と話すということ:データが“人”になる瞬間

私の仕事の中で一番面白い部分の一つは、一般的なデータサイエンスのイメージとは少し違うかもしれません。それは インタビュー です。

GIFTechでは、プロダクトを作る前に、まずN1クライアント —— つまり「その一人」に直接話を聞くことから始まることがよくあります。

チェックボックス形式のアンケートではありません。台本通りの質問でもありません。本当の会話 です。

日常のルーティン、フラストレーション、ワクワクすること、混乱すること。時には、本人も言語化できていないけれど、確かに感じている感情についても話します。

私はこれをすべて「生データ」として扱います。丁寧に聞き、メモを取り、パターンを探し、テーマを抽出し、感情の揺れにも注意を払います。N1の一言が、何千行のデータより価値があることもあります。

ここで、データは抽象的なものから「人間的なもの」になります。

好奇心から収集へ

インタビューの次は、探索モードに入ります。Webサイト、SNS、マーケットプレイス、ブログ、レビュー、フォーラム、 時には本当にマニアックなインターネットの奥地まで探します。

  • 人はどこでこのテーマについて語っているのか。
  • どんな言葉を使って価値を表現しているのか。
  • どんなイメージや比喩に反応しているのか。

それを理解してから、スクレイピングを始めます。プラットフォームごとに構造が違うので、「万能なスクリプト」は存在しません。 毎回ロジックを書き、必要なものを抽出し、少しずつデータセットを育てていきます。

汚いし、完璧じゃない。でもリアルです。そして、それが一番大事です。

カオスを構造に変える

生データは、基本的にいつも汚いです。本当に。

  • テキストはバラバラ。
  • 画像にはラベルがない。
  • 価格の書き方も統一されていない。
  • 意味はスラングや感情、文脈の中に隠れています。

だから私の仕事の大きな部分は、カオスを構造に変えること です。

クレンジングして、正規化して、重複を消して、ビジネスに本当に意味のあるスキーマを設計します。時には、既存の分類が合わなすぎて、新しいタクソノミーをゼロから作ることもあります。

この瞬間、データサイエンスは「分析」というより、プロダクトデザイン に近くなります。情報の「理解のされ方」そのものを設計している感覚です。

スクレイピングだけでは足りないとき

特に、伝統文化、工芸、ニッチな文化領域のプロジェクトでは、オンラインのデータだけでは全く足りないことが多いです。

浅すぎたり、断片的だったり、そもそも存在しなかったり。

そんなときは、人に直接聞きに行きます。

ターゲット層に向けたリアルなアンケートを設計して実施します。
表面的な質問ではなく、認知、感情、文化的共鳴、満たされていないニーズまで踏み込みます。

設計も、分析も、解釈もすべて自分で行います。この調査データは、「私たちが思っていること」と「人が実際に感じていること」をつなぐ、非常に大事な橋になります。

それでも現実が小さすぎるとき

インタビューも、スクレイピングも、アンケートもやった。それでもまだ、世界が小さすぎる。新しすぎる。ニッチすぎる。

そんなときに使うのが 合成データ(Synthetic Data) です。

AIを使って、文脈を理解した仮想データを生成します。でも、これは適当に作るわけではありません。 人がチェックし、ステークホルダーとレビューし、「リアルに感じるか」を必ず確認します。

これは「偽る」ためのデータではなく、可能性をシミュレーションするためのデータ です。
リスクを取らずに、アイデアを試すための手段です。

これらのデータはどこに行くのか

インタビュー、スクレイピング、アンケート、合成データ。
これらはすべて、私たちのシステムに組み込まれていきます。RAGパイプライン、エージェントフロー、コンセプト生成、デザイン支援、マーケット分析モデルなど。

私の役割は、AIが空中で思考しないようにすること。ちゃんと現実に根ざして、人を映して、文化を映して、意図を映すようにすること。

良いデータがなければ、AIはただの推測になります。

データが意思決定をどう変えるか

GIFTechでは、データは「決まったあとに見るもの」ではありません。
決めるために使うもの です。

  • どのアイデアを進めるか。
  • どれを早めに捨てるか。
  • どの物語を強めるか。
  • どこに時間とエネルギーを使うか。

すべてに影響します。

直感を裏付けることもあれば、真っ向から否定することもあります。
どちらも同じくらい価値があります。

この仕事の“感覚”

GIFTechでのデータサイエンティストは、裏方という感じがしません。むしろ、創る側の中にいる感覚 です。

私はただ「あるもの」を分析しているわけではありません、「あるべきもの」を一緒に定義しています。

人、文化、テクノロジー、ビジネス戦略を行き来しながら、時には全部を同じ日に考えています。

カオスで、濃くて、クリエイティブ。私はこの感じが好きです。

なぜこの働き方が好きなのか

GIFTechに入った理由は、ここがテクノロジーを「人の意図を増幅するもの」として扱っているからです。置き換えるのではなく、広げる。

ここでのデータは冷たくありません。

  • 物語があり、
  • フラストレーションがあり、
  • 希望があり、
  • 野心があります。

それを構造に変え、方向に変え、プロダクトに変えることができるのは、本当に意味のある仕事だと思っています。

これはただのデータサイエンスではありません。 創造です。

もし私の話に共感していただけたなら、ぜひ下記YouTube動画でAIを活用した最新のN1エンジニアリングチャレンジをご覧ください。

Part 1: クラファンで1円も集まらなかった!? 伝統工芸を救う職人×最新AIエージェント | 前編【GIFTech】

Part 2: クラファンで1円も集まらなかった!? 伝統工芸を救う職人×最新AIエージェント | 後編【GIFTech】

最後に

GIFTechのデータサイエンティストであるということは、
人と話し、何もないところからデータを作り、知性を形にし、アイデアが現実になる瞬間を見ることです。

きれいじゃない。予測できない。でも、とてもリアル。

私は、完璧なデータセットと引き換えにはしません。

7
4
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
7
4

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?