Tobii Pro Lab の AOI hit データを効率的に集計する方法について(0/1 の大量行データ処理)
Q&A
Tobii Pro Lab を使用して視線データを取得しています。
現在、AOI hit データ(0/1)を基準とした分析処理で課題に直面しており、
より効率的な方法をご存知の方がいればご教授いただきたいです。
🧪 データ構造と課題
Tobii Pro Lab からエクスポートした AOI データは、サンプル単位の 0/1 データになっており、
各行は 1ms または 60Hz のサンプルで記録されています。
【データ量】
1 名あたり 6000〜12000 行
刺激(ページ)が 6 セット
AOI 列が複数(exp/miss/right、pic/text)
全被験者:10 名以上
Excel や手作業では非現実的な量になっています。
🎯 やりたいこと
被験者ごとに:
▶ 1. 各 AOI 列(0/1)を合計し「命中回数(hit count)」を求める
▶ 2. AOI 名から page / exp / miss1〜5 / right / pic / text を抽出
▶ 3. 画像 AOI(pic)とテキスト AOI(text)に分類
▶ 4. ページ順(tea01 → tea03 → tea04 → …)に整形
▶ 5. 6ページ × 画像/テキスト の計 12表を出力
最終的には、各被験者分の pic/text の集計表を自動生成したいです。
🛠 今週試した方法
Excel(SUM, FILTER 等 → 行数が多すぎて固まる)
Python(pandas で melt/groupby → 実装は可能だが AOI 命名の揺れが多い)
R(tidyverse / eyetrackingR)
KNIME(ノーコードツール、向いていそう)
Tobii Pro Lab の Summary Export(必要な粒度にならない)
現状、最も安定した処理方法を探しています。
❓ 質問したいこと
同じように Tobii Pro Lab の AOI hit(0/1)データを扱っている方へ:
✔ 大量のサンプル単位 0/1 データを
自動で集計・分類した経験はありますか?
✔ 特に「AOI 名の解析」や「複数被験者のバッチ処理」は
どう実装されましたか?
✔ 推奨するツール(Python / R / KNIME / その他)があれば教えてください
✔ 既存のワークフローや参考コードがあれば、ぜひ共有いただけると助かります
🙇♂️ 最後に
同様のデータ処理を行っている研究者・技術者の方がいれば、
アドバイスをいただけますと大変ありがたいです。
よろしくお願いいたします。