1
4

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 5 years have passed since last update.

はじめに

エンジニア?アナリスト?サイエンティスト?歴5ヶ月めの新卒社員が最近学んだことをちょっとずつまとめてみたもの。12回目の今日は、前回推測統計についてまとめたときにあまり詳しく触れられてなかった非標本誤差について復習してみました

これまでに書いた記事の最新3回分はこちら↓
第9弾
第10弾
第11弾

ちょっとばかし、体調を崩してしまいました。遅い時間での更新でごめんなさい

標本誤差と非標本誤差

  • 調査したい母集団のデータ数が多く、全体調査をすることができない場合、標本調査を実施
    →母集団の一部のデータを抽出、その集団を「標本」として分析をする(標本抽出理論参照)
  • 標本の誤差には、標本誤差と非標本誤差の2種類が存在
    • 標本誤差・・・標本抽出にともなうデータの誤差
    • 非標本誤差・・・標本誤差以外の誤差
      →非標本誤差って具体的になんやねん・・・。具体的な例を列挙してみることに。

非標本誤差の種類

妥当ではない母集団

  • 母集団が手間や費用を理由に、本来調べるべき母集団から標本を取っていないことを原因に発生するデータの誤差
    • 同じ環境での刺激提示の内容の違いによる差を検証したいのに、違う環境の集団を対照群として母集団にしてしまった(A群は芸術選択で音楽を専攻しているが、対照群は美術を専攻していたなど)
    • そもそも母集団が対象とすべきものと違った(エンジニア対象の調査を、周りにエンジニア職である対象となる集団がいなかったので営業職にしてしまうなど)
  • 対策
    • 調査対象とする母集団が調査目的に即しているかを確認する

回答者の疲労

  • データ収集の方法が質問紙やアンケートなどを中心に、対象となる回答者が途中で疲労感を感じることによって発生する誤差。心理学の場合、特に顕著に出やすい(身体的指標の測定においても影響が現れる可能性が大きいため)
    • 回答する質問数が多い
    • 質問内容の心理的負担が大きい
  • 対策
    • 事前に使用する指標の疲労度を作成者や予備調査としてほかの人を対象にして測定する
    • 質問紙の回答を複数回に分割する(環境等の統制は別途必要)
      など

社会的望ましさ

  • 結果に対して、対象が社会的に望ましいと考えられる結果を気にするあまり、正直に答えないことによって発生する誤差
  • 倫理観、価値観についての調査をする際に発生しやすい誤差
  • 対策
    • 結果について、個人単位での開示をするかどうかなどの事前の説明(インフォームド・コンセント)を施す
    • その質問が調査に必要がない場合はその質問をはずしてしまう
      など

質問文の不備

  • 設定した質問に対し、対象者が意味を取り違えてしまうことによって発生する誤差
  • 対策
    • 先行研究がある場合、大きな影響が発生しないのであれば文章を変更しない
    • 意味が正しく/わかりやすく伝わるか事前に検証する
    • 質問内容そのものが調査に即したものであるかの検討
      など

データ取得時に発生する不備

  • データの入力時のミス、回答者の不在や回答拒否、回答し忘れた箇所(欠損という)があるなどによって発生する誤差
    • データ入力が1行ずれていた、転記ミス
    • 質問内容がセンシティブなものだったため、回答者が回答拒否の意思を示した
    • 欠損
  • 対策
    • データ入力完了時に間違いがないか、ダブルチェックを行う
    • 欠損データは必要がなければ分析時に標本から取り除く
    • 回答終了時に欠損がないか確認を行う(ただし、事前説明が必要)
      など

データ取得時に影響を与えてしまう

    • 調査主体バイアス・・・調査主体(調査を企画・実施している組織)に対して対象が好意、あるいは敵意を持って回答していることにより、データに影響を与えてしまう場合
    • 調査員バイアス・・・担当の調査員が、対象にとって異性や顔なじみなどにより正直に答えづらい質問内容に対して信頼できる結果が得られにくいことによってデータに影響を与えてしまう場合
    • メイキングによる調査不正・・・じゅうぶんな数のデータが得られず、調査員が自分でデータを作成し、混ぜてしまうことでデータに影響を与えてしまう場合
  • 対策
    • 事前に調査主体を明らかにする(マナーや対象の不安の解消も含む、調査主体バイアス)
    • 調査対象からデータを得る際に事前に担当の分担を明確にしておく(複数人で実施する場合/調査員バイアス)
    • メイキング防止(メイキング)
      など

非標本誤差 まとめ

  • 非標本誤差が発生するには理由がちゃんと存在する
  • 非標本誤差は未然に防ぐことができるため、できる範囲で対処を事前に施しておく(ただし、それがかえって非標本誤差を生み出してしまう可能性も意識しておく必要あり)
  • 調査結果が予測と違った場合、非標本誤差ができてしまうようなデータの取り方だったかを検証する必要がある(ただし、予測が誤りであった可能性を常に念頭に残しておく)
  • 調査後も継続的に同じ内容の調査をする場合は、前回調査時の検証、考察をもとに適切なデータの取り方を再考する

感想

非標本誤差について今回は改めてまとめてみましたが、やっていくと卒論のときにこんなこと気をつけていたなぁとか、お世話になった先輩方や協力してくれたたくさんの同期や後輩は元気にしているかなぁとか。なかなか普段思い出さないことを思い出しました。
それと一緒に、今が改めて充実しているなぁ、とも感じるっていう。笑
人との出会いって本当に大切!(←雑)

今度、改めて旧友ともお酌をゆっくり酌み交わそうと思います
ではまたー^^

1
4
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
4

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?