初めに
本記事は、書籍「生命科学の実験デザイン[第4版]」の内容について、自分の理解を整理するために書いています。見出し以外の内容については、書籍の内容を書き写すのではなく、基本的には自分の言葉で書くことを心がけています。
書籍について
書籍名:生命科学の実験デザイン[第4版] Amazon
著者 :G.D.ラクストン、N.コルグレイヴ
訳 :麻生一枝、南條郁子
出版社:名古屋大学出版会
発売日:2019/06/10
「生命科学の実験デザイン」は、より少ない時間・予算及び、シンプルな統計解析手法を用いて、解きたい課題に対する明確な答えを得られるような実験デザインが出来ることを目的として書かれています。そのため、統計学で出てくる統計的仮説検定には触れず、その前段であるデータ収集の際に、どのような手続きを通してデータを集めれば良いかに焦点を当てています。
また、本書は、存在する実験デザイン全てを網羅しているわけではなく、単純な実験デザインの例を通して根本的な考え方について記載しています。
本書の要点(個人的に大事だと感じた内容)
実験デザインの重要性
実験は、ある立証したい仮説を検証するために行われる。その際、最も大きな問題となるのが「交絡1」である。実験デザインを適切に行うことによって「交絡」が発生することを防ぎ、解析を容易にすることが可能となる。交絡の原因となる因子を交絡因子と呼ぶ。
シンプソン2のパラドックス
実験デザインをするときだけでなく、データを解釈するときにも交絡因子に注意が必要であり、データをひとまとめにして解釈することへの批判を示すもの。
例:男女の合格率がそれぞれ、男性50%、女性40%だとする。この数字だと男性の方が合格率が高く、女性の方が低いため差があることは明確である。しかし、これを学部・学科別に見ると、合格率が同じになることがある。これは、男女で志望する学部・学科が異なり、女性の方がより難しい学部・学科への志望者が多い等の場合に発生する。難しい試験を受けた結果、志望した女性の多くが不合格となり、女性全体で見た時の合格率が下がるからである。
このように、データをひとまとめにすることで、学部・学科という交絡因子によって結果が歪められてしまう。
悪魔の代弁者
実験から導き出された結論は可能な限り力強いものでなければならない。悪魔の代弁者(弱点・矛盾等をついて批判する人)を納得させるためには、良い実験デザインを行い、筋が通った、他の手段で説明の余地がない結論を導く必要がある。
実験デザインの大枠
大きく分けて「操作的実験(Manipulative study)」と「相関的実験(Correlational study3」の2種類がある。操作的実験は、研究対象に何らかの操作を行い、その操作が及ぼす影響を調べる方法を指す。相関的実験は、自然にあるばらつきを利用し、ある因子が別の因子に及ぼす影響を調べる方法を指す。
ここで大きく問題となるのが「相関と因果」である。私たちが普段検証する仮説は、因子Aが因子Bに影響を与えるかどうか、といった因果関係を検証する目的であることが多い。しかし、自然な環境で行われる相関的実験では、因果の向きがA→Bなのか、B→Aなのかが明確にならず、あくまでA→Bという向きであることを示すデータが提供できるだけである。一方で、操作的実験であれば、この問題を回避することが可能である。
ただし、操作すること自体が倫理的に不可能なケースも多い(人間や動物に対する実験等)。そのため、相関的実験も多く実施されている。
実験デザインの基本原理
ばらつきには、関心を持っている因子のばらつきと、それ以外の因子のばらつき(ノイズ)の2種類がある。実験デザインでは、前者のばらつきが良く見えるようにし、後者のばらつきを取り除こうとしている(制御しようとしている)。
例:ある治療薬の効果を確かめるために、治療薬を処方した処置群と、ブラセボを処方した対象群を用意し検証を行った結果、治療薬の効果が統計的に確かめられたとする。しかし、処置群には男性が多く、対象群には女性が多いことが分かったため、今回の結果が治療薬によるものだったのか、男性が単に治癒しやすかっただけなのかの判断が出来なくなってしまった。
このように、注目している因子におけるばらつき(今回だと治療薬を処方したか、していないか)を見るためには、他の因子におけるばらつき(今回だと男女)を取り除いておく必要がある。また、上記の例だと、性別が交絡因子になっている可能性があることになる。
ランダム化
被検体(上の例だと被験者)は通常、それぞれ異なる特性(性別、身長、血液型等)を持っており、片方の群においてその特性が偏ってしまうと交絡が発生する可能性がある。そのため、被検体を各群に割り振る際にランダムな割り振りを行い、どちらかの群への特性の偏りを避けることが有効な手段となる。これにより、それぞれの群で特性の数や平均値を計算すると同程度になっていることが期待できる。さらに、***計測できていない特性についても同様に、同程度になっていることが期待できる。***これらの群の片方に対して処置(操作)を行うことで、処置をしたか、していないか、だけが際立つように出来る。このような試験をランダム化比較試験(RCT:Randomized controlled trial)と呼ぶ。ただし、ランダムに割り振りを行うため、ばらつき(分散)が大きくなる傾向があり、サンプルサイズが小さいと検出が困難になってしまうというデメリットがある。
被検体以外の側面においてもランダム化が重要である。被検体を配置する場所、計測する順番等もランダムにする必要がある。
例:治療薬を処方された人たちはある病院の一室に、ブラセボを処方された人は別の一室に誘導されたとする。その部屋で経過を観測されることとなるが、片方の部屋を担当する人はスキルが高く、より正確な数値を計測可能かもしれない。その結果、偶然治療の効果があると出てしまったのかもしれない。あるいは、片方の部屋にいる人を先に計測してから、別の部屋にいる人を計測する順番になっていたとすると、その時間の差によって治療薬の効果が変わってきてしまうかもしれない。
このように、被検体以外の要素もランダム化しておかなければ、悪魔の代弁者に隙を与えてしまうこととなる。さらに、上の例の場合だと、計測を担当する人には、誰が治療薬を処方され、誰がブラセボを処方されたのかについて、何の情報も与えないことが必須である。でなければ、ブラセボを処方された人を善意で優先的に計測してしまうかもしれない。
感想
本書籍で扱った実験デザインは、データを取得する前段階でしっかりとデザインしておくことの重要性を述べていました。しかし、経験上、データサイエンティストとして仕事をする中では、「データありき」でプロジェクトが進行することが多いと思います。そのため、私たちとしては、データが取得された背景に思いを巡らせ、そこに交絡因子が入る余地があったのかどうか、あったならどういった交絡が想定されるかを常に考えることが重要だと感じました。その上で、適切な層別解析等を行い、結果を解釈していかなければ、簡単に悪魔の代弁者に隙をつかれてしまいそうです。
最後に
今回、本書のほんの一部の内容について記載しました。実験デザインの中でも色々な種類のデザインが紹介されており、どのような手順でデザインを選んでいくかについても図が示されています。興味のある方は是非手に取って読んでみてください。
最後に、一般的な統計の知識なので記載を省略したキーワードをいくつか列挙したいと思います。もし時間があればご自身で調べてみてください。より知識が深まると思います。
- 検出力
- 効果量
- 主効果
- 相互作用
- 単純ランダムサンプリング
- 層化サンプリング
- 集塊サンプリング
- 便宜的サンプリング
-
参考 交絡:因果の判断を惑わすもの ↩
-
イギリスの統計学者エドワード・H・シンプソンの名前から命名 ↩
-
測定的実験、観察的実験とも呼ばれる ↩