オッズ比とリスク比
オッズ比はリスク比の代わりとして良く用いられますが,誇大表現される危険性があります.
オッズ比は,後ろ向き研究でリスク比の代わりとして活用できるメリットがあります.しかし,アウトカムのイベント発生率が10%未満であれば,という制約が付きます.従って,10%を超える例では,リスク比とオッズ比の乖離が起こり,そのままの値を鵜呑みにすることはできなくなります.実際にはそれを承知の上でオッズ比を解釈しているのですが,なかなか実感できない値であるため,考察も難しくなるデメリットがあります.
分割表を示したうえでオッズ比を提示すれば,リスク要因がアウトカムに及ぼす影響の理解を深めることができます.しかし,多重ロジスティック回帰分析に代表される多変量解析では複雑な現象を扱うために,分割表の提示というのも難しいですし,解釈も容易ではありません.医学の研究では,多重ロジスティック回帰分析が多用されるため,オッズ比の提示はけっこう多いのですが,はたしてこれは適切か?という疑問が沸きます.
修正ポアソン(Poisson)回帰分析
通常のポアソン回帰は,従属変数がカウントデータの場合に適用され,平均=分散という強い制約が付きます.
ところが,修正ポアソン回帰分析という方法があるのだそうです.知人から伺って知りました.新しいものには飛びつく性格ですが,これはちょっと調べてからでないと手を出せないということで,いろいろと調査してみました.
修正ポアソン回帰分析の実行
まず修正ポアソン回帰分析を行うためには,いろんな統計ソフトがありますが,ここではRを使用します.Rではrqlmパッケージが提供されています.
このパッケージを使うと,非常に簡単に解析できます.コマンド入力が面倒な場合は,改変Rコマンダー(4.5.0以降)で解析できます.
修正ポアソン回帰分析について
このページには,
ロジスティック回帰モデルから推定されるオッズ比は、集団におけるアウトカムのイベントの頻度が低いときに(概ね10%未満)、リスク比の近似になる以外、曝露・治療効果の指標としての解釈ができないことが知られています (Greenland, 1987; Nurminen, 1995)。
と書かれています.
おなじ人の他のページでは,
コホート研究とケースコントロール研究が、疫学研究の2つの主要な研究デザインであった.ケースコントロール研究では、原則として、リスク差・リスク⽐を直接的に推定することはできない.
しかし、オッズ⽐のみは推定することができる(ロジスティック回帰も使える︔もちろん、稀な疾病のときのみ)
どちらのデザインでも、共通の指標として使える、オッズ⽐が、学問体系の発展途上では「簡単であるため」好まれてきたという経緯もあるようである
つまり,後ろ向き研究では,リスク比の代わりに,仕方なくオッズ比を使ってきたわけです.昔から,稀な発生率の場合以外はリスク比とオッズ比が近似しないこともわかっていました.
探せば探すほど,出てきます.
参照ページ①,参照ページ②
修正ポアソン回帰はロジスティックモデルと異なり,リンク関数がリスクそのものを算出するようになっています.もはやリスク比を算出するには,この方法が最適になります.
一般化線形モデルを用いて解析比較
いわずと知れたKaggleのTitanicをRに読み込み,従属を生死(生を0,死を1),独立をチケットクラス,性別,年齢,兄弟配偶者同乗者数,親子同乗者数,運賃に設定していくつかの手法で解析,比較してみます.統計計算には,R4.5.0を使用しています.
多重ロジスティック回帰分析
AICによるステップワイズ法の多重ロジスティック回帰分析で解析します.
変数 | Estimate | z value | Pr | odds-ratio | 2.5%CI | 97.5%CI |
---|---|---|---|---|---|---|
(Intercept) | -5.601 | -10.306 | 0.000 | 0.004 | 0.001 | 0.010 |
性別[T.male] | 2.623 | 12.229 | 0.000 | 13.784 | 9.139 | 21.216 |
チケットクラス | 1.317 | 9.350 | 0.000 | 3.734 | 2.851 | 4.958 |
年齢 | 0.044 | 0.008 | 0.000 | 1.045 | 1.029 | 1.063 |
兄弟配偶者同乗 | 0.376 | 3.106 | 0.002 | 1.457 | 1.157 | 1.862 |
この例ですと,性別のオッズ比は女性に比べて男性が13.784となっています.チケットクラス(3段階)は,3.734です.結構これらの影響は大きいと考えます.
修正ポアソン回帰分析
修正ポアソン回帰分析で,おなじデータを解析しました.CL,CUは95%信頼区間の下限上限です.
変数 | exp(coef)=リスク比 | SE | CL | CU | P-value |
---|---|---|---|---|---|
(Intercept) | 0.0714 | 0.1605 | 0.0522 | 0.0979 | 0 |
性別[T.male] | 2.9053 | 0.1057 | 2.3615 | 3.5744 | 0 |
チケットクラス | 1.4682 | 0.0437 | 1.3477 | 1.5994 | 0 |
年齢 | 1.0118 | 0.0021 | 1.0077 | 1.016 | 0 |
兄弟配偶者同乗 | 1.1029 | 0.0237 | 1.0529 | 1.1552 | 0 |
性別のリスク比は女性に比べて男性が2.9053と小さくなっています.チケットクラスも,1.4682です.結構違う値になりました.
Firthの罰則付きロジスティック回帰分析
少しばかげていると思いますが,Firthの罰則付きでも解析してみます.凖または完全分離の問題は無いはずなので.
変数 | オッズ比 | 95%CI下側 | 95%CI上側 |
---|---|---|---|
(Intercept) | 0.004 | 0.001 | 0.011 |
性別[T.male] | 13.419 | 8.923 | 20.59 |
チケットクラス | 3.682 | 2.817 | 4.88 |
年齢 | 1.045 | 1.029 | 1.062 |
兄弟配偶者同乗 | 1.444 | 1.149 | 1.841 |
多重ロジスティック回帰の時とあまり変わりません.当たり前と言えば当たり前ですが.
スパース(lasso)多重ロジスティック回帰分析
ここまできたら,ラッソ回帰でもどうなるか試してみます.これもばかげた実験です.
偏回帰係数 | オッズ比 | 標準偏回帰係数 | 標準化オッズ比 | |
---|---|---|---|---|
(Intercept) | -7.021 | 0.001 | 0.498 | 1.645 |
性別 | 2.394 | 10.961 | 1.154 | 3.171 |
チケットクラス | 1.123 | 3.075 | 0.942 | 2.564 |
年齢 | 0.033 | 1.033 | 0.476 | 1.61 |
兄弟配偶者同乗 | 0.235 | 1.264 | 0.218 | 1.244 |
多重ロジスティック回帰,Firthの罰則付きよりも,やや小さくなりましたが,やはりあまり変わりません.結局,オッズ比はオッズ比でした.
まとめ
いったんまとめておきます.
-
リスク比を求める解析では,修正ポアソン回帰分析が適している.
- ただし,リスク比を求めるためなので,やはり後ろ向き研究のデザインでは避けた方が良い.
- 問題の引き金となったと思われる文献でも,前向き研究への適用に触れている.
-
イベント発生率が大きいデータに多重ロジスティック回帰分析を適用するとき,出力されたオッズ比は誇張されている可能性が高い.
- そのような時には,オッズ比が○○(倍)で非常に大きく影響した,などの考察はせず,分割表をみて適切な解釈を述べるべきである.
- 対策法の一つとして,標準化されたオッズ比が参考になるかも.
-
修正ポアソン回帰分析は理論的には不明なところもある.
- モデルの評価はAIC等でできる(はず)だが,少なくともRでは変数選択法は適用できない.それはともかくとしても,適用の条件が不明である.多重ロジスティック回帰分析の代わりに修正ポアソン回帰分析を,というノリで行けるかどうかわからない.
ということで,前向き研究のデータでリスク比が必要であれば,修正ポアソン回帰分析を適用しても良いと思います.ただし,そのデータが修正ポアソン回帰分析に適したものかどうかは,正確に把握する手段がない(見つけられないだけかも)現状です.
追って調査を進め,なにかわかれば記事を改変します.