Python
pandas

全米世帯動向調査とそのドラマ、pythonを添えて

はじめに

この投稿は以下リンク先を参考にしています。
Think Stats: Exploratory Data Analysis in Python

結局なんなのか、前置きいらんので結論だけ知りたいという方は最後の解釈だけ呼んでもられればいいです。

概要

上記リンク先で得た大量のデータから垣間見ることができる一つのドラマについて共有します。
データは アメリカ疾病予防管理センターの妊娠出産に関する者で、横断調査によって得られたものです。つまりその内容自体はスナップショットです。

コード

早速、中身を見てみましょう。基本的に上記リンク先通りに進めれば問題ないので該当のコードだけをあえて選びます。

test.py
# 任意の調査対象者のidを定義
>> caseid = 10229
# データ内のインデックスに含まれるリストを要素にもつcaseidをキーとした辞書を作成
>> preg_map = nsfg.MakePregMap(df)
# 上記のcaseidからリストを呼び出し
>> indices = preg_map[caseid]
# リストに該当する結果、ここで出力されるそれぞれの数字は以下の対応表に準ずる。
"""
1 LIVE BIRTH (出生)
2 INDUCED ABORTION (人工流産)
3 STILBIRTH (死産)
4 MISCARRIAGE (流産)
5 ECTOPIC PREGNANCY (子宮外妊娠)
6 CURRENT PREGNANCY (妊娠中)
"""
>> df.outcome[indices].values
[4 4 4 4 4 4 1]

解釈

原文から上記結果の解釈について簡単にまとめます。

"The outcome code 1 indicates a live birth. Code 4 indicates a miscarriage; that is, a pregnancy that ended spontaneously, usually with no known medical cause."

番号1は出生、4は流産を表しています。

Statistically this respondent is not unusual. Miscarriages are common and there are other respondents who reported as many or more.

統計的には、この回答者は珍しいことではありません。 流産は一般的であり、より多くの報告をした他の回答者がいます。

But remembering the context, this data tells the story of a woman who was pregnant six times, each time ending in miscarriage. Her seventh and most recent pregnancy ended in a live birth. If we consider this data with empathy, it is natural to be moved by the story it tells.

しかし、このデータは、6 回も妊娠し、そのたびに流産になった女性のことを伝えています。彼女の7回目の妊娠は無事に出生という形で終わりました。このデータを感情移入して考察すれば、そのストーリーに感動するのは自然なことでしょう。