データに関する記事を書こう!
テーマ2『データに関する記事を書こう!』参加記事です。
データ件数10,30,100。三段統計活用法
の具体例のうち、10の例。
@e99h2121 記事の最初の10個。
本人しかViewsは取れないかもしれず、ひとまずいいね(LGTM), 記録(stock)と、そこで参照している記事の数、それぞれの記事のいいね(LGTM), 記録(stock)と自己参照かどうか(1自己参照、空白 他己参照)
統計的な数値を出してもいいし、
統計的な数値を出さずに分析してもいい。
人気記事を分析しているのが10記事中4記事。参照がないのが5、自己参照だけが1となっている。
人気記事を追っかけている傾向がここではあると仮定しよう。
自己参照記事のうち、後から追記したものがある。
過去記事を書き直しているところは好ましい感じがする。
そこで、編集履歴数を追加した。
データ量が少ないときは、統計項目を増やすのが一番。
少ない統計項目の間の相関を取るのが一番危険。
統計の嘘
A -> B の順に発生したとしても、
C-> A, D-> Bなのかもしれない。
CとDを観測していないと A -> Bが成り立つことは、100%この順番で起きても原因と結果とは言えない。
C-> A; C->D->Bなのかもしれない。
本人が嘘をつくつもりがあったかどうかは、言明が嘘かどうかとは関係ないかも。