データに関する記事を書こう!
テーマ2『データに関する記事を書こう!』参加記事です。
プログラマにも読んでほしい「QC検定にも役立つ!QCべからず集」
社会現象では。ほんの少しの初期条件、制約条件の違いで逆が真になる。
また、扱うデータの件数は30件くらいから統計処理をするといいという経験則を聞いたことがある。
与件解析(data analysis)入門。仮説(195)統計と確率(14)
与件網(data network)が凡人網(ordinary people network)
ここでは上記Qiitadelika記事について分析する。
まだ追記していないが、ほぼ30件になった。
データ 10件
何か、同じ値を持つものがあれば、それが何割か、計算しなくてもいいのが便利。
予備分析として10項目くらい仮説を立てるとよい。
例えば、「与件網(data network)が凡人網(ordinary people network)」の最初の10件データが集まった時の特徴を記載する。
- viewsはそれぞれ100以上
- いいね(LGTM)はほぼ0件
- ストックもほぼ0件
- 連結もほぼ0件(某記事ができてからはそれぞれ1件)
- 参照は最初はほぼなし(すぐに10件に)
- 自己参照は最初はほぼなし(すぐに5件から10件に)
- 相互参照はなし(すこしつづ追加)
- タグはAdventCalendar2022以外は熟考していない。
- 英語みだしはまだつけてない
- 標題、抄録の英語はつけてない。
- 締めの短歌をつけてない。
データ 30件
10件の時の予備分析との違いを見るとよい。
10件の時に立てた特徴の変化を記載するとよい。
- viewsはそれぞれ100以上
twitter不調で100件未満ばかり。 - いいね(LGTM)はほぼ0件
そんな感じ - ストックはほぼ0件
そんな感じ - 連結はほぼ0件
連結ほぼ1件
【毎日自動更新】データに関する記事を書こう! LGTMランキング!
-
参照は最初はほぼなし
参照は10件以上 定番+その題材 -
自己参照は最初はほぼなし
参照は5件から10件 定番+その題材 -
相互参照はなし
すこしつづ追加 -
タグはAdventCalendar2022以外は熟考していない。
そのまま -
英語みだしはまだつけてない
そのまま -
標題、抄録の英語はつけてない。
そのまま -
締めの短歌をつけてない。
そのまま
データ 100件
何か、同じ値を持つものがあれば、それが何%か、計算しなくてもいいのが便利。
16個同じ値のものがあれば16%なんだから。
集められれば、100件データを集めるとよい。
ただし、10件、30件の段階で、予備分析をしているとよい。
移行の条件
10件、30件、100件と増えていったとき、
分散が単調増加かどうか。
10件から30件に移行したときと、30件から100件になったときで違和感がないか。
量がふえたための現象か。
金属疲労のような時間推移にともなう現象か。
時間推移にともない、初期条件、制約条件が劇的に変化したことにともなう現象か。
これらの分析の鍵を100個くらい持っているとよい。
私は記憶していないが、数値の列を見れば思い出すこともある。
計算機にが学習させるのも手。
人間が計算機に勝てる3つのこと。忘れる、あきらめる、やめる
Data といえば Data Robot
統計
第1部 データ分析の基礎知識..
参考資料(reference)
@e99h2121 育児していたからこそエンジニアのお仕事に役立ったこと10選
@e99h2121「女性こそエンジニアになるべきだ?」デブサミウーマン登壇記録
@ohakutsu 新卒2年目から見た達人プログラマーの振る舞い
@torifukukaiou 【毎日自動更新】データに関する記事を書こう! LGTMランキング!
@torifukukaiou Qiita 10周年記念イベント LGTMランキング!
@torifukukaiou Qiitaエンジニアフェスタ2021 LGTMランキング!
@torifukukaiou 私のAdvent Calendar 2022 ーー はじめたきっかけ、1月のふりかえり、今後の展望
@kazuo_reve 新人の方によく展開している有益な情報
@kazuo_reve 私が効果を確認した「小川メソッド」
自己参照
新人(学生)を指導するよりも新人(学生)に指導してもらった方が効率的。仮説(139)
プログラミング言語教育のXYZ。Youtube(1) 仮説(52)
データサイエンティストの気づき「勉強だけして仕事に役立てない人。大嫌い!」。『それ自分かも!』ってなった。
凡人網が与件網