データに関する記事を書こう!
テーマ2『データに関する記事を書こう!』参加記事です。
datum, data, data set。data三段階活用(English)
big dataをどう説明しようか迷った。
インフラエンジニアがSREを学ぶ点
上記記事を書いている最中は、そうだよねって思いながら書いていた。
しかし、big dataがどこにあるかを考えて迷った。
各地のデータセンタにあることは間違いない。
しかし、データの重複、矛盾があるかもしれない。
データの間で、戦争したらどうなるだろう。
自分のデータが一番強力だという戦争。
データがデータを生み出す場合には、際限がない。
風数のデータの関係を計算して、つぎつぎにデータを自己増殖させていったら、そのデータは最強かもしれない。大きすぎて使えないかもしれない。
データの最強ってなんだろう。
目的を絞り込めば、その目的を達成する誘導力、根拠、経緯、結果などなど、いろいろな段階を想定できる。
地図
地球表面の図は強力なbig dataである。
三次元の動画であれば、なおさら。
航空地図
同じ気球表面のデータでも、刻一刻と変わる地表の状況を示す、航空写真はいろいろな使い道がある。
生物分布
絶滅危惧品種をはじめ、どのような生物が地球に分布しているかはとても大切である。例えば、コロナに感染している人の分布はじめ、さまざまな病気、怪我などの分布も大事かもしれない。
赤十字、国境なき医師団はじめ、医療関係者の方々に、適切な生物分布情報を提供するのはとても大事なことだと思う。
生物統計学
医療系の現状と課題。安全(16)
放射性物質分布
世界の放射性物質の分布をしることは、原子力発電所事故をはじめとする、
原子力兵器の事故などを含め、事故以降の継続的な分布調査が必要だろう。
凡人網の例を示すほど煮詰まっていない
インタネットデータ
インタネット上を流れているデータは、その春歌でBig Dataであろう。
刻一刻と変わっている。
特定の目的で濾過して利用する場合もある。
インタネットのゲートウェイで蓄積している場合があるだろう。
Wireshark インフラエンジニアの玉手箱
遺伝子情報
遺伝子の情報は、多くの生物と人間でそれぞれさまざまな用途で用いることができる。
悪用しようと思えば、この情報ほど危険性が高いものはないかもしれない。
遺伝子特許出願件数
「DNAと遺伝情報の物理」伏見譲。統計と確率(20)
参考資料
データサイエンティストの気づき「勉強だけして仕事に役立てない人。大嫌い!」。『それ自分かも ? 』ってなった。
データサイエンティストへの5つの門。あなたはいくつの門をくぐりましたか?統計と確率(8)
プログラマによる、プログラマのための、統計と確率のプログラミングとその後。統計と確率一覧(0)
統計と確率が扱えれば工学のほとんどは大丈夫。仮説(119)統計と確率(1)
統計の嘘。仮説(127)
与件科学者(data scientist)入門。統計と確率(13)