@tsukki

Are you sure you want to delete the question?

If your question is resolved, you may close it.

Leaving a resolved question undeleted may help others!

We hope you find it useful!

2値の時系列データの分析法について(2点AとBに相関がある仮定したうえで、適切なB になるAの値の閾値(Target)を決めたい)

解決したいこと

時系列データに関して、2値の挙動に相関があることを確認したうえで、一方の値がある閾値以上になるようなもう一方の値の閾値を決めたい。

例)
写真は、二つの時系列データ(A、B)があり、AvsBのデータプロットになります。
Screenshot 2024-05-30 112940.jpg

やりたい事としてはAとBに相関がある仮定したうえで、適切なB (40以上)になるAの値の閾値(Target)を決めたいです。経験的にはAとBは相関があると言われていますが、統計的には何もまだ計測・確認していないです。

伺いたい事

・実際にデータの相関があるかどうかの判定方法。
・正しいB(40以上)になるAの閾値セット(Target)方法。

NameError (uninitialized constant World)

自分で試したこと

・Aの各値に対するB値のプロットは数点 あるので、各A値の平均値に対して、近似曲線を引いて相関があるかの確認。相関係数も0.3程度と、これで相関があるといっていいか分からないです。

経験的にはAが209の時にB値が安定することが分かっていて、実際もその値で運用していて問題ないことが分かっています。

0 likes

3Answer

相関係数も0.3程度

どうやって算出したか記載は無いが、相関係数が出ているならそれが結論でしょう。
判断基準は業界によって異なるので何ともですが、大目に見ても弱い。
https://atmarkit.itmedia.co.jp/ait/articles/2110/13/news027.html

でも相関係数を二乗した決定係数R^2が0.0187ってあるから
そこから出る相関係数は負の相関が0.14程度なのでそっちの値だと相関無いと判断せざる得ない。
何個のデータ数か記載ありませんが、数千個とか用意すれば別の結論になるかもしれません。

0Like

「適切なB (40以上)になる」とは

  1. Bが40以上になる可能性があるものは決して除外しない(取りこぼさない)
  2. Bが40以上なのに除外されたり、Bが40以下なのに除外されない件数を最少にする
  3. Bが非常に大きいのに除外されたり、Bが非常に小さいのに除外されないといった誤差の量を最小にする

のどれでしょうか。
示されたプロットから予想すると、一番目だとAの閾値は非常に大きくなり実質意味のないものになるのではないかと思うのですが。

0Like

全然話の意味が分かってない者ですが,そのプロットだけを見るに…

(1) 「Bの下限値」というのを見ると,Aとの間に何らかの関係がありそうには見えます.
(2) Bには謎の上限値(60)が存在していて,Aの値がいくつだろうが,常に観測値がこの上限値に達してしまう様子.(測定手段の限界か何かに依る?)

という雰囲気?
素人的には,このデータに対して

各A値の平均値に対して、近似曲線を引いて…

とかやること自体が適切とは思えない感じです.

なんというか,上記(2)より,Bの実際の分布を正しく観測できていない(上側が60に改竄されてしまっている)ように見える,というか.
例えば,本来のBの値というのが
{ 40, 50, 60, 70, 80 } であったとして,もしもこれを観測した結果のデータ値というのが
{ 40, 50, 60, 60, 60 } に化けてしまうとか,あるいは単純にBが大きいデータは観測できなくて
{ 40, 50, 60 } というデータしか得らないとかだとしたら,この観測データの平均値なんてものを考えることは果たして妥当なのか? っていう.

単なる素人の憶測でしか無いですが,下図のような話だったりしないのか? みたいな…
Fig.png


で,

適切なB (40以上)

という話は上記の(1)だけを考えればよいのではないだろうか? という気がします.

0Like

Your answer might help someone💌