TimeGPT-1は先月公開された初めての時系列問題用のラージモデルです。
その時は論文だけ出しましたが、最近になってモデル自体もリリースされました。
中国のあるサイトで、実際にこのモデルを使って精度を検証した記事を読みましたので、共有したいと思います。
(私は時系列問題にはあまりやったこと少なく、最新モデルとかについてはあまり詳しくないですが、)
まずTimeGPT-1の中身について、細かいところはよくわからないですが、全体的にはLLMと同じく、時系列データをembeedingして、モデルが学習するという流れです。
学習に使用されたデータは、様々な分野の時系列データです。約1000億件を使用しました。
ラージモデルのために、ほとんどのタスクは基本zero-shotでできます。
または少しfinetuingすれば複雑なタスクにも対応できるようになりますので、結構使いやすいかもしれません。
以下のスクリーンショットは開発者が論文で公開したモデルの精度です。月単位、週単位の場合は一番高くて、日単位や時間単位でも2,3位くらい高いですね。
あとは処理速度も注目されました。TimeGPTは平均0.6ms/件の速度で処理を行い、通常の統計モデルやlgbmなどのモデルよりは数十倍速いです。(lgbmは57ms/件)
それでこの記事では、その精度が本当に高いのかを実際に試し、スペックを確認しました。
この方は自分のブログのPV数データを使って予測を行いました。
評価指標はmae(平均絶対誤差)とmse(平均二乗誤差)を使用し、確かに他のN-BEATS, N-HiTSとPatchTSTとかのモデルよりも精度が高かったですね。
最近Kaggleにも時系列データの異常検出コンペがあります。TimeGPTは区間予測が可能なので、異常検出にも適用できると思います(99%を超えたら異常値と判断するとか)。TimeGPTを使ってやってみたいと思います。
精度確認に使われたコードは以下となります。
興味ある方試してみてください。
論文: