LoginSignup
7
8

More than 5 years have passed since last update.

データ前処理ツールの調査

Posted at

AIモデルの学習にはデータが必要です。

例えば、時系列データを学習に用いるモデルを作る場合、多量の時系列データを用意しますが、得てして一部に欠損があったり、標準化する必要があったりと前処理と呼ばれる加工が必要になります。

また、データの可視化のためグラフにすることも多々あります。

そうした時に、少量をサンプルとして抽出し、エクセル使って加工したり、PythonのPandasを使ったりしていたのですが、元データと加工後データの紐付けをフォルダ構成でなんとかしたりとか、何かと本筋とは別のところで気を使う日々を過ごしていました。

ちょっとそういう状態はどうにかならないかなということで、世にあるツールを探してみたところ、2つ気になるツールがあったのでメモです。
※後日、使ってみた感想を追記していきます。

  1. OpenRefine
  2. Orange
7
8
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
7
8