2
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 3 years have passed since last update.

コマンドラインで、csvファイルの列数と行数を取得する

Last updated at Posted at 2021-03-28

概要

業務にて、データ分析のために拡張子が.csv のファイルを扱う機会があった。
pandas.DataFrameにデータを食わせて取得しても良いのだが、コマンドラインでささっと数と行数・列名(カラム名)一覧を確認したかったので、備忘録として残しておく。

行数を取得

wcを使う。

terminal
$ wc -l hoge.csv
30

列数を取得

awkを使う。

terminal
$ awk -F ',' 'NR==1{print NF}' hoge.csv
1000000 hoge.csv

条件で1行目NR==1を指定し、列数(NF)を出力している。

列名を取得

awkを使う。

terminal
$ awk -F ',' 'NR==1{print $0}' hoge.csv
id, age, gender, time, created_at, updated_at, ...

条件で1行目NR==1を指定し、1行目の文字列全体$0を出力している。


列数、行数や列名(カラム名)一覧の確認程度であれば、Jupyterを開かずともLinuxコマンドで実現できるので、知っておきたいですね。
ささっとコマンドが書けると、ちょっと楽しい。

2
0
1

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?