こんにちは。
CSVデータに対して、q
コマンドを使ってヒストグラムデータ(頻度数)を計算してみました。
第一カラムの値に対して、0.5 刻みで出力する例は
$ cat data.csv | q "select round(c1/0.5-0.5)*0.5, count(round(c1/0.5-0.5)) from - group by round(c1/0.5-0.5)" | awk '{r="";i=$2;while(i-->0)r=r"#";printf "%s %2d %s\n",$1,$2,r;}'
1.0 4 ####
1.5 8 ########
2.0 12 ############
2.5 5 #####
3.0 1 #
- 1.0 以上、1.5 未満の頻度数が 4 です
-
awk
コマンドで図示(#
の連続)を付け加えています