WindowsからテキストファイルをftpなどのバイナリモードでUNIX上に転送した場合,行末の改行コードが「^M」に変換されてしまう。
スクレイピングしているとき,このようなファイルをUNIXでひらくとファイル読込めなかった
→(解決策)
http://d.hatena.ne.jp/yoshifumi1975/20080503/p1
コマンド
tr -d '\r' < hogehoge.html > pokopoko.html
でOK
-(メモ)
^Mとうっても認知されないので[Ctrl]+[V]キーを押してから、[Ctrl]+[M]キーを押す。