今朝気付いたのだが、CSVをMS Excelのようなテーブルエディタで編集することができるパッケージ「Tablr」がついにマルチバイト対応されたようだ。
私の環境ではMS Excelから出力されたShift-JISなCSVや、過去の遺産から出力されたEUC-JPなCSVが飛び交うため、非常に嬉しくなってしまい記事を書くことにした。
動作サンプル
例として郵便局が配布している郵便番号データを用いる。
拡張子が大文字(.CSV)だとAtomがCSVと認識してくれなかったため、小文字(.csv)に直す必要がある。
CSVを読み込むとTablrの設定画面が表示される。
郵便番号データはShift-JISのため、プレビュー表示で文字化けしていることが確認できる。
画面右側の"Encoding"を選択し、"Japanese (Shift JIS)"を選択する。
(Atomにとって)比較的大きいファイルサイズのCSVを読んでいるからか、リストの文字が表示されるのにやや時間がかかった。リストを開いたら真っ白だったという場合も慌てずしばらく待ってみて欲しい。
正しい文字コードを選択すると、プレビュー欄が更新されて正しいデータが表示される。
その後他の設定項目を適時設定し、"Open Table Editor"をクリックして編集画面に移動する。
表示だけでなく、入力や更新後の再読み込みでも文字化けすることなく扱うことが出来た。
これでどのようなCSVが来てもAtom一本で対応できる。
少量のデータであれば通常のテキストエディタでも充分編集可能だが、これが百件超のデータ量となるとかなり作業しづらい状況となる。
その度にMS Excel等開くのは非効率なので、AtomだけでスムーズにCSVが編集できるのは非常に嬉しい限りである。
注意事項
CSVの新規作成
Tablrは編集専用であり、新規作成には対応していない。
もし新規に作る場合は一度"Open Text Editor"からテキストエディタを開き、ヘッダーだけ手動入力してから"Open Table Editor"を選択するようにしてほしい。
文字コードの判別
残念ながら文字コードの自動判別機能は実装されていない。
デフォルトはUTF-8で読もうとするので、もしCSVの文字コードが分からなければ別途確認するか、"Encoding"リストから総当りで確認する必要がある。