IBMのCloud Pak for DataのAdvent Calendar向けの記事として書きました。実際にやっていてちょっとわかりにくいかな、と思った点です。
Advent Calendar
https://qiita.com/advent-calendar/2021/cloudpaks
Shift-JISエンコーディングされたCSVファイルの扱いです。
Microsoft Windows環境でのエクセルから作成したCSVファイルはShift Jisでのエンコーディングであることが多いようです。
CLoud Pak for Dataでそのようなファイルを読み込むと以下のように文字化けしてしまいます。
とりあえず右上の"整形”をクリックしてください。
処理中のメッセージが出た後以下にような画面になります。
そしてここがちょっとわかりにくいのですが下の方の矢印が2つあるところをクリックしてください。
そうすると以下のような画面が出てきてエンコーディングを選択することができます。ここでSJIS(Shift JIS)を選んでみましょう。
このように文字が正常に表示されました。
このあとはRefinelyのジョブを作って変換後のデータを保存しましょう。
任意の名前をつけて