はじめに
みなさん、ごきげんよう♪
新入社員の入社や人事異動もなんとなく落ち着いてきた今日この頃。そろそろ部署の同僚の氏名を五十音順に並べたくなったりしませんか?? でも漢字・ひらがな・カタカナなどが入り交じった氏名での並べ替えは中々うまくいかなくて、ヽ(`Д´)ノプンプンとなってませんか??
今回は Power BI で氏名を五十音順に並べ替えるテクニックをお伝えしたいと思います。
【結論】ふりがなの列を作れ
並び替えの方法
ひらがな or カタカナ のどちらかに字種を統一したふりがな列を作成し、昇順 or 降順で並び替えると正しい並び順になります。
ふりがな作成の Tips
ふりがなを手打ちで入力するのが面倒で、ふりがなのマスタデータも持っていないという方は PHONETIC 関数を利用すると一瞬でふりがなを出力できる場合があります。
ある程度正確にカタカナのフリガナを抽出してくれますので、こちらを値としてコピー&ペーストすれば時短になります。
PHONETIC 関数を確実に利用できるのは漢字の氏名を手入力で入力した場合のみです。漢字の氏名をなんらかのシステムから出力した場合は正常に動作しないことがあります。
Power BI での文字の並び替えの仕組み
Power BI で文字を昇順 or 降順で並び替えると、文字コードの順序に従って並びます。文字コードというのは漢字・ひらがな・カタカナ・アルファベットそれぞれ別の文字として認識し、1個ずつ異なるコードが与えられます。その為、以下のような氏名を単純に氏名列で昇順に並べ替えると、北村より中村の方が先に来るというおかしな事象が発生します。
氏名 | フリガナ | 文字コード |
---|---|---|
あきの はなこ | アキノ ハナコ | 12354 12365 12398 32 12399 12394 12371 |
アルフレッド ジョーンズ | アルフレッド ジョーンズ | 12450 12523 12501 12524 12483 12489 32 12472 12519 12540 12531 12474 |
中村 良太 | ナカムラ リョウタ | 20013 26449 32 33391 22826 |
北村 美香 | キタムラ ミカ | 21271 26449 32 32654 39321 |
高野 美紗 | タカノ ミサ | 39640 37326 32 32654 32023 |
また、同じ「あ」でもひらがなの「あ」とカタカナの「ア」では文字コードが異なるため、違う文字として扱われることになります。
- ひらがなの「あ」の文字コード:12354
- カタカナの「ア」の文字コード:12450
その為、字種をひらがな or ふりがなのどちらかに統一すると正確な順番で並べ替えることができます( *´艸`)
おわりに
いかがでしたか?
意外と知っているようで、知らない部分かなと思います。
Power BI での文字の並び替えの仕組みまで合わせて覚えておくと、豆知識的にドヤァできると思いますので、ぜひ覚えてくださいね。
それではごきげんよう✨