はじめに
こんにちは。すぎもんです。
企業はデータ利活用の促進を進め、あらゆる業務において担当者レベルでデータを活用することが増えてきました。世に溢れる様々なサービスを駆使して、いわゆる技術者ではない人たちも「内製化」という名のもとに、データを扱います。
ただこの「データを扱う」というところで、重要なポイントであるものの、意外と深~く理解している人がすくない「文字コード」。日々様々な技術が生まれて消えていく中、古くから変化せずに「文字コード」は存在しています。
今回は、その文字コードに関連した案件の中で、気付いた情報を整理しました。
最近出会った案件にて
お客様の中には自治体様も多く、国や行政としてのシステム仕様やデータ要件への対応で、DataMagicをご案内することがあります。
例えば、珍しい漢字の姓名が含まれた名簿データ。いわゆる「異体字」です。
まず、この苗字「髙橋」さんは読めますか?
もちろん「たかはし」さんなのですが、「髙」をよーく見て頂くと、普通の「高」ではなく「髙」なのです。俗に「はしごだか」と呼ばれている「異体字」です。難読苗字だからというわけではなく、この記事の閲覧環境によっては文字化けで読めない文字です。
※文字化けしてしまって読めていない方のために画像を貼っておきます
■ 「地方公共団体情報システム」のデータ要件・連携要件
文字化けの問題は、システム開発においても大きな問題になります。
単純な見た目の問題だけでなく、データを正しくシステムが認識し登録できるかという問題になるからです。(「髙(はしごだか)」で登録した文字をシステムが勝手に「高」へ変換して登録すると、それはもう誤登録です。)
特に、戸籍や住民基本台帳を管理している地方自治体のシステムでは、
通常使われない珍しい漢字や「異体字」を含む氏名、地名に対応しなければいけないため必須の対応になります。
そういった対応を進めるために、
国・地方行政のIT化やDXの推進を目的としたデジタル庁では、
地方自治体のシステム仕様を整理し、公開しています。
デジタル庁: データ要件・連携要件の標準仕様
https://www.digital.go.jp/policies/local_governments/specification/
この仕様書の文字要件にあたる部分を満たすことで、地方公共団体で管理しているシステムでの問題の発生を防ぐことが可能となります。
最近の案件でそういった要件に対応するために私はDataMagicをお客様にご紹介しています。それは、「DataMagic」が「地方公共団体情報システム データ要件・連携要件 標準仕様書 【第 3.0 版」の要件に準拠しているからです。
→→→→→→→→→→→→→→→→→→→→→→→→→→→→→→→→→→→→→→→
要は、「地方公共団体情報システム」の文字要件※の変換に対応している。
※ 文字情報基盤の文字セットであるMJ文字
→→→→→→→→→→→→→→→→→→→→→→→→→→→→→→→→→→→→→→→
自治体システムの文字要件として、2025年以降は、下記が定義されています。
データの文字セット | 文字コード |
---|---|
JIS X 0213:2012 | JIS X 0221:2020 |
文字セット「JIS X 0213:2012」とは
「UTF-8」「UTF-16」「IBM漢字」で表現可能な文字集合です。「JIS X 0213」の2012年改正版で、「JIS X 0213:2004(通称 JIS 2004)」から文字追加はありません。
文字コード「JIS X 0221:2020」とは
Unicode(=UCS:Universal Character Set)と同義です。
「UTF-8」「UTF-16」「UTF-32」のいずれかの文字コードを使えば表現できます。
文字セットや文字コードは、一般的にも、SJISやUnicodeなどご存じの方も多いと思います。でも…文字コード「JIS X 0221:2020」と言われると、なんだか難しそうに見えますよね。ここは「Unicode」と読み替えてもOKです。
IPAmj(MJ文字)への対応には、この「Unicode」と「異体字」の対応が必須なのです。
DataMagicは、この「Unicode」と「異体字」に対応している。つまりは、「IPAmj(MJ文字)に対応している=自治体システムの文字要件を満たす」というわけです。
DataMagicの機能詳細はこちら
おわりに
いかがだったでしょうか。戸籍などを扱う地方自治体ならではかつ、文字コード要件に踏み込んだ内容でした。案件対応で知った内容もいくつもありましたが、自治体だけでなく、一般企業でも顧客名簿のシステム登録等で考慮するべき点が見えてくるかと思います。皆さんが珍しい漢字や異体字を扱った際にこの記事を思い出していただければ幸いです。
このブログでは、今後も様々なTopics記事や接続検証等、皆さんの役に立つような記事を投稿していきたいと思います!
ここまで読んでいただきありがとうございました。それでは、また!