unicode

Unicode文字について色々なメモ

変な文字や記号について

Unicodeには色んな言語を表現するために変なものがいっぱいあります。それらを知っている限りメモしようと思います。

1. 強制RTL

これはRTL、つまり右から左へ文字を書くことを強制します。

‮これは右から左へ書くテキストです。戦前みたいですね!

Qiitaでは⋤で使えます。また、拡張子をユーザに対して偽装する目的でファイル名などに使用されたことがあります。

2. 単位を表す文字

これは一文字で単位を表せる優れたものです。何故か日本語もあるのはガラパゴスな文字だったからでしょうか。

㌢ ㌠ ㌘ ㍊

文字数を削減する目的で使われたりしています。

3. 上付き文字

日本語の゛の扱いはmacOS(かな入力)ではか゛のように「か」+「゛」で表現する場合があります。
同様にタイ語やドイツ語、フランス語などは¨などを元々ついたものと2文字を合成したものがあります。

4. 逆さま文字

これはそのまま逆さというわけではなく、ほとんど逆さの文字と同じな別の文字です。
ラテン・アルファベットに対しては数学記号などからほぼ全て存在します。例えば∀とか。

5. 使い所の分からない文字

  1. 麻雀牌
  2. トランプカード
  3. 易占の記号(韓国の国旗のあれ)
  4. チェス記号
  5. 錬金術記号

6. 日本語の縦書き専用文字

日本語の縦書きはWindowsなどはフォントで対応していましたが、専用の文字が存在しています。ただ、縦書き用の「ー」はありません。何故だろう。

7. 半角句読点

幅が半分になります。文字間隔が空きすぎているという人は使うといいと思います。以下が幅の違いです。ちょうど半分ぐらいになります。個人的にはこっちのほうがいいので辞書登録して使っています。

。|
。|