8
Help us understand the problem. What are the problem?

More than 5 years have passed since last update.

posted at

updated at

URLに日本語を使うときに気をつけること

ドメインには日本語が使えるとちょっと前から聞くようになってきた。
ファイル名なども、推奨しないことも多いけど、大抵動くような気がする。
フレームワークなどによって、URIがそのままパラメーターになることもよく見かける。

でも、注意しなければいけないことは、マルチバイト文字列はときにパーセントエンコーディングされるということだ。
Firefoxなんかは日本語を含むURLをコピペしたときにパーセントエンコーディングされて難儀する。

ただのアドレスならブラウザが味良うしてくれるのか、問題になることは少ない。
しかし、エンコードが起こるという時に気をつけないといけないことは、エンコードが多重に起きないかということだ。
とくにエンコード後の%がエンコード対象(%25)になるのがミソ。

つまり

p1.png

p2.png

p3.png

エンコード デコード

エンコード
ポエム → %E3%83%9D%E3%82%A8%E3%83%A0
再エンコード
%E3%83%9D%E3%82%A8%E3%83%A0%25E3%2583%259D%25E3%2582%25A8%25E3%2583%25A0
デコード
%25e3%2583%259d%25e3%2582%25a8%25e3%2583%25a0%e3%83%9d%e3%82%a8%e3%83%a0
再デコード
%e3%83%9d%e3%82%a8%e3%83%a0 → ポエム


なにが原因かはわかりませんが、気をつけようと思った(小並感

参考

Why not register and get more from Qiita?
  1. We will deliver articles that match you
    By following users and tags, you can catch up information on technical fields that you are interested in as a whole
  2. you can read useful information later efficiently
    By "stocking" the articles you like, you can search right away
Sign upLogin
8
Help us understand the problem. What are the problem?