LoginSignup
2
4

More than 3 years have passed since last update.

swift UTF8からSJISに変換するときに、数値文字参照も使用する

Last updated at Posted at 2019-12-03

問題 文字コード変換だけでは望ましい結果にならない

具体的にはしたらば掲示板(EUC-JP)や旧2ちゃんねる互換掲示板(ShiftJIS)を想定しています。

ShiftJISのウェブサーバにPOSTしたいのですが、変換できない文字があると
String.data(using: .shiftJIS)だと失敗します。

String.data(using: .shiftJIS, allowLossyConversion: true)
を使うと失敗はしませんが変換できなかった部分が?になって「何これ?」ってなります。

解決方法

  1. 1文字ごとにShiftJIS(EUC-JP)に変換できるか確認する
  2. 変換できない場合にはhtmlの文字参照に起きかえる
  3. ShiftJIS(EUC-JP)変換を行なう というステップを取ります。
var postStr: String = "(´・ω・`)"
let postStrChaRef: String = postStr.characterReferenceSJIS() // 文字参照変換
let postData:Data? = postStrChaRef.data(using: .shiftJIS)  // SJIS変換

import Foundation
extension String {
    func characterReferenceSJIS() -> String {
        var buf = ""
        for c in self.map({ String($0) }) {
            if c.canBeConverted(to: String.Encoding.shiftJIS) {
                buf.append(c)
            } else {
                let buf1 = NSMutableString(string: c)
                CFStringTransform(buf1, nil, kCFStringTransformToXMLHex, false)
                buf.append(buf1 as String)
            }
        }
        return buf
    }
}
2
4
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
4