Swift の改行コードの挙動について勘違いしていたので、メモとして記録する事にします。きっかけは、Foundation
の NSScanner
/ Scanner
が使いにくいので、独自で同様な物を実装しようとして色々実験していた時に以下のようなコードが動かない事に気がつきました。
.swift
let carriagereturn: Character = "\u{d}"
let linefeed: Character = "\u{a}"
let string = "123\r\n456\r\n789\r\n"
print("begin")
for ch in string {
switch ch {
case carriagereturn: print("CR")
case linefeed: print("LF")
default: break
}
}
print("end")
あれ!CRもLFも出力されません。
.console
begin
end
そこで、こんなコードを書いてみました。最もこのコードにたどり着くために紆余曲折しているわけですが…
.swift
var string1 = "abc\r123\r" // CR
var string2 = "abc\n123\n" // LF
var string3 = "abc\r\n123\r\n" // CRLF
var string4 = "abc\r\n123\n\r" // irregular
var strings = [string1, string2, string3, string4]
for string in strings {
print(string.map { $0.debugDescription }.joined(separator: ", "))
}
なんと、CRLF
は一つのキャラクターとして処理されていました。
"a", "b", "c", "\r", "1", "2", "3", "\r"
"a", "b", "c", "\n", "1", "2", "3", "\n"
"a", "b", "c", "\r\n", "1", "2", "3", "\r\n"
"a", "b", "c", "\r\n", "1", "2", "3", "\n", "\r"
改行コードの分別は地味に面倒なので、これはこれでありがたいですが、カッテを知らないとすったもんだと無駄にエネルギーを消費していました。
.console
$ swift --version
Apple Swift version 5.1.3 (swiftlang-1100.0.282.1 clang-1100.0.33.15)
Target: x86_64-apple-darwin19.2.0
ひょっとして、Swift 5
から挙動が変わったのかと、手持ちですぐ試せた、Apple Swift version 4.2
で試してみましたが、結果は同じでした。