サーバー側で情報をどのように扱っているかは以下の公式記事に書いてあります。
https://simeji.me/blog/simeji_safety
iPhoneの通信を解析すると、文字を入力するごとにURLエンコードされた文字データを送信していることがわかる。
少し調査しただけでも以下のことがわかった。
2文字以上入力された段階で送っている
1文字入力では送らない
例えば「いい」という文字列を入力した場合
GETリクエストのpyという変数にURLエンコードされた「いい」が格納されている。
「いいう」と連続で入力すると下記のようなリクエストが追って飛ぶ
実際、「いいう」になっている。
ちなみに個人的に興味深いと思ったのだが、「ああ」「うう」と入力してもデータは送信されないが「いい」「ええ」「おお」ではデータが送信される。入力内容でどのようなバリデーションを行っているかはデコンパイルすればわかりそう。
英語(ローマ字)は送っていない
「It's a pen」
「I am fine」
「www」
などと入力したときの通信はなかった。
数字も送っていない
一般の数字や電話番号も送っていないことが確認できた。先の記事に「パスワード、クレジットカード番号その他の秘匿性の高い情報については、自動判別機能を用い、原則として取得しない扱いとしています。」とあるが実際に正しそう。
漢字も取得していない
例えば「いぬ」「ねこ」といったワードを入力すると、先のようにURLエンコードされたひらがなが送られているが、漢字に変換するタイミングでは送られていない。