LoginSignup

Are you sure you want to delete the question?

Leaving a resolved question undeleted may help others!

文字に中国語のような文字(太字や文字の違うサイズの漢字)が混ざっている

Q&AClosed

デザインをオフショアに投げているもので、一部文字が中国語のような文字が混ざっておりました。

これは、クロームブラウザで開いたものを、ローカルのメモに張り付けたりしたときに起こります。
テキストベースのサイトであれば、日本語変換されますが、一部のアプリ等には中国語のような文字になります。
文字の特徴としては、文字が太字のようになったり、サイズが少し違ったりします。

こちらのようなテキストサイトには変換されないので、画像を参照下さい。

sssgh.jpg

質問としては、何故このような現象が起こるのでしょうか。
また、ブラウザ上では日本語として認識されているのでしょうか。

0

3Answer

通常日本語で使用されるものと異なるコードポイントの文字が混ざっているのでしょう。
おそらく、Unicodeブロックの一つである康煕部首の文字が使われているものと思われます。
漢字文化圏の人が使うIMEなら普通は登場しない文字ですが、漢字を使わない人にはまず見分けがつかないのでこのような入力ミスは往々にして発生します。

ブラウザ上で開いた時やメモ帳にコピペした時などで表示される文字が異なるのは、使用されているフォントによるとしか言えません。康煕部首は普通の文章には(それこそこのような入力ミスがない限り)ほとんど登場しないのでフォントにグリフが登録されていないことも多く、日本語対応フォントにグリフが存在しなかった場合はフォントフォールバックの仕組みによりとりあえずそのコードポイントに対応するグリフが登録されているフォントが使われることになります。その時に使われるフォントによっては、中国語用のフォントが使われてしまうこともあり得ますね。

2

こちら明快なご回答ありがとうございました。
非漢字圏の方が作成された可能性は高いです。

>その時に使われるフォントによっては、中国語用のフォントが使われてしまうこともあり得ます
ね。

こちら、中国語用フォントであっても、日本語としてブラウザや検索エンジンには認識されるのでしょうか。検索の対策等で関わってくるため、この部分も知りたいです。

0

とりあえず、ユーザーのアプリやOSにどんなフォントがインストールされていようが検索エンジンには関係ありません。

最近の検索エンジンは見た目もチェックしている可能性がありますので、例えば検索エンジン内部で使われているレンダリング用のフォントが中国語用フォントになってしまうことで何らかの影響が出る可能性はゼロとは言えません。

ですが、見た目の問題よりも異なるコードポイントの文字が利用されていることによりキーワードを抽出できなくなる問題や、日本語にあまり登場しない文字が誤って登場していると、あまり質の良くないページと判断されて優先順位を下げられてしまうといった可能性の方が高いと思います。私はGoogleの中の人ではないので(中の人でも分かる人は少数でしょうけど)具体的にどのような影響が出るかは分かりませんが。

まあ、直せるものなら直しておいた方が良いのではないかと思います。

ブラウザがどう認識するかというのが何を気にしているのかは分かりませんが、例えばブラウザでそのページを開いた時に日本語ページだと認識させたいという話なら HTML に lang 属性をつけるなり HTTP のレスポンスに Content-Language ヘッダをつける方が手っ取り早いと思います。

0

Your answer might help someone💌