0
0

『"』や『&』などの謎の文字列がでてきた【特殊文字】

Last updated at Posted at 2024-09-10

解決策

HTMLを覗いていると時々出会う "& などの "&~~~;" は特殊文字と呼ばれるもの。

HTMLから情報を取得する際は下記のように置き換えよう。

# 出現頻度が高い文字

# ダブルクォーテーションを変換
.gsub('"', '"')
.gsub('"', '"')

# アポストロフィを変換
.gsub(''', "'")
.gsub(''', "'")

# アンパサンド(アンド)を変換
.gsub('&', '&')
.gsub('&', '&')

特殊文字とは

HTMLで " < " や " " " などを文字列として表したいときに使う方法
文字実体参照」と「数値文字参照」の2種類の表示方法がある

代表的なものは以下

文字 文字実体参照 数値文字参照 説明
< &lt; &#60; 不等号(小なり)
> &gt; &#62; 不等号(大なり)
& &amp; &#38; アンパサンド(アンド)
" &quot; &#34; ダブルクォーテーション(二重引用符)
' &apos; &#39; シングルクォーテーション(引用符)、アポストロフィ
/ &sol; &#47; スラッシュ
% &percnt; &#37; パーセント

実際に使ってみると

<p> 例文だよ </p>
&lt;p&gt; 例文2だよ &lt;&#47;p&gt;

例文だよ

<p> 例文2だよ </p>

参考

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0