Help us understand the problem. What is going on with this article?

文字列中の   (C2A0) を正規表現で削除

More than 5 years have passed since last update.

スクレイピングなどしているとテキスト中に含まれている   によく遭遇します。
これは strip でも gsub(/\s/'') 等でも消せませんが、以下のようにすると削除できます。

 # 正規表現でPOSIX文字クラスを使う
inner_text.gsub(/[[:space:]]/)

 # 文字コード直接指定でもできる
inner_text.gsub(/\u{C2A0}/)  # gsub(/\uC2A0/) でもOK

 
リファレンスよく読めばかいてありますね。
* リファレンスマニュアル - 正規表現

ここを読んでピンと来ました。
* Stack Overflow - How to remove whitespace from string in Ruby

hollydad
最近はJava, AngularJS。
Why not register and get more from Qiita?
  1. We will deliver articles that match you
    By following users and tags, you can catch up information on technical fields that you are interested in as a whole
  2. you can read useful information later efficiently
    By "stocking" the articles you like, you can search right away