3
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

雑・Excel入門試論 - 脱VLOOKUPの思考Advent Calendar 2022

Day 4

雑・Excel入門試論 - 脱VLOOKUPの思考 04 - セル - 文字列型

Last updated at Posted at 2022-12-03

データ型

 エクセルの中で扱われるデータ型は、以下の4つの基本データ型からできています。

  • 数値 (Number)
  • 文字列 (Text)
  • 論理値 (Logical value)
  • エラー (Error value)

テキストデータとは

 アルファベット、数字、特殊記号、Unicode文字などが含まれます。数値データとテキストデータの違いは、計算できるかどうかです。日付や数値は規定ではテキストデータとして認識されません。目的に応じて書式設定する必要があります。

Case Insensitive

 エクセルの文字列は、大文字と小文字を区別しないCase Insensitiveで扱われます。下記のように、"Cat"と"cat"を比較("Cat"="cat")すると、TRUEが返されます。また、「禰豆子」と「禰󠄀豆子」の比較もTRUEが返されます。「禰」と「禰󠄀」は、Unicodeでは異字体セレクタというコードで区別されていますが、Excelの(「禰󠄀豆子」が正しく表示されないのですが)
image.png
 大文字、小文字を区別して比較する必要がある場合は、EXACT関数を使用します。(EXACT("Cat","cat"))
image.png
上図のように、文字列の比較は以下のルールになっています。

  • CS (Case-Insensitive) 大文字と小文字の区別しない
  • AS (Accent-Sensitive) "a"と"á"、"ば"と"ぱ"の区別する
  • KS (Kana-Sensitive) ひらがなとカタカナの区別する
  • WS (Width-Sensitive) 半角と全角の区別する

ふりがな

 オプションの「Officeの編集言語と構成機能」が日本語になっている場合は、ふりがなが有効になります。
 セルに日本語変換をして入力すると、Open XML では SharedStrings.xml に全てのシートの文字列が保存されます。日本語変換を使って入力すると、ふりがなが rPh タグで登録されています。

sharedStrings.xml
  <si>
    <t></t>
    <rPh sb="0" eb="1">
      <t>イチ</t>
    </rPh>
    <phoneticPr fontId="1" />
  </si>

 同一ブック内で、ふりがなも同じ文字列は1つのデータとして保存されますが、ふりがなが異なる場合は別のデータとして保存されます。

ふりがなが異なる文字列
  <si>
    <t></t>
    <rPh sb="0" eb="1">
      <t>イチ</t>
    </rPh>
    <phoneticPr fontId="1" />
  </si>
  <si>
    <t></t>
    <rPh sb="0" eb="1">
      <t>ハジメ</t>
    </rPh>
    <phoneticPr fontId="1" />
  </si>

 エクセル内でコピー&ペーストした場合は、セルの値はコピー元と同じ値を持ちます。変換を行わないでメモ帳にあるテキストを貼り付けした場合は、ふりがなが登録されません。

メモ帳から貼り付け
  <si>
    <t></t>
    <phoneticPr fontId="1" />
  </si>

スペース

 セルに入力された文字列の前後に付けられた半角スペースは有効(preserve)になります。特に、文字列の最後にスペースが入る場合は、視認しにくいためトラブルの原因となることがあります。

space
  <si>
    <t xml:space="preserve"> abc </t>
    <phoneticPr fontId="1" />
  </si>

ソート

ソートは、数字、英字、日本語の順に並び替えられます。日本語は、読みの「あいうえお順」に並び替えられます。「朝(あさ)」の読みと「朝(ちょう)」の読みでは、同じ漢字でも順番が変わっています。
image.png
読みがない場合は、Unicodeのコード順に並びます。読みのあり・なしが混在する場合は、読みがあるものが「あいうえお順」で最初に並び、その後に読みがないものがUnicode順に並びます。
image.png

コンテンツ

3
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
3
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?