目次
- はじめに
- PDF - Portable Document Format
- CSV - Comma Separated Values
- TSV - Tab Separated Values
- JSON - JavaScript Object Notation
- XML - eXtensible Markup Language
- QR - Quick Response
- URL - Uniform Resource Locator
- URI - Uniform Resource Identifier
- API - Application Programming Interface
- まとめ
はじめに
開発やデータ分析をしていると、PDF、CSV、JSON、APIといった略語を毎日のように目にします。これらの略語は日常的に使っているものの、正式名称や「なぜその略称なのか」まで知らないことも多いのではないでしょうか。私自身、CSVは「カンマで区切られたファイル」という認識はあったものの、Valuesの複数形だったことに気づいていませんでした。この記事では、よく使うファイル形式や技術用語の略語について、その正式名称と意味を整理してみます。
PDF - Portable Document Format
PDFは「Portable Document Format」の略で、直訳すると「持ち運び可能な文書形式」という意味です。
【なぜPortableなのか】
PDFが登場する前は、文書を別の環境で開くと、フォントが変わったり、レイアウトが崩れたりすることがよくありました。PDFは、どのデバイスで開いても、同じ見た目で表示されることを目的に作られた形式です。
この「どこでも同じように見える」という特徴が、Portable(持ち運び可能)という言葉に込められています。
【Formatの意味】
Formatは「形式」という意味で、データをどのように構造化するかを定めたものです。PDFの場合は、文字、画像、レイアウト情報などを1つのファイルにまとめて保存する形式になっています。
CSV - Comma Separated Values
CSVは「Comma Separated Values」の略で、「カンマで区切られた値たち」という意味です。
【Valuesが複数形の理由】
CSVファイルには通常、複数行のデータが含まれています。各行には複数の値(Value)があり、それらがカンマで区切られているため、Valuesと複数形になっています。
例えば、以下のような商品リストがCSV形式で保存されます。
商品名,価格,在庫数
りんご,100,50
バナナ,80,30
【なぜカンマで区切るのか】
カンマ(,)は、データの区切りとして視覚的に分かりやすく、ほとんどのプログラミング言語で簡単に処理できる記号です。シンプルな構造のため、Excelなどの表計算ソフトでも、データベースでも扱いやすいという利点があります。
TSV - Tab Separated Values
TSVは「Tab Separated Values」の略で、「タブで区切られた値たち」という意味です。
【CSVとの違い】
TSVはCSVとほぼ同じ構造ですが、区切り文字がカンマではなくタブ文字(見えない空白文字)になっています。
商品名 価格 在庫数
りんご 100 50
バナナ 80 30
タブ文字は日常的な文章ではあまり使われないため、データの中に区切り文字が紛れ込むリスクが低いという利点があります。
詳しい使い分けや実装方法については、以下の記事で解説しています。
JSON - JavaScript Object Notation
JSONは「JavaScript Object Notation」の略で、「JavaScriptのオブジェクト記法」という意味です。
【Notationの意味】
Notationは「記法」や「表記方法」という意味です。JSONは、JavaScriptでオブジェクト(データのまとまり)を表現する書き方をそのまま利用したデータ形式です。
{
"name": "田中太郎",
"age": 25,
"skills": ["Python", "JavaScript"]
}
【なぜ広く使われるのか】
JSONは人間にとって読みやすく、プログラムでも扱いやすいという特徴があります。特にWeb API(サーバーとのデータのやり取り)では、JSONが標準的なデータ形式として使われています。
CSVと違って、階層構造(入れ子のデータ)を表現できるため、複雑なデータを扱う場面で便利です。
XML - eXtensible Markup Language
XMLは「eXtensible Markup Language」の略で、「拡張可能なマークアップ言語」という意味です。
【eXtensibleの意味】
最初の「X」は「eXtensible(拡張可能)」のXです。XMLは、ユーザーが自由にタグ(データの種類を示す目印)を定義できるため、拡張可能という言葉が使われています。
<person>
<name>田中太郎</name>
<age>25</age>
</person>
【Markup Languageとは】
Markup Language(マークアップ言語)は、文書の構造や意味を「タグ」で示す言語のことです。HTMLもマークアップ言語の一種ですが、XMLはHTMLよりも柔軟にタグを定義できます。
QR - Quick Response
QRは「Quick Response」の略で、「素早く読み取れる」という意味です。
【なぜQuickなのか】
QRコードは、バーコードよりも多くの情報を格納でき、かつ高速に読み取れることを目的に開発されました。開発したのは日本のデンソーという会社で、工場での部品管理を効率化するために作られたものです。
バーコードは横方向にしか情報を持てませんが、QRコードは縦横両方向に情報を持つため、同じ面積でより多くのデータを保存できます。
【Responseの意味】
Responseは「応答」という意味で、スキャンした瞬間に情報が返ってくる(応答する)速さを強調した言葉です。現在では、スマートフォンのカメラで読み取るだけでURLを開いたり、決済ができたりするため、日常生活でも欠かせない技術になっています。
あるテレビ番組でこの開発秘話を観たことがあるのですが、現場の困りごとから生まれた技術が、今では世界中で使われるようになった経緯に驚きました。
URL - Uniform Resource Locator
URLは「Uniform Resource Locator」の略で、「統一された資源の場所を示すもの」という意味です。
【各単語の意味】
- Uniform(統一された): どのWebサイトでも同じルールで場所を示す
- Resource(資源): Webページ、画像、動画など、Web上のあらゆるデータ
- Locator(場所を示すもの): データがどこにあるかを特定する情報
例えば、https://example.com/page.htmlというURLは、「example.comというサーバーの、page.htmlというファイルの場所」を示しています。
【なぜUniformなのか】
インターネットが普及する前は、システムごとに異なる方法でファイルの場所を指定していました。URLは、世界中のどのWebサイトでも同じルールで場所を特定できるように統一されたものです。
URI - Uniform Resource Identifier
URIは「Uniform Resource Identifier」の略で、「統一された資源の識別子」という意味です。
【URLとの違い】
URIは、Web上のリソース(データ)を識別するための名前や場所の総称です。URLはURIの一種で、「場所(Location)」を示すものを指します。
もう1つの種類として、URN(Uniform Resource Name)があります。これは場所ではなく「名前」でリソースを識別するものですが、実務ではあまり使われていません。
API - Application Programming Interface
APIは「Application Programming Interface」の略で、「アプリケーション同士をつなぐ仕組み」という意味です。
【Interfaceの意味】
Interfaceは「接点」や「つなぐもの」という意味です。APIは、あるプログラムの機能を、別のプログラムから使えるようにする仕組みのことを指します。
例えば、天気予報アプリが気象庁のデータを取得する際、気象庁が提供するAPIを利用します。これにより、自分でデータを収集しなくても、必要な情報を取得できます。
【なぜProgrammingという言葉が入っているのか】
APIは、プログラムを書く開発者が使うものだからです。一般ユーザーが直接操作する画面ではなく、プログラム同士が通信するための窓口という位置づけです。
まとめ
普段何気なく使っているPDF、CSV、JSON、API、URLといった略語には、それぞれの技術が目指した目的が込められています。正式名称を知ることで、その技術がどのような場面で役立つのか、より深く理解できるようになります。