はじめに
UiPathでXMLファイルの形式を扱うことが多くなったことをきっかけに、
ゼロからXMLを勉強しようと思ったので、メモとして残します。
今回の学習メモ
今回勉強した内容です。
箇条書きでまとめています。
XMLの特徴
-
XML(Extensible Markup Language)の略称
-
W3C(World Wide Web Consortium)により勧告されるメタ言語で「拡張可能なマークアップ言語」の訳
- W3CはWWWで利用される技術の標準化を推進する団体。マサチューセッツ工科大学など大学や研究所、企業などが集まって1994年10月に発足。
- W3Cでは
- 作業ドラフト
- 勧告候補
- 勧告案
- 勧告
の手順で標準化作業が進む。XMLでは現在のVer1.0が1998年に勧告された。
-
「XMLはメタ言語」といわれるが、この意味は「言語を作ることができる言語」という意味。
-
「マークアップ(文中につける印)」を使い、文章やデータの中に、別の情報を埋め込む言語」をマークアップ言語と呼ぶ。
-
XMLは「自分で文中につける印を拡張し、言語(仕様?)を作る言語ということになる。
SGMLやHTMLとの関係
-
XML以前にも同じ目的でSGML(Standard Generalized Markup Language)というメタ言語が存在したが、あらゆる用途に使えるようにと考えられたため、非常に複雑で扱いづらいものだった
-
その後インターネットのWebページを記述する言語であるHTML(Hyper Text Markup Language)がSGMLから作られ、W3Cに勧告された
-
しかしHTMLは
- 複数の文字コードがエンコードできない
- 大文字と小文字を識別しない
- 使用できるタグが固定されている
- 終了タグのないものや省略できるもの、独自に拡張されたものがあり使用が不安定
という問題があり、様々なデータを文書中に埋め込むのは難しかった
-
そこでSGMLの部分集合として不要と思われる機能を削除し、「インターネットで扱いやすい言語」としてXMLというメタ言語が開発されることとなった
-
現在はXMLで定義されたHTML(XHTML)もW3Cにより勧告されている
データ形式
- XMLのデータは「XML文書」と呼ばれ、テキストデータで構成されている(XMLの文書ファイルはテキストファイル)→インターネットでやり取りがしやすく、直接エディタなどで内容を表示・編集することができる
- XMLがプラットフォーム(OS・実行環境)に依存しない、柔軟なデータ交換に利用できる
XMLの応用
- XMLの応用として、
- 社内文書
- 仕様書
- マニュアル
- 製品カタログ
などの文書データや、 - 顧客情報
- 受発注などのDB
- アプリケーションのデータ
などすべてのデータをXMLで置き換えることが考えられている
(実現すれば不特定多数の企業間による相互データ連携がインターネットを通じて可能になると考えられているため)
おわりに
続きはまた今度書きます。