※書き溜めたものを随時貼っていく。
※試用版を使っています。
フォレストの作成
まずはフォレストの作成が必要とのこと。
Guide:Forest
フォレストって何?
フォレストの集合体がデータベースとなるらしい。
イメージ図があったけど、もう少し進めてみないとわからないな。
いったん下記で作成。細かい設定も可能なようだがまずは作る先行。
- 名前:Test
- 上限:100MB
- 権限:Read-Only
データベースの作成
Manual:Creating a New Database
マニュアルに従い、データベースを作る
- security database は推奨通り「Security」を選択
- schema databaseは一旦マニュアルと同じように「Schema」としておく。
フォレストとの関連付け
データベースにデータを登録す
東京都が公開しているオープンデータを取り込んでみる。(CSV) ※略。
平成27年度 自動車交通騒音調査結果
一連番号,測定地点の住所,環境基準類型,路線名,緯度,経度,座標系,車線数,道路種別,測定開始年月日,測定終了年月日,車道端からの距離(m),地上高さ(m),等価騒音レベル(dB)/昼間,等価騒音レベル(dB)/夜間
1,千代田区麹町4丁目5-20,C,国道20号(新宿通り),35.683782,139.736748,JGD2011,8,3,2015-12-17,2015-12-18,6.2,1.2,67,65
2,千代田区神田錦町1丁目8-11,C,都道403号[大手町湯島線](日比谷通り),35.693161,139.764912,JGD2011,4,4,2015-12-17,2015-12-18,5.6,1.2,65,62
3,千代田区外神田3丁目5,C,都道452号[神田白山線],35.701727,139.769424,JGD2011,4,4,2015-12-17,2015-12-18,2.5,1.2,66,66
-
UTF-8でないことを通知され、失敗。WarningではなくError。
ちなみに今回登録したのはSJIS(CRLF)。
-
どうやらMarkLogicは内部的にUTF-8へ変換しているらしい。
MarkLogic Server stores all content in the UTF-8 encoding
専用のコマンドラインオプションで変換がついてくるなどあるかもしれないが、追って確認する。
まさか「毎回UTF-8にエンコードしないと受け付けません」なんてことは…ないだろう多分。 -
再チャレンジ(文字コードをUTF-8へ変換した)
フォレストを読み取り専用にしていたので失敗・・・
権限を更新して再実行(all=乱暴か??)
登録したデータを参照する
MarkLogicサーバのクエリコンソールから確認できそうだ。
http://localhost:8002
その他
MarkLogicサーバーが扱うデータ形式
Creating and Configuring Forests and Databases
MarkLogic Server stores XML, JSON, XQuery, and JavaScript data in forests. App Servers connect to a database that, in turn, accesses one or more forests.
- XML
- JSON
- XQuery
- JavaScript