2
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 3 years have passed since last update.

WikimediaAdvent Calendar 2020

Day 5

コモンズのカテゴリを整理してアクセス統計を取るまで

Last updated at Posted at 2020-12-04

- コモンズ利用のヒント2

コモンズにメディアファイルをアップロードする際の悩みどころのひとつにカテゴリの付け方があります。適切なカテゴリを見つけきれず、仕方なく空欄にしたり適当な名前を赤リンクで登録するといった経験をされた方もおられるのではないでしょうか。

1 コモンズのカテゴリの構造

コモンズのカテゴリの最上位には「CommonsRoot」を起点として8つのカテゴリがあり

メディアファイルのページはその配下にカテゴリで階層構造を作って置くことになっています。同じファイルでも複数のカテゴリを持てるため、階層構造の経路(パス)はひとつとは限りません。
配置する際の原則などについては「Commons:カテゴリ」を参照してください。

2 前回画像を置いたカテゴリの階層をたどってみる

前回アップロードした画像はひとまず提供元の名前を付けた「Images from NDL digital collection」というカテゴリに置きました。その経路を起点からたどると以下の通り9番目の階層に相当します。(これ以外の経路もあります)
CommonsRootCommons mediaMedia typesImagesImages by sourceImage sourcesImages from governmentsImages from the government of JapanImages from NDL digital collection

深いですねー。実はこれでもまだ浅い方です。経路も一直線ではなく分岐と合流を繰り返す、まさに迷路そのものであり、しかも経路は日々更新されています。このため不慣れな経路で階層を追って目的のカテゴリにたどり着くには何度も行きつ戻りつしなければなりません。探しづらいが故に似たようなカテゴリが別々の階層に複数作られていたりもします。

とはいえ森羅万象を表現できる美しい階層構造など、予めトップダウンでそう簡単に作れるものではありません。コンテンツの追加に合わせて逐次見直しや改善を進めるボトムアップのやり方こそが利用者参加型に適したスタイルであり、強みでもあります。完璧ではないとしても何となくこのあたり、という位置にひとまず置いたりカテゴリを作成したりしながら慣れてきたらよく分かっているあたりから少しずつ整理していく、というのがコモンズとの正しい付き合い方ではないでしょうか。

3 カテゴリの探し方

階層構造をたどるやり方に対してやはり直感的に探しやすいのは全文検索です。コモンズは原則として英語のカテゴリ名をベースに各国の同じ物事を集めているため、カテゴリ名を検索する際は基本的に英語になります。簡潔な英語表現が難しいものなどはローマ字読みで作成されていることもあります。
その探し方はいろいろありますが、ファイルやカテゴリのページには日本語での記述も多いので、検索窓で日本語や英語やローマ字で検索してとにかく類似した内容のカテゴリやファイルのページを開き、その上位や下位のカテゴリへのリンクをたどって目的のカテゴリに近づくやり方が現実的な探し方のひとつです。

4 検索用カテゴリの改善

利用者視点で考えると、芸術作品であればその提供機関を表すカテゴリ名よりも作者名など描かれた内容に着目した切り口で検索することが多いでしょう。このような場合にはファイルのページに別の切り口を示すカテゴリを追加登録します。いわば、オリジナルを保管するためのカテゴリとは別に閲覧・検索用のカテゴリを作るイメージです。
前回アップロードしたもののうち、下記画像を例にカテゴリ分類のコツに沿って追加するカテゴリの候補を挙げてみます。

  • what? / whom?(なに?):対象物。「新版画」(説明:「絵画」や「木版画」だと抽象度が高く同じカテゴリ内のページファイルが多くなりすぎて探しにくいのでより限定的な「新版画」くらいが良さそうです。これに相当するカテゴリ「Shin Hanga」を選びます。)
  • where?(どこ?): 場所。「東京都港区芝公園の増上寺」(説明:階層関係にあるものはいちばん下位の、より詳細なカテゴリを選びます。ここでは増上寺に相当する「Zōjō-ji」です。そのカテゴリページを見ると既に200件以上の画像があり、サブカテゴリもいくつかあります。そのうち「Zōjō-ji in ukiyo-e」が(浮世絵と新版画は少しジャンルが異なりますが)いちばん近いのでそこに入れることにします。「Zōjō-ji in art」くらいのカテゴリがあるとピッタリでしたが。なお、階層構造のより上位のカテゴリ、例えば「東京都」を重複して付けることは同一カテゴリツリー構造の中の複数の分岐に配置することになるため「過剰な分類」として避けるべきとされています。)
  • when?(いつ?): 製作年。「昭和6(1931)年」(年代で区切るカテゴリはいろいろありますが、ここでは場所との組合せで適度な大きさの「1931 in Tokyo」を選びます。)
  • who?(誰?): 作者。「川瀬巴水」(アーティストにはたいてい読みのローマ字表記によるカテゴリがあります。カテゴリ「Kawase Hasui」を選びます。)
  • how?(どう?): メディアの種類。「画像ファイル」(上位カテゴリで画像を表わしているのでここでは不要です。)
  • その他:上記以外にも画像に描かれている題材に着目したカテゴリもよく付けられます。

追加するカテゴリの候補をいくつか選びましたが、このうち「Shin Hanga」は「Kawase Hasui」のひとつ上のカテゴリになっていて過剰な分類に相当しますので、それ以外の3つZōjō-ji in ukiyo-e, 1931 in Tokyo, Kawase Hasuiを追加することにします。

4.1 カテゴリの追加方法

3通りのやり方を紹介します。

4.1.1 手動追加

ファイルのページを編集モードで開き、[[Category:カテゴリ名]]のように記述するとカテゴリが追加されます。

[[Category:Zōjō-ji in ukiyo-e]]と記述してみましょう。

どこに記述しても構いませんが、ここでは分かりやすく既にあるカテゴリ記述の近くに置いて「変更を公開」。

カテゴリが追加されました。クリックするとそのカテゴリページに遷移します。

いろんなアーティストの描いた増上寺が比べられて興味深いですね。

4.1.2 HotCat

単独のファイページにカテゴリを追加する場合には「HotCat」を使うのがいちばん手軽です。
1931 in Tokyoを追加してみましょう。
次で使う「Cat-a-lot」と併せて、まずガジェットを有効化します。
画面右上の個人設定>ガジェット で下記2つにチェックを入れて有効化します。

対象画像ファイルページの下部にあるカテゴリの右端にある「(+)」をクリックします。

入力欄が現れるのでカテゴリ名を入れて「OK」。

追加されたカテゴリをクリックしてカテゴリページを開くと

同年の東京の写真に並んで表示されました。

4.1.3 Cat-a-lot

カテゴリを複数のファイルページに一括して削除/コピー/移動できるツールです。前回アップロードした新版画の作者は全て川瀬巴水なのでKawase Hasuiを一括追加してみましょう。
まず一括操作したいカテゴリページに移動します。ガジェットを有効化してあるので、画面右下に「Cat-a-lot」と書かれた付箋のようなボタンが表示されています。

これをクリックすると画面右下に下記のような操作ウィンドウが開きます。この操作ウィンドウはドラッグして操作しやすい位置に動かしたり、枠線をドラッグしてサイズを変更したりすることができます。

初回は「Preferences」をクリックして必要に応じて初期設定を行います。

□Mark edits as minor(細部の編集とする)をチェックしておくと良いでしょう。設定したら「OK」。
コピー/移動先のカテゴリを、開いた操作ウィンドウ内に表示されているものから、もしくは上部の白い入力欄でカテゴリ名を直接入力して指定します。操作対象のファイルは各ファイルのリンクが張られていない箇所(ファイルサイズが表示されているあたり)をクリックすることで緑がかった黄色に変化し、選択されたことを示します。

ここでは2件を除いて全て川瀬巴水の作品なのでウィンドウ内の「Select: all」をクリック。

全て色が変わって選択状態になるので

対象外のファイル(のURLリンク以外の部分)をクリックして選択を外します。

操作ウィンドウで追加するカテゴリ名を入力して「Enter」。

操作ウィンドウを広げると「Kawase Hasui」というカテゴリが見えるので、その右端の「+」(コピー)をクリックします。見かけ上は別のカテゴリにこのファイルをコピーする動きになりますが、内部的にはファイルの数が増えている訳ではなく各ファイルにカテゴリ名が追加されているだけです。

コピーが完了しました。選択したファイルのうち、2件は既にコピー先カテゴリにあったため処理がスキップされました。「ページに戻る」で終わりです。

コピー先のカテゴリに正しくコピーされています。

このようにカテゴリ変更の一括操作は比較的簡単にできます。

4.2 下の階層にカテゴリを追加してファイル移動

カテゴリ「Kawase Hasui」にコピーした結果、カテゴリ内のファイル数は156件になりました。一覧するにはやや多すぎる件数です。元々コピーしたものは「川瀬巴水版画集」という作品集でファイルが104件あります。この作品集のカテゴリを1階層下に作りましょう。

まず対象となるファイルをひとつ選んで画面下部にあるカテゴリの「Kawase Hasui」右隣にある「(±)」をクリックすると

カテゴリ名を上書きできるようになります。

「川瀬巴水版画集」を表すカテゴリ名としてKawase Hasui Hanga-shuと入力して「OK」。

カテゴリページが未作成であることを示す赤リンクが表示されるのでそれをクリックします。編集エリアに移動してひとつ上のカテゴリとして[[Category:Kawase Hasui]]を入力して「ページを公開」。

これでKawase Hasuiの下にKawase Hasui Hanga-shuカテゴリページができました。

Kawase Hasuiカテゴリのページに戻ってCat-a-lotで該当ファイルをKawase Hasui Hanga-shuに移動します。「+」(コピー)ではなく「→」(移動)ボタンをクリックします。

目的の階層にカテゴリが作成され、104件のファイルが登録されました。

4.3 カテゴリの削除とリダイレクト

誤ったカテゴリを作成してしまった時などカテゴリを削除したいことがありますが、普通の権限では削除はできず、{{Delete}}テンプレートに削除理由を記述して権限を持った管理者によるレビュー、削除実施を待つ形になります。
<記述例>

    {{Delete
    |reason=wrong category name
    |subpage=Category:(削除するカテゴリ名)
    |day=29
    |month=November
    |year=2020
    }}

作ったばかりでまだあまり使われていないカテゴリは削除で良いのですが、時間を置いて改善のためにカテゴリ名を見直した場合などには古いカテゴリ名は残したままリダイレクトで新しいカテゴリの移転先名を記述しておき、古いカテゴリにアクセスした場合でも行き先が分かるようにします。
<記述例>

{{Category redirect|(移転先のカテゴリ名)}}

5 起源(オリジナル保管用)カテゴリの改善

一括アップロードガイドのカテゴリのところには以下のようなことが書かれています(要約)。

大まかにいえばファイルはその内容に関わる「トピック(トップカテゴリはtopics)」と出所に関わる「起源(トップカテゴリはCommons media)」の2つを持つことができます。
「起源」はさらに追跡カテゴリと情報源カテゴリに分けられ、前者はツールを使ってページビューをカウントしたりすることができます。ネットでは複製が出回りがちですが、提供機関によって寄贈されたデジタルコピーの原本として示すこともできます。従って下記のように2つのカテゴリを持つことができます。
- Media contributed by <institution>(追跡カテゴリ)
- Collections of <institution>(情報源カテゴリ)

まとめると、GLAM機関が提供している画像はCommonsRootの直下にあるトップカテゴリから以下のように複数のパスでカテゴリを設定することがガイドとして示されています。

  • topics
    -- トピックに応じたカテゴリ(作者、場所、日時など)
  • Commons media
    -- 追跡カテゴリ(二次利用を追跡するためのカテゴリ)
    -- 情報源カテゴリ(情報源を示すためのカテゴリ)

このガイドに基づいて国立国会図書館(NDL)のコンテンツに関わるカテゴリを改めて見てみます。

5.1 NDLの提供コンテンツを格納しているカテゴリ(変更前)

ざっと検索したところ、現在3つのカテゴリが使われているようです。(経路は一例です)

  1. CommonsRoot>Topics>Activities>Human activities>Art>Art by location>Art by origin>Art by country of origin>Art from Japan>Prints from Japan>Japanese prints by museum(世界中の博物館の所蔵する日本の版画)>Ukiyo-e in the National Diet Library(浮世絵が6件)
    →コンテンツの内容による分類のひとつで、日本の浮世絵(版画)を博物館ごとに階層化しています。

  2. CommonsRoot>Topics>Culture>Culture by subject>Cultural buildings>Libraries>Libraries by country>Libraries in Japan>National Diet Library>Collections of the National Diet Library(NDLコレクションを種類ごとに分類)>Prints in the National Diet Library(浮世絵、写真が混在104件)
    →コンテンツの内容による分類のひとつで、NDLが所蔵する浮世絵(版画)を図書館の切り口で階層化しています。

  3. CommonsRoot>Commons media>Media types>Images>Images by source>Image sources>Image sources by country>Image sources of Japan>Images from the government of Japan(隠しカテゴリ。大阪市立図書館所蔵作品もここにある)>Images from NDL digital collection(浮世絵が106件)
    →コンテンツの起源による分類で、政府機関の切り口で階層化しています。

5.2 NDLの提供コンテンツを格納しているカテゴリ(変更内容)

ここでは以下のような方針で整理しました。

  1. Ukiyo-e in the National Diet Library
     →NDLが所蔵する浮世絵作品のカテゴリとしてこのままにします。ただし、博物館の配下からは外し、下記2)の版画(Prints)のカテゴリの下に配置してファイルを浮世絵とそれ以外の版画作品で区別して入れ直しました。
  2. Prints in the National Diet Library
     →1)に記載した通りカテゴリの階層構造とファイルの位置を整理します。Prints(版画作品)をその種類(浮世絵、新版画、etc.)で区別して下位の階層に置きました。
  3. Images from NDL digital collection
     →起源となる画像のカテゴリとしてこのままにしました。同じ階層に「Images from the National Diet Library」カテゴリがあり、NDLの複数のコンテンツ提供サービスに由来するものが混在しています。これは本来NDL全体のカテゴリと提供サービスごとのカテゴリの2階層にしてコンテンツを整理すべきですが、使用しているテンプレートに隠しカテゴリが含まれていて、その意図するところと矛盾しないようにする必要があるため、ここでは早急に整理することは控えておきます。

6 アクセス統計

公開した側にとって、どれだけ二次利用されているのかは知りたいところです。BaGLAMa 2というツールで統計を取りたいカテゴリを登録すると、翌日くらいからその配下にあるファイルに対するページビューが検索できるようになります。なお、統計の対象はウィキメディア財団が運営するサイトに限られています。

上記は2020/12/2現在のものです。アメリカ議会図書館のコンテンツがあるカテゴリへの全ページビューは累計で37,725,882,521(377億!)回であるのに対してImages_from_the_National_Diet_Library(NDLのコンテンツの一部です)は6,951,374(7百万弱)回となっています。これは現状でNDLのコンテンツがコモンズへはまだあまりアップロードされていないことを考えると、今後の可能性を示しているものと捉えるべきでしょう。

さらに「Show」をクリックすると月別の推移(このカテゴリは10月に登録したので10月の統計値だけがポイントで表現されています)と、その下に参照しているサイトごとのページとビュー数がカウントされています。

ウィキペディア日本語版と英語版からのアクセスが多数を占めています。さらにウィキペディア日本語版の行で「Detail」を選ぶと、どのページで閲覧されているかがわかります。

内閣総理大臣の一覧、渋沢栄一など近代の人物で写真のあるものがよく閲覧されているようです。これはニーズもあるでしょうが、そもそも現時点ではこの統計対象のカテゴリ「Images from the National Diet Library」にある画像は著作権保護期間満了で肖像権的にも問題のない肖像写真が大半を占めているためだと思われます。今後アップロードされた画像の種類が増えていくと、より多様なところからアクセスされるでしょう。
さらにアクセスページ先頭の目のアイコンをクリックすると日別のアクセス情報も見ることができます。

こうしてある程度時系列で見ながらどんなコンテンツへのアクセスが多いのかを分析していくと二次利用を増やすやり方が見えてきます。一般的にはウィキペディアの記事で、その内容に適した画像を利用(表示)する形が効果的です。前回アップロードした画像の内『大根河岸の朝』というタイトルの作品に関連して、日本語版ウィキペディアの記事「八重洲」に「大根河岸」に関する記述があったのでそのあたりに画像を追加した例が下記記事です。

7 最後に

コモンズのカテゴリに関する様々な決め事にはコミュニティの知恵が集積されています。しかしながらカテゴリによる分類とウィキテキストによる表現だけでは利用やメンテナンスがなかなか厳しい状態になっています。これを改善する手がかりとして導入されたのがコモンズの構造化プロジェクトやウィキデータとの連携です。次回はそのあたりの記事を投稿予定です。

8 関連情報まとめ

関連記事

2
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?