LoginSignup
2

More than 3 years have passed since last update.

WikidataからWikipedia記事の下書きを自動生成するMbabel

Last updated at Posted at 2018-12-04

Mbabelはブラジルのウィキメディアンが開発したテンプレートで、ウィキデータに登録されたデータを元にウィキペディア記事の下書きを自動生成するもの。(オリジナルのツールページ(ポルトガル語)紹介記事(英語)

これまでウィキペディアからinfoboxの内容などをウィキデータにインポートすることはよく行われてきたが、これはその逆。ウィキデータに登録された項目でまだウィキペディア記事になっていないものを選んで、ウィキペディア記事の下書きをサンドボックス内で作成する。以後は通常のウィキペディア記事作成手順通りだ。jawikiではまだ使えないようだが、enwikiでは使えるようになっているので以下にひとつ試してみる。

喜多川歌麿の版画「婦女人相十品 文読美人」はウィキデータ上にあって(Q番号:Q18689402)enwikiに無いので、enwiki上の自分のsandboxページに以下のように記述する。頭にQの付いた数字はウィキデータ項目の識別子で、この部分を適宜入れ替えて使用する。

{{Mbabel
|1 = Q18689402
}}

これをプレビューすると以下のように赤くリンク切れ表示されるのでこれをクリック(ウィキデータ上で英語のタイトルは「Untitled」となっているのでそれが表示されている)
sandbox_preview_enwiki.png

英語記事の下書きがinfoboxや出典などとともに表示された。
Draft Untitled  Kitagawa Utamaro .png

単体記事を書くのであれば、過去に書いた記事や分野にあったひな形をコピーして使うのとさほど変わりはない。しかしながら使い方によっては2点ほどメリットが考えられる。

1.効率性
類似の記事、例えば市内の小学校の記事を全て整備しようとする時などに、

  • 主要項目をCSVで作成
  • ウィキデータに一括登録
  • Mbabelで下書き作成
  • サンドボックスで編集して正式版へ

といった流れで作業すればウィキデータとウィキペディアの双方に登録しつつ、結果的にはひとつずつ記事を書くより効率的にやれるのではないだろうか。もちろん効率だけが全てでは無いことは言うまでもない。

この手順を洗練させてウィキデータの候補項目を種類ごとにリストアップして、リンク切れに見える赤いタイトル文字のワンタッチだけで下書きを作れるようにしたのがメトロポリタン美術館の例
Wikipedia GLAM Metropolitan Museum of Art Artworks   Wikipedia.png

2.他人の文章コピペの懸念が減る
上記の実例では本文の記述が少ないが、テンプレートの作り方によっては本文もかなりの部分自動生成できることが予想される。
参考文献から事実情報(学校であれば創立年、住所、モットー、公式サイトなど)を抽出してウィキデータに登録し、それらを元に主観の混じらない文章を自動生成する、という流れはウィキペディアンなら誰でも頭の中でやっていることに相当するのではないだろうか。この部分は経験の浅い人にとっては最初の関門である。それを曖昧さなしに機械的な作業にブレイクダウンできるので、とりわけ不慣れな方には他人の文章をうっかりコピペしてしまう懸念が減るのではないだろうか。

jawikiでも使えるようになることを楽しみにしている :)

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
What you can do with signing up
2