序
@kagamiwari と申します。
「ラテン語プログラミング」という謎のアドベントカレンダーに投稿するために、この記事を書きました。
至らぬ点もございましょうがよろしくお願いします。
さてこの記事では、直接プログラミングに絡む話をするのではなく、ラテン語を計算機上でプログラミング的観点から扱う上できっと役に立つであろう、電子形式のラテン語辞書データについて記してゆきます。
初めに断らせていただきますと、この記事だけでは内容は完結しておりません。結論だけを得ようとお急ぎの方にはゴメンなさい。近日、続きを書きますので、楽しみにしていてくださいね。
なぜ、自由に使える辞書データを用意するの?
なぜ自由に使える辞書データを用意するのか?一言で答えると、便利だからです!
自然言語を対象として何らかの作業を行う際には、その言語の辞書があるととても便利です。世の中には優秀な「紙の」辞書が多数存在しますが、計算機上で扱うにはこのような紙の辞書は不便です。やはり「電子」辞書が欲しくなります。
世の中には優秀な電子辞書も多数存在しますが、一般にそのような辞書は有料です。高価です。我々プログラマという人種は、一般に吝嗇家です。読書は図書館で、あるいは(数百ページあろうとも)立ち読みで済ましてしまうというプログラマの方は多いでしょう。高価な電子辞書を購入するのはつらいことです。
とは申しましても、有料の商品を購入するというのは楽しいことでもあります。有料の電子辞書もいざ買ってみれば、きっと楽しい日々が待っているでしょう。しかし、このような辞書は一般に消費者向けに作られているものです。プログラマが有料辞書データを自身の研究・プログラミングに活用しようとすると、多数の厄介事が待ち構えています。
有料の辞書データを活用するにはまずは辞書データのフォーマットの解析が必要になったりします。また、苦労して辞書データを扱いやすい形式に変換できたとしても、そのデータを自分の研究・プログラミングに使用してもよいものかどうか、ライセンス上の問題があるやもしれません。更には、その辞書データを他者と共有して作業を行うこと、作業の成果を公表することなどなどにも、きっとライセンス上の問題があるでしょう。有料の辞書データを非営利のプログラミングに利用するのは厳しそうです。
そこで、自由に使える辞書データを手に入れましょう!というのがこの記事の趣旨です。
自由に使える辞書データはどこにある?それともイチから作るの?
素晴らしいプロジェクトが存在します!
ウィクショナリーの目的は、あらゆる言語の語句の意味・語源・用法・関連語などを記載した多機能辞典を作ることです
素晴らしいです!
内容が永久にフリー
ウィクショナリーは GFDLおよびクリエイティブ・コモンズ 表示-継承 ライセンスというライセンスを採用しています。ウィクショナリーでの著作はすべてこのライセンスの下に公開されます。これはこの辞書の内容が永久にフリーであることを意味します。
まさにうってつけです!
ラテン語のデータもあります!
これを利用させていただくことにしましょう。
…
本日はここまで。続きはまた近いうちに書きます。よろしくお願いします。