背景
新しい案件が始まるときに、新しい論文を読んだりモデルを検証することで頭が一杯になってしまって、結局ラインセンスの制約上使用できないということが何度かありました。
なので、今回は、もし開発しているモデルを将来商用利用する予定がある場合、どのようなライセンスに気を付けたほうが良さそうかを共有します。主なカテゴリーとして、下記の二つがあります。
- ソフトウェアライセンス
- データセットライセンス
(不足点あれば教えてください)
Open Source Software License
OSS(open source software) ライセンスの中で主に二つあります。 PermissiveとCopyleft.
Permissive Software Licenses
Permissiveライセンスが付いているソフトウェアは、ちょっとでも修正をしたり付け加えをすれば自分のものにすることができます。その中でよく見るものが下記です。
-
MIT license
著作権の表示とライセンスのテキストを貼り付けるだけで使用することができます。商用利用も可能です。 -
Apache License 2.0
MITライセンスのように商用利用は可能ですが、少しだけ制約があります。- 大きな修正がある場合は、変更箇所を明示
- ライセンスのテキストに加えて、追加で覚書等を含める必要がある
Copyleft Software Licenses
一方で、Copyleftライセンスを使用したソフトウェアを使う場合、修正をしたとしてもこのライセンスの制約が維持され続けます。下記が例となります。
-
GPLv2
”強い” copyleft に分類されて、ソフトウェア全体に制約が適用されます。 -
Mozilla Public License 2.0
”弱い” copyleft に分類されて、ソフトウェアの一部にのみ制約が適用されます。
確認方法と注意点
確認方法は、GitHubリポにアクセスして基本的に⇓の画像のように右側にあります。
今回のTensorflowは、Apache License 2.0を使用しています。
注意点として、上記に箇所に加えて必ずREADME全体も見たほうが良いです。この前あったのが、上記の流れで確認したライセンスが商用利用可能なものを使っているのに、READMEの一番下に”研究目的のためのみ”という追記があって、データセットとソフトウェアを使用できないということがありました。
Dataset License
Githubリポが使用しているデータセットも使いたいとなった場合、こちらのライセンスも確認する必要があります。全部取り上げるのは無理なので、いくつかピックアップしたものを共有します。
Public Domain
これは実質ライセンスではなくて、理由としては、このライセンスを取得するということは下記を意味します。
- データセットを公の場に寄付する
- 商用利用も含めて、誰でも何の目的に対してでも使用できる。
- 別途記載が無い限り制約はない
- データセットからすべての著作権をはく奪する
下記のようなライセンスがこのカテゴリーに該当します。
- CC0 (CC Zero)
- ODC-PDDL
Attribution
適切なクレジットを表示し、ライセンスへのリンクを提供する必要があります。下記のライセンスが該当します。
- CC BY
Non-commercial
その名の通り、商用利用ができないライセンスとなります。下記が該当します。
- CC BY-NC
- CC BY-NC-SA
- CC BY-NC-ND
参考資料
- Dataset and Software License Types You Need to Consider
- All About Open Source License
- What Is a Software License? 5 Types of Software Licenses You Need to Know About
- Common license types for datasets
Writed by F.K(20代・入社3年目)