みなさん、こんにちは。
こちらは「ABEJAアドベントカレンダー2020」の23日目の記事です。
はじめに
私は、弁護士として法律事務所に所属しつつ、ABEJAで法務のサポートなどをしています。
また、JDLAのE資格を取得したので、機械学習エンジニアを名乗って少しだけエンジニア的な活動をしたりもしています。
仕事柄、AIと法律の話をすることが多いのですが、その際に私がよく質問されるのが、
① 所有権とか著作権とか特許権とか、権利がいろいろあってAIとの関係で何が問題になるかよくわからない
② データの利用が法的にOK/NGってどういう観点から検討してるのかよくわからない
③ AI開発の委託・受託のときのモデルの権利問題がよくわからない
といったものです。
そこで今日は、この3つの問題をできるだけわかりやすく、一気に解説してしまおう!という記事を書きました。
経産省の「AI・データの利用に関する契約ガイドライン(AI編)」にも少し触れながら解説します(この記事では「AI契約ガイドライン」といいます)。
長文なので、気になるところだけでも読んで参考にしていただければ幸いです!
(ちなみに、ABEJA法務にはRDチームの立ち上げ経験があり自分で機械学習モデルの開発もやっちゃう弁護士もおりまして、その弁護士が書いた「AIと公平性」の記事も絶賛公開中です!)
ということで、早速本題に入っていきましょう!
よくある質問①:所有権とか著作権とか特許権とか、権利がいろいろあってAIとの関係で何が問題になるかよくわからない
AIの開発段階・利用段階は以下のように図示することができます(AI契約ガイドライン12頁より引用)。
また、AIの開発過程で様々なノウハウが共有されますし、新たに生まれてきます。
そうすると、開発の際の契約で問題になりそうなものとしては、生データ・学習用データセット・学習用プログラム・推論プログラム・学習済みパラメータ・ノウハウといったものが挙げられそうです。
権利と聞いてパッと思いつくのは、所有権・著作権・特許権あたりでしょうか(「知的財産権」が思いついたという方もいらっしゃるかもしれませんが、知的財産権は著作権・特許権・商標権…といった権利の総称として使われる言葉なので、今回は使いません)。
そうすると、次の表の空欄を埋めることができれば「何の権利が問題になるか」という疑問には答えられそうです。
空欄の中身がわかりますか?
それでは、空欄を埋めるべく、所有権・著作権・特許権を簡単に解説したいと思います。
(1) 所有権
答えから言うと、上記の表では所有権はいずれも発生しません!
なぜなら、所有権は「有体物」に生じる、とされているからです(民法206条→85条を読んでいただけるとわかります)。データやプログラムといったものは有体物ではないので、これらには所有権は生じない、ということです。データが記録媒体に保存されている場合、記録媒体を所有していても、中身のデータを所有している、とは言えません。
ということで、所有権の部分の答えは以下のようになります。
(2) 著作権
所有権とは異なり、著作権は、基本的に無体物に発生します。著作権は、「思想又は感情を創作的に表現したもの」に発生しえます。
著作権は、絵画や音楽などに加え、創作性のある文章や写真、プログラムにも発生しえます。
したがって、例えば学習につかう生データが、誰かが書いた文章や誰かが撮影した写真などであった場合、当該データには著作権が発生している可能性があります(他方、機械的に取得した数値データや機械的に撮影した写真などには、基本的に著作権は発生しません。また、パラメータにも発生しません)。
学習用プログラムや推論プログラムのソースコードにも、著作権が発生しえます。
ということで、著作権の部分の答えは以下のようになります。
(学習用データセットについては、△としていますが、「データベースの著作物」という解説しだすとややこしい問題があるので、ここでは省略します。)
ここで、「著作権が発生する」ということの意味を少しだけ解説します。
著作権は、よく「権利の束である」と言われます。どういうことかというと、著作権を持つと、著作物をコピーしたり(複製権)、Qiitaで公開したり(公衆送信権)、編集したり(翻案権)、といったことができるようになりますし、他人が無断でそういった行為をしていたらやめるように求めることができます。
著作権は、こういったいろいろな権利を束にしたものなのです。
所有権が、所有する「物」を支配する権利であるのに対し、著作権が無体物である創作に対する権利であることが何となくイメージできましたでしょうか?
例えば、絵画を例に挙げると、物体としての「絵」には所有権が生じ、無体物としての「絵」(これは見た感じでは物体としての絵と一体となっています)があります。物体としての絵が盗まれた場合には、所有権に基づいて返還請求をしますが、似たような絵を描いて販売しているのをやめさせたい場合には、基本的に所有権では対応できません(物体としての絵を奪われたわけではないため)。この場合には著作権を根拠に、似たような絵の作成をやめるよう請求することになります。
(3) 特許権
特許権は、発明をした場合に、当該発明を出願し、登録されることで効力を生じる権利です。
著作権は著作物ができれば同時に発生しますが、特許権は出願し、登録されないと発生しないという点が一つの特徴です。
では、特許権はどういったものに生じるでしょうか。
特許権は発明である必要があるので、生データといった単純なデータには生じないのが通常です。
学習用プログラムについては、純粋にAIのモデルのみの開発を行う(周辺のシステムなどは含まない)場合を考えると、アルゴリズムについての発明に特許権が成立する可能性があります(有名な発明としては、Googleのバッチノーマライゼーションがありますね。バッチノーマライゼーションは日本・米国等においてすでに特許として登録されています。こういった、GAFA等による重要特許の取得についても語りたいことはたくさんあるのですが、ここでは書ききれないのでまたの機会にします)。
ということで、特許権の部分の答えも埋まりましたね!
(4) 権利が発生しないものもある?
と、ここで気になる点が出てきたのではないでしょうか?
それは、全てが×(要は所有権・著作権・特許権のいずれも発生しえない)のものがあるということです。例えば、創作性のない生データや学習済みパラメータがそうですね。学習済みパラメータは、重要な情報ではありますが、創作性のない単純な行列の値なので著作権も特許権も基本的に生じないと考えられています。
こういった、「何も権利が生じていない情報」は何か保護がされるのでしょうか?
答えは「保護はされない」となります(ここでは割愛しますが、「営業秘密」「限定提供データ」などの例外はあります)。
つまり、権利が発生しない情報をうっかり第三者に渡してしまった場合、第三者が情報をどう扱おうと、基本的になにも文句は言えないということになります。
それは困る!ということで出てくるのがNDAなどの秘密保持条項です。秘密保持条項では、通常、
・情報を●●という目的以外には使ってはならない(目的の限定)
・第三者に開示してはならない(対象者の限定)
・複製してはならない(利用態様の限定)
といった制約が置かれていますが、これは、権利が発生しない情報を守る、という効果もあるのです(情報授受の前にいちいちNDAを締結するのは面倒ですが、実はすごく重要だということがお分かりいただけるかと思います)。
(5) まとめ
ということで、いったんここまでのポイントをまとめます。
まず、この図は重要ですね。
その他、以下の点が重要です。
- 所有権は有体物にしか生じないため、データやプログラムには生じない。
- 著作権・特許権は無体物に生じる。
- 著作権は創作と同時に発生するが、特許権は登録しないと発生しない。
- 著作権は権利の束。著作権を持っていると、複製、公表、編集など様々なことができる(著作権を持っていないとできない)。
- 所有権・著作権・特許権などの権利が発生しない情報もある。そのような情報を保護するには、開示する際に契約を締結して制限をかける必要がある。
よくある質問②:データの収集・利用が法的にOK/NGってどういう観点から検討してるのかよくわからない
(1) データの収集方法ごとの検討
機械学習では、まずデータを収集する必要があります。
データの確保には様々な方法がありますが、①自社で用意する、②特定の企業からデータを買う、③公開されているデータセットを使う、④不特定多数から収集する、といった方法が考えられますので、順にみていきましょう。
① 自社で用意する場合
①自社で用意する場合の例はたくさんありますが、例えば、不良品検知のAIを作るために、自社製品の写真を大量に準備する、といったことが考えられます。この場合、準備した画像は(おそらく機械的に撮影するでしょうから)通常は創作性がなく、著作権は発生しなそうですね(生データに著作権が発生するかどうかは、データの創作性の有無によって異なってくることを先ほど説明しました。)。利用にあたっても、特に法的な障害はなさそうです。
② 特定の企業からデータを買ってくる場合
②特定の企業からデータを買ってくる場合には、売主の企業が権利を持っていることを確認して、権利ごと譲ってもらえば大丈夫そうです。また、権利は売主に残しつつ、学習に使うことを許可してもらう形でも良さそうです。
要は、締結する契約の内容次第ということですね。
実は、データの取引についても経産省からガイドラインが出ています(「AI・データの利用に関する契約ガイドライン(データ編)」)。興味がある人は見てみてください。
③ 公開されているデータセットを使う場合
③公開されているデータセットを使う場合には、利用条件が設定されている場合が多いです。
例えば、有名な画像のデータセットであるCOCOでは、Creative Commons Attribution 4.0 LicenseのBYという要素が採用されており、原作者のクレジット(氏名、作品タイトルなど)を表示することが要求されています。このようなデータセットの利用条件は、データをダウンロードした時点で利用条件に同意した(=契約した)と解されるため、データ提供者と受領者との間での契約という形で当事者を規律します。契約上の義務として利用条件がかかってくるという構造はNDAとも同じですね(②特定の企業からデータを買ってくる場合も同様です)。
要は、設定している利用条件を検討する必要があるということになります。
④ 不特定多数から収集する場合
④不特定多数から収集する場合には、どういった点が問題になるでしょうか?
例えば、クローリング・スクレイピングにより風景画像を収集して学習に使いたいと思った場合を考えてみましょう。
収集した風景画像はいろんな人が撮影したものなので、著作権が発生しています。そして、学習に使おうとすると、画像をコピーして、リサイズ等の前処理やアノテーションをする必要がありますが、これは複製権や翻案権を侵害しそうです。また、著作権者に許諾を得ようにも誰が著作権者かがわかりません。
でも、実はこのような行為は著作権を侵害せずに行い得ます。
日本の著作権法が「機械学習パラダイス」と呼ばれていたりするのをご存じの方もいらっしゃるかもしれませんが、著作権法30条の4という条文で、機械学習のような情報解析の目的では、一定の場合に著作物を利用できるとされているからです。
この著作権法30条の4は、2019年1月1日施行の改正著作権法で改正されたもので、(改正前から機械学習パラダイスといわれていたのですが)より機械学習パラダイスな条文になっています。
ちなみにABEJAでは、2019年2月にRPAテクノロジーズ様と提携し、改正法で初めて可能になったワンストップのデータセットクローリングサービスを展開しています。サービス開始時のプレスリリースでは、プレスリリースとしては珍しく、かなり詳細に改正法の解説をしました。
著作権法30条の4の内容が気になる方は是非プレスリリースを読んでみてください。
不特定多数人からデータを収集するケースとして、もう一つ、街頭にカメラを設置して人の顔画像を収集する場合を考えてみましょう。カメラから機械的に取得される画像は基本的に著作物ではありませんが、この場合は、個人情報保護法やプライバシー・倫理という別の観点の制約に留意する必要があります。
このように、データの収集や利活用を行う場合には、個人情報保護法などの法令や、プライバシー・倫理といった観点からの検討が必要な場合があります。
(2) まとめ(データの収集・利活用の際のチェックポイント)
- 契約によってデータ利活用が制限されないか
- 個人情報保護法などの法令等によりデータ利活用が制限されないか
※ データの中に第三者の著作物が含まれていても、適法に利活用しうる
よくある質問③:AI開発の委託・受託のときのモデルの権利問題がよくわからない
(1) 学習用プログラム・推論プログラムと著作権
モデル開発の委託/受託では、学習用プログラム、推論プログラム、学習済みパラメータといったものについて、開発フェーズで納品されることが多いかと思います。
下図のとおり、学習用プログラム・推論プログラムには著作権が発生しますが、学習済みパラメータにはこういった権利は発生しません。
この記事では、特に重要な、著作権が生じる学習用プログラム・推論プログラムについて解説をしたいと思います。
納品予定の学習用プログラム・推論プログラムの著作権について契約で定める場合、①著作権をどちらに帰属させるか(権利帰属)、②双方がどういった条件で利用できるようにするか(利用条件)の二段階の検討が必要です。
(2) 著作権の権利帰属
まず、著作権がユーザ・ベンダのどちらに帰属するかを決める必要があります。
ユーザ帰属、ベンダ帰属、ユーザとベンダの共有、といった選択肢があります。
後述の利用条件のところでも述べるとおり、あまり「どちらに帰属させるべき」という定式はありませんが、
- ベンダがライセンスフィーで利益を得るようなビジネスモデルの場合には著作権の帰属にこだわることが多い
- ユーザが開発手法等についても主導権をもって開発を進め、ベンダの裁量が狭いような場合にはユーザに著作権を帰属させることも多い
- ユーザ・ベンダが協業して完成したモデルを売っていくような場合には共有にすることも多い
といった大まかな傾向はあるかもしれません。
ちなみに、権利帰属について契約で何も決めない場合は、基本的には、プログラムを生成したベンダに著作権が帰属します。
(3) 利用条件
所有権の対象(有体物)は、基本的に「一人しか対象物を利用できない」ことになりますが、著作権の対象(無体物)は多数の人が同時に利用可能です。
例えば、家は有体物で所有権の対象とりますが、
- 所有者が住む
- 所有者は使わずに賃借人に住まわせる
といった程度の選択肢しかありません。
他方、著作権の対象となるもの(たとえばプログラム)であれば、
- 著作権者だけが使う
- 著作権者も使うが、公開して世界中の人にも使わせてあげる。
- 著作権者は使わず、もっぱら知り合いに使わせてあげる。使うだけでなく、改良することも許可する。知り合いが改良版を公開したいといったので許可する。
といった、様々な使い方があります。
先ほど、著作権は「権利の束」だと説明しました。
この束のなかで、どの部分を許可するかを自由に決めることができるのです(a)。
例えば、
・複製は自由に許す
・貸与することも許すが、お金の支払いなどの条件を付ける
・翻案(編集)も許すが、編集できる範囲を制限する
・複製・貸与・翻案以外は禁止
といった具合です。
また、これも重要な視点ですが、著作権者の権利を契約によって制限することもできます(b)。
著作権者の権利を全部制限し、他方で第三者に広い範囲でライセンスを付与するような場合には、もはやライセンスを付与される第三者が著作権を持っているのとあまり変わらない状態にもなり得ます。
「権利をどちらに帰属するか」も重要ですが、「利用条件をどのように設定するか」が重要なことがお分かりいただけたでしょうか。
では、利用条件はどういった要素に着目して定めればよいでしょうか。
この点については、経産省のAI契約ガイドラインの次の表が参考になります(AI契約ガイドライン31頁)
例えば、
・著作権はベンダ帰属
・ユーザは自己の業務に必要な範囲で、無償・無期限の非独占的な利用の許諾を受ける
・ベンダは基本的に自由に使えるが、ユーザの競合企業である●●社には横展開してはならない
といった条件を定めることが考えられます。
このような条件を決めたら、上記の表を「別紙」として契約書につけて、「別紙の条件で利用します」という趣旨の条項に落とし込めばOKです!(この表をいい感じに完成させて法務にもっていけばいい感じに契約に落とし込んでくれるはずです!)
以下はAI契約ガイドラインを参考にした規定例です(AI契約ガイドライン114~118頁参照)。
第●●条(本件成果物の著作権)
1.本件成果物および本開発遂行に伴い生じた知的財産(以下「本件成果物等」という。)に関する著作権(著作権法第 27 条および第 28 条の権利を含む。)は、ユーザまたは第三者が従前から保有していた著作物の著作権を除き、ベンダに帰属する。
2.ユーザおよびベンダは、本契約に従った本件成果物等の利用について、他の当事者および正当に権利を取得または承継した第三者に対して、著作者人格権を行使しないものとする。
第●●条(本件成果物の利用条件)
ユーザおよびベンダは、本件成果物等について、別紙「利用条件一覧表」記載のとおりの条件で利用できるものとする。同別紙の内容と本契約の内容との間に矛盾がある場合には同別紙の内容が優先するものとする。
「著作者人格権」などの難しい表現は一旦さておき、何となくイメージを持っていただけたのではないでしょうか。
(4) 契約の落とし穴
最後に、契約締結の際に陥りがちな落とし穴を二つほど紹介します。
落とし穴①:「著作権共有」
著作権の帰属について、ユーザもベンダも譲らず決着がつかない…といった場合には、折衷案として著作権をユーザ・ベンダの一方に帰属させず、「共有」とすることもあるかと思います。また、共同開発のような場合にも共有とすることもあるでしょう。
この場合、「共有にしたからお互い自由に使える」と思っていませんか?
著作権法65条1項・2項を見てみましょう。
(共有著作権の行使)
第六十五条 共同著作物の著作権その他共有に係る著作権(以下この条において「共有著作権」という。)については、各共有者は、他の共有者の同意を得なければ、その持分を譲渡し、又は質権の目的とすることができない。
2 共有著作権は、その共有者全員の合意によらなければ、行使することができない。
条文をみると、著作権の行使は「他の共有者の合意」が必要とされています。
つまり、「●●に使っていいよ」という合意を逐一得ないとなにもできない、ということですね。
ですので、共有にする場合には、同じ契約で「●●に使っていいよ」という合意を得ることが重要です。
AI契約ガイドラインの契約書案でも、共有にする場合にはちゃんとこの「合意」についての規定があります(114頁)。
ちょっと長いですが、条文を貼っておきます。
第●●条(本件成果物等の著作権)
1.本件成果物および本開発遂行に伴い生じた知的財産(以下「本件成果物等」という。)に関する著作権(著作権法第 27 条および第 28 条の権利を含む。)は、ユーザのベンダに対する委託料の支払いが完了した時点で、ユーザ、ベンダまたは第三者が従前から保有していた著作物の著作権を除き、ベンダおよびユーザの共有(持分均等)とする。なお、ベンダからユーザへの著作権移転の対価は、委託料に含まれるものとする。
2.前項の場合、ユーザおよびベンダは、共有にかかる著作権につき、本契約に別に定めるところに従い、前項の共有にかかる著作権の行使についての法律上必要とされる共有者の合意を、あらかじめこの契約により与えられるものとし、相手方の同意なしに、かつ、相手方に対する対価の支払いの義務を負うことなく、自ら利用することができるものとする。
3.ユーザ及びベンダは、相手方の同意を得なければ、第 1 項所定の著作権の共有持分を処分することはできないものとする。
4.ユーザおよびベンダは、本契約に従った本件成果物等の利用について、他の当事者および正当に権利を取得または承継した第三者に対して、著作者人格権を行使しないものとする。
落とし穴②:「協議によって定める」
著作権の帰属について、ユーザもベンダも譲らず決着がつかない…という場合には、帰属について定めることをあきらめて「協議によって定める」といった規定がされることもあります。
しかし、これは当事者にとってリスクが残る契約といえます。
著作権の帰属について何も定めなかった場合には、著作権は開発を行った側、すなわちベンダに帰属します。
そうすると、ユーザとしては、「協議によって定める」場合に協議がまとまらないと、権利を得られないことになります。また、利用許諾も得ていないと、せっかくできたモデルを何も使えない、ということになってしまいます。
ベンダとしても、例えばユーザに有償でライセンスして利益を得ようと思っていた場合、「協議」がまとまらないと結局このようなも目論見が外れてしまい、せっかく作ったのにお金にならない、、となりかねません。
したがって、権利帰属をペンディングにして「協議によって定める」ということは避けるべきです。
同様のことは、開発PJ開始時に権利帰属について定めていない場合にも妥当することがあります。
すなわち、アセスメント・PoCと個別に契約を締結して進めてきたものの、開発フェーズに入って初めてモデルの権利帰属を議論したところまとまらない、といった事態が生じうることがあります。
これはどうすれば防げたかというと、アセスメント開始時に、開発PJ全体に適用される「基本契約書」と締結し、そこでモデルの権利帰属について定めておけばよかった、ということになります。
ただ、開発PJ初期で開発対象が明確に決まっていないことも多く、そういった場合に無理して権利帰属の議論をすることは避けた方がよい場合もあり、どういった形の契約を締結するかは案件ごとに判断した方がよいです。
(5) まとめ
- 学習用プログラム・推論プログラムには著作権が発生する。
- 権利帰属と利用条件の二つを決める必要がある。
- 利用条件を考える際には、AI契約ガイドライン31頁の表が参考になる。
- 著作権を共有にする場合には、行使についての合意をしておく。
- 「協議によって定める」といった条項は避けた方がよい場合が多い。
最後に
いかがでしたでしょうか?
今回、初めてQiitaに記事を投稿させていただいたのですが、これまでAIの開発契約を数多く見てきた中で、「技術者・ビジネスサイドと法務がもっと理解しあっていればもっとスムーズに契約交渉が進むのに…」と思ったことが数多くありました。また、技術者が法的なところで疑問を持っているが適切な相談相手がまわりにいない、という場面を見かけることもありました。
この記事が、少しでもそのような問題の解決の一助になれば、と思っております!
かなり長文になってしまったので、最後まで読んでくださった方はいるのだろうか。。。という気もしますが、
今後も記事を更新していくかもしれませんので、疑問点などあればお気軽にコメントなどしていただけますと幸いです!
最後までお読みいただき、ありがとうございました。
※※※※※※※
・この記事のうち意見にわたる部分は私の個人的な見解でであり、私が所属する組織の見解ではないことにご留意ください。
・この記事は一般論を述べたものであり、具体的ケースのご判断の際には専門家にご相談ください。
・この記事はわかりやすさに重点を置いたため、厳密には不正確な表現となっている部分もあることにもご留意ください。
※※※※※※※