AI・データの利用に関する契約ガイドライン
AI・データの利用に関する契約ガイドライン
AI・データの利用に関する契約ガイドライン
- AI 編 -
目 次
(0) x x x x x 0000 等 と の 関 係 7
5 本 ガ イ ド ラ イ ン ( デ ー タ 編 ) と の 関 係 8
(1) AI( 人 工 知 能 ・ Artificial Intelligence) 9
(3) 機 械 学 習 ( マ シ ン ラ ー ニ ン グ ・ Machine Learning) 9
(1) 従 来 型 の ソ フ ト ウ ェ ア 開 発 と の 違 い 11
3 想 定 す る AI 技 術 の 実 用 化 の 過 程 11
(4) 学 習 段 階 お よ び 利 用 段 階 の 関 与 者 17
4 AI 技 術 を 利 用 し た ソ フ ト ウ ェ ア 開 発 の 特 徴 18
(1) 従 来 型 の ソ フ ト ウ ェ ア 開 発 と 比 較 し た 特 徴 18
(2) 学 習 済 み モ デ ル の 特 性 を 理 解 す る こ と の 重 要 性 22
1 AI 技術を利用したソフトウェアの開発・利用をめぐる契約の現状 23
(1) 各 当 事 者 の 立 場 や 考 え 方 の 違 い 24
(2) 当 事 者 間 で 問 題 が 生 じ う る 事 項 24
(1) 知 的 財 産 x x に 関 す る 整 理 25
(2) x x 帰 属 ・ 利 用 条 件 の 設 定 27
(2) 排 他 条 件 付 取 引 ・ 拘 束 条 件 付 取 引 等 36
第 4 AI 技 術 を 利 用 し た ソ フ ト ウ ェ ア の x x x 約 38
1 AI 技 術 を 利 用 し た ソ フ ト ウ ェ ア の 開 発 と は 38
(1) ソ フ ト ウ ェ ア の 一 般 的 な 開 発 方 式 41
(2) 学 習 済 み モ デ ル 生 成 に 適 し た 開 発 方 式 42
(2) 契 約 に お け る 交 渉 の ポ イ ン ト と 留 意 点 49
2 学 習 済 み モ デ ル の 利 用 サ ー ビ ス 61
(2) サ ー ビ ス の 利 用 方 式 と 提 供 形 態 62
(1) 学 習 済 み モ デ ル の カ ス タ マ イ ズ 63
2 学 習 済 み モ デ ル の 生 成 ・ 利 用 で 問 題 と な り 得 る 事 項 68
3 各 モ デ ル 契 約 の 前 提 や 留 意 点 78
(1) ア セ ス メ ン ト 段 階 : 秘 密 保 持 契 約 書 78
(2) PoC 段 階 : 導 入 検 証 契 約 書 78
(3) 開 発 段 階 : ソ フ ト ウ ェ ア x x x 約 書 78
4 ア セ ス メ ン ト 段 階 の 秘 密 保 持 契 約 書 ( モ デ ル 契 約 書 ) 80
6 | 開発段階のソフトウェア開発契約書(モデル契約書) | 102 |
第8 別添 | 総括 作業部会で取り上げたユースケースの紹介 | 139 |
第 1 総 論
本ガイドライン(AI 編)は「AI1技術(人間の行い得る知的活動をコンピュータソフトウェアに行わせる一連のソフトウェア技術)」を利用するソフトウェアの開発・利用を促進する等の観点から、AI 技術を利用したソフトウェアの開発・利用に関する契約の基本的な考え方を解説したものである。
1 目 的
現在、主に機械学習を利用した AI 技術 2が実用化段階に入り、多くの企業が AI 技術を利用したソフトウェアの開発・利用に取り組み始めている。今後、AI 技術が社会に広く普及していくことが想定される。また、AI 技術によって、利便性・生産性の向上や今までは対応しきれなかった少子高齢化等の社会的・構造的課題への対応が可能になることが期待されている。
しかし、AI 技術を利用したソフトウェアの開発・利用に関して、権利関係をどのように処理すればよいのか、開発・利用に伴って発生し得る責任を誰が負うのかといった法律問題は新しい問題であり、法律が整備されていないため不明確な点も多い。
このような状況においては、当事者間で契約を締結することによって権利関係や責任の分担を定めておくことの必要性が高い。
もっとも、AI 技術の基本技術思想は、データから結論を推論する帰納的なものであり、従来型の演繹的なソフトウェアの基本技術思想とxx的に異なっている。
このような違いから生じる AI 技術を利用したソフトウェアの開発、典型 的には学習済みモデルの生成における、従来型のソフトウェア開発と比較 した特徴として、①学習済みモデルの内容・性能等が契約締結時に不明瞭な 場合が多いこと、②その内容・性能等が学習用データセットに依存すること、
③その生成に際して特にノウハウの重要性が高いこと、および④各種生成物について更なる再利用の需要が存在すること等が挙げられる。
また、当事者に目を向けると、データが必要となることが多い AI 技術を利用したソフトウェアの開発にあたっては、その開発を依頼する者(以下
「ユーザ」という。)は、データやノウハウを提供することによって、それらの価値が低下することや情報が流出することを懸念する立場にある一方で、AI 技術を利用したソフトウェアを開発する者(以下「ベンダ」という。)は、知的財産がユーザに移転することで自らの事業の自由度が奪われることやノウハウの流出を懸念する立場にある。
しかし、このような AI 技術の特性や、相手方の立場についての理解が広く社会に浸透しているとは言い難い。その結果、契約交渉において、当事者が自らの権利の確保に固執したり、相手に AI 技術の特性やデータ・ノウハウの価値を無視した、現実的ではない要求をすることによって、契約交渉が難航して契約が不成立となったり、当事者の事業の自由度が過度に制約されイノベーションが妨げられてしまうおそれや、契約締結するにあたって、
1 「AI」とは「Artificial Intelligence」の略称であり、日本語では「人工知能」と訳される。もっとも「AI」に確立した定義は存在しないのが現状である。詳細は、後記第 2-1-⑴で解説する。
2 機械学習は、AI に関連する技術の一つにすぎない。もっとも、便宜上、本ガイドライン(A I 編)では、機械学習のみを意味して、「AI 技術」という表現を使用することがある。詳細は、後記第 2-1-⑵で解説する。
当事者の労力・時間といったコストが高くなるおそれがある。
このようなことになれば、AI 技術の開発・利用が阻害され、ひいては我が国の産業競争力が失われたり、社会的・構造的課題の解決が困難となるといった結果をもたらしかねない。
そこで、本ガイドライン(AI 編)は、AI 技術を利用したソフトウェアについて、その特性を踏まえた上で、開発・利用契約を作成するにあたっての考慮要素、トラブルを予防する方法等についての基本的な考え方を提示する。それによって、当事者の双方が納得する合理的な契約を締結するための情報を提供し、契約プラクティスを形成する一助となることで、AI 技術を利用したソフトウェアの開発・利用を促進することを目的としている。
なお、本ガイドライン(AI 編)は、契約についての基本的な考え方を提示するものにすぎず、何ら法的な拘束力を有するものではなく、また、当事者の契約の自由を何ら制約するものではないことを念のため付言する。
2 問題の所在と解決方法
AI 技術を利用したソフトウェアに関する法的問題は、AI 技術が産業利用可能な技術として近年急速に発展・普及してきたため、①AI 技術の特性を当事者が理解していないこと、②AI 技術を利用したソフトウェアについての権利関係・責任関係等の法律関係が不明確であること、③ユーザがベンダに提供するデータに高い経済的価値や秘密性がある場合があること、④AI技術を利用したソフトウェアの開発・利用に関する契約プラクティスが確立していないことに主に起因していると考えられる。以下、これらの問題の所在と、これらの問題を本ガイドライン(AI 編)によってどのように解決していくことを目指すかについて述べる。
(1) 問題の所在
① AI 技術の特性を当事者が理解していないこと
AI 技術がどのような技術なのか、どのような特性を有しているのかについて、現時点ではまだ共通の理解と認識が形成されておらず、そのような中では、当事者の意見の食い違いや誤解が生じ、トラブルが発生しやすい。
詳細については、後記第 2-4 のとおり、AI 技術を利用したソフトウェアと従来型のソフトウェアの開発における違いとして、たとえば、成果物(後述する学習済みモデル)の精度が、学習に利用するデータに大きく依存するため、開発の初期段階で、どのような成果物が完成するか予測することが、原理的に困難なことが挙げられる。
このような AI 技術の特性が理解されていない結果、成果物の性能保証等をめぐって、ユーザとベンダとの間で決着がつかない議論が展開されるおそれがある。
② AI 技術を利用したソフトウェアの権利関係・責任関係等の法律関係が不明確であること
AI 技術の急速な発展・普及に法律が追い付いていないため、AI 技術を利用したソフトウェアに関する権利関係や責任関係について、法律によって明確にされていない部分が多い。
権利関係については、たとえば、学習済みモデルを構成する学習済み
パラメータについて著作権が生じるか否かという点について、確立された解釈は存在していない。
責任関係については、たとえば、ユーザがデータを提供しベンダが開 発した AI 技術を利用したソフトウェアが第三者に損害を与えた場合に、その損害がデータに起因するのか、プログラムに起因するのかについ ての判断は容易ではなく、民法等の法律の規定によって、ユーザとベン ダがどのように損害賠償責任を分担することになるかについては明確 ではない。
このように法的関係が法律によって明確に示されていない場合、当事者の予測可能性が担保されていないため、開発・利用に対して消極的となってしまうおそれがある。また、契約締結交渉において、お互いに責任分担を押し付けあう結果、交渉がまとまらずに契約が不成立となることも考えられる。さらに、実際にトラブルが生じた場合、それを解決するための指針がないため、問題解決が困難となる。
③ ユーザがベンダに提供するデータに高い経済的価値や秘密性がある場合があること
精度が高く競争力のある AI 技術を利用したソフトウェアを開発するためには、一般的には学習のための高品質で大量のデータが必要である。AI 技術を利用したソフトウェアの開発においては、開発期間の前半には、データの取得と加工に時間と労力をかけることも多い。このように AI 技術を利用したソフトウェアの開発は、データとセットで考える必要があり、開発に必要なデータは、ユーザからベンダに提供されることが一般的である。
ユーザからベンダに提供されるデータは、ユーザが、多大な労力と費用をかけて入手したものであったり、顧客データ、生産管理データ、ノウハウが化体したデータ等、企業としての競争力の源泉となる経済的価値や秘密性があるデータである場合もある。
ユーザとしては、このようなデータを提供することによって、データやノウハウが外部に流出してしまい、企業としての競争力を失ったり、秘密保持義務違反や個人情報保護の問題が生じることを懸念することも多い。また、ユーザとしては、提供したデータから生成された学習済みモデル等の開発の成果物は、自らが提供したデータの上に成り立っていると考える傾向にある。
他方で、ベンダは、たとえば、学習済みモデルに含まれる学習済みパラメータから提供された生データを読み取ることは一般的に困難であることから、情報流出の懸念はないと考える傾向にある。また、ベンダには、学習済みモデルの利活用を図るという観点から、ユーザのデータを使って学習した学習済みモデルを、そのユーザ以外の第三者にも提供したいというニーズがある。
そこで、かかるユーザのデータに対するニーズと、ベンダの成果物の利活用に対するニーズをどのように調整するかが問題となる。このような問題は必ずしも AI 技術を利用したソフトウェア特有のものではないが、学習用データセットにその性能が大きく依存する学習済みモデルの生成において、特に先鋭化しやすい状況にあるといえる。
④ AI 技術を利用したソフトウェアの開発・利用に関する契約プラクティスが確立していないこと
AI 技術を利用したソフトウェアの開発・利用に関する契約については、契約当事者の知識・経験も十分に形成されておらず、AI 技術を利用したソフトウェアの有する特性、データ・ノウハウの価値、相手方の立場について十分に理解されないままに契約交渉が行われていることも少なくない。
そのような状態では、権利関係や責任の所在について、当事者が現実的ではない要求を押しつけたり、逆に過度に防衛的になることで、当事者間で話が平行線をたどって契約がまとまらないことも考えられる。そうなると、AI 技術の開発・利用が阻害されたり、AI 技術の開発・利用の範囲が限定されてしまう。また、契約条項に誤解や見落としがあるままで契約を締結したために、トラブルが発生した際の解決コストが高くなってしまうリスクもある。
しかも、このような状況を打破するための利益調整の解決方法も広 く知られていない。そうなると、ユーザ等のデータの提供者は、データ やノウハウの価値が下がることや外部流出してしまうことを懸念して、データを外部提供することに躊躇してしまう。他方で、ベンダ等のデー タの受領者は、データ提供者に AI 技術に関する知的財産権やノウハウ を奪われてしまうことや、トラブルが発生したときに過大な責任を負 わせることになることを懸念して、開発やサービス提供に対して消極 的となってしまう。
このような状況のままでは、AI 技術の開発・利用が阻害されてしまい、AI 技術が社会にもたらす様々なメリットを人々が享受できなくなってしまうおそれがある。
(2) 解決方法
上記の問題に対して、本ガイドライン(AI 編)は次の方法によって解決することを目指している。
① AI 技術の特性を当事者が理解していないこと
また、AI 技術の特性は、契約による当事者間のリスク分配を直ちに決するものではなく、あくまでも、リスクの評価の一要素にすぎない。この点については、AI 技術に関する契約であっても、既存の契約となんら変わらない。
たとえば、事業上は、学習済みモデルの生成やこれを利用したサービスの対価の支払いを一定の結果や KPI4の達成にかからせる方法等の支払条件のバリエーションにより、ベンダとユーザのバランスをとるとの方法は考えられる。
また、AI 技術の不確実性に伴うリスクを織り込んだ上で、対価を調整することも考えられ、そのような調整が難しいのであれば、契約を断念することも当然にあり得る選択肢である 5。
そのため、AI 技術の特性は、契約締結に際して重要な要素ではあっても、決定的な要素ではない。その内容を十分に理解した上で「AI」とのマジックワードに惑わされない、冷静かつ現実的な事業判断が重要となることはいうまでもない。
② AI 技術を利用したソフトウェアに関する権利関係・責任関係等の法律関係が不明確であること
AI 技術を利用したソフトウェアに関する権利関係・責任関係等の法律関係が不明確であるという問題に対しては、契約によって当事者間の権利関係や責任関係を定めることが考えられる。
これによって、法律では不明確な当事者間の権利関係や責任関係を明確化することができる。本ガイドライン(AI 編)および末尾に付したモデル契約(以下「本モデル契約」という。)は、学習済みモデルの開発契約における基本的な考え方を示すことで、当事者間において立場が違うために、議論が平行線となって交渉が進まなくなりがちな事項について、状況を打開するための手がかりとなる考え方を提示している。
また、AI 技術を利用したソフトウェアに関する権利関係については、契約の中に、権利の帰属について定めるだけではなく、成果物やデータに対する利用条件をきめ細やかに設定していくことで、当事者の目的を達成するための柔軟な枠組みを提示している。このような柔軟な枠組みは、契約だからこそ可能になるといえる。この枠組みは、学習済みモデル等について、開示するものと開示しないものを分けて利活用するというオープン・クローズの戦略の活用にも資することになろう。
③ ユーザがベンダに提供するデータに高い経済的価値や秘密性がある場合があること
ユーザがベンダに提供するデータに高い経済的価値や秘密性がある 場合があることによるユーザの懸念や権利主張という問題に対しては、本ガイドライン(AI 編)および本モデル契約は、上記のとおり、成果 物やデータに対する利用条件をきめ細やかに設定していく枠組みを提 示し、この利用条件において、当事者の状況や提供するデータの性質を 反映した条件を設定することによって、ユーザのデータの取扱いに対 するニーズとベンダの成果物の有効活用についてのニーズの調和を図 るという考え方を提示している。
4 Key Performance Indicator の略称であり「重要業績評価指標」とも呼ばれる。
5 この意味で、本ガイドライン(AI 編)は、契約締結を至上の目的とするものではない。
④ AI 技術を利用したソフトウェアの開発・利用に関する契約プラクティスが確立していないこと
AI 技術を利用したソフトウェアの開発・利用に関する契約プラクティスが確立していないという問題に対しては、「探索的段階型」の開発方式を提唱し、その上で各段階について、モデル契約を提供している。すなわち、具体的には、本ガイドライン(AI 編)は、AI 技術を利用 したソフトウェア開発の特徴として、たとえば、学習済みモデルの内容・性能等が契約締結時に不明瞭な場合が多いことや、その内容・性能等が学習用データセットに依存することがあることを踏まえて、開発プロセスに、①学習済みモデルの実現可能性を検討するアセスメント段階、②PoC6段階、③開発段階、④追加学習段階を設けて、段階ごとに AI 技術によって自らの目的を実現することができるか否かや、次の段階に進むか否かについて探索しながら、それらの検証と当事者相互の確認を得ながら段階的に開発を進めていくプロセス(「探索的段階型」の開発方式)を導入することを提唱している。この「探索的段階型」の開発方式は、最初に要件定義を固めるウォーターフォール形式と異な
り、試行錯誤型の開発を許容する開発方式である。
帰納的に推論を行う AI 技術を利用したソフトウェア開発では、開発初期段階で成果物を確定的に予測することが、演繹的に推論を行う従来型のソフトウェアの開発と比較すると難しく、また、ユーザとベンダの間の認識にも違いが生じやすい。そこで、このように開発における段階を複数に分ける「探索的段階型」の開発方式をとることによって、当事者が開発を進める中で成果物の具体的内容をすりあわせていくことが可能となり、成果物について、その性能保証の適否を含めた、ユーザとベンダの認識の違いが生じることをできるだけ防ぐことができる。
また、「探索的段階型」のプロセスでは、開発を進める中で必要な性能を有する成果物ができないことが判明した場合には、次の段階に進まないという選択をすることができる。このように「探索的段階型」の開発方式を採用することにより、成果物について当事者の認識の違いから生じるトラブルや開発が失敗することによるリスクを限定することが可能となる。
加えて、本ガイドライン(AI 編)は、本文で「探索的段階型」のプロセスを含めた契約の基本的な考え方を解説すると共に、末尾にモデル契約を提供している。
本ガイドライン(AI 編)が、このような情報を広く世の中に提供することで、AI 技術を利用したソフトウェアの開発・利用に関する契約プラクティスが形成されていく一助となれば、契約プラクティスが確立していないという問題の解消が促進されることになるであろう。
3 対 象
(1) 想定する契約当事者
本ガイドライン(AI 編)の想定する契約当事者は、大企業から中小企業までの全ての企業である。
6 PoC(Proof of Concept)とは、概念実証のことであり、新たな概念やアイデアを、その実現可能性を示すために、部分的に実現することを意味する。
AI 技術を利用したソフトウェアの開発・利用におけるユーザとしては大企業から中小企業まで様々な企業が想定される。他方、AI 技術を利用したソフトウェアを開発するベンダとしては、大手 IT ベンダだけではなく、ベンチャー企業等も存在する。
そのため、本ガイドライン(AI 編)で想定している AI 技術を利用したソフトウェアの開発契約またはサービス契約は、当事者としては大企業に限定したり、中小企業に限定することはしていない。
このように、本ガイドライン(AI 編)では中小企業が当事者となり得ることを想定しているところ、中小企業においては、法務知識を有する人材が十分にいないことがあることや、開発対象として大規模なシステム開発を想定していないことから、本モデル契約はシンプルなものを目指した。
(2) 対象ソフトウェア
本ガイドライン(AI 編)の対象ソフトウェアとしては、事業やオペレーションに関する一定の目的を実現するための AI 技術を利用したソフトウェア、特に学習済みモデルを想定している。これは、AI 技術を利用したソフトウェアについては、現時点では、企業の基幹システムよりも、事業やオペレーションに関する特定の目的を実現するために AI 技術を利用したソフトウェアを用いることが多いと考えられるからである。
なお、本ガイドライン(AI 編)では、全体の構成として、近年、研究開発が進む統計的性質を利用する機械学習(統計的機械学習)、特にディープラーニングを利用したソフトウェア開発を念頭に置いて解説している個所が多数存在する。しかしながら、これはあくまでも説明の便宜とわかりやすさの観点によるもので、実務上研究開発されている機械学習の手法がディープラーニングに限ることを意図しているものではない。この点については、後記第 2-2-⑵で解説する。
(3) モデル契約 2007 等との関係
2007 年公表の経済産業省のモデル取引・契約書(第一版)(以下「モデル契約 2007」という。)は、契約当事者として、対等に交渉力がある大企業のユーザ・ベンダを想定しており、対象システムとして、重要インフラ・企業基幹システムの受託開発、保守・運用を想定している。
また、2008 年公表のモデル取引・契約書(追補版)は、契約当事者として、IT の専門知識を有しない中小企業のユーザと業として情報サービスを提供するベンダを想定しており、対象システムとしては、財務会計システム、販売管理システム等の導入等としている。
本ガイドライン(AI 編)の想定はモデル契約2007 等の想定と異なるが、これは、現時点における AI 技術を利用したソフトウェアの開発・利用の状況を踏まえたことにより生じた違いである。
4 全 体 構 成
本ガイドライン(AI 編)の構成は次のとおりである。
第 1 総 論
本ガイドライン(AI 編)の目的や対象を述べる。
第2 AI 技術の解説
AI 技術の基本的概念や AI 技術を利用したソフトウェア開発の特徴について解説する。
第3 基本的な考え方
AI 技術を利用したソフトウェア開発・利用契約について基本的な考え方を述べる。
第4 AI 技術を利用したソフトウェアの開発契約
学習済みモデルの開発契約について契約の考え方や契約締結時の考慮要素等を述べる。
第5 AI 技術の利用契約
AI 技術の利用サービスの契約の考え方や考慮要素等を述べる。第6 国際的取引の視点
外国企業との間で学習済みモデルの開発契約や利用契約を締結する際の考慮要素等を述べる。
第7 本モデル契約について
学習済みモデルの生成について、本モデル契約の基本的な考え方を述べ、本モデル契約を示す。
第 8 総 括
本ガイドライン(AI 編)を総括する。
なお、本ガイドライン(AI 編)の末尾にユースケースを示している。
5 本ガイドライン(データ編)との関係
既に述べたとおり、AI 技術を利用したソフトウェアの開発をするには、データが重要である。また、AI 技術を利用したソフトウェアの学習に利用される学習用データセットや学習済みモデルに含まれる学習済みパラメータはデータそのものである。
データの提供・利用に関する法的問題や利害調整の方法については、本ガイドライン(データ編)が正面から取り上げており、詳細な検討を行っている。データに関する一般的な取扱いについての基本的な考え方や契約条項例については、本ガイドライン(データ編)を参照されたい。
第2 AI 技術の解説
1 基本的概念の説明
(1) AI(人工知能・Artificial Intelligence)
「AI」とは「Artificial Intelligence」の略称であり、日本語では「人工知能」と訳される。従前より、この「AI」という言葉は、多義的に用いられてきた。たとえば、脳科学や神経科学の分野においては、生物学的なアプローチから人間の知能そのものについて理解しようというような試みが行われているし、コンピュータサイエンスの分野においては、人間が知能を使って行うことを機械に行わせようというような試みが行われている。
近年、主としてコンピュータサイエンスの分野において、この「弱い AI」は、機械学習に関する技術として理解され、特に画像処理や自然言語処理のxxxにおいて、広く利用されている。
本ガイドライン(AI 編)は、現在実用化が進められているのは「弱い AI」であるという認識の下、「AI」という言葉を、「弱い AI」、中でも特に機械学習に関する学問分野(研究課題)を意味するものとして説明を行うこととする。
もっとも、このような定義は、本ガイドライン(AI 編)で、便宜上用 いるものにすぎない。すなわち、上述の立場を前提とする場合であっても、
「AI」を「強い AI」と理解する立場も当然存在するし、また、「AI」を
「弱い AI」と理解した場合であっても、機械学習とは異なるアプローチによってそれを実現しようとする立場もあるため留意されたい。
(2) AI 技 術
「AI 技術」とは、人間の行い得る知的活動をコンピュータ等に行わせる一連のソフトウェア技術の総称である。なお、本ガイドライン(AI 編)では、便宜上、「AI 技術」と表記した場合、後述する「機械学習」、またはそれに関連する一連のソフトウェア技術のいずれかを意味するものとする。
(3) 機械学習(マシンラーニング・Machine Learning)
「機械学習」とは、あるデータの中から一定の規則を発見し、その規則に基づいてxxのデータに対する推測・予測等を実現する学習手法の一つである。
コンピュータサイエンス分野の研究者および実務家の中でも、機械学習という用語は多義的に使用されており、必ずしも、確立した定義は存在しないものと思われる。現に、機械学習に分類される手法としても、サポートベクターxxxx(SVM)、決定木、ニューラルネットワーク、クラ
7 一般社団法人人工知能学会、xxxx://xxx.xx-xxxxxx.xx.xx/xxxxxxx/XXxxxxxxxx.xxxx
スタリング等種々のものがあり、その外延の確定は容易ではない。
もっとも、開発的過程に着目すれば、機械学習を用いた技術開発が帰納的 8に行われるという点で、概ね共通すると思われる。すなわち、機械学習を利用したソフトウェア開発においては、従来のソフトウェア開発のように演繹的なアプローチではなく、実際に観察される事象(データ)に基づいて帰納的にソフトウェア(たとえば、学習済みモデルに該当する)開発を行うという点で共通するものと考えられる。
また、機械学習の手法を用いたソフトウェア開発には様々なアプローチがあるが、本ガイドライン(AI 編)では①「教師あり学習」、②「教師なし学習」、③「ディープラーニング」と呼ばれるアプローチについて概説する。
① 教師あり学習(Supervised Learning)
機械学習の手法の一つであり、ある入力に対して望まれる出力(正解)が事前に与えられたデータセット(学習用データセット)から一般化し た法則を導き出すために利用される学習手法である。
正解の付与が容易な場合、たとえば、画像認識のxxxでよく用いられている。
② 教師なし学習(Un-supervised Learning)
機械学習の手法の一つであり、事前に正解が与えられていない学習用データセットから一般化した法則を導き出すために利用される学習手法を意味する。
たとえば、クラスタリングがこれに該当する。
③ ディープラーニング(Deep Learning)
近時着目されている学習方法として、ディープラーニング(Deep Learning)がある。これは、機械学習の一手法であるニューラルネット
(脳の情報処理を模して開発された機械学習の一手法)を多層におい て実行することで、より精度の高い推論を目指した手法である。他の機 械学習と比較しても、学習用に大量のデータが必要となるものの、近年 の技術開発(コンピュータの処理速度の向上(CPU・GPU 等)、インタ ーネットによりデータ収集の容易化、クラウドによるリソース利用・デ ータ保存コストの低下等)により、今後更なる利用が期待されており、 特に、画像認識や自然言語処理等の分野において、広く利用されている。
ディープラーニングは、教師あり学習の一手法として分類されることもあるが、近年ではディープラーニングの手法であっても正解データを与えることを要しない手法が開発されており、教師なし学習の一手法としても、利用されている。
2 対象とする AI 技術
(1) 従来型のソフトウェア開発との違い
前記第 2-1-⑶のとおり、本ガイドライン(AI 編)では、AI 技術、すなわち、「機械学習」を「あるデータの中から一定の規則を発見し、その規則に基づいてxxのデータに対する推測・予測等を実現する学習手法の一つ」として定義している。
従来型のソフトウェア開発においては、まずソフトウェアの仕様を詳細に定義し、既に知られた法則や知識を念頭に、実装の工程を段階的に詳細化していくという演繹的な開発手法が用いられている(以下、このような演繹的な開発手法を用いるソフトウェア開発を「従来型のソフトウェア開発」という。)。
これに対して、機械学習の手法を取り入れたソフトウェア開発においては、実際に観察される事象(データ 9)を用いた帰納的な開発手法を用いることから、仕様の定義、実装や評価の方法等に従来型のソフトウェア開発とは異なる方法論が用いられる場合がある。
(2) 機械学習の位置づけ
前記第 1-3 のとおり、本ガイドライン(AI 編)は、近年、研究開発が進む統計的性質を利用する機械学習(統計的機械学習)、特に、ディープラーニングを念頭に置いて作成されている。これはディープラーニングへの関心が近年高まっている状況に加えて、ディープラーニングを利用した技術開発には、従来のソフトウェア開発と特に異なる点が存在するからである。
言い換えれば、本ガイドライン(AI 編)は、各種機械学習の手法を対象としつつも、説明の便宜とわかりやすさの観点から、ディープラーニングを例として、従来のソフトウェア開発と特に異なる開発過程に着目し、契約の考え方について、解説を行うものである。
なお、実務上は、ディープラーニングのみに留まらず、複数の機械学習手法を組み合わせたり、演繹的なアプローチにより開発された既存のソフトウェアと組み合わせることで、システム開発を行う場合も多々存在する。このような場合、従来のソフトウェア開発の際に締結されていた契約手法と本ガイドライン(AI 編)において提案される契約手法を適宜組み合わせて利用することで、当事者間の紛争を解決する一助となることを期待するものである。
3 想定する AI 技術の実用化の過程
(1) 実用化の過程
本ガイドライン(AI 編)では、AI 技術を利用したソフトウェア、典型的には学習済みモデルの実用化の過程において、まず、①学習済みモデルの生成段階(以下「学習段階」という。)があり、次いで、②生成された学習済みモデルの利用段階(以下「利用段階」という。)があることを想定している。その概要は下図のとおりである(本ガイドライン(AI 編)における各々の用語の意味は後記第 2-3-⑵から第 2-3-⑷のとおりである。)。
図 1:学習段階・利用段階の流れ
① 学 習 段 階
学習段階は、センサやカメラ等何らかの方法により収集・蓄積された
「生データ」から、最終的成果物としての「学習済みモデル」を生成することを目的とする段階である。その過程は、次の二つに細分化することができる。
a 学習用データセットの生成段階
生データは、欠測値や外れ値を含む等、そのままでは学習を行うのに適していないものであることが多い。そのような場合には、生データに対して何らかの加工を施す必要がある。
また、特に教師あり学習のアプローチをとる場合には、たとえば画像データに一定のラベル情報を付す等の方法により、あるデータの入力に対する正解を規定することで作成された、いわゆる正解データを用意する必要がある。
このように、機械学習の手法により学習を行う場合、生データから学習済みモデルを生成するための第一段階として、学習を行うのに適した学習用データセットを生データから生成する過程を経ることが必要となる。
b 学習済みモデルの生成段階
学習用データセットの中から一定の規則を見出し、その規則を表現するモデルを生成するためのアルゴリズムを実行する「学習用プログラム」を用意する必要がある。
生データから生成された学習用データセットを学習用プログラムに対する入力として用いることで、一定の目的のために機械的に調整された「学習済みパラメータ」を含むモデルを得ることができる。これをプログラムに実装することで、ソフトウェアとしての「学習済みモデル」を得ることができる。
② 利 用 段 階
利用段階は、学習済みモデルに「入力データ」を入力し、その出力として一定の結果(「AI 生成物」)を得ることを目的とする段階である。なお、実務において、一度学習を終了し学習段階から利用段階に移行 した場合であっても、再度、利用段階から学習段階に移行するような場合もある。たとえば、利用段階において学習済みモデルによって思うような結果が得られない場合や学習段階においては想定できなかった事象が生じたような場合に、利用段階において逐次収集・蓄積されたデータを用いて、再度、学習させることにより、新たな学習済みモデルを生
成することで、精度が向上する場合があるためである。
(2) 学習段階の各要素
本ガイドライン(AI 編)では、学習段階の要素として「生データ」、
「学習用データセット」、「学習用プログラム」、「学習済みモデル」および「ノウハウ」の 5 つを想定している。
① 生 デ ー タ
「生データ」10とは、ユーザやベンダ、その他の事業者や研究機関等により一次的 11に取得されたデータであって、データベースに読み込むことができるよう変換・加工処理されたものをいう。
たとえば、ある事業者の事業活動から副次的に発生し、収集・蓄積されたデータであって、前記の変換・加工処理を施されたものはこれに該当する。生データは、欠測値や外れ値を含む等、そのままでは学習を行うのに適していないものであることが多い。
また、生データは、生成される学習済みモデルの内容・品質に大きな影響を及ぼす。
ここで、生データに対して、生データとは別個のデータ(以下「付加
11 ここでの「一次的」とは、学習用データセットへの変換・加工処理前との趣旨で用いている。
データ」という。)を付加する場合(このような付加データの付加行為を「アノテーション」ということもある 14。)、そのような付加データには、生データと同様に、生成される学習済みモデルの内容・品質に大きな影響を及ぼす一方、生データから独立した形式ではその用をなさないという性質がある。そのため、生データとこれに対する付加データとがいわば一体となったものを学習用データセットと見ることが適切であろう。教師あり学習の手法を用いる場合についていえば、前処理が行われた生データにラベル情報(正解データ)を合わせたものが学習用データセットに該当する。
また、学習用データセットには、生データに一定の変換を加えていわば「水増し」されたデータを含むこともある(この手法はデータオーギュメンテーション(データ拡張)とも呼ばれる場合がある。)。
③ 学習用プログラム
「学習用プログラム」とは、学習用データセットの中から一定の規則を見出し、その規則を表現するモデルを生成するためのアルゴリズムを実行するプログラムをいう。具体的には、採用する学習手法による学習を実現するために、コンピュータに実行させる手順を規定するプログラムがこれに該当する。
学習用プログラムは、ベンダが既に保有している場合もあれば、それに一定の機能を付加する場合、ゼロから作り上げる場合がある。また、学習用プログラムの開発においては、OSS(オープン・ソース・ソフトウェア)と呼ばれるソースコードが一般に公開され、著作者により一定の範囲の利用が許諾されたソフトウェアを利用することが多い。
④ 学習済みモデル
「学習済みモデル」とは「学習済みパラメータ」が組み込まれた「推論プログラム」をいう。
a 学習済みモデルの多義性
実務上、「学習済みモデル」という言葉は、利用する者によって、学習済みパラメータを組み込んだ推論プログラムだけでなく、「生データ」、「学習用データセット」、「学習用プログラム」、「推論プログラム」、「学習済みパラメータ」、「その他派生的な成果物」を含む概念として多義的に用いられる場合があり、確立した定義がないのが実情である。
しかしながら、「学習済みモデル」が具体的にどのような意味で使用されているのか、具体的にどこまでの範囲(成果物)が学習済みモデルを意味するのかについては、後記第 3-3 及び第 3-4 の各種論点
(権利帰属・利用条件の設定や責任の分配等)を論じる上でも、非常に重要である。そのため、後記第 4-4-⑵-④のとおり、学習済みモデルの内容(具体的な定義や範囲)については、事前に契約の当事者間で十分に議論を行い、明確に定めておくことが望ましい。
14 特にディープラーニングによる学習に際して「アノテーション」との用語が用いられることが多い。
本ガイドライン(AI 編)では、著作権法上の保護対象がプログラムである点や、ベンダとユーザ間での学習済みモデルに関する取引の実態を考慮して、便宜上、「学習済みパラメータ」が組み込まれた
「推論プログラム」を一体として「学習済みモデル」と呼ぶこととする。
b 学習済みパラメータ
「学習済みパラメータ」とは、学習用データセットを用いた学習の結果、得られたパラメータ(係数)をいう。
学習済みパラメータは、学習用データセットを学習用プログラムに対して入力することで、一定の目的のために機械的に調整されることで生成される。学習済みパラメータは、学習の目的にあわせて調整されているものの、単体では単なるパラメータ(数値等の情報)にすぎず、これを推論プログラムに組み込むことで初めて学習済みモデルとして機能する。たとえば、ディープラーニングの場合には、学習済みパラメータの中で主要なものとしては、各ノード間のリンクの重み付けに用いられるパラメータ等がこれに該当する。
これに対して、学習のために設定する学習率や学習回数(エポック)等については、このような学習済みパラメータとは性質を異にして、学習の枠組みを規定するために用いられるパラメータであり、主と して人為的に決定されるため「ハイパーパラメータ」と呼ばれること がある。
c 推論プログラム
「推論プログラム」とは、組み込まれた学習済みパラメータを適用することで、入力に対して一定の結果を出力することを可能にするプログラムをいう。
たとえば、入力として与えられた画像に対して、学習の結果として取得された学習済みパラメータを適用し、当該画像に対する結果(認証や判定)を出力するための一連の演算手順を規定したプログラムである。
d 派生的な学習済みモデル
後記第 2-4-⑴-④のとおり、学習済みモデルについては、再利用の需要が存在するが、実務上は、特に、再利用モデルや蒸留モデル等派生的な学習済みモデルの取扱いが問題となることが多い。学習済みモデルの定義が多義的であることから、これらの派生的な学習済みモデルの定義も多義的とならざるを得ないが、本ガイドライン(AI)編では、便宜上、次のとおり定義する。
まず、「追加学習」とは、既存の学習済みモデルに、異なる学習用データセットを適用して、更なる学習を行うことで 15、新たに学習済みパラメータを生成することを意味する。そして、「再利用モデル」とは、追加学習により新たに生成された学習済みパラメータが組み
15 学習済みモデルの精度の維持または向上を行うことや、当初学習させた領域と異なる領域に適応させること等を目的とすることが考えられる。
込まれた推論プログラムを意味する。
次に、「蒸留」とは、既存の学習済みモデルへの入力および出力結果を、新たな学習済みモデルの学習用データセットとして利用して、新たな学習済みパラメータを生成することを意味する。そして、「蒸留モデル」とは、蒸留により新たに生成された学習済みパラメータが組み込まれた推論プログラムを意味する。
⑤ ノ ウ ハ ウ
ノウハウはそれ自体多義的な用語ではあるが、本ガイドライン(AI 編)において、「ノウハウ」とは、AI 技術の研究・開発・利用過程におい て、ベンダまたはユーザが有する知見、技術、情報等 16を意味する。具体的に想定されるノウハウとして、次のものがある。なお、これらのノ ウハウは、特許法上の発明の対象となる場合もあるであろう。
a 生データの取得・選択
生データの取得に関するノウハウは、原則として生データの提供主体(多くの場合データを提供するユーザ)が有するものであるが、 AI 技術の適用にあたって、ベンダが、生データの取得や選択(または、その助言)を行う場合もあり、このようなデータの取得や選択に関する知識もノウハウになり得る。
たとえば、画像処理に関する学習を行う場合、どのような画像データ(画像の種類や条件等)を取得すれば学習を行いやすいのかについてのノウハウは、そのような学習の経験を有するベンダが有している場合もある。一方で、繊細な動きをするロボットに関する学習を行う場合、学習を行うためのデータには、ロボットのハードウェアとしての特性や性質等が大きく影響することがあり、ユーザがノウハウを有しているような場合もある。
b 学習用データセットへの加工
学習に適した生データ加工のノウハウについてはベンダ側が有していることが一般的である。たとえば、画像処理に関する学習を行う場合に画像に対してどのようなラベル付けを行えば学習をし易いのかということは、画像処理に関する学習を行った経験を有するベンダであれば、ある程度推測が可能な場合もある。このような知見がある場合、通常、ベンダが有するノウハウといえるだろう。
他方、生データ加工のノウハウについては、ユーザ側が有していることも想定されるところである。たとえば、生データにラベル情報
(正解データ)を付与する場合にあたりユーザの業務ノウハウを必要とする場合もあるであろう。
c 学習用プログラムを用いた学習
学習用プログラムを用いた学習には、ベンダのノウハウが用いられることが多い。この際、ハイパーパラメータの調整も行われるが、
16 ベンダについては、AI 技術の研究・開発に関して有する知見、技術、情報等が、ユーザについては、AI 技術の適用対象となる業務に関して有する知見、技術、情報等が含まれる。
これもノウハウに含まれる。
学習を行う場合、既存(単一)の学習手法(またはソフトウェア)のみを用いて精度の良い学習済みモデルを生成することは困難な場合が多く、ベンダにより複数の学習手法(またはソフトウェア)を組み合わせて、最終的な学習済みモデルの生成が行われることがある。たとえば、このような場合に、ベンダが学習を行う際に、どのような学習手法を採用するのか、また採用した学習手法をどのような順番で処理をするのか等は、ベンダ独自の工夫が含まれる場合も多く、ノウハウとなり得る。
なお、このような工夫が顕著な場合、このような学習手法の組合せや処理の順序等のアルゴリズムについても直接的または間接的に特許取得の対象となる場合がある。
d 学習済みモデルの調整
学習済みモデルを本番環境で使うためには、調整が必要となり、これにはユーザやベンダのノウハウが用いられる。たとえば、AI を搭載した画像認識機能を有する防犯カメラのような場合、認識対象となる可能性の高い対象を限定し、認識の精度を高めるような場合もある。このような場合、防犯カメラの設置位置や角度等、認識対象となる画像が取得しやすいような調整を行う場合がある。
(3) 利用段階の各要素
本ガイドライン(AI 編)では、利用段階の要素として「入力データ」、
「学習済みモデル」、「AI 生成物」および「ノウハウ」を想定している。
「学習済みモデル」と「ノウハウ」については、前記のとおりである。
① 入力データ
「入力データ」とは、学習済みモデルに入力することで AI 生成物を出力するためのデータを指す。学習済みモデルの利用目的にあわせて、音声、画像、動画、文字、数値等様々な形態をとる。
② AI 生 成 物
「AI 生成物」とは、学習済みモデルに入力データを入力することで、 出力されたデータを指す。学習済みモデルの利用目的にあわせて、音声、画像、動画、文字、数値等様々な形態をとる。
(4) 学習段階および利用段階の関与者
本ガイドライン(AI 編)では、学習段階および利用段階の関与者として「ベンダ」と「ユーザ」を想定している。
① ベ ン ダ
本ガイドライン(AI 編)において、「ベンダ」とは、学習済みモデル等の AI 技術を利用したソフトウェアの開発やこれを用いたサービス提供を行う者を指す。ベンダは、AI 技術を利用したソフトウェアに関する専門知識を有していることが多く、そのような場合には、ベンダが AI技術を利用したソフトウェアに関するプログラム・ノウハウ等の作成・
提供を行う。
なお、本ガイドライン(AI 編)では、「ベンダ」として、SIer からベンチャーまで多様な企業を想定している。
② ユ ー ザ
本ガイドライン(AI 編)において、「ユーザ」とは、事業等の一定の目的を達成するために、ベンダに対して、対価を支払って、AI 技術を利用したソフトウェアに関する研究・開発・サービス提供等を依頼する者を意味する。
なお、AI 技術を利用したソフトウェアの開発は、ユーザの事業に適用することを目的とすることから、生データや学習用データセット等の学習に利用するデータについてはユーザが提供する場合が一般的であり、その生成にユーザが重要な役割を果たす場合も少なくない(このデータにユーザのノウハウが反映されている場合もある。)。
4 AI 技術を利用したソフトウェア開発の特徴
(1) 従来型のソフトウェア開発と比較した特徴
AI 技術を利用したソフトウェアの開発、典型的には、学習済みモデルの生成については、従来型のソフトウェア開発と比較して、①学習済みモデルの内容・性能等が契約締結時に不明瞭な場合が多いこと、②学習済みモデルの内容・性能等が学習用データセットによって左右されること、③ノウハウの重要性が特に高いこと、および④生成物について更なる再利用の需要が存在すること等の特徴を有するため、契約において、特に留意すべき点がある。以下、簡単に解説する。
① 学習済みモデルの内容・性能等が契約締結時に不明瞭な場合が多いこと
従来型のソフトウェア開発の場合、その基本的な作業は、一般的に、
「入力値の処理手順を一定のルールとして記述し、その記述をコード化する」という演繹的なものである。あらかじめ開発対象物が特定されており、かつ、その動作原理も直感的に把握しやすいことが多い。
他方、学習済みモデル生成の場合、学習用データセットという限られたデータのみからxxの様々な状況における法則を推測するという性質上、AI 技術に習熟した技術者であっても、推測対象となるxxのあらゆる事象を予測して学習を行うのは極めて困難である。
その結果、AI 技術を利用したソフトウェアの開発を伴う契約を締結する際には、次の特性を踏まえた上で、当事者間のリスク分配を検討する必要が生じる。
a 事前の性能保証が性質上困難であること
従来型のソフトウェア開発の場合、開発初期の企画・要件定義段階においてユーザとベンダが適切かつ十分に協議すれば、どのようなソフトウェアが開発されるかがわからないという事態は想定しがたい。また、開発されたソフトウェアについては、その内部的な計算・処理過程が明確であるが故に、その挙動を予測することも比較的容易である。そのため、開発段階で取り扱われなかったxxの入力(デ
ータ)の処理についても、事前に一定の性能保証を行うことができる場合がある。
これに対して、学習済みモデル生成の場合、あらかじめベンダ等により用意された学習用データセットからユーザまたはベンダの求める挙動、精度および前提条件等を満たす学習済みモデルの生成が可能であるか、また、これを完成させることができるかを事前に予測することが困難である(開発対象確定の困難さ)。
そのため、当然ながら、契約時点においても、当事者が生成後の学習済みモデルの性能のイメージを共有して、契約を締結することが難しい。さらにいえば、学習済みモデルは、学習用データセット以外のxxの入力(データ)に対しての挙動が不明確であり、この点についても、契約時点の性能保証が困難であるといえる 17(性能確定・保証の困難さ)。
このように、学習済みモデルの生成においては、「開発対象確定の困難さ」、「性能確定・保証の困難さ」といった問題が生じることが多く 18、契約の当事者は、このような性質を契約時に十分に留意する必要がある。
b 事後的な検証等が困難であること
従来型のソフトウェア開発の場合、仮に契約時点において、期待されていた性能のソフトウェアが得られなかった場合、ソフトウェアの処理プロセスを再度検証・修正することによって、原因が特定できることも少なくない。このような場合、特定された原因に対して適切な対処を行うことで、結果的に、満足のいく性能のソフトウェアを開発することが可能になることも多い。
他方、学習済みモデル生成の場合、学習済みモデルの生成過程やその性質について、人間が直感的に理解することが困難な場合も多い。そのため、学習済みモデルによる推論結果が期待された精度を達成しない場合、学習用データセットの品質(性質)の問題であるのか、人為的に設定されたパラメータ(ハイパーパラメータ)の問題であるのか、あるいは、実行されたプログラムにバグがあるのか等の原因の切り分けが、現時点の技術水準においては、困難な場合がある 19。このような特性は、統計的機械学習の手法全般に共通した性質の一つであるが、中でもディープラーニングを始めとする深層学習において強く見られる性質である。
つまり、学習済みモデルの生成においては、従来型のソフトウェア開発の場合と異なり、事後的な検証に基づいて、満足のいく性能の学
習済みモデルを生成するという手段を選択することが困難であるという特性を有しているといえる。
c 探索的なアプローチが望ましいこと
以上のとおり、学習済みモデルの生成の場合、事前にどのような学習済みモデルが生成されるか予測ができず、また、生成されたモデルの挙動を事後的に検証することが困難である。
また、学習済みモデルの生成の場合、実際にベンダが負担する工数のうち非常に多くの工数を、学習を行う前段階のデータの加工や調整(学習用データセットの生成)にかける場合も少なくない一方で、学習それ自体は学習プログラムにより半自動的に実行される。そのため、学習の結果として、満足する結果が得られなかった場合に、新たなデータセットを用いて再度学習を行うことが、比較的容易な場合も多い。
このような事情から、学習済みモデルの生成の場合、探索的なアプローチを用いて試行錯誤を繰り返すことにより、ユーザの満足いく性能の学習済みモデルを生成するという手法を採用しやすいという特性を有している。
② 学習済みモデルの内容・性能等が学習用データセットによって左右されること
学習済みモデルの生成は、学習用データセットの統計的な性質を利用して行われるという性質上、次のような原理的な限界を有するとされている。
学習時と推論時(学習済みモデル)の確率分布が同一であることを前提としており、学習時と推論時の確率分布が大きく異なるような場合には機能しない場合があり得る。
学習用データセットに通常性質が反映されないような「まれな事象」に対して、推論が及ばない可能性がある。
学習データセットから統計的なバイアスを排除することは不可能であり、生成された学習済みモデルをxxデータに適用する場合には、本質的に誤差が含まれることになる。
そのため、学習済みモデルの性能は、学習用データセットの品質に依存する。すなわち、学習済みモデルが学習用データセットの統計的性質を反映して生成されることから、学習用プログラムの仕様に問題がないような場合であっても、ユーザの満足のいく性能の学習済みモデルが生成できないという事態も十分に想定される。
たとえば、学習用データセットに含まれるデータに本来の統計的性質を反映していないデータ(外れ値)が混入していた場合や、学習用データセットのデータに大きな統計的なバイアスが含まれていた場合等には、精度の高い学習済みモデルを生成することはできないことが多いため、ユーザおよびベンダの双方がこのような特性を十分に理解する必要がある。
③ ノウハウの重要性が特に高いこと
学習済みモデルの生成・利用過程において、ユーザおよびベンダの有する様々なノウハウが利用され、最終的に生成される学習済みモデルの性能に大きく影響する。
従来型のソフトウェア開発においても、もちろん、ノウハウの一般的な重要性は認められてきたが、学習済みモデルの生成においては、学習用データセットの加工方法や、学習用プログラムを実行する際のハイパーパラメータの設定等、従来型のソフトウェアで想定されていなかった新たな種類のノウハウが生じうる場面が多いところに特徴がある
20。
また、帰納的アプローチをとる学習済みモデルの生成では、演繹的な開発手法と比較した場合に、相対的に試行錯誤を繰り返すことが多い。そして、そのような試行錯誤の過程においては、暗黙知としてのノウハウの集積が生じやすく、かつ、かかるノウハウは類似の学習に際して応用可能であることも少なくない。このような事情も、また、学習済みモデルの生成におけるノウハウの重要性を高めているといえる。
そして、学習に関するノウハウは、ベンダのみならず、ユーザにも生 じ得るものである。たとえば、学習用データセットの加工について見る と、学習用データセットに通常性質が反映されないような「まれな事象」を学習データに含むのか、ノイズとして除去するのか等については、ま さに学習済みモデルを生成するベンダのノウハウといえる。他方、ユー ザについても、そのデータを日常的に取り扱っている場合には、ノウハ ウを有している場合があり、学習済みモデルの生成・利用において、そ のノウハウが重要な意味を持つこともある。
このように、学習済みモデルの生成においては、従来型のソフトウェア開発と比較して、ノウハウの重要性が高い場面が少なくないと思われる。もっとも、一言でノウハウといっても様々なものがあり、価値の高いノウハウもあれば、同業者であれば簡単に思いつくことができるノウハウもある。そのため、ノウハウであれば、どのようなものであっても重要であるわけではないことにも留意が必要である。
また、そもそも、ノウハウについては、確立した価値評価手法がないため、当事者の信じる価値(主観的価値)と、実際のノウハウの価値(客観的価値)が異なることがしばしばある。そのため、かかる対立が生じうることを認識の上、冷静に判断し、その利用条件を設定することが、当事者間の無用のトラブルを防止するために有益なことも多いであろう 21。
④ 生成物に更なる再利用の需要が存在すること
学習済みモデルの生成の場合、従来のソフトウェア開発における生
20 このようなノウハウには、特許法上の発明等の知的財産権の対象となり得るものもあると考えられる。また、秘密として管理されていれば不正競争防止法上の営業秘密として保護を受ける場合もある。
成物(プログラム)とは別に、学習段階で生成される学習用データセットや学習済みモデルが生成される。
この学習用データセットや学習済みモデルは、それ自体が多大なコストや時間をかけて生成されたものであり、また、学習済みモデルにおいては学習済みパラメータを変更することで精度の向上や他の目的での利用も可能となる場合があることから、従来のプログラムと比較して、より多くの場面で研究開発あるいは商業目的での再利用が可能である。
具体的な再利用の方法としては次の方法が想定される。
追加学習等により再利用モデルを生成する。
蒸留モデルを生成する。
複数の学習済みモデルの出力結果を組み合わせることで学習済みモデルの精度を向上させる(アンサンブル学習)。
このように、学習済みモデルの生成の場合、従来のソフトウェア開発では想定し得なかった生成物が生成される。ベンダとしては、これら生成物を再利用することで、新たな技術開発や事業展開の基礎とする要望がある一方、ユーザとしては、多大な費用と労力の結果生成された生成物の再利用を制限したいとの、インセンティブを有することが一般的である。そのため、利害調整の必要が生じる。
(2) 学習済みモデルの特性を理解することの重要性
もっとも、従来の演繹的なアプローチでは対応することができないような複雑な課題に対して、推測を行う(解法を得る)ためには、このような帰納的なアプローチが有効であることが少なくない。そのため、ユーザが新規の事業展開を行う上で、市場における競争優位性を確保するべく、学習済みモデルの有用性に着目し、誤差が含まれるとの性質を踏まえても、なお、これを利用するとの事業判断を行うこともあるであろう。
このような場合には、ユーザおよびベンダは、従来の演繹的なアプローチにより生成されたソフトウェアの性質と、帰納的なアプローチにより生成されたソフトウェア(たとえば、学習済みモデル)の性質とを共に理解した上で、その必要とされる精度や条件等によって、使い分けることが重要である。
第3 基本的な考え方
1 AI 技術を利用したソフトウェアの開発・利用をめぐる契約の現状
AI 技術を利用したソフトウェアを用いた事業に関する類型としては、大きく分けて 22①ユーザがベンダに依頼して、学習済みモデルの生成を行う
「開発」型と、②AI 技術を利用したサービスを提供する「サービス利用」型が想定される。
一般に、学習済みモデルの生成においては、ユーザがベンダに対してデータを提供し、ベンダがそれを学習用プログラムに学習させることが多い(ただし、ベンダがデータを提供することもある。)。また、AI 技術を利用したサービスにおいても、ユーザが、ベンダに対してデータを提供することが多い。
そして、学習済みモデルの生成または AI 技術を利用したサービスにより生成された各要素については、学習済みモデルの生成者であるベンダと、生データまたは入力データの提供者であるユーザとの間において、たとえば、その知的財産権の帰属や利用条件等について、各局面で、利害が対立することがしばしばある。また、学習済みモデルまたは AI 技術を利用したサービスの品質に関して、当事者の利害が対立することがある。
その結果、事業上の優越関係や技術的な知識の格差等を背景として、いわば、「オール・オア・ナッシング」の一方的な契約条項が押しつけられることもある。
しかしながら、xx、当事者の利害が対立するように見えても、学習済みモデルの特性と法律上のルールの内容を理解することで、合理的な条項に合意することができる場合もあると考えられる。
2 契約の検討に向けた視点
学習済みモデルの生成・利用を目的とする契約の具体的な内容を検討するにあたっては、前記第 2-4 で説明した AI 技術の特性を前提とした上で、事業を進める際に、各当事者が何を守る必要があるか、また、リスク要因がどこにあるか、すなわち、契約による合意の対象を確定することが重要である。
その上で、これら契約の対象について、契約がなければどのような法的関係が認められるかを検討し、自らの事業目的を実現するために必要な契約の内容を検討協議することになる。
22 もちろん、絶対的な区分があるわけではなく、現実には両者を渾然一体として取り扱う事業類型も考えられるところである。
(1) 各当事者の立場や考え方の違い
学習済みモデルの生成に際しては、次のとおり、ユーザとベンダとの間に立場や考え方の違いがあることが珍しくない。
ユーザ側 | 開発費を支払い、学習済みモデル生成のための学習に用いるために価値あるデータ・ノウハウを提供したのだから、学習済みモデルに関する権利は全部自社のものとしたい。 学習済みモデルを競合事業者に使われたくない。 自社のデータ・ノウハウを外部に流出させたくない。 学習済みモデルやこれを用いたシステムは一定レベルのものを完成・納品してもらいたい。 自らのデータを使って追加学習させて学習済みモデルの精度をさらに上げたい。 |
ベンダ側 | 自社の研究・開発に関する事業自由度を確保したい。 プログラムやシステムに関する権利は、開発主体である自社に帰属してしかるべきである。 学習済みモデルを横展開して一定の範囲で他社にも提供したい。 追加学習して精度を上げた学習済みモデルを生成したい。 そもそもユーザの求める目的に合致する学習済みモデルを作成できるかどうかはやってみないとわからない。 学習済みモデルの完成やxxの入力(データ)に対して性能の保証はできない。 |
(2) 当事者間で問題が生じうる事項
AI 技術の開発または利用に関しては、前記第 3-2-⑴のとおり、当事者間に立場や考え方の違いがあることから、契約締結に際して、様々な問題が生じうる。その一例としては、次のようなものがある。
① 生データに特有の問題(生データの有無、提供の可否・遅延、品質・十分性等)
② AI 技術を利用したソフトウェアに特有の問題(完成の可否・完成義務の有無、開発したソフトウェアの品質等)
③ 知的財産権の帰属・利用条件に関する問題(成果や開発途中で生じた知的財産 23や AI 生成物(アウトプット))
④ 責任に関する問題
⑤ その他、ユーザ側の開発・利用目的(事業上のニーズ)と、ベンダ側の技術的な認識の不一致等からくる問題
これらの多くは、ユーザとベンダの認識の緊密なすり合わせと契約による合意によって解消できる場合がある。
AI 技術を利用したソフトウェア、特に学習済みモデルの生成・利用に関する契約を締結するに際しては、権利帰属・利用条件の設定と、責任の所在を明確化することが重要である。
3 権利帰属・利用条件の設定
(1) 知的財産xxに関する整理
学習済みモデルの生成・利用に際しては、様々な要素が事業価値の源泉、すなわち、当事者が権利利益を主張する事項となり得る。具体的には、次 の事項について、権利帰属や利用条件が問題となることが多く、したがっ て、その法的関係をあらかじめ整理しておくべきである。
学習段階 | 生 デ ー タ 学習用データセット 学習用プログラム 学習済みモデル(学習済みパラメータ・推論プログラム) ノ ウ ハ ウ |
利用段階 | 入力データ 学習済みモデル(学習済みパラメータ・推論プログラム) AI 生成物(アウトプット) ノ ウ ハ ウ |
これらの対象は、法的には、次のとおり、①データ、②プログラム、および③ノウハウに大別することができる。
① デ ー タ
生データ、学習用データセット、学習済みパラメータ、入力データ、
AI 生成物等は、コンピュータに取り込むことが可能な形式で存在する
「データ」である。
データは、無体物(情報)であるため、所有権の対象とはなり得ない
(民法 206 条、同法 85 条参照)。また、データは、それぞれ、著作物や営業秘密または個人情報に該当する場合があり、著作xxや不正競争防止法、個人情報保護法により保護を受け得る。たとえば、生データが、写真、音声、映像、小説等であれば、それ自体が著作物に該当する可能性があり、また、学習用データセットが「情報の選択又は体系的な構成」によって創作性を有する場合には「データベースの著作物」に該当する可能性がある(著作xx 12 条の 2)。
もっとも、知的財産法制や個人情報保護法制による保護を受ける場
また、実務においては、データの「帰属」が議論の対象となることが少なくないが、以上のデータの法的性質を踏まえれば、データの「帰属」を抽象的に議論するのではなく、データに現実にアクセス可能な者による自ら、またはデータへのアクセスを希望する者に対してのデータ利用の制限の当否および内容を具体的に議論し、契約に定めることが重要である。
② プログラム
学習用プログラムや推論プログラム等の「プログラム」は、ソースコード部分は著作xxによるプログラムの著作物として著作権法上の保護を受ける可能性がある(なお、オブジェクトコードに変換されても同様である。著作xx 10 条 1 項 9 号)。
また、アルゴリズム部分は、特許法上の要件を充足すれば 25、「物(プログラム)の発明」等として、特許法の保護を受け得る。
原則として、著作権を取得するのは著作者(作成者)であり、特許を受ける権利を取得するのは発明者(作成者)である。
そのため、ベンダが開発したプログラムについて著作xxまたは特許法による保護が及ぶ場合、一次的には、職務著作(著作xx 15 条)
や職務発明(特許法 35 条)等の制度を通じて、その著作権や特許を受ける権利はベンダに帰属することが多い。その上でユーザがベンダからこれらの権利を譲り受け、またはその利用許諾を受けることが必要である場合には、ベンダとユーザとの間の契約に定めることが必要である。
③ ノ ウ ハ ウ
AI 技術の開発や利用に関しては、「ノウハウ」の利用条件も問題となる。前記第 2-3-⑵-⑤のとおり、AI 技術の開発に関するノウハウには、複数の種類のものが含まれる。
学習用データセットや学習済みモデルの生成に必要とされるノウハウは、データと同様に無体物(情報)であり、所有権の対象とはならない。ただし、管理されているノウハウの一部には、営業秘密として不正競争防止法上の保護が及ぶ場合や、また、特許法上の発明に該当する場
24 他方、データに知的財産権が発生する場合には、当該知的財産権の権利者に独占排他的権利が帰属することを前提とした上で、当該知的財産権の利用許諾の範囲の設定が問題となる。
合もあるであろう。
これらの法令上の保護対象となる場合を除いては、ノウハウの利用条件についても、契約による合意がなければ、それに現実にアクセス可能な者が自由に利用できるのが原則である。もっとも、AI 技術の開発は、ベンダとユーザの共同作業としての性質もあり、その過程で生じたノウハウ 26については、双方が権利を主張することも少なくないため、契約で明示的に合意することが重要である。
(2) 権利帰属・利用条件の設定
① 知的財産権の対象の整理
前記第 2-3-⑵のとおり、AI 技術の開発においては、開発対象として合意された成果物(学習済みモデル等)や、開発の過程で学習用データセット、学習済みパラメータ等が生じるが(以下、このような成果物や、中間生成物を「成果物等」という。)、その中には知的財産権(特許権や著作xx)の対象になるものと、対象にならないものが含まれる。
a 知的財産権の対象となる場合
成果物等のうち知的財産権の対象となるものについては、原始的に誰に、どのような権利が発生するかに関するルールが法律のデフォルトルールとして定められていることから(たとえば、特許法 29
条 1 項、著作xx 17 条 1 項等)、契約においては当該デフォルトルールを前提として、知的財産権の①「権利帰属」および②「利用条件」を定める必要がある。
たとえば、学習用プログラムや推論プログラム等がプログラムの著作物に該当する場合、著作権法上は、当該プログラムを創作した者が「著作者」(著作xx 2 条 1 項 2 号)となり著作権を有することになる。したがって、推論プログラムをベンダが開発した場合、法律のデフォルトルール上はベンダが推論プログラムの著作者(著作xx 15 条)として、当該プログラムに関する著作権を有することになることが一般的であろう。その上で、契約においては当該プログラムに関する著作権がベンダに帰属することを確認するか、ベンダからユーザに移転(譲渡)するかを定めることになる。これが知的財産権に関する①「権利帰属」の問題である。
さらに、知的財産権については、その利用条件を当事者間の合意により設定することが可能であるため(特許法 78 条 1 項、著作xx 63
条 1 項等)、契約においては必要に応じて、それら②「利用条件」を設定することになる。
b 知的財産権の対象とならない場合
以上に対し、成果物等の中には、知的財産権の対象にならない可能性があるものも存する。たとえば、学習済みパラメータは大量の数値データであって、創作性等が認められず、通常は知的財産権(著作権
等)の対象にはならない可能性が高いと考えられるし、ノウハウについては、秘密管理性、有用性、非公知性の要件を満たす場合に、営業秘密として一定の保護を受ける場合があり得るにすぎない。
このような知的財産権の対象とならない成果物等については、その利用等に関する法律上の明確なデフォルトルールが存在しない。
したがって、原則としては、現実にアクセス可能な当事者が自由に利用することができるのであり、その利用を制限する必要があるのであれば、当事者の合意によって直接「利用条件」を設定する必要がある。このような知的財産権の対象とならない成果物等については、特許法における「実施」や、著作xxにおける「複製」等のように、利用態様が法令上定められていない以上、具体的な利用態様について、合意しておくことが重要である。
② 取決めにおける考慮要素
a 一般的な考慮要素
以上のとおり、成果物等が知的財産権の対象となる場合には、権利の帰属について議論をすることが重要であるが、理論上は、誰が権利者(著作者・発明者等)に該当するかが問題となる。もっとも、その原始的な取得者が誰であれ、当事者間の合意によりその帰属先を選択できることに照らせば、考慮すべき事項は当事者の合意によって決まる利用条件の設定の場面と類似しているといえる。
また、成果物等が知的財産権の対象とならない場合についても、契約によりその利用条件を定める必要があることも少なくない。
このような、「権利帰属」や「利用条件」の設定については、その対象となるデータやプログラムの生成・作成に寄与した程度(寄与度)、これに要する労力や、必要な専門知識の重要性、データやプログラムの利用により当事者が受けるリスク等を主たる基準として判断されることが一般的であると考えられる(本ガイドライン(データ編)第 5-2-⑷参照)。
具体的に、寄与度に影響する要素としては、次のものが考えられる。
当事者が提供したデータ・ノウハウ・創意工夫の価値
当事者の技術力
生成・作成に要した人的・物的なコスト
生成物の独自性・固有性・当事者にとっての有効性、有用性
支払われる対価の額や支払条件等
これら要素を踏まえて、契約対象について、どの部分(全体なのか一部なのか)について、どのような条件(独占・非独占/対価の有無・金額等)で、いずれの当事者に帰属させ、あるいは利用を認めるか否かを明確にする必要がある。
b 「権利の帰属」について
契約の実務においては、成果物や知的財産等の「権利の帰属」をめぐる議論により協議・交渉が膠着状態に陥ることがある。
特に、学習済みモデルの生成・利用を目的とする契約については、
実務的な知見・経験がいまだ十分に蓄積されていないこともあり、
「何か問題があると困るため、とりあえず権利を全て取得しておけば安全である」との発想に陥るケースも散見される。
具体的には、ユーザが提供したデータのみを利用して学習済みモデルの生成を行った場合、ユーザは、ベンダに対価を支払っていることに加えて、データの取得・生成に相応の投資をしていることや、自社のノウハウがデータに反映されていること等から、そのデータを利用して生成された学習済みモデルに関して自社への「権利の帰属」が認められるべきであるとの意識を持つことが少なくない。
他方、ベンダも、ユーザに学習済みモデルの権利の全てがユーザに移転してしまうと、学習済みモデルの生成が自由にできなくなり、今後の事業の自由度に大きな制約を受けることになってしまうとの危惧から、やはり、学習済みモデルの「権利の帰属」を主張することになる。
しかしながら、このような「権利の帰属」をめぐる議論に多大なコストを費やすことが常に必要とは限らない。むしろ、AI 技術の開発の遅れを招き、競合事業者の後塵を拝するようなことにもなりかねない。そこで、契約の当事者が、それぞれ何を求めているかを相互によく理解して、利用条件をきめ細やかに設定することで、適切な合意に至ることができることもある。
たとえば、AI 技術の発展のスピードが著しいことに照らせば、学習済みモデルにつき、ベンダに権利を帰属させた上で、開発後、一定期間の目的外利用や競業的利用をベンダに禁止する等の対応をすることによって、当事者双方の利益に合致する契約を締結できる場合もあるだろう。また、逆にユーザに権利を帰属させた上で、ベンダが事業上必要な範囲については、その利用を認めることも考えられる。
このように、当事者は、権利の帰属に必ずしもこだわるのではなく、利用条件についても目を向けることによって、妥当な解決を目指す ことができることもある。協議・交渉が無用な膠着状態に陥ることは、それ自体が事業の目的を阻害する要因となり得るのであり、可能な 限り避けるべきものである。
c 「利用条件」について
前記第 2-3-⑵および第 2-3-⑶の各対象について、設定可能な利用条件としては、下表のようなものが考えられる。ただし、これらの要素を全て確定しておく必要があるわけではなく、また、それが常に可能であるとも限らない。
利用条件の設定においては、下表を参考に、当事者が対象となるプログラムや、データ、ノウハウの利用条件の設定により確保したい利益を明確化して、交渉を行うべきである。利用条件の主な交渉ポイントとしては、以下が挙げられる。
利用目的(契約に規定された開発目的に限定するか否か)
利用態様(複製、改変およびリバースエンジニアリングを認めるか)
第三者への利用xx・xxの可否・範囲(他社への提供(横展開)を認めるか、競合事業者への提供を禁じるか)
利益配分(ライセンスフィー、プロフィットシェア)
なお、実務上、ユーザが、学習済みモデルの転用を許容することにより、自らが提供する各種データやノウハウの流出に懸念を示すことが少なくない。
このような場合、ベンダ側の利用に関し、第三者への開示、利用許諾、提供等(下表【ベンダ側】②)に関するきめ細やかな定めによって、懸念を払拭できる場合があるであろう 28。加えて、たとえば、第三者に提供する学習済みモデルをデータ提供者に見せて、その中に秘密情報やノウハウが含まれていないことを確認してもらうとの対応をとることも考えられる。
このように、ユーザ側の懸念が生データや元のノウハウの秘密性 の喪失に依拠する場合は当該懸念に配慮した合意や協議ができれば、ユーザ側の懸念が払拭されることも少なくないと思われる。
【ユーザ】
利用の範囲 | 利用の可否・条件 |
① 自己の業務遂行に必要な範囲での利用(②に記載の利用を除く) | 利用対象・態様・地域 独占・非独占 期 間 地 域 ライセンスフィーの支払有無・内容 その他条件 |
② 再利用モデルの生成 | 再利用モデル生成の目的・態様(例:新たなデータを利用した追加学習) 独占・非独占 期 間 地 域 ライセンスフィーの支払有無・内容 その他条件(再利用モデルの他方当事者へのグラントバック等) |
③ 第三者への開示、利用許諾、提供等 | 独占・非独占 期 間 地 域 再利用許諾権の有無 一定の第三者(ベンダの競合事業者等)への利用許諾の可否 ライセンスフィーの支払有無・内容 その他条件 |
【ベンダ】
利用の範囲 | 利用の可否・条件 |
① 本開発目的以外の目的のための利用(再利用モデルの生成等) | 利 用 目 的 利用態様(例:新たなデータを利用した追加学習) 独占・非独占 期 間 地 域 ライセンスフィーの支払有無・内容 その他条件(再利用モデルの他方当事者へのグラントバック等) |
② 第三者への開示、利用許諾、提供等 | 独占・非独占 期 間 地 域 再利用許諾権の有無 一定の第三者(ユーザの競合事業者等)への利用許諾の可否 ライセンスフィーの支払有無・内容 その他条件 |
4 責任の分配
(1) 責任に関する整理
学習済みモデルの生成や利用に関し、たとえば開発が頓挫したり、学習済みモデルによる何らかの誤りが生じたりした場合の当事者間の契約に基づく責任の分配については、①債務不履行(契約で合意された債務の履行があったか否か)29と、②帰責性・因果関係(生じた結果を当事者に帰責できるか否か)の有無の問題に分けて考えることができる。
① 債務不履行の有無
契約上、当事者間の責任の所在が明確になっている場合には、その定めに従い、個別の問題を処理すれば足りる。
他方、当事者間の契約上何らの定めがない場合には、債務不履行の有無は、通常、学習済みモデルの生成またはサービスの目的、当事者の技術力、支払われる対価の額や支払条件等を総合的に考慮し、当事者がどの程度の水準のサービスを相手方に提供することを約していたか(黙示の合意の内容)によって定まると考えられる。
ただし、一般的には、前記第 2-4-⑴に述べたような AI 技術の特性に照らし、ベンダが、xxの入力(データ)について一定の結果(あるいは想定しなかった挙動が起こらないこと)を約束または保証していたと解することは難しい場合も少なくないと考えられ、このような場合には、学習済みモデルによる誤りが債務不履行と評価されないこともあり得る。
② 帰責性・因果関係の有無
また、仮に債務不履行があったとして、帰責性・因果関係の有無については、当事者の一方が損害の発生にどれだけの寄与をしたといえるか否かが考慮されることになる。もっとも、故意・過失等の帰責性や因果関係が不明であることが少なくないと考えられる。このような場合には、生じた結果をベンダに帰責することには困難が伴うであろう。
以上のことから、当事者としては、開発やサービスの利用にあたって、どのような開発を行いまたはどのようなサービスを提供するかについ て、相互に十分協議した上で、責任分配について何が可能で可能でない かを十分に理解し、必要に応じて責任分配の点を契約に明記しておく ことが望ましい。
(2) 学習済みモデルの生成
開発段階では、上記の視点のうち、主に①債務不履行の有無が問題となることが多いであろう。
① 開発頓挫のリスク
学習済みモデルの生成は、前記第 2-4-⑴のとおり、従来型のソフト
ウェア開発等と異なり、統計的な本質を有し、試行錯誤が必要不可欠
(帰納的)であって、また、結果として、ベンダ側で学習済みモデルを完成できないこともあり、初期段階で開発を中止せざるを得なくなるおそれも小さくない。このような場合には、いずれの当事者が、開発頓挫のリスクを負うかが問題となる。
もっとも、このような開発頓挫の責任をめぐる争いが生じること自体を避けることが、ユーザ・ベンダ双方にとって望ましい場合が多いと思われる。
そのためには、当事者間で、学習済みモデルを含む AI 技術の完成について、開発の初期段階において保証することが技術的には容易でないことを踏まえつつ、開発の進展に伴い、⑴対価の額や支払方法、⑵ユーザ側が学習済みモデルに求める水準等について、相互理解を深めながら合意を形成する必要がある。具体的には、後記第 4-2-⑵のとおり、契約をアセスメント段階から開発段階(必要に応じて追加学習段階)まで、多段階に分ける「探索的段階型」の開発方式を採用することは一考に価すると思われる。
② 学習済みモデルの品質や性能の問題
加えて、開発された学習済みモデルの品質や性能が問題となることも少なくない。開発の各段階における契約の法的性質としては、後記第 4-3-⑴のとおり、請負や準委任等が考えられるものの、あくまでも当事者間の合意がない場合のデフォルトルールにすぎない。
ユーザとベンダにおいて、何を開発の目的とするか、成果物をどのように評価するか、どのような基準で報酬等を支払うかを契約において明確に定めておく必要が高いといえよう。
③ インテグレーション
さらに、学習済みモデルの生成に関しては、外部システムとの統合
(インテグレーション)も問題になり得るため、この点に関しても意識した契約を締結することが望ましい。
(3) 学習済みモデルの利用
学習済みモデルの利用段階では、上記の視点のうち、①債務不履行の有無と②帰責性・因果関係の有無の両方が問題となる場合が多いであろう。
① 学習済みモデルの利用に関して生じる責任の特徴
学習済みモデルの利用段階では、学習済みモデルの動作等に誤りや、当事者が期待または満足しない結果が生じ、ひいては、ユーザまたは第三者に損害が生じた場合に、誰がどのような責任を負うのかが問題となる。
この点についても、生じた損害に寄与した者が責任を負うのが民法その他の法令上の一般的な考え方であるといえるが、前記第 2-4-⑴のとおり、学習済みモデルについては、次の事項を踏まえた検討が必要になり、その責任の所在を把握することが困難な傾向にある。
xxの入力(データ)に対する学習済みモデルの事前の性能保証
が技術上難しい。
因果関係等につき事後的な検証等が技術上困難である 30。
学習済みモデルの性能等が学習用データセットに依存する。
AI 生成物の性質等が利用段階の入力データの品質に依存する。
また、現状の AI 技術の水準を踏まえれば、学習済みモデルを利用したサービスは、本質的に統計的な、高度な事業支援を内容とするものがほとんどであって、学習済みモデル等により出力された結果の採否は、基本的にユーザの判断に委ねられていると考えられ、この観点からも、生じた結果につき、ベンダに責任を負わせることは難しい面があることは否定できない。
このような性質を持つ学習済みモデルの利用に伴う責任に関しては、生じた結果に寄与した者が責任を負担するという不法行為法によって は明確な結論を得ることが難しく、ユーザとベンダのどちらがどれく らい責任を負うかは不明確とならざるを得ない。したがって、当事者に おいて、契約に定めることによって、そのルールに従って分配されるこ とが一般的であるし、望ましい。
加えて、第三者との関係では、不法行為法に基づく処理がなされることが基本であるが、ユーザ・ベンダ間と同様に、責任を負担する者を明確にすることは一般に難しい。
② 契約当事者間の関係
前記第 2-4-⑴のとおり、学習済みモデルを利用したサービスについては、AI 技術の特性を考慮すれば、ベンダが、xxの入力(データ)について、一定の結果を約束または保証することは実態に即さず、または困難な場合が少なくないと考えられる。
そのため、現在の実務上、契約においては、ベンダ側の責任を一定の範囲に限定する規定を設ける等の対応に留まっていると思われる。ベンダもユーザも、このような AI 技術の特性を理解した上で、必要な交渉を行い、契約関係に入ることが必要であろう。
③ 第三者との関係
学習済みモデルやこれを利用したサービスの提供により、第三者に損害を与えた場合に、ベンダが責任を負うか否かについては、次のように整理できる。
当該損害について故意または過失がある場合、ベンダは不法行為責任を負いうる。しかしながら、AI 技術の特性に照らせば、結果予見性がなく、過失がないと判断される場合や、損害との因果関係が認められない場合も考えられる。
学習済みモデルそのものは、無形物であるため、製造物責任法
(平成 6 年法律第 85 号。PL 法)上の製造物には該当しない。
ただし、学習済みモデルがハードウェア(製造物)に組み込まれ一体化した場合には、当該製造物の製造事業者等が PL 法に基づく責任を負いうる。そして、当該製造事業者等に対して学習済みモデルを提供しているベンダは、当該製造事業者等から、第三者に生じた損害に関して、求償を受ける可能性があり得る。
④ 契約における取決め
以上のようなことから、学習済みモデルまたはこれを利用したサービスを提供するベンダは、直接の契約の相手方との間で、適切な責任の分配について取り決めておく必要があるといえる。
もっとも、責任の分配については、開発段階と同様に、①学習済みモデルの内容・性能等が契約締結時に不明瞭な場合が多いこと、②その内容・性能等が学習用データセットに依存する等の AI 技術の特性から、ベンダの側で、学習済みモデルの誤りに関して責任を負うことが困難であることが少なくない点に留意すべきである。特に、利用段階においては、ユーザが学習済みモデルに入力するデータについては、ベンダのコントロールが及ばず、ベンダが学習済みモデルの挙動について責任を負うことがより困難な場合もあるであろう。
ただし、このような AI 技術の特性から直ちに契約条件が導かれるわけでもない。学習済みモデルの生成やこれを利用したサービスの対価の支払いを一定の結果や KPI の達成にかからせる方法等の支払条件のバリエーションにより、ベンダに対して一定の結果の達成にインセンティブを与えることによりベンダとユーザのバランスをとるとの方法も考えられる。
いずれにせよ、事業モデルに即した、当事者の合意によって、責任の分配については契約上できるだけ明確化しておくことが望ましい。また、その交渉に際し、対価の額や支払条件等が重要な交渉ツールとなることが少なくないと考えられる。
5 独占禁止法上の問題
前記に加えて、大企業と中小企業やベンチャー企業との契約交渉等において事実上の優越関係がある中で一方的な契約条項等が押しつけられる場合や、排他条件付取引や拘束条件付取引等が行われる場合には、独占禁止法上の問題になり得る点には留意が必要である。
(1) 優越的地位の濫用
契約当事者間に相対的な優越関係がある場合には、独占禁止法上の優越的地位の濫用(独占禁止法 2 条 9 号 5 号)が問題となり得る。この点、xx取引委員会による「役務の委託取引における優越的地位の濫用に関する独占禁止法上の指針」31は、次の考えを示している。
① 役務の委託取引において、取引上優越した地位にある委託者が、受
31 xx取引委員会、「役務の委託取引における優越的地位の濫用に関する独占禁止法上の指針」、xxxx://xxx.xxxx.xx.xx/xx/xxxxxxxxx/xxxxxxxxxx/xxxxxxxxxxxxx.xxxx、(平成 1 0 年 3 月 17 日。平成 23 年 6 月 23 日改正)
託者に対し、成果物が自己との委託取引の過程で得られたことまたは自己の費用負担により作成されたことを理由として、一方的に、これらの受託者の権利を自己に譲渡(許諾を含む。)させたり、当該成果物、技術等を役務の委託取引の趣旨に反しない範囲で他の目的のために利用すること(二次利用)を制限したりする場合等には、不当に不利益を受託者に与えることとなりやすく、優越的地位の濫用として問題を生じやすい。
② しかし、このような場合に、成果物等にかかる権利の譲渡または二次利用の制限に対する対価を別途支払ったり、当該対価を含む形で対価にかかる交渉を行っていたりすると認められるときは、優越的地位の濫用の問題とはならない。
③ ただし、このような場合であっても、成果物等にかかる権利の譲渡等に対する対価が不当に低い場合や成果物等にかかる権利の譲渡等を事実上強制する場合等、受託者に対して不当に不利益を与える場合には、優越的地位の濫用として問題となる。
したがって、本ガイドライン(AI 編)が対象としているベンダとユー ザとの間の AI 技術を利用するソフトウェアの開発に関する契約において、どのような条件で取引をするかは、基本的には当事者の自主的判断に委 ねられているものの、いずれか一方が取引上優越した地位を利用して、正 常な商習慣に照らして不当に、代金の支払遅延、代金の減額、著しく低い 対価での取引や、やり直し、または AI 技術を利用するための生データ、学習用データセット、学習用プログラムおよび学習済みモデルにかかる 権利等の一方的な取扱い(たとえば、権利の譲渡や二次利用の制限)を行 うこと等は、優越的地位の濫用の問題を生じさせることとなる。もっとも、権利の譲渡や二次利用の制限について、別途、適切な対価を支払ったり、 当該対価を含む形で対価にかかる交渉を適切に行ったりしている場合
(二次利用における収益配分の条件を含む。)には、優越的地位の濫用は問題とならないことになろう。
(2) 排他条件付取引・拘束条件付取引等
AI 技術を利用したソフトウェアに関する契約において、AI 技術を利用したソフトウェアにかかる利用条件の設定やその制限に関する契約条項を定めるにあたっては、独占禁止法上の排他条件付取引や拘束条件付取引等の不xxな取引方法(独占禁止法 19 条)も問題になり得る。
たとえば、本ガイドライン(AI 編)の想定する場面では、ベンダとユーザとの間の、知的財産のうち技術に関するものの取扱いについては、ライセンス契約関係が生じないこともあるので、そのまま当てはまるものではないが、ライセンス契約においては、ライセンシーが開発した改良技術について、ライセンサーもしくはその指定する事業者に権利を帰属させる義務、またはライセンサーに独占ライセンスをする義務を課す行為は、原則として不xxな取引方法に該当するとされ、共有とする場合であってもxx競争阻害性を有する場合には、不xxな取引方法に該当する
(一般指定 12 項)。
他方で、xxxxxxの改良技術について、ライセンサーに非独占的にライセンスをする義務を課す行為は、xxxxxxが自ら開発した改良
本ガイドライン(AI 編)で想定する AI 技術を利用したソフトウェアの開発委託に限った話ではないが、プログラムの作成委託は下請代金支払遅延等防止法の「情報成果物作成委託」(同法 2 条 3 項、6 項)に該当するため 34、一定規模を超える元請事業者が開発の全部または一部を一定規模以下の下請事業者に委託する場合 35には、同法の対象となる。つまり、下請法は、一般的なユーザ・ベンダの取引には適用されず、大手システム会社が開発の一部を他の中小システム会社に委託するような場合に適用される。
下請法の対象となる場合には、独占禁止法上の優越的地位の濫用規制と同様に、発注者である事業者(親事業者)は、支払遅延、下請代金の減額、著しく低い下請代金での取引等を行うことが禁止される。
また、親事業者は、①下請事業者から給付を受領してから 60 日以内のできる限り短い期間内に対価の支払期日を定める必要があり、②下請代金の額、支払期日および支払方法等を記載した書面を交付しなければならず、③支払遅延の場合には、下請事業者の給付を受領した日から起算して 60 日を経過した日から支払いをする日までの期間について、年率 14.6%の遅延利息の支払義務を負うと共に、④一定の書類の作成・保存義務を負うことになる(同法 2 条の 2、3 条、4 条の 2、5 条)。
32 xx取引委員会「知的財産の利用に関する独占禁止法上の指針」、xxxx://xxx.xxxx.xx. jp/dk/guideline/unyoukijun/chitekizaisan.html、(平成 19 年 9 月 28 日。平成 28 年 1 月 21 日改正)
33 下請代金支払遅延等防止法(昭和 31 年法律第 120 号)
35 同法の対象となる場合は、同法 2 条 7 項から 9 項に規定されている。
第4 AI 技術を利用したソフトウェアの開発契約
1 AI 技術を利用したソフトウェアの開発とは
AI 技術を利用したソフトウェアとしては、学習用プログラムや学習済みモデルが考えられるところである。実務上は、ベンダが学習済みモデルを開発し、ユーザ等の委託者に納品することで収益を得る類型の汎用性が特に高いと思われるため、本章では、学習済みモデルの開発(生成)について、その考え方や契約を締結する際の考慮事項等を解説する。
2 学習済みモデルの開発類型
(1) 開発類型の分類
本作業部会でヒアリングしたユースケース等においては、①学習済みモデルのみ生成する類型、②学習済みモデルを含んだシステムを開発する類型、および③学習済みモデルの生成の再受託を受ける類型の 3 つの類型が見られた。
図 2:開発類型
① 学習済みモデルのみ生成する類型
<事例 1 ユーザがデータの提供を行い、ベンダが単独で学習済みモデルのみを生成する場合>
例:損害保険会社 Y 社が、データ解析会社 X 社に対して、自社データの解析を依頼した。X 社では、当該データについて機械学習を実行し、Y 社に対して、その要望する機能を備えた学習済みモデルを納品した。
<事例 2 ユーザとベンダが共同でデータの提供を行い、ベンダが単独で学習済みモデルのみを生成する場合>
例:機器製造事業者 X 社は、Y 社に提供する監視機器について、特定の対象を検出できることを目的とした学習済みモデルの搭載を検討している。学習済みモデルの生成にあたっては、X 社および Y 社の双方が提供する画像データを併せて学習させた。
② 学習済みモデルを含んだシステムを開発する類型
<事例 3 ユーザがデータの提供を行い、ベンダが単独で学習済みモデルを含んだシステムを開発する場合>
例:商社 Y 社が、学習用データセットを提供し、受託を受けた機械学習の開発業者 X はそのデータを用いて、学習済みモデルを含むシステムを開発し、Y 社に納品した。
<事例 4 ベンダが自らデータの準備を行い、単独で学習済みモデルを生成し、これを基に別の事業者がシステム全体を開発する場合 36>
例:Y 社がベンダ X1 社とシステム開発事業者 X2 社に対して、本人確認システムの開発を委託した。X1 社は自らが準備したデータを用いて学習済みモデルを生成し、これを X2 社が本人確認システムに組み込み、Y 社に納品した。
③ 学習済みモデルの生成の再受託を受ける類型
<事例 5 ユーザからシステム全体の開発委託を受けた SIer 等からベンダが学習済みモデルの生成部分のみの再受託を受ける場合>
例:SIer である Y 社は物流業界企業(エンドユーザ)から荷物の積載を自動計算するシステム開発の受注をした。Y 社はベンダ X 社が生成した学習済みモデルを組み込んだシステムを開発し、エンドユーザに納品した。
(2) 対象とする開発類型
本章では、前記①学習済みモデルのみを生成する類型を前提として、学習済みモデルの開発契約を説明する。前記②の類型では、ベンダが、また、前記③の類型では SIer が、それぞれ、学習済みモデルを、いわゆるモジュールとして含むシステムの開発を受託することになるが、モジュール部分の開発については前記①の類型に関する議論が同様に妥当する。
なお、成果物や開発途中で生じた知的財産については、ベンダにその知的財産xxを帰属させることもあれば、ユーザに帰属させることもあり、開発型であることは、必ずしも一方当事者への自動的な権利帰属を意味しないことに留意が必要である。
3 開 発 方 式
学習済みモデルの生成に関する契約の枠組みを決定するためには、まず、学習済みモデルをどのようにして生成するかを検討する必要がある。そのため、まず、一般的なソフトウェア開発方式を紹介した上で、学習済みモデル生成に適した開発方式を説明する。
(1) ソフトウェアの一般的な開発方式
一般的にソフトウェアの開発方式は、①ウォーターフォール型と、②非ウォーターフォール型(プロトタイプ型、スクラム型、アジャイル型等)に分類される。
① ウォーターフォール型
ソフトウェア開発の過程を「要件定義」、「システム設計」、「システム方式設計」、「ソフトウェア設計・プログラミング・ソフトテスト」、
「システム統合」、「システムテスト」、「運用テスト」、「運用・評
価」等の工程に分割し、前工程によって後工程における作業を詳細化していく開発手法である。完全に前工程への手戻りが否定されるものでないものの、ソフトウェアの仕様等を開発の初期に確定し、これを基に開発が進むことから、後に仕様等を変更することに困難を伴うことが多い。
② 非ウォーターフォール型
(2) 学習済みモデル生成に適した開発方式
学習済みモデルのみを開発する場合、前記第 2-4-⑴のとおり、契約締結時には、成果物として何が出来上がるかを事前に予測することが難しく、また、その過程で生じた生成物の性能等を事後的に検証することも困難である。そのため、その開発過程は必然的に探索的にならざるを得ず、試行錯誤を何度も重ねる必要がある。このような状況では、後戻りが不可避的に発生することから、あらかじめ確定した要件定義を前提とし、開発を段階的に詳細化していくウォーターフォール型の開発は必ずしも実態にそぐわない場合が多く、非ウォーターフォール型の開発が適している
37 モデル契約 2007・31 頁の図「品質保証の観点からの設計とテストとの対応関係」
38 独立行政法人情報処理推進機構ソフトウェア・エンジニアリング・センター「非ウォーターフォール型開発 WG 活動報告書」、xxxxx://xxx.xxx.xx.xx/xxxxx/000000000.xxx、(平成 23 年 3 月)105 頁
場合が多いと考えられる。
そこで、本ガイドライン(AI 編)では、開発プロセスを別個独立した複数の段階に分けて探索的に開発を行う「探索的段階型」の開発方式を採用することを提唱する。具体的には、次のとおり、①アセスメント段階、
②PoC 段階、③開発段階、④追加学習段階の4 段階による開発方式である。
図 4:「探索的段階型」の開発方式
このような開発過程を多段階に分ける開発思想はウォーターフォール型開発やアジャイル型開発とも共通し、必ずしも目新しいものではない。しかし、本ガイドライン(AI 編)が提唱する「探索的段階型」の開発方式は、開発初期に成果物を確定しない点でウォーターフォール型開発と、また、開発全体を 1 つの基本契約で規律するフレームワークを採用しない点でアジャイル型開発と、それぞれ異なる。
このような「探索的段階型」の開発方式を採用するメリットは 2 つある。
第 1 に、学習済みモデル生成においては、前記第 2-4-⑴-①のとおり、従来型のソフトウェア開発と異なる不確実性があることから、開発対象や性能について、事前に予測することが困難であり、ユーザとベンダの認識に齟齬が生じることが少なくない。そこで、開発を複数段階に分け、各段階における達成目標を明確とすることで、ユーザとベンダとの間の話合いが促進され、最終的な成果物である学習済みモデルに対する認識をすりあわせることができる。
第 2 に、そのような学習済みモデル生成の不確実性から、多大な投資を したにも関わらず、開発の途中で学習済みモデルが予定した性能を発揮 できないことが明らかとなり、開発を中止することも十分に考えられる。そこで、開発を複数段階に分け、十分な性能を備えた学習済みモデルの生 成が困難であることが判明した場合には、その段階で開発を中止するこ とにより、それ以上の損失拡大を防ぎ、リスクヘッジを図ることができる。
(3) 各段階の説明
本ガイドライン(AI 編)が推奨する「探索的段階型」の開発方式の各段階について、以下、説明する。その概要は次の表のとおりである。
アセスメント | PoC | 開発 | 追加学習 | |
目的 | 一定量のデータを用いて学習済みモデルの生成可能性を検証する | 学習用データセットを用いてユーザが希望する精度の学習済みモデルが生成できるかを検証する | 学習済みモデルを生成する | ベンダが納品した学習済みモデルについて、追加の学習用データセットを使って学習をする |
成果物 | レポート等 | レポート/ 学習済みモデル(パイロット版)等 | 学習済みモデル等 | 再利用モデル等 |
契約 | 秘密保持契約書等 | 導入検証契約書等 | ソフトウェア開発契約書 |
なお、開発の各段階は、必ずしも明確に区別されるものではなく、その一部または全部が連続的に行われる場合もある。その意味でこれらの区別はあくまでも相対的なものにすぎない。なお、これらの各段階はそれぞれ 1 回で完了させない場合もあり、各段階の中で数回に分けて契約を締結することも考えられる。
① アセスメント段階
「アセスメント段階」とは、ベンダがユーザとの間で秘密保持契約を締結した上でユーザから一定量のデータ(たとえば、ユーザ側でそれほど労力をかけずに提供できるデータ)を受領し、学習済みモデルの生成可能性があるか否かを事前検証する段階である。この段階では、レポート等の成果物提供を伴うこともあるが、極めて初期的な段階であるため、学習済みモデルが成果物として提供される場合はほとんどない。
事前検証の内容は様々であるが、まず重要なことは、ユーザが、AI 導入により何を解決したいのかを探求すること、すなわち、課題の設定である。AI 技術に対する理解不足や、過度な期待から「とりあえず AI を導入したい」との漠然とした問題意識のみで、学習済みモデルの生成を委託するケースが実務上少なくない。しかしながら、AI 技術はあくまでもツールにすぎず、重要なのは、これを用いていかなる事業上の課題を解決するかという視点である。
また、同様に、事業上の課題が、いかなる場合に達成できたと評価するか、すなわち、KPI が設定できる場合は、KPI を明確にすることも重要である。
40 追加学習に関する契約としては多様なものが想定され、たとえば、保守運用契約の中に規定することや、学習支援契約または別途新たなソフトウェア開発契約を締結することが考えられる。
これら事業上の課題および KPI の設定は、事業内容に依存することから、ユーザの責任において実施され、ベンダはそれを支援するとの役割分担が実情に即していると思われる。そして、これらの課題が明らかとなって初めて、ユーザがベンダに対してどのようなデータを提供する必要があるか、必要なデータは十分にあるのか、足りないデータがある場合には集められるのか、といった事項を、ユーザとベンダ間で事前検証できる。その上で、データの仕様等についてさらに協議を重ねることになる。
このような意味で、学習済みモデルの生成に際しては、ユーザの積極的な関与が必要不可欠である。そして、データに関する打合せや検証作業は、ユーザとベンダとの間の密接なコミュニケーションを伴うことから、場合によっては有償での契約を締結した上で、数か月単位の時間をかけて行うことも珍しくはない。
なお、アセスメント段階で、およそ成功可能性がないということになれば、開発がそのまま終了することもある。
加えて、アセスメント段階を踏まずに、「PoC 段階」からスタートする場合や、アセスメント段階と PoC 段階を一体として実行する場合もある。
② PoC 段 階
学習済みモデルの生成において「PoC 段階」は、ユーザまたはベンダが保有しているデータを基に学習済みモデルの生成を進めるかについて検証する段階として捉えられることが多い。
アセスメント段階と異なり、基本的にはユーザが保有している一定量のデータ(あるいは新たにデータを生成するのであれば生成されたデータ)を用いて、学習済みモデルの生成・精度向上作業を行い、事後の開発の可否や妥当性を検証する。このような検証の結果は、レポートにまとめられることが一般的である。
また、PoC 段階の内容には、学習済みモデルのパイロットテストを含むことがある。この場合、PoC 段階では、既存のシステムの一部を学習済みモデルを用いたモジュールで置換し、その統合(インテグレーション)をした上で、性能を評価する。そして、KPI が実現可能であると確認された場合、開発段階に進むことになる。このようなパイロットテストは、ベンダの環境下において実施することもあれば、実環境を模した仮想環境、あるいは、実環境において実施することもある。特に、仮想環境あるいは実環境において PoC を実施する場合には、成果物として学習済みモデルが生成されることもある。この場合には、その権利帰属や利用条件について協議をする必要が生じる。
このように、PoC 段階では、様々な業務が対象となり得る。そのため、実務上、PoC 段階の契約については、その対象範囲や対象期間を合意しておくことが重要となる。また、PoC 段階は、学習済みモデルの生成が試行錯誤を不可避的に伴うことから、1 回で完結せず、複数回実施されることも少なくない。
PoC 段階では、その後の開発段階への移行が想定されているため、それぞれの段階で統一的に取り扱うべき事項があるか、あるいは、各段階で個別に取り扱うべき事項があるかを整理しておく必要もある。たと
えば、検証のため提供されるデータや、成果物(特に学習済みモデル)に関する権利帰属や利用条件について、各段階の取扱いをあらかじめ検討しておくことが望ましい。その結果、PoC 段階の成果物に関する知的財産xxについてはベンダ帰属とするが、開発段階の成果物についてはユーザ帰属とすることも考えられる。
また、PoC 段階が功を奏した場合に、開発段階へと移行するとのユーザ・ベンダ間の認識を確認する趣旨で、開発契約締結の努力義務を定めることもある。
③ 開 発 段 階
「開発段階」は、実際に学習用データセットを用いて学習済みモデルを生成する段階である。その概要は、前記第 2-3-⑴のとおりである。
④ 追加学習段階
「追加学習段階」は、ベンダが納品した学習済みモデルについて、追加の学習用データセットを使って学習をする段階である。学習済みモデルを生成したベンダが追加学習支援をすることもあれば、全く別のベンダが実施する場合もある。保守運用とセットでなされることも考えられる。
(4) ユーザ・ベンダの役割
学習済みモデルの生成に際しては、従来型のソフトウェアの開発以上に、ユーザとベンダ双方の積極的な関与が必要である。
① ユーザの役割
前記のとおり、学習済みモデルの生成が、データを用いた帰納的なアプローチにより行われる以上、その性能は、学習に用いる学習用データセットに大きく依存する。
そして、学習済みモデルを生成するにあたって必要となる生データは、ユーザのコントロール下にあり、ベンダは、そもそも、ユーザがいかなるデータを有しているかを事前に知らないことが通常である。したがって、ユーザから開発を希望する機能を抽象的に伝えられるのみでは、学習済みモデルの生成に着手することは原理的に困難であり、ベンダは、ユーザから生データまたは学習用データセットの提供を受けて、初めて開発を進めることができる。
このように、ユーザが学習用データセット、あるいは、その元となる生データをいかにして準備するかは、学習済みモデルの生成における最重要プロセスの 1 つであり、従来型のソフトウェア開発と比較して、
ユーザの果たす役割が大きいポイントの 1 つである。
そして、ユーザが、必要なデータを準備するためには、⑴学習済みモデルを生成することによって、その事業上、何を獲得目標とするかについて、すなわち、事業上の課題および KPI を明確に認識した上で、⑵いかなるデータが自らのコントロールする環境において生成されるかを把握し、さらに、⑶学習あるいは評価に適したデータを選択する必要がある。
このような作業に際しては、ベンダの支援を受けることができる場
合もあろうが、主体となるのは、あくまでも、ユーザである。学習済みモデルの生成は、ユーザの積極的かつ主体的な関与がなければ進めることは困難であるといえる。
② ベンダの役割
ベンダについて見ると、前記のとおり、学習済みモデルについては、技術上、完成保証やxxの入力(データ)に対する性能保証を行うことは必ずしも容易ではないものの、そのことは直ちに、ベンダが契約上、何ら完成責任を負わないことを意味しない。最終的には当事者のリスク分配により、ベンダの義務範囲が定まることになるからである。
そのため、ベンダが、たとえば、開発段階において、限定された評価用データ 41について、契約上、一定の性能を有する成果物の完成を約束することも想定できる。このような場合には、ベンダには、ユーザの希望目標を達成することが求められることになる。また、たとえ、ベンダが、学習済みモデルの完成義務を負わない場合であっても、プロフェッショナルとして一般的に求められる水準で、開発を進めることが求められるであろう。
加えて、このように開発を進める中で重要であるのが、ユーザとの間において、密接なコミュニケーションをとることである。特に、AI 技術が新しい技術であることを踏まえれば、ユーザとベンダとの間には、技術に関する情報格差や認識の齟齬が存する場合も少なくないと考えられる。そのため、ベンダには、学習済みモデルの生成が内包する不確実性や、従来型のソフトウェア開発との違いについて、ユーザに対して適切かつ丁寧に説明をし、共通の技術認識を形成すべく、最大限の努力を払うことがやはり求められる。
このような意味において、学習済みモデルの生成は、ユーザのみならず、ベンダによる積極的かつ主体的な関与がなければ進めることは困難であるといえる。
4 契約における考慮要素
(1) 契約の法的性質
契約の内容は、当事者の合意によって個別具体的に定めることができるのが原則である。もっとも、一定の事柄についてベンダとユーザの間に明示的な合意がない場合に適用されるであろうデフォルトルールを理解することは、契約の内容を協議し定める上でも重要である。
以下では、従来型のソフトウェア開発の場合と比較しながら、特に、役務の提供を契約の目的と見るのが適切であるのか 42(準委任型)、役務の結果を給付することまでを契約の目的と見るのが適切であるのか(請負型)に注目して、学習済みモデル生成の各段階に親和的な契約の性質を検
41 アセスメント段階や PoC 段階においてユーザからベンダに対して提供されたデータではなく、開発段階において新たに準備された評価用のデータを想定している。
討する。
① 従来型のソフトウェア開発の場合
従来型のソフトウェア開発においては、それぞれの工程の性質の違いに応じて異なる考慮を行うのが一般的である。
まず、従来型のソフトウェア開発では、企画・要件定義の段階においては、ユーザ・ベンダ双方にとって開発の対象となるソフトウェアの具体的内容がまだ十分に特定されておらず、一般に準委任型の契約が実態に沿うといわれている。
他方、企画・要件定義を経て設計・開発の段階に移行した段階においては、既に開発の対象となるソフトウェアの具体的内容が十分に特定されていることから、特定のソフトウェアの完成までを目的とした請負型の契約が親和的であることが多いといわれている。
② 学習済みモデル生成の場合
従来型のソフトウェア開発の場合とは異なり、学習済みモデル生成の場合はどの段階においても準委任型の契約が親和的である。
まず、アセスメント段階は学習済みモデルの生成可能性を検証するための段階であり、PoC 段階は学習済みモデルの生成をさらに進めることの可否および妥当性を検証するための段階であって、そもそも学習済みモデルの完成を目的とする段階ではない。
また、開発段階は学習用データセットを用いて学習済みモデルを生 成することを目的とする段階であるが、前記第 2-4-⑴の学習済みモデ ルの特性から、契約締結時までに仕様や検収基準を確定することは難 しいことが多く、また、xxの入力(データ)に対しては、学習済みモ デルがユーザ・ベンダのいずれもが想定しない挙動をしないことの保 証をすることも困難である。そのため、具体的な仕事の完成を目的とし、一定の瑕疵担保責任を伴う請負型の契約にはなじみにくい 43。なお、準 委任型の契約を締結する場合には、成果完成型を志向するか、それとも、履行割合型を志向するのかについて、当事者間において、明確にしてお くことが望ましく、また、成果完成型を選択するのであれば、対象とな る成果物がどのようなものかについて合意しておく必要がある。
さらに、追加学習段階は、ベンダが納品した学習済みモデルを基礎に、追加の学習用データセットを使って学習を行うことを目的とする段階
43 他方、既知の入力(データ)に対する学習済みモデルの性能については、前掲注 17 のとおり、評価条件を適切に設定・限定できるのであれば、性能保証を行うことに合理性が認められる場合もあると考えられる。この場合には、学習済みモデルを成果物とする請負契約として構成することになるであろうが、既知の入力(データ)のみならず、xxの入力(データ)に対する性能保証について、当事者間の認識を明確にしておくことが重要となると思われる。
また、この場合、実務上は、限定された評価用データに対しての性能保証がなされる場合が想定されるが、このような評価用データが、ユーザの事業上のリスクを十分に評価したものであるかは、通常、ユーザのみが把握する事項であり、したがって、評価用データの準備は、原則として、ユーザの費用と責任で行われることが合理的なことが多いと思われる。そのため、ユーザが、ベンダに対して、既知の入力(データ)に対する学習済みモデルの性能について保証を求める場合には、かかる費用および責任を負っても、なおも保証を受ける意味があるかについて判断をすることが重要になる。
であって、一定の学習済みモデルの完成を目的とする段階ではない。以上のとおり、学習済みモデル生成の各段階には、具体的な学習済み
モデルの完成を約束する請負型の契約ではなく、一定の検証や開発といった役務の提供を目的とする準委任型の契約がその実態になじみやすい。
(2) 契約における交渉のポイントと留意点
ベンダとユーザのいずれも、学習済みモデル生成の各段階について、
「生データ」、「学習用データセット」、「学習用プログラム」および「学習済みモデル」、また必要に応じて学習済みモデルを構成する「学習済みパラメータ」と「推論プログラム」のそれぞれの取扱いを意識して交渉することが重要である。また、「ノウハウ」の取扱いについても交渉の対象とすることが望ましい場合がある。以下、それぞれについて、契約交渉において特に留意すべき点を述べる。
① 生 デ ー タ
生データは、ベンダやユーザが一定の労力を投下することによって収集・蓄積されたものである場合もあれば、二次利用が可能な利用ルールの下に公開された、いわゆるオープンデータである場合もある。後者の場合には、生データの利用方法をめぐって交渉上の問題が生じることを想定することは難しい。
なお、生データを相手方に開示する当事者は、開示の目的のために必要最小限の範囲を超えた生データの第三者への開示や複製を防止する必要がある場合には、それを明示的に禁止する契約を相手方との間で締結する必要がある。また、生データの開示を受ける当事者が、その開示の直接の目的を超えてそれを利用することを望む場合には、ベンダとユーザのそれぞれの立場から、生データ利用の目的、時期、範囲、対価その他の利用条件を十分に検討の上、互いに協議することが望ましい。
② 学習用データセット
a 定義の重要性
学習用データセットは、前処理が施された生データに正解データ
の付加等を行うことによって二次的に生成されたデータであって、生データそのものではない。しかし、前記第 2-3-⑵-②のとおり、生データと学習用データセットとの間に自ずと明らかな境界が存在するわけではなく、これらの取扱いについて疑義が生じる可能性がある。そのため、これらの語を用いる場合には、契約上の意義を明確化することが紛争防止の観点からは望ましい。
b 役割の分担
学習用データセットの生成は、学習済みモデルの生成と密接に関連する行為ではあるが、それに必ず付随する行為とまではいえない。そのため、学習用データセットを生成する主体は、当事者の合意によって定めるべき内容である。もっとも、学習済みモデルの内容・品質がその基礎となる学習用データセットの内容・品質に実質的に依存することを考慮すると、ユーザの協力の下、学習済みモデルとともに学習用データセットの生成をベンダに委ねることが適切であることが多いであろう。
なお、学習用データセットを生成するために、生データに対して関連する情報を注釈として付与する「アノテーション」を行う場合、このうち単純ではあるものの多大な労力を要するものについては第三者に委託されることがある。ユーザが特にベンダの開発力に期待して契約関係に入った場合には、ベンダに(準)委任された業務の第三者への再(準)委任についてはユーザの承諾が契約上必要とされるのが一般的であり、その場合には、学習用データセットの生成を担うベンダが第三者にアノテーションを委託するには、ユーザからそのための承諾を得る必要がある。
c 権利帰属・利用条件
学習用データセットの生成には、通常、収集・蓄積された生データとこれに対する一定の処理・加工が必要である。生データの収集・蓄積とこれに対する処理・加工にはそれぞれ相当の費用・労力が投下されることは少なくなく、後者には一連の学習済みモデル生成に要する工数の大部分が費やされる場合もある。そのため、学習済みモデルの取扱いとは別に、学習用データセットの契約上の権利帰属や利用条件が交渉上の重要な課題となることがある。
権利帰属、利用条件その他学習用データセットの取扱いを契約に定めるにあたっては、学習用データセットの生成に対する各当事者の寄与と、その基礎となる生データの性質をどのように評価すべきであるのかが、契約の交渉時にしばしば議論の対象となる 45。以下は、その際に考慮されるべきポイントを整理したものである。
当事者の寄与 | 生データの収集・蓄積に投下する費用・労力 生データの処理・加工に投下する費用・労力 学習用データセットの生成に要する各種ノウハウの希少性 |
データの性質 | 生データ自体の価値(営業秘密性・希少性) 学習用データセットの転用可能性 学習用データセットからの生データ復元可能性 |
学習用データセットの取扱いは、ベンダとユーザの利益のバランスの中で終局的には定められるべきものである。しかし、一般論としては、生データに対する前処理、正解データの作成等に希少性の高いノウハウが用いられる必要性が大きく、またはそのようなノウハウにより創出されると見込まれる価値が大きいほど、学習用データセットの生成を担った当事者には交渉上の優位性が認められやすいといえる。また、事業の目的に照らし、営業秘密性の高い生データを含む学習用データセットについては、契約の目的外の利用を許諾しない代わりに、学習用データセットの生成に投下された費用・労力は別途対価の算定において考慮されることもあるだろう。
なお、後記第 4-4-⑵-④-b のとおり、学習済みモデルは、その二次利用を防止し、または生成に用いられたノウハウを秘匿する等の目的により、バイナリファイルの形式を用いる等、判読や二次利用が困難な方法によりベンダからユーザへ提供されることが少なくない。学習済みモデルそのものではなく、ベンダが生成した学習用データセットの分析からも学習済みモデル生成のノウハウ等が解析される危険があることから、これを避けるために学習用データセットを契約上の提供対象に含めないことを検討すべき場合もあり得る。
③ 学習用プログラム
学習用プログラムは、その入力として学習用データセットを利用することにより、学習済みパラメータを生成するためのプログラムであ
る。特定の開発目的のためにゼロから学習用プログラムを作成することはもちろん可能であるが、現在までに様々な機械学習ライブラリ(フレームワーク)が OSS として提供され、普及していることから、学習用プログラムの作成にはこうしたライブラリが広く利用されている 47。そのため、学習用プログラムの権利帰属が交渉上の問題となることは少なく、ベンダの開発部分に関する権利にも特段触れられないことも多いであろう。
もっとも、そのことは、ユーザによる学習用プログラムの利用やソースコードのユーザへの開示等を認めることに問題がないということを意味しない。機械学習ライブラリは、学習用プログラムの作成に要する費用や労力をたしかに低減するものではあるが、目的に適合した学習済みモデルを生成するためには、そのようなライブラリの採否にかかわらず、具体的な手法の選択等に高度なノウハウが要求される。ベンダが作成した学習用プログラムの著作xxをユーザに帰属させ、またはこれをユーザに利用させることの可否は、ユーザによる利用条件が当事者間の利益のバランスを損なうものでないかを十分に考慮して定められるべきである。
なお、学習用プログラムの権利帰属・利用条件を定めるにあたっては、開発対象である学習済みモデルが生成された後、これを基礎とし、また はこれとは独立して、新たな学習済みモデルを生成する事業上の必要 があり得ることに留意することも重要である。たとえば、学習用データ セットに新たなデータを追加して学習済みモデルを自ら生成する事業 上の必要があるユーザは、学習用プログラムについて少なくとも利用 許諾を受けなければならない。他方、そのような追加学習を保守・メン テナンスサービスの一環として行う事業モデルを持つベンダは、学習 用プログラムの利用をユーザに許諾しないという選択をすることにな るであろう。
④ 学習済みモデル
a 定義の重要性
AI 技術を利用したソフトウェアの開発を目的とする契約の実務において、学習済みモデルの取扱いはその中心的な交渉上の課題の一つである。しかし、学習済みモデルの法的な意義は、xxxxx的に明らかであるとはいえず、その取扱いに関する交渉にあたっては、この点について共通の理解を得ておくことが紛争予防の観点から望ましい。
具体的には、学習済みモデルに①学習用データセットを含むか、②学習用プログラムを含むか、また、③学習済みパラメータに加えて推論プログラムを含むかについて、十分な整理がなされないまま交渉が行われ、契約が締結されている例が見受けられる。無用な議論の混乱を避け、交渉を生産的に進めるためにも、当事者間でこれらを整理することが有用であることは多いであろう。
b 提 供 方 法
ベンダからユーザへの学習済みモデルの提供の方法は、ソースコードを開示する等、判読・二次利用が可能な方法による提供の可否という形で交渉上の課題となる場合がある。判読可能な形式により提供された学習済みモデルからはベンダのノウハウを読み取ることも可能な場合もあることから、判読・二次利用が可能な学習済みモデルをユーザの側で必要とする特別な事情が認められない限りは、バイナリファイルの形式を用いる等、判読や二次利用が困難な方法による提供が行われることが一般的である。学習済みモデルの提供方法については、判読や二次利用が困難な方法で行うかどうかを十分に検討した上で定めることが重要である。
c 権利帰属・利用条件
学習済みモデルに関する知的財産権の帰属および利用条件は、ベンダとユーザの間の交渉上の主要な課題である。
学習済みモデルに関する知的財産権の帰属は、学習済みパラメータと推論プログラムから構成される学習済みモデルのどの部分にいかなる知的財産権が成立するかについて明確なルールがまだ存在しないこととも関連し、学習用データセットまたはその基礎となる生データを提供した当事者と、学習用プログラムを作成して実行し、学習済みモデルを生成した当事者とが異なる場合に、特に問題となりやすい。
この場合には、後記⑤および⑥に記載の内容を十分に検討した上で利用条件等を定めることが重要である 48。
d 再利用モデルの取扱い
前記第 2-4-⑴-④のとおり、開発された学習済みモデルを再利用し、これとは異なる学習済みパラメータ等を有する学習済みモデルであ る再利用モデルを生成することが理論上は可能である。再利用前の 学習済みモデルと再利用モデルとの法的な意味での同一性は必ずし も明らかではない。そのため、ユーザまたはベンダが他方当事者によ る学習済みモデルの利用の目的や範囲を制限したい場合、その再利 用モデルの生成の諾否および内容についても契約上明確に定めてお くべきである。
もっとも、学習済みモデルの再利用に制限が定められた場合であ
っても、コンピュータの中でのソフトウェアの動作を外部から把握 することは難しく、これに対する違反を特定することは必ずしも容 易ではない。また、仮に特定することができたとしても、学習済みモ デルの再利用があったことを立証することにも困難が伴うであろう。そのため、紛争予防の観点からは、当事者間の利害が対立する可能性 が高い一定の取引の時期や範囲に制限を設ける等、取引の態様にx xの制限を設けることを検討すべき場合があろう。
⑤ 学習済みパラメータ
学習済みパラメータとは、学習用データセットを学習用プログラムに対する入力として用いることで、一定の目的のために機械的に調整されたパラメータをいう。これは数値等のデータによって表現されるものであるが、その配列自体は人間が「思想又は感情を創作的にしたもの」(著作xx 2 条 1 項 1 号)であるとは言い難いこと等から、一般に、著作権法上の保護が及ぶ著作物に該当する可能性は低いように思われる。
そのため、生成した学習済みパラメータに現実にアクセスすることができるベンダには、これを自由に利用し、管理することができる地位が原則 49としてあることを前提として、ベンダとユーザの間で学習済みパラメータの利用条件を交渉し、契約に定める必要がある。
他方、ベンダからの学習済みモデルの提供を内容とする契約がその 利用方法について何らの留保なく既に締結され、かつ学習済みパラメ ータが識読性がある形でベンダからユーザに提供されている場合には、ユーザによる学習済みパラメータの利用をベンダが認めていると解さ れる可能性がある。たとえば、PoC 段階における成果として学習済みモ デルが性能評価目的で提供される場合等、その利用の目的や範囲にx xの制限を設けることをベンダが希望するのであれば、そのことを契 約上に明示すべきである。
⑥ 推論プログラム
推論プログラムとは、学習済みパラメータがこれに組み込まれ、入力に対して一定の結果を出力することを可能にするプログラムをいい、一定の要件を充たす限り著作xxまたは特許法上の保護が及ぶ。また、これには前記第 3-3-⑴-②のプログラムに関する一般論が当てはまる。
推論プログラムは、開発対象とされる学習済みモデルから出力の結果を取得するために必要なプログラムである。そのため、ベンダによる学習済みモデルの提供が契約上に定められている場合には、ユーザによる推論プログラムの利用の可能性が契約上で明示的に排除されていない限り、ユーザによる推論プログラムの利用が可能であることが当然の前提とされた合意があるものと理解されることが多いであろう。
特に注意すべきなのは、ベンダとユーザの双方に「学習済みモデル」に関する権利を帰属させることを契約に定める場合である。学習済みモデルを構成する要素のうち推論プログラム部分には、著作xxや特
49 学習済みパラメータが著作物に該当する場合にはその権利者が利用条件の設定権限を一次的には有することになる。
xxによる保護が及ぶ可能性があり、自らの利用、第三者への利用許諾や譲渡の可否等について、これらの法律の規定を意識した交渉を行い、契約上に定める必要がある。
⑦ ノ ウ ハ ウ
契約の実務においては、ノウハウ、特に学習用データセットや学習済みモデルの生成ノウハウの取扱いが交渉の対象となることがある。しかし、特にベンダは、蓄積されたそのノウハウがベンダの実質的な競争力の源泉であることも多く、競争力を毀損するおそれがあるノウハウの開示には慎重になることが合理的である。そのようなノウハウをベンダが開示することを契約に定めるにあたっては、当事者間の利益のバランスが図られているかを十分に検討することが重要である。
一方、ユーザが収集・蓄積した生データを用いてベンダが学習用データセットを生成し、さらに学習済みモデルを生成する場合に、そのような生データにはユーザのノウハウと評価されるべき情報が含まれており、あるいは開発の目的に適した処理にはそのような情報が必要である場合もある。そのため、学習済みモデルの生成にユーザも一定の貢献があったという主張がユーザからなされることがある。このような場合、ベンダによる学習済みモデルの(再)利用の可否が問題となりがちであるが、状況に応じて利用条件を適切に調整するという選択も視野に入れるべきであろう。
(3) 具体例による解説
<事例 1 生データの継続利用>
例:ベンダ A 社は、生産財メーカ B 社から商品の販売データ(生データ)の開示を受け、これを基礎として生成した学習用データセットを用いて、B 社の顧客の購買行動を推定する学習済みモデルを生成し、これを B 社に提供することに合意した。A 社は今後、B 社の競合事業者 C 社、D 社からも商品の販売データの開示を受けて、より精度の高い学習済みモデルを生成したい。
ベンダ A 社は、秘密保持契約等の下でメーカ B 社のデータの開示を受け、これを第三者に開示しない義務や、メーカ B 社のために学習済みモデルを生成する以外の目的のために利用してはならない義務を負担していることが一般的である。
もし、A 社が、B 社への学習済みモデルの提供後に、B 社から開示を受けたデータの利用を続け、メーカ C 社、D 社から開示を受けたデータと合わせてより精度の高い学習済みモデルを生成することを希望する場合には、たとえば特定の目的を持った学習済みモデルの品質・性能の向上のためにのみそのデータの利用することの許諾を B 社、C 社、D 社から受け、これと併せて更新された学習済みモデルの継続提供を約束するという利用条件が考えられるであろう。
<事例 2 提供された学習用プログラムを利用した追加学習>
例:ベンダ A 社は、システム開発ベンダ B 社がその顧客 C 社から提供された人物写真データ(生データ)の開示を受け、これを基礎として生成した学習用データセットを A 社開発の学習用プロブラムに読み込ませて、C 社のサービスの消費者とそのデータベース上の人物との同一性を推定する学習済みモデルを生成し、これを B 社に提供することに合意した。B 社は、学習済みモデルだけではなく、A 社の学習用プログラムの提供を受けてこれを利用し、新たに C 社から開示されるデータを用いて追加学習を行うサービスを C 社に提供したい。
ベンダ A 社が作成した学習用プログラムを B 社に提供した場合、当該学習用プログラムから、より高い精度で人物認証を行うという目的に適合した学習済みモデルを生成するための A 社のノウハウのうち重要な一部を読み取ることができる可能性がある。
学習用プログラムの調整に A 社が相応の試行錯誤を重ね、または前記のノウハウに高い独創性があると A 社が信じる場合には、それに応じた十分な対価を得ることなく学習用プログラムの利用を B 社に許諾することは少ないであろう。他方、事後に B 社の顧客 C 社から開示されるデータを用いた追加学習のサービスこそが B 社の事業上の競争力を生むものであり、また A 社のノウハウは競合事業者との差別化が容易であるほど高度なものでないと B 社が信じる場合には、学習用プログラムの利用を頑なに許諾しようとしないA 社との契約を締結することは困難であろう。この場合は、少なくとも前記のサービスを可能にする限度で学習用プログラムの利用が許諾され、その対価の調整が可能な場合にのみ A 社とB 社との間で開発取引が行われることになるであろう。
<事例 3 段階別の学習済みモデルの提供>
例:ベンダ A 社は、機械メーカ B 社から製品の外観データ(生データ)の開示を受け、これを基礎として生成した学習用データセットを用いて、B 社の製品上のキズの存在を推定する学習済みモデルを生成し、B 社に提供することに合意した。
① A 社と B 社は、理想的な環境下で得たデータを用いて学習済みモデルを生成した後、実際の現場でこれを評価したい。
② B 社は、学習済みモデルには B 社の現場情報が反映されていることから、A 社による(再)利用を防ぎたい。
理想的な環境下で得られたデータを用いて生成された学習済みモデルについては、ノイズが少ないデータを用いて検証されたその精度を、様々なノイズが入力に混入し得る実際の現場環境下においてそのまま実現できるとは限らない。そのため、生成された学習済みモデルを実際に現場に投入するに際しては、事前の検証結果から期待される精度が現場環境下でも実現可能であるかをさらに検証すべく、現場への学習済みモデルの導入前に現場環境下での性能評価を行うことが必要となる。
現場環境下での性能評価を行う一つの方法としては、機械メーカ B 社に秘密保持義務を負わせた上で(開発途上の)学習済みモデルをベンダ A社の秘密情報として B 社に開示し、一定の条件を満たす環境下での性能評価の目的に限定してその利用を許諾するというやり方がある。
この他に、PoC 段階のみをカバーする開発契約を締結するやり方もある。この場合、ノイズの少ない環境下で得られたデータを用いて A 社が開発 した学習済みモデルをその成果とし、利用目的を限定した学習済みモデ ルの利用を B 社に許諾することになるであろう。
また、たとえば、秘匿したい現場情報が学習済みモデルに反映されており、競合事業者への漏えいのリスクが大きいと B 社が懸念する場合には、 A 社による学習済みモデルの利用や再利用を防ぎたいという動機が B 社に生まれることがある。この場合、①学習済みモデルに関する権利を B 社のみに帰属させ、A 社による利用を一切許諾しないという方法、②目的や範囲等を限定して A 社に学習済みモデルの利用を許諾するという方法等があり得るが、A 社との交渉が膠着状態に陥るのを避け、かつ、漏えいによるリスクを最小化するための方法として、③A 社に、学習済みモデルの利用を一定の範囲で許諾しつつ、B 社の特定の競合事業者との競業を一定期間制限するというやり方もあり得るであろう。
<事例 4 多数当事者による学習済みモデルの生成>
例:ベンダ A 社は、医療機器メーカ B 社と医療支援サービス事業者 C 社から、それぞれ医用画像データ(生データ)の開示を受け、これを基礎として生成した学習用データセットを用いて、特定の疾病の罹患可能性を推定する学習済みモデルを生成し、B 社と C 社に提供することに合意した。A 社、B 社、C 社は、それぞれ学習済みモデルを自由に利用したい。
ベンダ A 社が、単一の当事者からデータの開示を受けて学習済みモデルを生成する場合と、複数の当事者から開示を受けてこれを生成する場合とで、交渉において考慮すべき要素が本質的に異なってくるということはない。ただし、利害関係者の数が増えるほど契約上の利害の対立が生じやすくなり、一般に、二者間での調整に必要とされる以上に大きな交渉のコストが発生する。
たとえばこの事例では、医療機器メーカ B 社と医療支援サービス事業者 C 社にそれぞれ何らかの学習済みモデルの利用が認められるとして、
①ベンダ A 社に学習済みモデルの利用を認めるか、②(A 社に学習済みモデルの利用を認めるとして)A 社、B 社、C 社のそれぞれにいかなる利用条件の下で学習済みモデルの利用を認めるかについて、三者間での合意を形成する必要がある。この場合、まずは各自が投下した費用や労力等を考慮して利益の調整を図るのが基本であろう。ただし、他の当事者の事業を阻害しない利用条件の設定が可能であれば、それを採用することで議論の膠着を避けることが全ての当事者にとって望ましい場合もあるであろう。
第5 AI 技術の利用契約
1 AI 技術の利用とは
第 4 では、学習済みモデルの生成に関する契約について論じてきたが、AI技術に関する事業モデルには、開発の他に(または開発に加えて)、ベンダが開発した学習済みモデル等の AI 技術を提供し、ユーザがこれを利用する形態の事業モデル(以下「AI 技術の利用サービス」という。)がある。
現状、AI 技術の利用サービスといわれるものには様々なものがあり、一概に類型化はできないが、たとえば、次のものがある。
① ベンダが学習済みモデルを提供し、ユーザがこれを利用するサービス(ユーザが自己のデータをベンダの学習済みモデルに入力して、出力結果である AI 生成物を利用するサービス)
② ベンダが学習用プログラムを提供し、ユーザがこれを利用するサービス(ユーザが自己の学習用データセットをベンダの学習用プログラムに読み込ませて、学習済みモデルを生成し、当該学習済みモデルとその出力結果である AI 生成物を利用するサービス)
なお、サービスによっては、次のようなケースもある。
ベンダの有する AI 技術をユーザの個別の要望にあわせてカスタマイズした上で提供される場合
関連する他のサービス(たとえば、データ収集サービスや、データ処理サービス等)と組み合わせて提供される場合
その他、AI 技術を用いてユーザのデータを分析した結果に基づきベンダがコンサルティングサービス等を提供する場合
以上のとおり、AI 技術の利用サービスには様々なものがあるが、本節では、上記①のサービス(学習済みモデルの利用サービス)について以下説明していく。
2 学習済みモデルの利用サービス
(1) 概 要
学習済みモデルの利用サービスについては、次の事例が考えられる。
<事例 1 ユーザが自己のデータを、インターネット経由でベンダのサーバにある学習済みモデルに入力し、AI 生成物(出力)を利用するサービス>
例:製造事業者であるX 社(ユーザ)が、自己の工場の機械に設置したセンサから得られる機器の稼動データを、インターネット経由で Y 社(ベンダ)のサーバに送信し、当該稼動データを機械制御目的のために開発されたベンダの学習済みモデルに入力し、出力された AI 生成物を、インターネット経由でユーザが利用するサービス。
<事例 2 ユーザが自己のデータを、インターネット経由でベンダのサーバにある学習済みモデルに入力して、出力結果である AI 生成物に基づきベンダが作成したレポートを利用するサービス>
例:小売業者である X 社(ユーザ)が、自社店舗で取得した販売データを、インターネット経由で Y 社(ベンダ)のサーバに送信して、ベンダの有する購買行動分析目的で開発された学習済みモデルに入力し、出力された AI 生成物に基づき、ベンダが作成した分析レポートの提供を受けるサービス。
(2) サービスの利用方式と提供形態
学習済みモデルの利用サービスの方式としては、上記事例のように、ユーザが、インターネットを通じてベンダの環境にある学習済みモデルにアクセスして、これを利用する場合(以下「クラウドサービス型」という。)が多いと思われるが、クラウドサービス型の他に学習済みモデルを、ユーザの環境にインストールして利用する場合(以下「オンプレミス型」という。)もある。なお、オンプレミス型の場合も、提供される学習済みモデルは、バイナリ形式など再利用が困難な形態での提供が通常と思われる。
また、サービスの提供形態としては、上記事例 1 のように、ユーザが、学習済みモデルに入力データを読み込ませて得た出力結果である AI 生成物の提供を受ける場合の他に、上記事例 2 のように、ユーザが AI 生成物そのものを得るのではなく、AI 生成物にベンダが別の技術を組み合わせる等して作成されたものや、AI 生成物を元にベンダが作成したレポート等の提供を受ける場合もある。このように、サービスの提供形態は様々であるが、前記第 2-4-⑴-④のとおり、理論上、出力結果である AI 生成物を用いることにより、学習済みモデルの再利用が可能であることから、無許可での再利用を防ぐために、学習済みモデルの利用サービスにおいては、AI 生成物がそのままの形で提供されるのではなく、それを加工して得た結果や、他の技術と組み合わせて得た結果等が提供される場合も少なくないと思われる。
(3) 契約の形式
既存の学習済みモデルを利用するサービスの場合、当該学習済みモデ ルにかかる権利は、当該モデルを提供するベンダに帰属し、ユーザはベン ダとの契約内容に従い一定の利用権を得るものである。上記のとおり、提 供されるサービスの内容は様々であり、契約もサービス内容次第ではあ るが、学習済みモデルの利用サービスのサービス利用契約は、基本的には、クラウドサービス型のサービスの場合は一般的なクラウドサービス契約 と、オンプレミス型のサービスの場合は一般的なソフトウェアライセン ス契約と同様であろう。
なお、継続的な利用を前提とした学習済みモデルの利用サービスも多く、このような場合、サービスの内容に、運用保守(場合によっては、学習済みモデルの精度向上のための更なる学習もサービス内容になり得るであろう。)にかかるサービスが含まれることもある。
ただし、個別のユーザの要請に基づき、ベンダがカスタマイズを行った学習済みモデルが提供される場合、学習済みモデルの生成の場合と同様の問題が生じ得る。よって、カスタマイズが行われる場合は、ユーザ・ベンダ間でのトラブルを避けるため、開発の場合と同様に、アセスメント段階や、PoC 段階を設けるのが望ましいであろう。
3 契約における考慮要素
以下では、学習済みモデルのサービス利用契約における、交渉ポイントや、協議や検討が必要となる要素について検討する 50。
50 なお、学習済みモデルの利用サービスによっては、サービス利用約款が設けられている
(1) 学習済みモデルのカスタマイズ
学習済みモデルのカスタマイズが伴う学習済みモデルの利用サービスの場合で、ユーザのデータを用いて学習済みモデルをカスタマイズする場合、開発の場合と同様、カスタマイズに用いられた生データ、学習用データセット、カスタマイズされた学習済みモデル(学習済みパラメータ、推論プログラム)、および関連するノウハウの権利帰属や利用条件が問題となり得る。そのため、このようなカスタマイズを伴うサービス利用契約においては、これらの権利帰属や利用条件について取り決める必要がある。取決めにあたっての、基本的な考え方や考慮要素は、前記第 4 の開発契約の場合と同様であり、カスタマイズの程度等、基本的には寄与度およびデータの性質を考慮した上で決定することになるであろう。
(2) 入力データ
クラウドサービス型の学習済みモデルの利用サービスの場合、サービス利用に伴い、ユーザがベンダのサーバに送信した入力データについて、ベンダからのアクセスが可能となる。入力データには、ユーザの営業秘密やノウハウが含まれる場合もあるが、このような入力データの法律上の取扱いは必ずしも明確でないことから、入力データの取扱いや利用条件について、サービス利用契約で取り決めることが望ましい。
入力データの取扱いに関して、特に争点となり得るのは、ベンダが入力データを、ユーザへのサービス提供以外の目的で利用することを望む場合である。このような場合、主に入力データの収集・蓄積にかかるコストの負担、入力データの機密性、別目的での利用範囲、サービス提供にかかるコストの負担、責任の分担等を考慮の上、ユーザ・ベンダ間で協議して取り決めることになる。
もっとも、別目的で利用できる入力データを限定する(たとえば、ユーザが特定できない形に加工したデータに限る、特に機密性の高い一定のデータは対象から外す等)、別目的での利用範囲を限定する(たとえば、研究開発目的での利用に限定する、一定期間ユーザの特定の競合事業者へのサービスには利用しないとする等)といった条件を設けることにより、ユーザ側の懸念を一定程度解消できる場合もあり得る。また、両者の利害の調整のために、ベンダ側が、入力データの目的外利用を承諾したユーザについては、何らかのメリットを設ける(たとえば、割安な料金設定とする等)ことを検討してもよいだろう。ユーザおよびベンダは、上記の各事項を考慮した上で、入力データの利用条件について取り決めることが望ましい。
ことも多く、実態として契約条件について個別の交渉が難しい場合もある。その場合、本項に記載の各要素について利用約款においてどのように取り決められている確認の上、利用可否について検討されたい。
51 データに個人情報が含まれる場合の取扱いについては、本ガイドライン(データ編)第 4
-2-(6)を参照。
(3) 再利用モデル
学習済みモデルの利用サービスにおいては、当該モデルの精度を維持 するため、または精度を高めるために、入力データを用いて追加学習を行 うことも想定される(追加学習を行うか否かについては、前記⑵で述べた、入力データの利用条件や、サービス内容の取決めによる。)。追加学習に より、再利用モデルが生成された場合、その取扱いが問題となり得るので、権利帰属や利用条件について、サービス利用契約において取り決めるこ とが望ましい。
再利用モデルの取扱いを決めるにあたって特に争点になりやすいケースは、追加学習で生成された再利用モデルを、ベンダがユーザ以外の第三者へのサービスに利用する場合であろう。この場合も、基本的には、双方の寄与度や利益のバランスを基準として、第三者へのサービス提供の可否や条件を取り決めることになる。具体的には、新たに学習されたデータの提供主体、データの機微度や流出のリスク、追加学習にかかる労力やコストの負担、ノウハウの希少性、利用範囲、責任の分担等の各要素が考慮されることになるであろう。
再利用モデルの取扱いについては、上記の事項を考慮の上、ベンダとユーザ間で十分協議して取り決めることが望まれる。
(4) AI 生 成 物
事例 1 のような学習済みモデルの利用サービスにおいて、ユーザは学習済みモデルを用いて出力された AI 生成物を得ることになるが、当該 AI生成物の取扱いについても、サービス利用契約において取り決めることが望ましい。なお、サービスによっては、AI 生成物そのものをユーザが得るわけではないものもあることは前記のとおりであるが、いずれにしても、ユーザが学習済みモデルの利用サービスの利用の結果として得る成果について、サービス利用契約において、取扱いを決める必要があることは同様である。
前提として、AI 生成物は、生成の過程に人間の創作的寄与がない限り、現行の著作権法上は著作物と認められないと考えられている 52。もっとも、当該 AI 生成物の生成過程に、人間の創作的寄与があったのか否かについて、当該 AI 生成物の外観から判断することは困難であるし、そもそも何を持って創作的寄与といえるかも現状明らかではないため、AI 生成物の帰属や利用条件については、契約において取り決めることが望ましい。
この場合も、当該 AI 生成物の性質、利用目的、データの提供主体、コストの負担、責任分担等の各要素を考慮の上、具体的な利用条件について取り決めることになるであろう。なお、AI 生成物の取扱いを決めるにあたり、特に考慮されるのは、AI 生成物の性質であろう。当該 AI 生成物が、
52 知的財産戦略本部 検証・評価・企画委員会 新たな情報財検討委員会、
36 頁
著作物と同様の外観を有する場合 53(たとえば、音楽や絵画、小説等)、著作物の場合と同じく、それ自体に相当な市場価値が認められることもあり得るので、このような場合は、AI 生成物の帰属や利用条件について、当事者の寄与度やデータの性質を基準に、特に慎重な考慮が必要となるであろう。
第6 国際的取引の視点
前記第 2 から第 5 では、日本法が適用されるとの前提の下、学習済みモデルの生成および AI 技術を利用したサービスに関する契約について解説した。もっとも、学習済みモデルの生成等は必ずしも国内で完結するものではなく、外国企業との間で、契約を締結する場面も少なくない。このような国際契約を締結する場合であっても、前記第 2 から第 5 の解説の大部分は当てはまるものの、他方で、国際契約特有の考慮が必要な場合もある。
そこで、以下、国際契約を締結する際の、①一般的な留意事項を概説し、また、②学習済みモデルの生成・利用で問題となり得る事項を、適宜必要に応じて、米国、欧州および中国の関連法規制に触れた上で解説する。
1 一般的な留意事項
(1) 基本的な視点
国際契約であっても、国内契約と同様に、まずは、当事者間の合意がない場合にいかなるルールが適用されるかを把握すること、すなわち適用法の確定および調査が必要である。
その上で、①取引の事情にそぐわないルールについては契約上変更を協議し、②契約による対応をしても残存するリスクについては、対価の調整等により、当事者間で分配を図ることになる。
もっとも、国際契約においては、言語や文化そして法体系が異なる当事者間において交渉をすることになるため、後々のトラブルを避けるため、国内契約と比較して、より詳細に当事者間の権利義務の範囲を確定する必要が生じることが多いことに留意が必要である。
(2) 適用法の確定
① 準拠法の選択
外国企業との取引において日本法を準拠法とする合意をしておけば、国内の専門家を介することにより、比較的容易に情報収集をすること ができ、紛争の結論の見通しがつきやすくなるというメリットがある ため、準拠法を日本法とする合意をしておくことが一般的には望まし い。
もっとも、準拠法を定めれば、紛争解決に適用されるルールの選択として十分になるわけではなく、選択する紛争解決手段次第では、当事者間の合意による準拠法の選択が無効とされたり、制限されたりすることがある。たとえば、裁判による紛争解決を選択するのであれば、その適用法は、原則として、裁判所の所在国の国際私法の定めに従って決定されるし、当事者による準拠法の選択を認めない国もある。このような場合には、希望する法の適用を受けるために、裁判外の手続(たとえば、国際商事仲裁や国際調停手続)等を選択することも検討に値する。
また、前記の留意点に加えて、仮に学習済みモデルを搭載した製品
(動産)を国外に向けて販売する場合等には、当事者間で合意した準拠法に加えて、ウィーン国際売買条約(CISG54)の適用を受ける可能性が
54 国際物品売買契約に関する国際連合条約、xxxx://xxx.xxxx.xx.xx/xxxxx/xxxxx/xxxxxx/ treaty169_5.html
あることも意識しておく必要がある。もしも、相手方当事者が適用を希望する準拠法よりも、自らに有利かつ、国際的なルールの適用を受けることができるのであれば 55、CISG の利用も検討に値する。他方で、CISGの適用排除を希望する場合には、契約書でその旨を明示することが必要である。
② 適用法の調査
多くの国においては、国際私法や仲裁法規の下で、契約自由の原則が認められているとは思われるものの、絶対的または相対的強行法規により、当事者が合意した内容の法的効力が結果として認められない場合もあるため、準拠法を含めた適用法のデフォルトルールを把握しておくことが必要である。
具体的な調査範囲としては、契約法はもちろんのこと、知的財産関連法規、競争法規、輸出入規制関連法規、さらには、行政規制も確認をすることが肝要であり、特に重要な事項については、現地専門家の見解を取得することが望ましい。
国内契約で述べた事項に加えて、国際契約で一般的に検討が必要な事項としては、次のものが考えられる。
当事者の義務水準(“Best Efforts”、“Reasonable Care”等)
違約金条項の有効性および範囲
免責・責任制限の範囲
不可抗力・事情変更の範囲
保証の範囲(特に黙示の保証の範囲)
第三者による・第三者に対する権利侵害への補償の可否および範囲
解除要件・効果
権利義務の譲渡の可否
(3) 紛争解決手段の選択
紛争解決の実効性は、適用される実体法のみならず、手続にも大きく左右される。この点、日本の裁判所における裁判には、その手続の流れや負担についての見通しの立てやすさの点からメリットがある。また、日本の弁護士が代理をすることからコミュニケーションの負担も少ない。そのため、日本の裁判所を専属的合意管轄としておくことが一般的には望ましいと思われる。
しかし、外国企業に対して日本の裁判所で裁判を提起して判決を得ても、相互承認等の問題で判決を執行することが難しいことも多い。また、相手方が日本における裁判に難色を示すことも少なくない。他方で、外国の裁判手続はその利用に物理的、時間的あるいは費用的な困難が伴うことも考えられる。
このような場合には、紛争解決手段を裁判ではなく、第三国における国際商事仲裁にすることも考えられる。国際商事仲裁の場合は、多くの主要国は、ニューヨーク条約 56を批准しているため、外国判決と比較すれば、外国仲裁判断を容易に承認・執行することができるというメリットがある 57。また、裁判と異なり、手続の秘匿性(非公開性)58が一般的に認められていることや、手続の柔軟性がメリットとなる場合もあると思われる。他方、仲裁人への報酬や仲裁機関 59の管理費用が発生することは訴訟と比較したデメリットとなる場合もあるであろう 60。
国際商事仲裁を利用する場合には、あらかじめ、仲裁地の仲裁法規や利用する仲裁機関の仲裁規則を確認した上で仲裁合意を作成することが望ましく、一般的には、紛争の仲裁付託合意、仲裁機関、仲裁人の数、仲裁地および仲裁言語等を記載することが重要となる。多くの場合には、各仲裁機関のモデル条項を採用すれば足りると思われるものの、これら要素が明示されていないものもあるため注意が必要である。
2 学習済みモデルの生成・利用で問題となり得る事項
(1) データ取得・生成
① 検討の視点
海外において生データの取得や学習用データセットの生成等を行う場合、これらデータの取扱いに、日本と異なる規制が及ぶことがあるため留意が必要である。実務上は前記第 4-4-⑵-①のとおり、取扱いデータが、著作物や、個人情報を含む場合には、特に権利処理が問題となることが多いが、権利者等が外国に所在する場合には、その調査、ひいては権利処理が一層困難である。
そのため、いかなる場合に、これらデータを権利者等の同意なく利活用ができるかを確認し、かつ、これらの権利処理をいずれの当事者の負担で行うかを合意することがより一層必要になる。
57 実際の執行に際しては、執行地の仲裁法規等の確認が必要となる。
② 著作物を含む場合
著作物については、ベルヌ条約 615 条 2 項に基づき、保護国法主義をとることが一般的である。具体的にいずれの国の法が適用されるかは、裁判所等の判断によるものの、著作物の利用行為および著作権の侵害行為については、これら行為の行われた地の法により規律されることが少なくない。
学習済みモデルの生成やサービス利用においては、海外のサーバに生データ等を保存する場合や、海外でデータの加工を行う場合には、その過程で行われる複製や翻案等が、サーバ設置地や加工を行った地の著作xxに違反するおそれがあるため、留意が必要となる。この点、日本においては、機械学習に利用するための著作物の記録および翻案は、著作xx 47 条の 762により許容されるとする見解が実務上有力であるもの、他の国において、必ずしも同様の例外が認められているわけではない。
たとえば、米国では、連邦著作権法上、批判やコメント、報道や教育、学問や調査目的の複製については、営利・非営利を問わず、著作xx違反を問われることがないとするフェアユース(fair use)の定めがある
(米国著作xx 107 条)。裁判例上は、変容的な利用(transformative use)については、著作物の表現そのものを利用しないことからフェアユースが認められる傾向にあり、たとえば、近時は米国 Google 社によるスニペット表示がフェアユースに該当すると判断した裁判例 63がある。もっとも、機械学習のための複製等がそもそもフェアユースに該当するか、また、その場合にはどのような要件の下許容されるかについては議論がある状況である。
また、欧州では、統一的な著作法はなく、各国の法制度に委ねられている。たとえば、英国著作xxには、著作物の複製を許容するフェアディーリング(fair dealing)規定があるものの、非営利目的のみを対象としている(英国著作xx 29 条、30 条および 32 条等)。
これに対して、中国では、中国著作xx 64には権利制限規定があるものの、フェアユースは導入されていない(中国著作xx 22 条)。
このように、海外においては、著作物の機械学習への利用が法律上必ずしも許容されていない場合があるため、いずれの当事者が権利処理をする必要があるか、契約により合意をしておくことが重要となる。
③ 個人情報を含む場合
62 平成 30 年改正著作xx施行後は、著作xx 30 条の 4 の適用の問題となる。
63 Authors Guild, Inc. v. Google, Inc., 804 F.3d 202(2d Cir. 2015)
64 公益社団法人著作権情報センター、「中華人民共和国編」、xxxx://xxx.xxxx.xx.xx/xx/ world/china.html
65 その詳細については、本ガイドライン(データ編)第 4-2-⑸を参照。
たとえば、米国では連邦政府レベルにおいて、個人情報一般について統一的な保護は図られておらず、医療情報(HIPAA)等、特定分野の規制がある他は、州法にその対応が委ねられている。
欧州では、2018 年 5 月 25 日に施行された EU 一般データ保護規制
(GDPR)において、「個人データ(Personal Data)」を EU 域内から第三国等へ域外移転させる場合、①欧州委員会による十分性認定がなされている第三国等への移転であるか(GDPR45 条)66、②欧州委員会による十分性認定がなされていない第三国等への移転の場合は、⑴適切な保護措置(管轄監督当局の個別承認を必要としないもの)に基づく移転であるか(GDPR46 条 1 項)、⑵データ主体による明示的な同意等の例外事由が認められなければならない(GDPR49 条)。
中国では、インターネット安全法 67等により個人情報および重要データの国外移転について規制がされている(インターネット安全法 37 条)。これらの法規制については、そもそも、想定している処理や移転が規
制の対象となるのかを確認することが重要である。その上で、匿名加工あるいは非個人情報化することにより、対象となる規制の適用外となる余地があるか等を検討し、必要な役割・リスク分担を契約で合意することが望ましい。
④ 表明保証条項の活用
生データや学習用データセットの利活用への予期せぬ障害に関して、リスクを分配するための契約上のメカニズムとしては、表明保証条項
(representations and warranties)の利用が考えられる。
学習済みモデルの生成やサービス利用に際しては、実務上、たとえば、一方当事者が、他方当事者から、これらデータの提供を受ける場合、著 作権を含む他者の権利や利益を侵害していない等、その取得や利用に 問題がないことについて表明保証条項を設けることがある。また、デー タの正確性、完全性、有効性、有用性、安全性等についての表明保証が 問題となることも皆無ではない。
データの提供者であれば可能な限り、保証を避け、また、受領者であ れば、保証を希望することは当然であるが、いずれの立場に立つにせよ、そのリスク分配については、後々のトラブルを避けるべく、契約xxx することが望ましい。
また、表明保証条項は、元々はxx法に由来する概念であるが 68、適
66 現時点で日本は十分性認定を受けていない。しかし、2018 年 5 月 31 日、個人情報保護委員会xx委員と欧州委員会ヨウロバー委員が、日 EU 間の個人データ移転について会談を行い、可能な限り早期に、個人情報保護法第 24 条に基づく個人情報保護委員会による EU の指定及び GDPR 第 45 条に基づく欧州委員会による日本の十分性認定にかかる手続を完了させるための作業を加速することに合意している(xxxxx://xxx.xxx.xx.xx/xxxxxxxxxxx/xxx peration/cooperation/300531/)。
用法によって、その元々の意味合いとは、要件や効果が変容している可能性があるため、違反した場合には、解除や違約金を認めるのか等、当事者間でどのように契約上の処理をするかについて合意しておくことも重要である。
(2) 学習済みモデルの生成
外国企業と学習済みモデルを含むAI 技術を利用したソフトウェアの開発契約を締結する場合の留意点としては、前記第 3 および第 4 の説明が概ね妥当する。
すなわち、まず、①開発の進め方そのものについて合意することが重要である。また、機械学習の過程で提供または生成される生データ、学習用データセット、学習用プログラム、学習済みモデル等、何を契約の対象とするかを明示した上で、②権利帰属および③利用条件を合意することが重要である。
① 開発の進め方
前記第 4-3-⑵のとおり、本ガイドライン(AI 編)は、学習済みモデ ルの生成に「探索的段階型」の開発方式を採用することを提唱しており、このことは、契約相手方が外国企業である場合にも変わりはない。
なお、開発の各段階について、日本ではその法的性質を、請負/準委 任の二分論で捉えた上で、契約のデザインを行うことが一般的である。しかしながら、これらの分類は、あくまでも日本の民法の適用を前提と した類型論にすぎず、国外の適用法下で妥当する保証はない。そのため、契約の類型論に捉われることなく、当事者間できめ細やかな協議を行 うことが重要である。その一例として次の事項が考えられる。
要 求 仕 様
各種テストの内容・手順
検収・性能確認要件
納品後の保守・運用の要否
契約不適合の場合の対応(損害賠償、解除、減額請求、追完請求の可否)
② x x 帰 属
本ガイドライン(AI 編)執筆時点において、米国、欧州および中国等において、学習済みモデルに関する権利の帰属関係や利用条件等を特別に規律する法律は見当たらない。そのため、外国企業との契約締結に際しては、適用法上の既存の法体系において、学習済みモデルが、どのような保護または規制を受けるかを調査および検討しておくことが重要である。実務上は、日本同様に、著作xx、特許xx、そして営業秘密法制が問題となることが多いところ、特に、学習済みモデルについてはプログラムの著作物または発明等としての保護が問題となること
れている。他方で、英国では両者を区別し、たとえば、「保証(warranty)」とのみ記載された場合には、「表明(representation)」がないとして、契約の解除を認めなかった裁判例(Sycamore Bidco Ltd v. Breslin [2012] EWHC (Ch) 3443)があり、xx法の国の中でも対応が異なる場合がある。
が多いと思われるため著作xxおよび特許法等について説明する。
a 著作権の取扱い
学習済みモデルの推論プログラムは、著作物として保護を受けることが多いと思われるところ 69、特許権と異なり、著作権は、一般的に、その発生に登録・登記を要しない。
もっとも、適用法によっては、権利行使に際しては登録・登記が必要となる場合もある。たとえば、米国では、著作権の登録は訴訟要件とされている(米国著作xx 411 条)。また、法定損害額の賠償は原則として登録後の損害についてのみ請求可能であるものの、権利発生から 3 か月以内であれば、登録までの期間に発生した損害につい
ても法定損害額の賠償を受けることができる(米国著作xx 412 条)。他方、欧州では各国の法制度によるものの 70、一般的に登録・登記が訴訟要件とはされていない。また、中国でも、訴訟要件とはされていないものの、登録・登記をすることで、訴訟における著作者性の立
証の一応の証拠になる。
そのため、著作権についても、その帰属のみならず、登録・登記の要否についても十分に意識して、契約上、協力義務を定める等の対応をすることが望ましい場合があるといえる。
b 特許xxの取扱い
たとえば、米国では、連邦最高裁による Alice 事件判決 72以後、コンピュータソフトウェアについては発明該当性が認められるためのハードルが低くはない状況にある。また、欧州では、発明該当性が認められるためには、コンピュータソフトウェア関連発明が技術的性質を持つことで足りるものの、技術的性質に貢献しない非技術的要素は、進歩性判断において考慮されないと解されているため、出願内容によっては、特許要件の充足は必ずしも容易ではない場合がある。
そのため、時間と労力をかけて交渉をし、特許を受ける権利等を取 得しても、権利化の保証がなく、十分な実益を欠く場合も考えられる。これら権利を取得することが契約の目的に照らして本当に重要であ
70 欧州および中国の状況について、xxxxx「諸外国における著作権の登録制度」パテント Vol.64.No.12(2011)
71 各国の状況について、一般社団法人 日本国際知的財産保護協会「各国における近年の判例等を踏まえたコンピュータソフトウェア関連発明等の特許保護の現状に関する調査研究報告書」(2017)
72 Alice Corp. Pty. Ltd. v. CLS Bank Int’l, 573 U.S. (2014)
るのか、利用権(実施権)の設定を受けることで足りるか等、あらかじめ検討をしておくことが望ましい。
また、仮に、特許を受ける権利を日本企業に帰属させる場合には、現地法制に基づく登録を独自に行うことが困難な場合もあるため、相手方当事者の協力義務を定めることも有用である。
③ 利 用 条 件
学習済みモデルの利用条件についても、契約で合意がない状態でいかなる利用が可能であるかを、あらかじめ把握した上で、当事者間で協議することが望ましい。
具体的な利用方法は、学習済みモデルの技術内容に大きく依存するものの、たとえば、著作権または特許権の対象となるのであれば、適用法上認められた利用方法を前提として考慮し、当事者間で、追加で定めるべき事項があるかをさらに検討することになると思われる。他方、データ等の、原則として自由に利用可能な対象については、現実にアクセス可能な者を基点として、利用条件を設定することになるであろう。
実務上定められることが多い事項として、リバースエンジニアリングや、競業の禁止がある。また、学習済みモデルに関する知的財産権が共有される場合にも当事者の利用条件を整理する必要がある。
a リバースエンジニアリングの禁止
仮に、前記第 4-4-⑵-⑥のとおり、ベンダが、そこに含まれるノウハウやデータの秘匿化を意図して、バイナリファイルの形式を用いる等、判読や二次利用が困難な方法により学習済みモデルを提供した場合であっても、リバースエンジニアリング等による解析が可能であれば実効性に欠ける。そのため、実務対応としては、リバースエンジニアリングの禁止条項を設けることが考えられるが、その有効性については、各国で対応が分かれているため留意が必要である。
たとえば、米国では、リバースエンジニアリングを米国著作権法上のフェアユースとして許容した裁判例がある 73。ただし、当事者間の契約でリバースエンジニアリングを制限することは有効とされている 74。
また、欧州では、営業秘密の保護に関する EU 指令(Directive (EU) 2016/943)において、適法に入手された製品のリバースエンジニアリングについて、当事者間の合意により禁止できることが明示されているものの、他方で、そのような合意を無効とする法律を各国が設けることも可能されている(前文 16 条)。そのため、欧州で事業を展開する上では、一部の国においては、学習済みモデル等のリバースエンジニアリングによる解析リスクが排除できない可能性があることを念頭に置く必要がある。
中国でも、リバースエンジニアリングは、原則として、営業秘密侵
74 Bowers v. Baystate Technologies (320 F.3d 1317)
害に該当しないと考えられている 75。もっとも、契約により、これを制限することは可能であるため、必要であれば契約xxxすることが望ましい。
b 競 業 制 限
ユーザが学習済みモデルを自らの事業に用いるためにベンダに開発を委託する場合には、ユーザと競合する形でこれをベンダが使用しないことを望むことは少なくないと思われる。
このような、競業制限については、業務終了後の秘密保持義務や、競業禁止義務として契約上定められることは少なくない。もっとも、これらの競業制限は、その具体的な内容によるものの、相手方当事者に対する過度の制限にあたると裁判所等に判断される場合には、適用法の競争法上の規制や公序(public policy)に反するとして、無効となるおそれがあることには留意しておく必要がある。
たとえば、米国ニューヨーク州では、競業避止条項(non-compete clause)の有効性は、正当な事業利益の保護の有無、地理的範囲およ び期間に関する合理性、契約当事者が被る困難の程度を考慮して判 断されているところ、近時、迷彩パターンのライセンス契約終了後に、
「類似(similar)」するパターン等を用いた製品の製造を期限の定めなく禁止する条項を無効にした裁判例がある 76。
c 他の共有者との関係
学習済みモデルを、ベンダとユーザとの間の共有とする場合には、各国の知的財産法制上、自らの使用や、他者へのライセンス、そして、第三者への譲渡等に際して、他の共有者からの同意を要するかについて、検討が必要である。もしも適用法上同意が不要である場合、予期せぬ利用を防止するためには、当事者間で別途合意の上、制限をかけておく必要がある。
たとえば、プログラムの著作権を共有する場合、米国では、自己利用の際、収益分配が求められているものの 77、他の共有者の同意は不要である(米国著作xx 106 条)。また、他者へのライセンスについて、他の共有者の同意を得ることなく非独占的ライセンスを付与することが認められている 78。そのため、これらの態様による利用には原則として同意が不要であるから、必要に応じて、あらかじめ契約で制限することが重要となる場合もあると思われる。
(3) 学習済みモデルの利用
AI 技術の利用、特に学習済みモデルを利用したサービスに関する契約上の留意点については、前記第 3 および第 5 で説明したとおりである。その上で、国際契約を締結する上での更なる考慮要素としては、①責任制
76 Crye Precision LLC v. Duro Textiles, 689 Fed. Appx. 104 (2017)
77 Erickson v. Trinity Theatre, Inc. 13 F.3d 1061 (7th Cir. 1994)
78 Sybersound Records, Inc. v. UAV Corp., 517 F.3d 1137 (9th Cir. 2008)
限規定や、②各種規制対応が考えられる。
① 責任制限規定
学習済みモデルによる推論過程は必ずしも人間が直ちに理解することはできず、そのため、当事者が意図していない挙動をした結果、第三者に対して損害が生じる可能性がある。このような場合、学習済みモデルの利用者に、そもそも、債務不履行責任や瑕疵担保責任あるいは不法行為責任(製造物責任を含む。)が発生するかは、適用法上問題になるものの、学習済みモデルまたはこれを用いたサービスの提供者と利用者との間の契約では、責任免除・制限条項(limitation of liability)を用いる、あるいは、補償条項(indemnification)を用いて当事者がとるべき対応を明示する等して、リスクの分配を協議しておくことが重要となる。
もっとも、国によっては、たとえば、当事者間の責任免除・制限条項の一部または全部が無効とされる場合がある。このような場合には、保険の適用等を含め、リスクをいかにして軽減するかを検討することが必要になる。
② 各種規制への対応
学習済みモデルを海外で利用させる/利用する場合には、輸出規制等、適用されうる行政規制等への対応を見据えて契約条項をデザインしておくことも必要となる。
a 外為法・技術輸出入規制
学習済みモデルを国内で開発して、国外に提供する場合には、日本において、外為法 79上の規制対応を行う必要があることに加えて、各国の輸出入規制の適用を受ける可能性がある。
たとえば、日本企業が、中国企業に対して、学習済みモデルをライセンスする場合には、強行法規である技術輸出入管理条例が適用される 80。その結果、技術の譲受人である中国企業が、学習済みモデルを利用して他人の合法的利益を侵害した場合、技術の譲渡人である日本企業が責任を負い(技術輸出入管理条例 24 条)、また、提供する技術の完全性、有効性および契約目標達成可能性について、保証義務を負うことになる(同 25 条)。このような場合には、中国子会社や香港子会社があるのであれば、そこを介して取引を行う等の実務対応が考えられるため、契約上、そのような対応を可能とする旨を明記しておくこと等が必要となると思われる 81。
また、逆に、海外で開発した学習済みモデルを海外から輸出し、国内に輸入する場合にも、やはり各国の輸出入規制を確認する必要が
79 外国為替及び外国貿易法(昭和 24 年法律第 228 号)。同法は機微な技術情報の管理を行うものである。
80 ジェトロ北京事務所知的財産権部、「中国技術輸出入管理条例に関する 技術供与者のリスク低減のための 契約条項案と契約スキームの検討」、xxxxx://xxx.xxxxx.xx.xx/xxx_xx ages/world/asia/cn/ip/report/gikanjyorei.pdf、(2015 年 12 月)
81 技術輸出入管理条例には、改良技術の取扱い等、その他の規制もあるため、事前確認が望ましい。
ある。たとえば、米国では、技術やソフトウェアのソースコードの開示は輸出管理規制(Export Administration Regulations。略称「EAR」)の対象となり、届出や許可等が必要となる場合があるため留意が必要である。
b 個人情報保護法制
学習済みモデルを利用した個人向けサービスを提供する場合には、生データ等の処理について前記したように、個人情報保護規制にも 留意する必要がある。
たとえば、欧州で事業を展開する場合、学習済みモデルを介在させ た入力データ等の処理が GDPR に違反すると判断されるリスクもある。 GDPR では、データ主体は、「同人に法的効果を生じさせるかまたは 同様の重大な影響を及ぼす、プロファイリングを含む自動処理にの み基づく決定の対象とならない権利」を有するところ(GDPR22 条)、
学習済みモデルの処理結果のみに依拠して、サービス利用者に関す る決定を行う場合には、上記の効果または影響を及ぼす自動処理に のみ基づく決定を行っていると判断される可能性があるからである。
そのため、もしも、欧州の現地企業と共同して学習済みモデルの利用サービスを提供する際には、あらかじめ、かかる規制を意識して、ビジネスモデルを構築した上で、契約を締結することが望ましいと考えられる。
第7 本モデル契約について
1 位 置 づ け
本ガイドライン(AI 編)においては、ここで述べた基本的な考えに基づいて作成した AI 技術を利用したソフトウェア開発のモデル契約として、本モデル契約を提示している。本モデル契約は、ユーザがベンダに対して、学習済みモデル等の AI 技術を利用したソフトウェアの開発を委託し、ベンダがユーザに当該ソフトウェアを成果物として提供する、または利用させる取引を対象としている。他方で、ベンダが開発した学習済みモデル等の AI技術を提供し、ユーザがこれを利用する形態の取引の契約(AI 技術の利用サービス利用契約)については、サービス提供の形態が多様であることや、 AI 技術に関する条項についてはソフトウェア開発契約と基本的に同じであることからモデル契約を提示していない。
本モデル契約は、従来の実務との継続性の観点から、システム開発契約において広く参考にされているモデル契約 2007 の考え方を基本的に踏襲しつつ、AI 技術を利用したソフトウェアの特性や想定する前提条件の違いを考慮して作成したものである。
契約は、契約当事者の合意によって成立するものであり、強行法規に抵触する場合等には無効となるという例外はあるが、基本的には、契約当事者が自由に定めることができるものである。本モデル契約は、AI 技術の特性を踏まえた AI 技術を利用したソフトウェア開発・利用契約の理解を促進するために、あくまで参考として提示するものであり、当事者が本モデル契約と異なる契約を締結することや、修正を加えることが自由であることはいうまでもない。
本モデル契約は、一定の前提を置き、当事者間が置かれている特定の状況を捨象した上で作成されているものであり、最大公約数的なものである。前提が異なれば契約の内容は異なることや、当事者の置かれた状況等を契約に反映する必要があることはご留意いただきたい。また、速いスピードで進む AI 技術の進展や実務に合わせるための修正が必要になることも想定される。本モデル契約は、AI 技術を利用したソフトウェアに関する規定が中心となっている。データの取扱いについて比較的詳細な規定を設けてはいるものの、もし、当事者が、AI 技術を利用したソフトウェア開発におけるデータの取扱いについてより詳細な取決めを希望するのであれば、本ガイドライン(データ編)の契約条項例を参照する等して、データの取扱いに関する契約を別途締結するか、データに関するより詳細な規定を本モデル契約に取り込むことも考えられるであろう。
2 特 徴
本ガイドライン(AI 編)で述べた AI 技術の特性を踏まえた本モデル契約の特徴は次のとおりである。
① 探索的段階型開発に沿った契約書(秘密保持契約書、導入検証契約書、ソフトウェア開発契約書)を提示した。
② ユーザが提供するデータの保護と利活用を図るため、データの取扱いに関する規定を充実させた。
③ 成果物等の取扱いについて、利用条件をきめ細やかに設定することでユーザとベンダの利益調整を図る枠組みを提示した。
④ ベンダは成果物の完成義務や性能の保証を行わない案を提示した。
3 各モデル契約の前提や留意点
AI 技術を利用したソフトウェア開発のモデル契約としては、次の各契約を用意している。各モデル契約の前提や留意点等については、次のとおりである。
(1) アセスメント段階:秘密保持契約書
アセスメント段階において、秘密保持契約書を締結するケースを想定している。秘密保持契約書のモデル契約は、ユーザから限定的なサンプルデータを受領し、短期間で AI 技術の導入可否について検証を行うことを前提としている。なお、検証結果を記載した簡易なレポートを提供することを想定している。
(2) PoC 段階:導入検証契約書
PoC 段階において、導入検証契約書を締結するケースを想定している。 PoC 段階において実施する内容は、本ガイドライン(AI 編)に記載のとおり、ケース・バイ・ケースである。導入検証契約書のモデル契約は以下を前提としている。
契約当事者:xxxとベンダ(ユーザやベンダの技術レベルや企業規模は問わない)
契約の法的性質:準委任型
時期:PoC の初期段階
業務内容:一定のサンプルデータを用いて学習済みモデルの生成や精度向上作業を行い開発の可否や妥当性の検証を行い、成果として検証結果をまとめたレポートを作成すること。
なお、たとえば、PoC の後期段階において、実データを用いて学習済みモデルのパイロットテストを含む検証を行い、成果として学習済みモデルが生成される場合には、開発段階に近いため、開発契約における規定
(主に、権利帰属や利用条件について)と同様の規定を導入検証契約書に盛り込むことも考えられる。
(3) 開発段階:ソフトウェア開発契約書
開発段階において、ソフトウェア開発契約書を締結するケースを想定している。ソフトウェア開発契約書のモデル契約は以下を前提としている。
契約当事者:xxxとベンダ(ユーザやベンダの技術レベルや企業規模は問わない)
開発モデル:非ウォーターフォールモデル
対象システム:機械学習を利用した特定機能を持つプログラムの開発
契約の法的性質:準委任型(成果完成型、履行割合型のいずれも含む)
時期:開発段階
業務内容:PoC 段階を経て開発可能性があると判断された学習済みモデルについて、ユーザが提供するデータを元にベンダが学習用データセットを生成した上で学習済みモデルを生成し、ユーザに当該学習済みモデルを提供すること。
本モデル契約は学習済みモデルのみの開発を行うケースを想定したシンプルな契約である。そのため基本契約と個別契約に分けていない。一定以上の規模を持つシステムの一部として学習済みモデルを生成する場合は、基本契約と個別契約に分けたり、システム開発契約を別契約として締結する等して、通常のシステム開発契約に必要な条項(モデル契約 2007、同 2008 参照)を適宜利用することが考えられる。
(4) 追加学習段階
追加学習段階におけるモデル契約については、開発段階におけるソフトウェア開発契約書の利用条件の設定や、その際に生成された再利用モデルの権利関係・責任関係についての規定と同様の規定を設けることが考えられるが、その内容は、ソフトウェア開発契約書のモデル契約のうちの権利関係・責任関係の条項とほぼ同一内容となることが想定されるため、追加学習の段階については、モデル契約は作成していない。
4 アセスメント段階の秘密保持契約書(モデル契約書)
【対象・前提】
・契約当事者:xxxとベンダ(ユーザやベンダの技術レベルや企業規模は問わない)
・概要:本モデル契約は、AI 技術の開発や導入検証段階(PoC 段階)前の、アセスメント段階を想定した契約である。アセスメント段階を設けるか、またアセスメント段階における実施内容はケース・バイ・ケースであるが、本モデル契約は、ベンダが、ユーザから限定的なサンプルデータを受領し、短期間で AI 技術の導入可否について無償で検証を行う場合を前提としている。なお、検証結果を記載した、簡易なレポートを提供する場合を想定した内容としている。
秘密保持契約書
●●(以下「ユーザ」という。)と●●(以下「ベンダ」という。)は、●●の実施可能性の検討(以下「本件検討」という。)に伴い、相互に開示する秘密情報の取扱いに関して、次のとおり契約を締結する。
第1条(秘密情報の定義)
1 本契約において秘密情報とは、本件検討に関して、相手方より提供を受けた技術上または営業上その他業務上の情報のうち、次のいずれかに該当する情報をいう。
① 相手方が書面(電磁的方法を含む。以下同じ)により秘密である旨指定して開示した情報
② 相手方が口頭により秘密である旨を示して開示した情報で開示後●日以内に書面により内容を特定した情報。なお、口頭により秘密である旨を示した開示した日から●日が経過する日または相手方が秘密情報として取り扱わない旨を書面で通知した日のいずれか早い日までは当該情報を秘密情報として取り扱う。
③ 本件検討の対象となる別紙記載のデータ(以下「対象データ」という。)
2 前項の定めにかかわらず、次の各号のいずれかに該当する情報は、秘密情報から除外するものとする。
① 開示者から開示された時点で既に公知となっていたもの
② 開示者から開示された後で、受領者の帰責事由xxxxに公知となったもの
③ 正当な権限を有する第三者から秘密保持義務を負わずに適法に開示されたもの
④ 開示者から開示された時点で、既に適法に保有していたもの
⑤ 開示者から開示された情報を使用することなく独自に開発したもの
第2条(秘密保持義務)
1 受領者は、秘密情報を、秘密として保持し、開示者の書面による事前の承諾を得ることなく、第三者に開示、提供または漏えいしてはならないものとする。
2 受領者は、秘密情報を、本件検討遂行の目的のために知る必要のある自己の役員および従業員に限り開示するものとする。
3 前 2 項の定めにかかわらず、xxxによる事前の書面による承認を得た場合(ただし、ユーザは合理的理由なく、かかる承諾を拒否できないものとする。)、xxxは、秘密情報を、本件検討遂行の目的のために必要な第三者( 以下「委託先」という。)に対して開示することができるものとする。この場合、xxxは、当該委託先に本契約の自己の義務と同等の義務を課すものとし、その秘密情報の管理について一切の責任を負うものとする。
4 前各項の定めにかかわらず、受領者は、秘密情報のうち法令の定めに基づき開示すべき情報を、可能な限り事前に相手方に通知した上で、当該法令の定めに基づく開示先に対し開示することができるものとする。
第3条(目的外使用等の禁止)
受領者は、秘密情報を本件検討遂行の目的以外の目的で使用、複製および改変してはならず、本件検討遂行の目的に合理的に必要となる範囲でのみ、使用、複製および改変できるものとする。
第4条(秘密情報の返却または消却)
1 受領者は、本契約が終了した場合または開示者から書面にて要求を受けた場合、開示者より開示および提供を受けた秘密情報を速やかに開示者に返却し、または自らの責任で消却するものとする(秘密情報の複製物および改変物も同様とする。)。なお、開示者は受領者に対し、当該消却について、証明する文書の提出を求めることができる。
2 前項の規定にかかわらず、xxxの秘密情報に、本件検討の結果について記載したベンダ作成の報告書(以下「報告書」という。)が含まれる場合、ユーザは報告書を本契約の終了後も使用することができるものとする。ただし、ユーザは、自己の社内利用に必要な範囲に限り、報告書を使用、複製および改変できるものとし、報告書を第三者に開示、提供または漏えいしてはならないものとする。
<ポイント>
秘密情報の返却または消却について定めている。
<解説>
本条 2 項に関して、報告書を秘密情報として保護するには、1 条 1 項に従い、秘密である旨の指定をする必要がある点に注意されたい。
第5条(秘密情報の保証の限定)
開示者は、開示する秘密情報に関し、受領者に対して保証しないものとする。ただし、開示者は、秘密情報を受領者に開示する正当な権原を有することを受領者に対して保証する。
第6条(知的財産権)
【A 案】知的財産権の取扱いについて、協議により定めるとする場合
1 本契約に基づく秘密情報の開示によって、本契約で明示的に認めた内容を除き、受領者は、開示者の秘密情報に関するいかなる権利についても、取得し、また許諾を受けるものではない。
2 受領者は、開示者の秘密情報に基づき、新たに発明その他の知的財産(以下あわせて「発明等」という。)が生じた場合、速やかに開示者に通知し、当該発明等にかかる特許権その他の知的財産権の取扱いについて両者協議の上決定するものとする。
【B 案】知的財産権の取扱いについて、発明者主義とする場合
1 本契約に基づく秘密情報の開示によって、本契約で明示的に認めた内容を除き、受領者は、開示者の秘密情報に関するいかなる権利についても、取得し、また許諾を受けるものではない。
2 本件検討の過程で生じた発明その他の知的財産(以下あわせて「発明等」という。)にかかる特許権その他の知的財産権(以下、特許権その他の知的財産権を総称して「特許xx」という。)は、当該発明等を創出した者が属する当事者に帰属するものとする。
3 ユーザおよびベンダが共同で行った発明等にかかる特許xxについては、ユーザおよびベンダの共有(持分は貢献度に応じて定める。)とする。この場合、ユーザおよびベンダは、共有にかかる特許xxにつき、それぞれ相手方の同意なしに、かつ、相手方に対する対価の支払いの義務を負うことなく、自ら実施または行使することができるものとする。
4 ユーザおよびベンダは、前項に基づき相手方と共有する特許xxについて、必要となる職務発明の取得手続(職務発明規定の整備等の職務発明制度の適切な運用、譲渡手続等)を履践するものとする。
<ポイント>
・ 本件検討の過程で特許権、著作xxの知的財産権が生じる場合の知的財産権の取扱いについて定めている。
<解説>
1 6 条は、本件検討の過程で特許権、著作xxの知的財産権が生じる場合に備えて、2 項以下では、知的財産権に関する取扱いについて定めている。なお、できるだけシンプルな規定とするため、知的財産権の詳細な定義は設けておらず、また、PoC 段階の導入検証契約書(モデル契約書)および開発段階のソフトウェア開発契約(モデル契約書)と異なり、著作権とその他の知的財産権とで規定を分けていない。
2 もっとも、本件検討は、簡易な検証を前提しているため、権利帰属が問題と
なるような知的財産が生じない場合も多いと想定される。また、アセスメント段階に入る前の時点で、どのような知的財産が生じるかについて予測することは極めて困難である。そのような状況においては、当事者間であらかじめ知的財産権についての取り決めをするための交渉に時間を費やすよりも、知的財産が生じた時点で当事者間で協議する方が合理的であることも多い。そのため、【A 案】では、知的財産が生じた場合、当該知的財産にかかる知的財産権の取扱いについては当事者間の協議によることとした。
3 一方、【B 案】では、知的財産権の取扱いについて発明者主義に従うものとし、共同発明等の場合は、貢献度に応じて共有としている。なお、著作権の共有の場合、原則として、共有者全員の合意がないと権利を行使(共有者の自己利用も含む。)することができないため(著作xx 65 条 2 項)、3 項で自己利用を可能とする旨規定している。第三者へ権利許諾については、特に規定していないので、法律上の原則どおり他の共有者の同意が必要となる(特許第 73
条 3 項、著作xx 65 条 2 項)。
4 本モデル契約では、本件検討の結果を記載した簡易なレポート・報告書をベンダが作成してユーザに提供することも想定しているが(4 条 2 項)、当該レポートに著作物性が認められる場合、作成主体であるベンダに著作権が帰属することになる(著作xx 15 条 1 項)。当該レポートのユーザへの利用許諾や利用条件については、4 条 2 項で定めている。
第7条(有効期間)
1 本契約は、●年●月●日から、●か月間効力を有するものとする。ただし、第 4 条から第 8 条の規定は、当該期間の終了後も、有効に存続するものとする。
2 第 2 条および第 3 条の規定は、本契約の締結日より●年間有効に存続するものとする。
<ポイント>
・ 秘密保持期間について定めている。
<解説>
7 条 2 項は、秘密保持期間について定めている。なお、対象データと、その他の秘密情報とで、秘密保持期間について異なる取扱いとすることも可能である。その場合、2 項の末尾に、次の文言を追記することが考えられる。
2 …ただし、対象データに適用される範囲においては、本契約の締結日より
●年間有効に存続するものとする。
第8条(管轄裁判所)
本契約に関する一切の紛争については、●地方裁判所を第xxの専属的合意管轄裁判所として処理するものとする。
第9条(協議事項)
本契約の履行について疑義を生じた事項および本契約に定めのない事項については、当事者間で協議し、円満に解決を図るものとする。
本契約締結の証として、本書 2 通を作成し、ユーザ、ベンダ記名押印の上、
各 1 通を保有する。
年 月
日
ユーザ
ベンダ
【別紙】対象データの詳細
5 PoC 段階の導入検証契約書(モデル契約書)
【対象・前提】
・契約当事者:xxxとベンダ(ユーザやベンダの技術レベルや企業規模は問わない)
・特徴:準委任型
・概要:本モデル契約は AI 技術の開発前における導入検証段階(PoC 段階) を想定した契約である。ガイドラインでも記載のとおり、PoC 段階において実施する内容はケース・バイ・ケースである。本モデル契約は PoC の初期段階を想定した、比較的シンプルな構成の契約である。PoC でも後期段階(実データを用いて学習済みモデルのパイロットテストを含む検証を行い、成果として学習済みモデルが生成される場合等)においては、開発段階に近いため、開発段階におけるソフトウェア開発契約のモデル契約書案(以下「開発モデル契約」という。)における規定(主に、権利帰属や利用条件について)と同様の規定を PoC 段階の契約に盛り込むことが必要な場合もある。
【本モデル契約が想定するケース】
一定のサンプルデータを用いて学習済みモデルの生成や精度向上作業を行うと共に、開発の可否や妥当性の検証を行い、成果として検証結果をまとめたレポートを作成するというケースを想定している。
導入検証契約書
●●(以下「ユーザ」という。)と●●(以下「ベンダ」という。)は、[検証対象となるベンダの AI 技術名]のユーザへの導入・適用に関する検証に関して、
本契約は、●●のユーザへの導入・適用に関する検証の遂行における、ユー ザとベンダの権利・義務関係を定めることを目的とする。
●●●●年●●月●●日に、本契約を締結する。第1条(目的)
第2条(定義)
1 本 検 証
ベンダの●●のユーザへの導入・適用に関する検証をいい、詳細は別紙に定める。
2 対象データ
本検証の対象となる、別紙記載のデータをいう。
3 知 的 財 産
発明、考案、意匠、著作物その他の人間の創造的活動により生み出されるもの(発見または解明がされた自然の法則または現象であって、産業上の利用可能性があるものを含む。)、および営業秘密その他の事業活動に有用な技術上または営業上の情報をいう。
4 知的財産権
特許権、実用新案権、意匠権、著作権その他の知的財産に関して法令によ
り定められた権利(特許を受ける権利、実用新案登録を受ける権利、意匠登録を受ける権利を含む。)をいう。
5 ベンダ提供物
ベンダがユーザに提供する旨、別紙に記載する報告書その他の資料をいう。
<ポイント>
・ 本モデル契約で使用する各用語の定義を定める条項である。
・ 本検証の具体的な内容や対象データについては、別紙を用いて特定する。
<解説>
1 「ベンダ提供物」は、本検証の成果物を意味し、具体的にはレポート等の資料を前提としている。仮に、パイロット版の「学習済みモデル」や「学習済みパラメータ」等を成果物とすることが想定される場合は、「ベンダ提供物」の定義に、これらを追記する必要がある。これらの定義については、開発モデル契約の定義を参照されたい。
2 本モデル契約においては「知的財産権」には、知的財産権により保護されるノウハウを除き、ノウハウに関する権利を含まないことを前提としているため、知的財産基本法における「知的財産権」の定義を一部修正している。
第3条(業務内容)
1 ユーザはベンダに対し、別紙に記載された本検証にかかる業務の提供を依頼し、xxxはこれを引き受ける。
2 別紙に本契約の条項と異なる定めがある場合は、当該別紙の定めが優先する。
<ポイント>
・ 本検証においてベンダが実施する具体的な業務内容を定める。
<解説>
1 本モデル契約で想定している検証とは、一定のサンプルデータを用いた学習済みモデルの生成や精度向上作業を実施することによる開発可否や妥当性の検証であり、一定の成果物を完成させる(請負型)のではなく、検証のための業務の実施を目的としたもの(準委任)であることから、具体的な業務の内容を規定している。
2 本モデル契約は、シンプルな内容とするため、業務の詳細等については、別紙にて記載することを前提としている。また、PoC 段階における業務内容は様々であることに鑑み、別紙の内容や項目は、自由度の高いものとしている。そのため、本モデル契約の条項と別紙の定めに、齟齬がある場合は、別紙の定めが優先するとしている。
第4条(委託料およびその支払時期・方法)
1 本検証の委託料は、別紙に定めるとおりとする。
2 ユーザはベンダに対し、別紙に定める委託料を、別紙で定めた時期および
方法により支払う。
<ポイント>
・ 本モデル契約における業務の対価としての委託料の金額、支払時期および支払方法を定める条項である。
<解説>
1 委託料については、固定金額とする他に、人月単位または工数単位に基づく算定方法のみ規定し、毎月の委託料を算定する方法とすること等が考えられる。
2 委託料の支払方法としては、①一定の時期に一括して支払う方式、②着手時および業務完了時等に分割して支払う方式、③一定の業務時間に達するごとに当該業務時間分の対価を支払う方式等様々な方式がある。
3 なお、ベンダが中小企業の場合には下請法が適用される場合があり、委託料の支払時期等に規制がある点に留意する必要がある(本ガイドライン(AI 編)第 3-5-⑶)。
第5条(検証期間)
本検証の期間(以下「検証期間」という。)は、別紙に定める期間とする。
<ポイント>
第6条(協力と各自の作業分担)
1 ユーザおよびベンダは、本検証遂行のため互いに協力しなければならない。
2 本検証に関するユーザおよびベンダの作業分担は、別紙に定めるとおりとし、ユーザおよびxxxは、自己の作業分担について責任を負うものとする。
<ポイント>
xxxは、善良なる管理者の注意をもって本検証を遂行する義務を負う。xxxは、本検証について完成義務を負うものではなく、本検証に基づく何らかの成果の達成や特定の結果等を保証するものではない。
・ 本検証の遂行に際しての双方の協力義務と役割分担を定める条項である。第7条(ベンダの義務)
<ポイント>
・ 本検証を履行するに際してのベンダの法的義務および結果に対する非保証
を定めた条項である。
<解説>
本モデル契約の法的性質は準委任契約であることから、ベンダが善管注意義務を負うことを確認している。また、検証段階という性質に鑑み、ベンダが完成義務を負うものではないことも明確にしている。
第8条(責任者の選任および連絡協議会)
1 ユーザおよびxxxは、本検証を円滑に遂行するため、本契約締結後速やかに、本検証に関する責任者を選任し、それぞれ相手方に書面(電磁的方法を含む。以下同じ)で通知するものとする。また、責任者を変更した場合、速やかに相手方に書面で通知するものとする。
2 ユーザおよびベンダ間における本検証の遂行にかかる、要請、指示等の受理および相手方への依頼等は、責任者を通じて行うものとする。
3 責任者は、本検証の円滑な遂行のため、進捗状況の把握、問題点の協議および解決等必要事項を協議する連絡協議会を定期的に開催する。なお、開催頻度については、別紙に定めるとおりとするが、ユーザおよびベンダは、必要がある場合、理由を明らかにした上で、随時、連絡協議会の開催を相手方に求めることができるものとする。
<ポイント>
・ ユーザとxxxのやり取りをスムーズに行うために、双方の窓口となる責任者を任命する。
・ 進捗状況の報告等を定期的に行う会議を開催し、課題等について情報の共有を行う。必要に応じて、緊急の会議を開催することも可能である。
<解説>
1 本検証遂行の過程で、当初の想定と異なる事態が生じた場合等、何らかの問 題が生じた場合には、適宜、連絡協議会でその旨について両者で協議を実施し、相互の認識を共有することがトラブル回避の観点から重要である。
2 連絡協議会の内容については、議事録を作成して、協議の内容を明確にしておくことが後の紛争予防の観点から重要である。
3 本検証の進捗により、当初の想定と大幅な変更が生じて、契約条件(検証期間や委託料、業務内容等)を変更する必要が生じた場合は、10 条の変更協議の規定に従う。
第9条(再委託)
1 ベンダは、xxxが書面によって事前に承認した場合、本検証の一部を第三者(以下「委託先」という。)に再委託することができるものとする。なお、xxxが上記の承諾を拒否するには、合理的な理由を要するものとする。
2 前項の定めに従い委託先に本検証の遂行を委託する場合、xxxは、本契約における自己の義務と同等の義務を、当該委託先に課すものとする。
3 ベンダは、委託先による業務の遂行について、ユーザに帰責事由がある場合を除き、自ら業務を遂行した場合と同様の責任を負うものとする。ただし、ユーザの指定した委託先による業務の遂行については、ベンダに故意または重過失がある場合を除き、責任を負わない。
<ポイント>
・ 本検証の遂行に際しての再委託の可否および再委託が行われた場合のベンダの責任内容について定める条項である。
<解説>
1 再委託の可否については、再委託についてユーザの事前承諾を要するxxxxと再委託先の選定について原則としてベンダの裁量により行えるパターンが考えられる。
2 AI 技術の導入検証においては、ベンダの技術力に着目して契約が締結されることや、対象データの取扱いについてユーザのコントロールを及ぼすという観点から、本モデル契約においてはユーザの同意を取得することとした。
第10条(契約内容の変更)
1 本検証の進捗状況等に応じて、検証事項が想定外に拡大した等の事情により、検証期間、委託料等の契約条件の変更が必要となった場合、ユーザまたはベンダは、その旨を記載した書面をもって相手方に申し入れるものとする。当該申し出があった場合、ユーザおよびベンダは、速やかに契約条件の変更の要否について協議するものとする。
2 前項の協議に基づき、本契約の内容の一部変更をする場合、ユーザおよびベンダは、当該変更内容が記載された、変更契約を締結するものとする。
<ポイント>
・ 契約の内容に変更が生じた場合における、契約変更の手続について定めた規定である。
<解説>
本検証に関して大幅な変更が生じたこと等により、検証期間や委託料等の契約条件の変更が必要となった場合における手続について取り決めている。
第11条(ベンダ提供物の提供および業務終了の確認)
1 ベンダは、別紙に記載する期限までに、ユーザにベンダ提供物を提供する。
2 ユーザは、ベンダ提供物を受領した日から●日(以下「確認期間」という。) 内に、ベンダ提供物の提供を受けたことを確認し、xxx所定の確認書に記名押印または署名の上、ベンダに交付するものとする。
3 前項の定めに従い、ユーザがベンダに確認書を交付した時に、ユーザの確認が完了したものとする。ただし、確認期間内に、ユーザから書面で具体的な理由を明示して異議を述べないときは、確認書の交付がなくとも、当該期間の満了時に確認が完了したものとする。
<ポイント>
・ ベンダによるベンダ提供物の提供およびそれを受けてのユーザによる確認方法を定めた規定である。
【オプション条項:予約条項】
第●条(開発契約の締結に関する検討)
ユーザおよびベンダは、本検証の結果、ユーザへの●●の導入により相当程度の効果が見込める場合、当該技術の開発段階への移行および開発契約の締結に向けて、最大限努力するものとする。
<ポイント>
・ 開発契約への移行についての努力義務についての規定である。
<解説>
PoC 段階は、開発契約移行のための実証段階という性質を有していることから、 PoC 段階での検証において開発段階に移行できる目途がつくような場合には、双 方が、開発契約に向けて努力する規定を設けることも考えられる。
第12条(ユーザがベンダに提供するデータ・資料等)
1 ユーザは、ベンダに対し、別紙に記載する対象データを提供するものとする。
2 ユーザは、ベンダに対し、本検証に合理的に必要なものとしてベンダが要求し、ユーザが合意した資料、機器、設備等(以下「資料等」という。)の提供、開示、貸与等(以下「提供等」という。)を行うものとする。
3 ユーザは、ベンダに対し、対象データおよび資料等(以下、総称して「ユーザ提供データ等」という。)をベンダに提供等することについて、正当な権限があることおよびかかる提供等が法令に違反するものではないことを保証する。
4 ユーザは、ユーザ提供データ等の正確性、完全性、有効性、有用性、安全性等について保証しない。ただし、本契約に別段の定めがある場合はその限りでない。
5 ユーザがベンダに対し提供等を行ったユーザ提供データ等の内容に誤りがあった場合、またはかかる提供等を遅延した場合、これらの誤りまたは遅延によって生じた本検証の遅延、ベンダ提供物の瑕疵(法律上の瑕疵を含む。)等の結果について、xxxは責任を負わない。
6 ベンダは、ユーザ提供データ等の正確性、完全性、有効性、有用性、安全性等について、確認、検証の義務その他の責任を負うものではない。
<ポイント>
・ 本検証に際して、ユーザがベンダにデータおよび資料等を提供すること、および提供された対象データや資料等に起因する責任について取り決めた規定である。
<解説>
1 AI 技術の導入検証においては、通常、ユーザのデータを用いて検証を行うことになるので、ユーザからベンダにデータやその他必要な資料の提供が行われることが一般的である。そのため、1 項および 2 項でデータや資料の提供について定めている。必要となるデータや資料に変更や追加が生じた場合は、 8 条の連絡協議会等において両者間で協議・合意の上、適宜追加等を行うことも可能である。なお、当該データ等の開示権限の有無・適法性については、開示する前提となるものであり、またユーザ自身が把握できることから、3 項においてユーザによるデータ等の表明保証を行うことにしている。
2 なお、1 項において、ユーザがベンダに対して提供することを合意した対象データについて、その量が不十分であったために、本検証の遅延やベンダ提供物に瑕疵等が生じた場合には、合意した対象データが検証に必要な時期に提出されていないことから、対象データの提供を遅延したものとして、5 項が適用されることとなる。他方、対象データ以外のデータの取扱いは、当事者の協議に委ねられる。
3 2 項については、ベンダがユーザに対して資料やデータの提示を請求できることを盛り込むことも考えられる。その場合の条項は、たとえば、「ベンダは、ユーザに対し、ユーザが保有する本検証の遂行に必要な文書、図面、ソフトウェア、データその他の資料(記録された媒体の種類を問わず、電磁的記録を含む。)の開示または提供を請求することができる。」とすることが考えられる。
第13条(対象データの管理)
1 ベンダは、対象データを、善良な管理者の注意をもって管理、保管するものとし、ユーザの事前の書面による承諾を得ずに、第三者(本契約第 9 条に基づく委託先を除く。)に開示、提供または漏えいしてはならないものとする。
2 ベンダは、対象データについて、事前にユーザから書面による承諾を得ずに、本検証の遂行の目的以外の目的で使用、複製および改変してはならず、本検証遂行の目的に合理的に必要となる範囲でのみ、使用、複製および改変できるものとする。
3 ベンダは、対象データを、本検証の遂行のために知る必要のある自己の役員および従業員に限り開示するものとし、この場合、本条に基づきベンダが負担する義務と同等の義務を、開示を受けた当該役員および従業員に退職後も含め課すものとする。
4 べンダは、対象データのうち、法令の定めに基づき開示すべき情報を、可能な限り事前にユーザに通知した上で、当該法令の定めに基づく開示先に対し開示することができるものとする。
5 本検証が完了し、もしくは本契約が終了した場合またはユーザの指示があった場合、ベンダは、ユーザの指示に従って、対象データ(複製物および改変物を含む。)が記録された媒体を破棄もしくはユーザに返還し、また、ベンダが管理する一切の電磁的記録媒体から削除するものとする。なお、ユーザはベンダに対し、対象データの破棄または削除について、証明する文書の提出を求めることができる。
6 ベンダは、本契約に別段の定めがある場合を除き、対象データの提供等により、ユーザの知的財産権を譲渡、移転、利用許諾するものでないことを確
認する。
7 本条の規定は、前項を除き、本契約が終了した日より●年間有効に存続するものとする。
<ポイント>
・ 本検証のためにユーザからベンダに提供された対象データに関する扱いを定める条項である。
<解説>
1 本検証のためにユーザからベンダに提供された対象データについては、一般的な秘密情報とは異なる別途の考慮が必要となる場合が多いと考えられるため、一般的な秘密情報に関する規定(14 条)と異なる規定を本条で設けている。たとえば、対象データについては、14 条 2 項の例外規定を設けることが適切でない場合も多いと考えられる。
2 本条の対象は「ユーザ提供データ等」ではなく「対象データ」のみであり、対象データに含まれない「資料等」(12 条 2 項)については、秘密情報の取扱いを定める 14 条での保護対象となる。
3 本モデル契約が想定する PoC 段階では、検証目的で一定のサンプルデータを受領する場合を前提としているため、開発モデル契約と異なりデータの目的外利用を認める規定例は設けていない。もっとも、データの本検証の遂行の目的以外での利用を否定するものではなく、必要あれば、別紙に定める等の方法により(開発モデル契約 13 条 2 項ただし書参照)、データの本検証の遂行の目的以外での利用を明確に規定することも考えられる
4 対象データが特に機密性の高いデータであり、より高度な管理を必要とする場合は、具体的な管理方法について両者間で合意した内容を別紙に追記し、当該追記箇所を参照する、とする方法も考えられる。
5 本条は、存続条項があるため(23 条)、本契約の終了後も効力を有する。もっとも、7 項の規定により、効力を有する期間は●年間となる。ただし、7項に、「前項を除き」と規定されていることから、6 項の規定については、原則に戻り、期間の定めなく効力を有することになる。
第14条(秘密情報の取扱い)
1 ユーザおよびベンダは、本検証遂行のため、相手方より提供を受けた技術上または営業上その他業務上の情報(ただし、対象データを除く。)のうち、次のいずれかに該当する情報(以下「秘密情報」という。)を秘密として保持し、秘密情報の開示者の事前の書面による承諾を得ずに、第三者(本契約第 9 条に基づく委託先を除く。) に開示、提供または漏えいしてはならないものとする。
① 開示者が書面により秘密である旨指定して開示した情報
② 開示者が口頭により秘密である旨を示して開示した情報で開示後●日以内に書面により内容を特定した情報。なお、口頭により秘密である旨を示した開示した日から●日が経過する日または開示者が秘密情報として取り扱わない旨を書面で通知した日のいずれか早い日までは当該情報を秘密情報として取り扱う。
[③ ベンダ提供物]
2 前項の定めにかかわらず、次の各号のいずれか一つに該当する情報については、秘密情報に該当しない。
① 開示者から開示された時点で既に公知となっていたもの
② 開示者から開示された後で、受領者の帰責事由xxxxに公知となったもの
③ 正当な権限を有する第三者から秘密保持義務を負わずに適法に開示されたもの
④ 開示者から開示された時点で、既に適法に保有していたもの
⑤ 開示者から開示された情報を使用することなく独自に開発したもの
3 秘密情報の取扱いについては、前条第 2 項から第 6 項の規定を準用する。この場合、同条項中の「対象データ」は「秘密情報」と、「ベンダ」は「秘密情報の受領者」と、「ユーザ」は「開示者」と読み替えるものとする。
4 本条の規定は、本契約が終了した日より●年間有効に存続するものとする。
<ポイント>
・ 相手から提供を受けた秘密情報の管理方法に関する条項である。
<解説>
1 ユーザからベンダに提供された対象データの秘密保持等の管理については、前条で規定しているため、1 項において秘密情報の対象から除外している。
2 ベンダ提供物について、秘密情報とする場合には、1 項①②の規定に従って秘密指定することも考えられるが、端的に 1 項において明示的に秘密情報であることを規定することも考えられる。
3 3 項において前条の対象データの取扱いの規定を準用している。もっとも、存続期間については、対象データと秘密情報の存続期間が異なることを想定して準用していないが、同一期間とする場合には準用することも可能である。
第15条(個人情報の取り扱い)
1 ユーザは、本検証遂行に際して、個人情報の保護に関する法律(本条において、以下「法」という。)に定める個人情報または匿名加工情報(以下、総称して「個人情報等」という。)を含んだデータをベンダに提供する場合には、事前にその旨を明示する。
2 本検証遂行に際してユーザが個人情報等を含んだデータをベンダに提供する場合には、ユーザはベンダに対し、法に定められている手続を履践していることを保証するものとする。
3 ベンダは、第 1 項に従って個人情報等が提供される場合には、法を遵守し、個人情報等の管理に必要な措置を講ずるものとする。
<ポイント>
・ ユーザがベンダに提供する対象データに個人情報や匿名加工情報が含まれている場合に関する条項である。