AI 開発契約を巡る模擬裁判を踏まえた実務 配付資料
AI 開発契約を巡る模擬裁判を踏まえた実務 配付資料
2020 年10 月26 日
東京弁護士会リーガルサービスジョイントセンター
第1 本講演の目的
近年の第3 次AI ブームを支える機械学習及び深層学習といった技術を利用したAI 開発は、これまでのシステム開発とは異なる要素があることから、経済産業省は、2018 年6 月15 日、「AI・データの利用に関する契約ガイドライン」を策定・公表しています。
他方で、経済産業省は、情報システム信頼性向上のための取引間・契約に関する研究会の最終報告書として、 2007 年4 月13 日に「情報システム・モデル取引・契約書(受託開発(一部企画を含む)、保守運用)(第一版)」を公表しています。
そこで、本講演においては、AI 開発契約であるにもかかわらず、従前のシステム開発の契約書を利用して契約を締結した場合、どのようなことがリスク事項になり得るのか、また、訴訟において、どのような点に注意をする必要があるのか、これらを踏まえて、AI 開発契約の締結における実務的な留意点を検討します。
第2 模擬裁判の事案
1 X 社は食品の製造メーカー、Y 社はAI 開発を行っているベンダである。
2 X 社がY 社に対してAI を含む不良品検出システムの開発を発注した。具体的には食品工場における製造ラインの最終検査工程において、製品の画像から自動的に不良品を検出するシステムである。
3 Y 社は、以下の工程を経て、本件不良品検出システムを開発した。
①X 社から提供を受けた製品のサンプル画像1万枚を加工して本件学習用データセットを作成。
②本件学習用データセットを用いて、ディープラーニングの手法を取り入れた本件学習用プログラムで学習させ、製品の画像から自動的に不良品を検出する本件学習済みモデルを開発。
③本件学習済みモデルを組み込んだ本件不良品検出システムを開発。
4 Y 社はX 社に対し、本件学習済みモデルを組み込んだ本件不良品検出システムを納品した。なお、開発過程において作成された本件学習用データセットは納品されていない。また、本件学習済みモデルを組み込んだ本件不良品検出システムは、ソースコードではなくバイナリコードの形式で納品されている。
5 X 社は、納品された本件不良品検出システムを運用していたが、その後、納品された本件不良品検出システ
ムについて、さらに精度を上げるために改良すること、また、他の製品の製造ラインにも同種のシステムを組み込むために、納品された本件不良品検出システムを改変することを考えた。ただ、Y 社の報酬が高いため、別のベンダに発注をかけようとした。
6 X 社は、Y 社に対し、以下の要求をしたが、Y 社は拒絶した。
①Y 社が上記3①で作成した本件学習用データセットの引き渡し(開示)
②Y 社が上記3②で開発した本件学習済みモデルのソースコードの引き渡し(開示)
7 X 社はY 社に対し訴えを提起した。
○X 社とY 社の間のシステム開発委託契約書(抜粋)
経済産業省商務情報政策局情報処理振興課の「~情報システム・モデル取引・契約書~(受託開発(一部企画を含む)、保守運用)〈第一版〉」を参照
xxxxx://xxx.xxxx.xx.xx/xxxxxx/xx_xxxxxx/xxxxxxx/xxxxx_xxxxxxxxxx.xxx
甲・・・X 社(ユーザー)乙・・・Y 社(ベンダ)
(納入物の納入)
第26 条 乙は甲に対し、個別契約で定める期日までに、個別契約所定の納入物を検収依頼書(兼納品書)とともに納入する。
2. 甲は、納入があった場合、次条の検査仕様書に基づき、第28 条(本件ソフトウェアの検収)の定めに従
い検査を行う。
3. 乙は、納入物の納入に際し、甲に対して必要な協力を要請できるものとし、甲は乙から協力を要請された場合には、すみやかにこれに応じるものとする。
4. 納入物の滅失、毀損等の危険負担は、納入前については乙が、納入後については甲が、それぞれこれを
負担するものとする。
(資料等の提供及び返還)
第 39 条 甲は乙に対し、本契約及び各個別契約に定める条件に従い、当該個別業務遂行に必要な資料等の開示、貸与等の提供を行う。
2. 前項に定めるもののほか、乙から甲に対し、本件業務遂行に必要な資料等の提供の要請があった場合、
甲乙協議の上、各個別契約に定める条件に従い、甲は乙に対しこれらの提供を行う。
3. 本件業務遂行上、甲の事務所等で乙が作業を実施する必要がある場合、甲は当該作業実施場所(当該作業実施場所における必要な機器、設備等作業環境を含む。)を、甲乙協議の上、各個別契約に定める条件に従い、乙に提供するものとする。
4. 甲が前各項により乙に提供する資料等又は作業実施場所に関して、内容等の誤り又は 甲の提供遅延によ
って生じた乙の本件業務の履行遅滞、納入物の瑕疵等の結果については、乙はその責を免れるものとする。
5. 甲から提供を受けた資料等(次条第2 項による複製物及び改変物を含む。)が本件業務遂行上不要となったときは、乙は遅滞なくこれらを甲に返還又は甲の指示に従った処置を行うものとする。
6. 甲及び乙は、前各項における資料等の提供、返還その他処置等について、それぞれ第 10 条に定めるx
x担当者間で書面をもってこれを行うものとする。
(資料等の管理)
第 40 条 乙は甲から提供された本件業務に関する資料等を善良な管理者の注意をもって管理、保管し、かつ、本件業務以外の用途に使用してはならない。
2. 乙は甲から提供された本件業務に関する資料等を本件業務遂行上必要な範囲内で複製又は改変できる。
(秘密情報の取扱い)
第41 条 甲及び乙は、本件業務遂行のため相手方より提供を受けた技術上又は営業上その他業務上の情報のうち、相手方が書面により秘密である旨指定して開示した情報、又 は口頭により秘密である旨を示して開示した情報で開示後10日以内に書面により内容 を特定した情報(以下あわせて「秘密情報」という。)を第
三者に漏洩してはならない。但し、次の各号のいずれか一つに該当する情報についてはこの限りではない。また、甲及び乙は秘密情報のうち法令の定めに基づき開示すべき情報を、当該法令の定め に基づく開示先に対し開示することができるものとする。
(1)秘密保持義務を負うことなくすでに保有している情報
(2)秘密保持義務を負うことなく第三者から正当に入手した情報
(3)相手方から提供を受けた情報によらず、独自に開発した情報
(4)本契約及び個別契約に違反することなく、かつ、受領の前後を問わず公知となった情報
2. 秘密情報の提供を受けた当事者は、当該秘密情報の管理に必要な措置を講ずるものと する。
3. 甲及び乙は、秘密情報について、本契約及び個別契約の目的の範囲内でのみ使用し、 本契約及び個別契約の目的の範囲を超える複製、改変が必要なときは、事前に相手方か ら書面による承諾を受けるものとする。
4. 甲及び乙は、秘密情報を、本契約及び個別契約の目的のために知る必要のある各自(本契約及び個別契
約に基づき乙が再委託する場合の再委託先を含む。)の役員及び従業員 に限り開示するものとし、本契約及び個別契約に基づき甲及び乙が負担する秘密保持x xと同等の義務を、秘密情報の開示を受けた当該役員及び従業員に退職後も含め課すものとする。
5. 秘密情報の提供及び返却等については、第39 条(資料等の提供及び返還)を準用する。
6. 秘密情報のうち、個人情報に該当する情報については、次条の規定が本条の規定に優先して適用されるものとする。
7. 本条の規定は、本契約終了後、3年間存続する。
(納入物の特許xx)
第 44 条 本件業務遂行の過程で生じた発明その他の知的財産又はノウハウ等(以下あわせて「発明等」という。)に係る特許権その他の知的財産権(特許その他の知的財産権 を受ける権利を含む。但し、著作権は除く。)、ノウハウ等に関する権利(以下、特許権 その他の知的財産権、ノウハウ等に関する権利を総称して「特許xx」という。)は、 当該発明等を行った者が属する当事者に帰属するものとする。
2. 甲及び乙が共同で行った発明等から生じた特許xxについては、甲乙共有(持分は貢献度に応じて定め
る。)とする。この場合、甲及び乙は、共有に係る特許xxにつき、それぞれ相手方の同意及び相手方への対価の支払いなしに自ら実施し、又は第三者に対し通常実施権を実施許諾することができるものとする。
3. 乙は、第 1 項に基づき特許xxを保有することとなる場合、甲に対し、甲が本契約及び個別契約に基づ
き本件ソフトウェアを使用するのに必要な範囲について、当該特許x xの通常実施権を許諾するものとする。なお、本件ソフトウェアに、個別契約において 一定の第三者に使用せしめる旨を個別契約の目的として特掲した上で開発されたソフトウェア(以下「特定ソフトウェア」という。)が含まれている場合は、当該個別契約 に従った第三者による当該ソフトウェアの使用についても同様とする。なお、かかる許諾の対価は、委託料に含まれるものとする。
4. 甲及び乙は、第2 項、第3 項に基づき相手方と共有し、又は相手方に通常実施権を許 諾する特許xxに
ついて、必要となる職務発明の承継手続(職務発明規定の整備等の職務発明制度の適切な運用、譲渡手続など)を履践するものとする。
(納入物の著作権)
第45 条 納入物に関する著作権(著作xx第27 条及び第28 条の権利を含む。以下同じ。)は、xxx第三者が従前から保有していた著作物の著作権及び汎用的な利用が可能なプログラムの著作権を除き、甲より乙へ委託料が完済されたときに、乙から甲へ移転する。なお、かかる乙から甲への著作権移転の対価は、委託料
に含まれるものとする。
2. xは、著作xx第47 条の2 に従って、前項により乙に著作権が留保された著作物につき、本件ソフトウェアを自己利用するために必要な範囲で、複製、翻案することができるものとし、乙は、かかる利用について著作者人格権を行使しないものとする。また、本件ソフトウェアに特定ソフトウェアが含まれている場合は、本契約及び個別契約に従い第三者に対し利用を許諾することができるものとし、かかる許諾の対価は、委託料に含まれるものとする。
○個別契約抜粋
1.作業範囲
X 社の食品工場の製品(商品名○○)の製造ラインにおける AI を利用した不良品検出システム開発、テスト及びドキュメント類作成
2.納入物
①システム設計書 印刷部数 1部 CD-ROM 1 部
②ソフトウェアテスト及び結果報告書 印刷部数 1部 CD-ROM 1 部
③システムテスト仕様書及び結果報告書 印刷部数 1部 CD-ROM 1 部
④ソースプログラム CD-ROM 2 部
⑤システム運用マニュアル 印刷部数 1部 CD-ROM 1 部
⑥ユーザ利用マニュアル 印刷部数 1部 CD-ROM 1 部
(以下略)
■用語集
経済産業省「AI・データの利用に関する契約ガイドライン」より
xxxxx://xxx.xxxx.xx.xx/xxxxx/0000/00/00000000000/00000000000-0.xxx
○AI 技術の実用化の過程
○学習用データセット
「学習用データセット」とは、生データに対して、欠測値や外れ値の除去等の前処理や、ラベル情報(正解データ)等の別個のデータの付加等、あるいはこれらを組み合わせて、変換・加工処理を施すことによって、対象とする学習の手法による解析を容易にするために生成された二次的な加工データをいう。ここで、生データに対して、生データとは別個のデータ(以下「付加データ」という。)を付加する場合(このような付加データの付加行為を「アノテーション」ということもある。)、そのような付加データには、生データと同様に、生成される学習済みモデルの内容・品質に大きな影響を及ぼす一方、生データから独立した形式ではその用をなさないという性質がある。そのため、生データとこれに対する付加データとがいわば一体となったものを学習用データセットと見ることが適切であろう。教師あり学習の手法を用いる場合についていえば、前処理が行われた生データにラベル情報(正解データ)を合わせたものが学習用データセットに該当する。
また、学習用データセットには、生データに一定の変換を加えていわば「水増し」されたデータを含むこともある(この手法はデータオーギュメンテーション(データ拡張)とも呼ばれる場合がある。)。
○ディープラーニング
近時着目されている学習方法として、ディープラーニング(Deep Learning)がある。これは、機械学習の一手法であるニューラルネット(脳の情報処理を模して開発された機械学習の一手法)を多層において実行することで、より精度の高い推論を目指した手法である。他の機械学習と比較しても、学習用に大量のデータが必要となるものの、近年の技術開発(コンピュータの処理速度の向上(CPU・GPU 等)、インターネットによりデータ収集の容易化、クラウドによるリソース利用・データ保存コストの低下等)により、今後更なる利用が期待されており、特に、画像認識や自然言語処理等の分野において、広く利用されている。
ディープラーニングは、教師あり学習の一手法として分類されることもあるが、近年ではディープラーニングの手法であっても正解データを与えることを要しない手法が開発されており、教師なし学習の一手法としても、利用されている。
○学習用プログラム
「学習用プログラム」とは、学習用データセットの中から一定の規則を見出し、その規則を表現するモデルを生成するためのアルゴリズムを実行するプログラムをいう。具体的には、採用する学習手法による学習を実現するため
に、コンピュータに実行させる手順を規定するプログラムがこれに該当する。
学習用プログラムは、ベンダが既に保有している場合もあれば、それに一定の機能を付加する場合、ゼロから作り上げる場合がある。また、学習用プログラムの開発においては、OSS(オープン・ソース・ソフトウェア)と呼ばれるソースコードが一般に公開され、著作者により一定の範囲の利用が許諾されたソフトウェアを利用することが多い。
○ハイパーパラメータ
学習のために設定する学習率や学習回数(エポック)等、学習の枠組みを規定するために用いられるパラメータであり、主として人為的に決定される。
○学習済みモデル
「学習済みモデル」とは「学習済みパラメータ」が組み込まれた「推論プログラム」をいう。
○学習済みパラメータ
「学習済みパラメータ」とは、学習用データセットを用いた学習の結果、得られたパラメータ(係数)をいう。 学習済みパラメータは、学習用データセットを学習用プログラムに対して入力することで、一定の目的のために機械的に調整されることで生成される。学習済みパラメータは、学習の目的にあわせて調整されているものの、単体では単なるパラメータ(数値等の情報)にすぎず、これを推論プログラムに組み込むことで初めて学習済みモデルとして機能する。たとえば、ディープラーニングの場合には、学習済みパラメータの中で主要なものとしては、各ノード間のリンクの重み付けに用いられるパラメータ等がこれに該当する。
これに対して、学習のために設定する学習率や学習回数(エポック)等については、このような学習済みパラメー
タとは性質を異にして、学習の枠組みを規定するために用いられるパラメータであり、主として人為的に決定されるため「ハイパーパラメータ」と呼ばれることがある。
○推論プログラム
「推論プログラム」とは、組み込まれた学習済みパラメータを適用することで、入力に対して一定の結果を出力することを可能にするプログラムをいう。
たとえば、入力として与えられた画像に対して、学習の結果として取得された学習済みパラメータを適用し、当該画像に対する結果(認証や判定)を出力するための一連の演算手順を規定したプログラムである。