spliti 〜「機械学習パラダイス」の日本、AIと著作権をめぐる議論の現在地。上野達弘さんインタビュー前編

Text by 生田綾
Text by 廣田一馬

生成AIが急速に発達するなかで、切っても切り離せないのが著作権の議論だ。

生成AIが作品を著作者に断りなく学習することや、それらのデータを利用してさまざまな作品を生み出すことには、反発する声も少なくない。

そのような状況のなか、文化庁の委員会は3月25日に「AIと著作権に関する考え方について」を発表。この文書には法的拘束力はないが、学習段階で著作権侵害にあたる可能性がある行為についても記述されるなど、生成AIと著作権に対する国の一定の見解が示された。

今回の記事では、早稲田大学法学学術院教授で、『AIと著作権』などの著書を出版した上野達弘さんにインタビュー。文化庁での議論にも委員として関わった上野さんに、AIと著作権の問題、日本の著作権の解釈などについて聞いた。「学習」と「生成」それぞれに焦点を当て、前後編に分けてお届けする。

※後編は8月26日（月）に公開予定。

―上野さんは以前より、「日本は機械学習パラダイスである」と指摘されてきました。著作権者の許諾なしでも機械学習ができることを規定した著作権法（いわゆる情報解析規定）を元にこのように表現されたと思うのですが、なぜ「機械学習パラダイス」という状態になったのでしょうか？

上野達弘（以下、上野）：まず前提として、「機械学習パラダイス」というのはあくまで「学習」部分のパラダイスにすぎないことに注意を要します。機械学習は著作権法上自由にできるのはたしかですが、生成AIの出力がつねに適法だというわけではありません。生成AIが出力したコンテンツが学習元の著作物と類似するものである場合は、著作権侵害になりえます。このように、AIと著作権については、「学習」と「出力」を分けて考えなければなりません。

上野達弘さん / 1971年、東京生まれ。京都大学法学部卒、同大学大学院法学研究科博士課程単位取得退学。成城大学法学部専任講師、立教大学教授を経て、2013年より現職。専門は著作権法を中心とする知的財産法。主著に『著作権法入門』（共著、有斐閣）、『AIと著作権』（共著、勁草書房）など。

上野：日本で情報解析規定ができたのは2009年で、世界で最も早かった。日本は何事にも慎重な国で、法制度についてもアメリカやヨーロッパ、あるいは韓国が立法したあとにやっと追いつくようなことが多いのですが、この規定に限っては日本が率先して導入した点に特徴があります。

私が最初にこの規定を紹介して、その活用を主張したのは2016年頃ですが、その時点で、日本以外にはイギリスにだけ情報解析規定がありました。ただ、イギリスの規定は、営利目的の情報解析を許容していないのに対して、日本の規定は営利目的の情報解析も許容していた。このような規定がせっかく日本にある以上、これは活かすべきだと思ったんです。本当はOpenAIみたいな会社は日本に生まれてほしかったと思います。

そもそも、日本がなぜ情報解析規定を設けたのかというのはよく聞かれるのですが、2009年改正当時、主に議論されていたのは検索エンジンを適法化する規定でした。そのついでに入ってきたのが情報解析規定で、当時はあまり目立っていなかった。それがAIの発展とともに注目されるようになり、2016年には内閣府の知的財産戦略本部でも議論されるようになったんです。

OpenAI CEOのサム・アルトマン / Shutterstock

―上野さんは、自由な機械学習を許容した日本の情報解析規定を「活かすべきだ」とおっしゃっています。この規定が評価されるポイントはどこにあると考えていますか？

上野：議論が分かれるところだと思いますが、情報解析規定の趣旨については、一般にいくつかの考え方があります。

よく海外で言われるのは、日本はテクノロジーの国だから、テクノロジーを発展させるために著作権を後退させたのだろうという見方です。これは技術や産業の発展のために著作権の制約を正当化する考え方で、これを支持する人もいるのですが、この考え方に対しては、なぜ文化が産業に劣後しなければならないのか、といった反論がありえます。

実際のところ、日本の情報解析規定については、これとは異なる説明がされてきました。というのも、日本の情報解析規定である30条の4というのは、機械学習のような情報解析を「非享受利用」と位置づけているのです。

著作物というものは、映画を観たり、本を読んだり、漫画を読んだりして楽しむ、誰かが「享受」するものです。そして、著作権は、そのように著作物が誰かに「享受」されることを前提に、そのために行なわれる利用行為をカバーしている。そのような著作権があるからこそ、著作者に対して利益が還元されるのです。

イメージ写真 / Shutterstock

上野：けれども、AIによる機械学習は著作物をあくまで「データ」として見ているにすぎません。そこでは、誰も著作物の表現を「享受」することはありません。

例えば、SNSの書き込みを集めてきて、そこで用いられる言葉の頻度を解析して、将来の商品流行を予測する場合も、書き込みという著作物の表現は誰にも享受されません。また、大量の医学論文を集めてきて、これを解析することによって新しい治療法や医薬品を生み出すAIを開発するという場合も、あくまで論文を機械的に分析しているだけで、その表現は誰にも享受されません。

このように日本の著作権法では、機械学習などの情報解析が「非享受利用」の典型例と位置づけられています。そのような情報解析のための著作物利用が非享受利用である以上、そもそも著作権がカバーすべき本来的な行為ではないのだから権利が及ばなくて当然と考えられます。これが日本法の考え方であり、私自身もこれは妥当なものと思っています。

―なるほど。

上野：一方で、昨今の急速な生成AIの発展のために、この情報解析規定を問題視する声もあります。

特に学習が進んだAIによって仕事が失われるのではないかという懸念もあり、営利目的でも営利目的でなくても、とにかく自分の作品を勝手にAI学習されたくないという意見があるのは事実かと思います。

―イラストや映像の生成AIが急速に普及していますし、著作権侵害ともとれるイラストもネット上に流布されています。そんな状況で3月に公表された文化庁の「考え方」（*1）では、学習段階で著作権侵害にあたる可能性がある行為が示されたことが注目されました。具体的に、どのような行為がNGかもしれないと示唆されているのでしょうか？

上野：一つ目はいわゆる「享受目的併存型」というものです。先ほど説明したように情報解析は基本的には「非享受利用」とされていますが、享受目的と非享受目的が併存する場合は純粋な非享受利用とは言えませんので、30条の4は適用されません。

たとえば、生成AIの開発のためだといっても、その生成AIが学習元著作物の創作的表現をそのまま出力してしまうことをはじめから意図しているような場合です。画像生成AIでも、出力される画像に学習元画像の一部がそのまま出てきてしまう場合のように、単なる作風やスタイルではなく、元の著作物の創作的表現がそのまま出力されるようなAIを開発する場合、30条の4は適用されないのです。

二つ目は議論が分かれる点でもあるのですが、特定のクリエイターのスタイルを真似するためにそのコンテンツを「狙い撃ち」で学習する場合です。この場合でも、出力されるコンテンツが学習元コンテンツと作風やスタイル、世界観において共通するだけでは著作権の侵害になりませんし、そうである以上、そのための学習も適法だというのが通説です。

しかし、たとえ出力されるコンテンツが学習元コンテンツのスタイルや作風のレベルでしか共通しない場合であっても、特定のクリエイターを狙い撃ちにして学習し、これと共通のスタイルで大量のコンテンツを出力する場合は、30条の4が適用されない場合もありうる、という意見が委員のなかで一定数ありました。

たしかに、著作権法30条の4の規定には、「権利者の利益を不当に害する場合はこの限りでない」という但し書きがあります。AIによって勝手に自分のスタイルの作品が大量に生み出され、仕事がなくなってしまったという場合には、このただし書きにあたる場合があるのではないかという考えです。少数説ではありますが、このことが文化庁の「考え方」にも書かれています。

三つ目は新聞記事データベースに関するものです。

新聞のイメージ写真 / Shutterstock

上野：たとえば、新聞社が大量の新聞記事を情報解析に適したかたちで整理したデータベースをAI事業者に提供しているとします。そのような中、AI事業者が契約して解析用データベースにアクセスするのではなく、ネット上にフリーで置かれている新聞記事を大量に集めた結果、その解析用データベースと同じものをコピーしたと評価できるような場合は、先ほど説明した但し書きの「権利者の利益を不当に害する」と言える場合が考えられるということが書かれているのです。

一方で、この点を「まるめて」伝える報道に接した人の中には、新聞記事の機械学習には情報解析規定が適用されず、つねに著作権侵害にあたると考えてしまう人が出てきてしまいはしないか気がかりでもあります。あくまで、「考え方」が問題にしたのは記事データベースの著作権の話であって、記事の著作権の話ではありませんし、解析用データベースの話も実際にはかなり限定的な場合と考えられます。大量の新聞記事を偏りなく学習することは適切なAI開発のためにも重要ですので、「考え方」を誤解して、新聞記事を用いた情報解析が過度に萎縮してしまわないように注意する必要があるかと思います。

◇

インタビューの後編「生成AIの発展と、クリエイターの権利保護は両立する？」は、8月26日（月）に公開予定。どんな場合にAIによる「生成」が著作権侵害になるのか、AIを使用する人が意識するべきこと、クリエイターの権利をどう守るべきかについて伝えます。