AIはコピーレフトを無力化するのか─ ― OSSライセンスと著作権がAI時代に直面する問題

AIはコピーレフトを無力化するのか─ ― OSSライセンスと著作権がAI時代に直面する問題 TECH
AIとOSSの知識循環モデル

序章 静かに変わり始めたOSSの風景

ここ数年、オープンソースソフトウェア(OSS)の世界で、ある小さな変化が起きている。

新しいプロジェクトの多くが、GPL系ではなく MIT License を選ぶようになったのだ。

GitHubの新規リポジトリを眺めてみると、この傾向はすぐに気付く。
もちろん GNU General Public LicenseGNU Affero General Public License が消えたわけではない。しかし新しいプロジェクトの多くは、より緩やかなライセンスを選ぶようになっている。

この変化の背景には、クラウドや企業OSS戦略など様々な要因がある。しかし最近、もう一つ無視できない要素が現れた。

AIである。

特に大規模言語モデル(LLM)の登場以降、ソフトウェアの作り方は急速に変わり始めている。たとえば OpenAI のChatGPTや Anthropic のClaudeは、コード生成能力を持つツールとして日常的に使われるようになった。

開発者はコードを書く。
AIはそれを補助する。

しかしこの関係は、単なる補助ツールの話にとどまらない。

AIはコードを「読む」。
そしてコードを「学習」する。
その上で、新しいコードを「生成」する。

このプロセスは、従来の著作権制度やOSSライセンスの前提と、微妙に噛み合わない部分を持っている。

もしAIが既存のコードを学習し、それとは異なる形のコードを生成できるとしたら、そのコードは元のライセンスの影響を受けるのだろうか。

もし受けないとすれば、コピーレフトはどうなるのだろうか。

この問いは、単なるライセンス論ではない。
ソフトウェアという知識の共有文化そのものに関わる問題である。

オープンソース運動の中心人物である Richard Stallman は、1980年代に「自由ソフトウェア」という概念を提唱した。彼が作ったGPLライセンスは、著作権を利用してユーザーの自由を守るという、非常にユニークな仕組みだった。

しかしAIは、その前提を揺さぶる存在かもしれない。

もしAIがコードを「再生成」できるなら、
コピーレフトは機能し続けるのだろうか。

あるいは逆に、AIはコピーレフトを無力化する装置になり得るのだろうか。

そしてもう一つ、より大きな問いがある。

もしAIによって生成されたソフトウェアが著作権を持たないとすれば、ソフトウェアは最終的に Public Domain のような巨大な知識の海へと沈んでいくのだろうか。

それは、人類の知識共有にとって理想的な未来なのか。
それとも、コミュニティの文化を失わせるブラックホールなのか。

この記事では、OSSライセンスの歴史を振り返りながら、AI時代にソフトウェアの自由と文化がどのように変化する可能性があるのかを考えてみたい。

OSSライセンスは何を守ろうとしていたのか

オープンソースライセンスを理解するには、まずその前提にある著作権制度を確認する必要がある。

著作権はしばしば「作者の権利を守る法律」と説明される。しかし本来の目的はもう少し広い。社会全体の創作活動を促進することである。

近代の著作権制度は、18世紀の印刷文化の拡大とともに生まれた。代表的なものが1710年のイギリスの「アン法(Statute of Anne)」である。この法律は、書物を印刷する権利を一定期間作者に与えることで、新しい作品の創作を促す仕組みだった。

つまり著作権は、

創作者

独占権

創作のインセンティブ

文化の発展

という構造を持つ制度である。

この枠組みは20世紀のソフトウェアにも適用された。プログラムは文学作品と同様に著作物として扱われ、コピーや再配布には権利者の許可が必要になった。

しかし1980年代、この仕組みに異議を唱える人物が現れる。

それが Richard Stallman である。

当時、スタルマンはMIT人工知能研究所のプログラマーだった。研究室ではソフトウェアを自由に共有する文化が存在していた。しかし1980年代に入ると、企業によるプロプライエタリソフトウェアが急速に広がり、ソースコードが公開されなくなっていった。

スタルマンはこれを大きな問題だと考えた。

ソフトウェアがブラックボックス化すると、ユーザーはそれを理解することも改良することもできなくなる。つまりソフトウェアが人間を支配する道具になりかねない。

そこで彼は1983年、GNUプロジェクトを開始する。

GNUの目標はシンプルだった。

誰でも自由に使えるオペレーティングシステムを作ること。

しかしここで一つの問題があった。ソフトウェアを公開しても、それを企業が取り込み、改変してクローズドソフトにしてしまう可能性がある。

その問題を解決するために考案されたのが GNU General Public License である。

GPLは非常に独特な仕組みを持つ。

普通の著作権は「コピーを禁止する」ための権利だ。
しかしGPLはその逆を行う。

著作権を利用して、

自由を強制する。

GPLの基本原則はこうだ。

プログラムを使用する自由
プログラムを研究する自由
プログラムを改変する自由
プログラムを再配布する自由

ただし一つ条件がある。

改変したソフトウェアを配布する場合は、同じライセンスで公開しなければならない。

この仕組みは「コピーレフト」と呼ばれる。

コピーを制限する著作権(copyright)に対して、
コピーを共有する義務を課す仕組みだからだ。

この思想はその後、Linuxをはじめとする多くのプロジェクトに影響を与えた。たとえば Linux のカーネルはGPLで公開されており、世界中の開発者が改良を続けている。

しかしOSSの世界には、もう一つ別の思想も存在する。

それが MIT License である。

MITライセンスは非常にシンプルだ。

ソフトウェアを自由に使用、コピー、改変、配布してよい。
ただし著作権表示とライセンス文は残すこと。

それ以外の制約はほとんどない。

つまりMITライセンスが守ろうとしているのは、ソフトウェアの自由そのものではなく、

技術の拡散

である。

GPLが「自由を守る」ライセンスだとすれば、
MITは「利用を最大化する」ライセンスと言える。

この二つの思想は長く共存してきた。

自由を守るGPL。
拡散を重視するMIT。

しかし21世紀に入り、クラウドや巨大IT企業の台頭によって、このバランスは徐々に変わり始める。

そして現在、その変化をさらに加速させているのがAIなのである。

AIは巨大なコンパイラなのか

AIによるコード生成を巡る議論は、しばしば感情的になりがちだ。
しかし問題の本質を理解するためには、まず技術的な構造を冷静に見ておく必要がある。

AIはどのようにコードを生成しているのか。

現在広く使われているコード生成AI――たとえば OpenAI のChatGPTや Anthropic のClaudeは、大規模言語モデル(LLM)と呼ばれる仕組みを利用している。

このモデルは、膨大なテキストデータを学習することで言語のパターンを理解する。
その学習データには、公開されているソースコードも含まれている。

コード生成のプロセスを単純化すると、次のようになる。

既存コード

統計的学習

パターン抽象化

新しいコード生成

このプロセスは、従来のソフトウェア開発ツールと比較すると興味深い類似性を持っている。

それは コンパイラ である。

コンパイラとは、人間が書いたソースコードを機械語へ変換するプログラムだ。代表的な例として GNU Compiler Collection がある。

コンパイラの動作を単純化すると次のようになる。

ソースコード

解析

最適化

機械語生成

このとき生成される機械語は、元のソースコードとは全く異なる形になる。
しかし法的には、機械語はソースコードの派生物と見なされる。

つまり表現が変わっていても、意味や構造が同じならば派生作品と扱われるという考え方だ。

ここでAIの話に戻る。

AIによるコード生成は、次のようなプロセスを持つ。

コードデータ

学習

抽象化

新しいコード生成

構造的には、これは「巨大なコンパイラ」に近い存在だとも言える。

ただし、決定的な違いがある。

コンパイラは決定的な変換を行う。
同じ入力なら同じ出力になる。

しかしAIは統計的生成を行う。
同じ入力でも異なるコードを生成することがある。

この違いは、著作権の議論において非常に重要になる。

もしAIが生成したコードが、元のコードの構造を実質的に引き継いでいるなら、それは派生作品と見なされる可能性がある。

しかしもしAIが抽象化した知識から新しい実装を生成しているなら、それは独立した作品と主張できる可能性もある。

この問題はすでにいくつかの事件で議論されている。

たとえば2022年、MicrosoftOpenAI が提供する GitHub Copilot に対して、開発者グループが集団訴訟を提起した。

訴訟の主張はこうだった。

CopilotはGitHub上のコードを学習しており、
GPLなどのライセンスを持つコードを再生成する可能性がある。

もしそうなら、ライセンス条件が無視されているのではないか。

この問題に対する明確な司法判断はまだ出ていない。

しかしここで重要なのは、AIが従来の著作権制度の想定外の領域にいるという点である。

著作権制度は

コピー
配布
改変

という行為を前提に設計されている。

しかしAIが行っているのは

学習
抽象化
再生成

というプロセスだ。

これはコピーとは少し違う。

だからこそ、AI時代のソフトウェアと著作権の関係は、まだ完全には整理されていない。

そしてこの曖昧さこそが、コピーレフトの未来に影響を与える可能性がある。

もしAIによる再生成が「派生作品ではない」と判断されるなら、GPLのようなコピーレフトライセンスは、従来よりも弱い拘束力しか持たなくなるかもしれない。

つまりAIは、意図せずしてコピーレフトの境界線を揺るがしている存在なのである。

なぜMITライセンスが増えているのか

ここ数年、GitHubを眺めていると一つの傾向に気付く。
新しいプロジェクトの多くが MITライセンス を採用している。

これは単なる偶然ではない。ソフトウェア開発の環境そのものが変わった結果である。

まず一つの転機は、クラウドの時代だ。

2000年代のOSSは「ソフトウェアを配布する文化」だった。
開発者はソフトウェアを公開し、ユーザーはそれをダウンロードして使う。

この前提の上で設計されたのが GNU General Public License である。

GPLの仕組みはシンプルだ。

プログラムを配布する

ソースコードも公開する

つまり「配布」がライセンスのトリガーだった。

しかしクラウドの時代になると、この前提が崩れる。

企業はソフトウェアを配布しなくなった。
代わりにサービスとして提供するようになった。

ユーザーはソフトウェアをダウンロードしない。
ブラウザからサービスを利用する。

このときGPLのルールは発動しない。

なぜなら「配布」が行われていないからだ。

この問題を解決するために作られたのが GNU Affero General Public License である。

AGPLはルールを変更した。

ソフトウェアをネットワーク経由で利用させる場合も、
ソースコード公開義務が発生する。

つまり

配布
ではなく
ネットワーク利用

をトリガーにしたライセンスである。

しかしAGPLは企業にとって扱いが難しいライセンスでもあった。

大企業の法務部門はAGPLを警戒する傾向がある。
なぜならソースコード公開義務が広範囲に及ぶ可能性があるからだ。

結果として、多くの企業はAGPLを避けるようになった。

この流れの中で広がったのが、より緩やかなライセンスである。

その代表が MIT License だ。

MITライセンスは非常にシンプルだ。

ソフトウェアの使用
コピー
改変
再配布

すべて自由。

条件は一つだけ。

著作権表示とライセンス文を残すこと。

つまりMITライセンスは、企業にとって極めて扱いやすい。

企業はコードを自由に利用できる。
改変してクローズドソフトに組み込むこともできる。

そのため、多くの企業がOSSプロジェクトを公開する際にMITライセンスを選ぶようになった。

例えばJavaScriptエコシステムの多くのライブラリはMITライセンスで公開されている。

さらに近年、この流れを強めているのがAIである。

AIモデルの学習には膨大なコードデータが必要になる。
もしコードのライセンス条件が複雑であれば、学習データとして利用することが難しくなる。

MITライセンスはその点で非常に都合が良い。

AI企業はコードを学習データとして利用できる。
ライセンスリスクも小さい。

このため、AI時代のOSSはますます「パーミッシブライセンス」に傾いている。

しかしここで一つの疑問が生まれる。

もしAIがコードを学習し、新しいコードを生成するなら、
そのコードは誰のものになるのだろうか。

もし著作権が成立しないとすれば、
ソフトウェアは最終的にPublic Domainのような状態に近づく可能性がある。

それは知識共有の理想なのだろうか。

それとも、OSS文化を支えてきたコミュニティのバランスを崩すことになるのだろうか。

この問題は、AI時代のソフトウェア文化にとって避けて通れないテーマである。

Public Domainブラックホール問題

AI時代のソフトウェアを巡る議論で、しばしば見落とされがちな問題がある。

それは 著作権の空白 だ。

従来のソフトウェアは、人間が書くものだった。
そのため著作権の帰属は明確だった。

プログラムを書いた人が作者であり、その人が著作権を持つ。

しかしAIがコードを生成する場合、この前提が揺らぐ。

もしAIが完全に自動で生成したコードがあるとする。
このコードの著作権は誰が持つのだろうか。

この問題はすでに米国で議論されている。

AIが生成した作品に著作権を認めるべきかという争いの中で、米国の裁判所は「人間の創作性が必要」という立場を維持している。

この議論の中心にあるのが Thaler v. Perlmutter である。

この事件では、AIが生成した画像を著作物として登録しようとしたが、米国著作権局はこれを拒否した。

裁判所も同様の判断を示した。

著作権は人間の創作物を保護する制度であり、
AI単独で生成された作品は対象にならない。

さらに2026年、Supreme Court of the United States は関連する争点の審理を拒否し、この解釈は事実上維持されることになった。

この判断が意味することは大きい。

もしAI生成物が著作権を持たないなら、それは法的には誰のものでもない。

つまり Public Domain に近い状態になる。

Public Domainとは、著作権が存在しない作品のことだ。

古典文学や古い音楽作品がその例である。
シェイクスピアの作品に著作権は存在しない。

誰でも自由に利用できる。

一見すると、これは理想的な状態に見える。

知識が自由に共有される社会。
誰でも利用できる技術。

しかしAIの時代、この構造は少し違った意味を持つ可能性がある。

AIは膨大な知識を吸収する。

人間の書いたコード

OSSとして公開

AIが学習

新しいコードを生成

もし生成されたコードに著作権が存在しないなら、
このプロセスは次のような構造になる。

人間

OSS

AI学習

生成コード

Public Domain

つまり人間の知識がAIを通じて「著作権の外側」に流れ出ていく。

この現象をここでは Public Domainブラックホール と呼ぶことにする。

ブラックホールの特徴は、物質が吸い込まれると戻ってこないことだ。

AIの知識循環も同じ構造を持つ可能性がある。

コミュニティが作ったコード

AIが吸収

企業がサービス化

利益は企業へ

この流れが続けば、OSS文化を支えてきたバランスが崩れる可能性がある。

もちろん、現実はそこまで単純ではない。

多くのAI生成物には人間の関与がある。
プロンプト設計や編集によって著作権が認められる可能性もある。

しかし根本的な問題は残る。

AIは

コピー
ではなく
再生成

を行う。

従来の著作権制度はコピーを前提に設計されている。
しかしAIはその外側にある。

このギャップこそが、AI時代の知識共有を巡る最大の論点なのである。

AI時代のライセンスは何を守ろうとするのか

これまで見てきたように、AIは従来のソフトウェアライセンスが想定していた世界とは少し違う仕組みで動いている。

従来のライセンスは主に三つの行為を前提にしていた。

コピー
配布
改変

これらをどのように許可するかによって、ライセンスの性格が決まっていた。

しかしAIが関わると、もう一つの行為が現れる。

それが 学習 である。

AIはコードをコピーして再配布するわけではない。
大量のコードを学習し、そこから抽象化された知識を取り出す。

そして、その知識をもとに新しいコードを生成する。

このプロセスは従来のライセンスではほとんど規定されていない。

つまりAI時代のライセンス問題は、

コピーの問題ではなく
学習の問題

になりつつある。

ここで重要になるのが「知識の循環」という視点だ。

オープンソース文化は、長い時間をかけてある循環を作ってきた。

開発者

コード公開

コミュニティ

改良

再公開

この循環があるからこそ、ソフトウェアは急速に進歩してきた。

例えば Linux の開発は、世界中の開発者が協力することで進んできた。Linuxカーネルは一人の開発者ではなく、巨大なコミュニティによって作られている。

しかしAIが登場すると、この循環に新しい要素が入る。

開発者

OSS

AI学習

モデル

生成コード

ここで問題になるのは、モデルが閉じてしまう場合である。

もしAIモデルがクローズドで、学習データも公開されない場合、コミュニティに知識が戻ってこない可能性がある。

この状況に対して、いくつかの新しいアイデアが議論され始めている。

一つは AI版コピーレフト である。

従来のコピーレフトは、配布を条件にソースコード公開を求めていた。

AI版コピーレフトでは、条件が変わる可能性がある。

例えば

コードをAI学習に利用する場合

モデルの公開義務

あるいは

生成コード

同じライセンスで公開

こうした仕組みが検討されている。

もう一つの議論は、学習データの透明性だ。

AIモデルは巨大なブラックボックスになりがちである。
どのデータが学習に使われたのかが分からないことも多い。

そのため、

学習データの公開
モデルの透明性
生成ルールの説明

などを求める動きも出てきている。

こうした議論はまだ始まったばかりだ。

しかし一つだけ確かなことがある。

AI時代のライセンスは、単にコードの利用条件を決めるものではなくなる可能性がある。

それは

知識
コミュニティ
AI

の関係を設計する制度になる。

つまりライセンスは、ソフトウェアの契約書であると同時に、

知識のエコシステムを守る仕組み

になりつつあるのである。

名誉という古い文化

ここまで見てきたように、AIの登場はソフトウェアのライセンス体系に新しい問いを投げかけている。

AIはコードをコピーするのではなく、学習し、抽象化し、再生成する。
このプロセスは従来の著作権制度の前提と必ずしも一致しない。

もしAI生成物に著作権が成立しないなら、ソフトウェアは最終的にPublic Domainに近い状態へと向かう可能性もある。

それは知識共有の理想の姿なのかもしれない。
しかし同時に、コミュニティ文化を支えてきた重要な要素を失う危険もある。

その要素とは 帰属(attribution)、つまり誰がそれを作ったのかという記録である。

オープンソースの世界では、多くの開発者が必ずしも金銭的報酬のためだけにコードを書いているわけではない。
もちろん企業や仕事としての開発もあるが、それだけでは説明できない文化が存在する。

自分の書いたコードが世界中で使われる。
誰かがそのコードを改良する。
そしてその履歴の中に自分の名前が残る。

それはある種の名誉である。

この文化は実はとても古い。

日本の宮大工は、建物の完成後に見えなくなる場所――梁や屋根裏などに自分の名前を刻むことがある。
建物は数百年の間に何度も修理され、柱や梁も交換される。

しかし屋根裏に残された墨書きは、時折それを発見した人にこう語りかける。

ここを作ったのは誰か。

MIT License は、ある意味でこの文化に近い。

MITライセンスが求めているのはただ一つ。
著作権表示を残すこと。

つまり

このコードを書いたのは誰か。

その記録だけは消さないでほしい、ということだ。

一方で GNU General Public License はもう少し強い主張を持っている。

ソフトウェアの自由を守ること。
そしてコミュニティへの還元を確保すること。

両者は違う思想を持っているが、共通している点もある。

それは

ソフトウェアは単なる商品ではなく、
知識文化の一部である

という考え方だ。

AI時代において、この文化がどのような形で残るのかはまだ分からない。

AIが巨大な知識コンパイラとなり、人間の書いたコードを学習し、新しいコードを生成する世界では、従来のライセンスだけでは十分ではないかもしれない。

しかし一つだけ確かなことがある。

人間は、知識を共有する文化を長い時間をかけて作ってきた。

科学も、数学も、工学も、
すべては過去の知識の上に築かれている。

その中で、人類はある習慣を守り続けてきた。

誰がそれを発見したのか。
誰がそれを作ったのか。

その名前を残すという習慣である。

AI時代のソフトウェアライセンスがどのような形になるとしても、
おそらくこの文化だけは消えないだろう。

梁の裏の墨書きのように。

そして未来の開発者が、
どこかのリポジトリの履歴を眺めながら、
こう思うかもしれない。

このコードは、誰が最初に刻んだのだろうか。


参照

Richard Stallman

コピーレフトという思想は、Richard Stallman が提唱した自由ソフトウェア運動に端を発する。ソフトウェアの自由を守るため、改変されたコードも同じ自由を保たなければならないという考え方だ。

Linux

Linuxは、Linus Torvaldsが公開したカーネルを起点に、世界中の開発者の貢献によって成長してきた。

U.S. Copyright Office(アメリカ著作権局)

現在のアメリカの立場では、U.S. Copyright Officeが「人間による創作でない作品は著作権の対象にならない」と繰り返し示している。

OpenRAIL License

近年はAIモデル専用のライセンスとして、OpenRAIL Licenseのような新しい枠組みも登場している。

The Cathedral and the Bazaar
Eric S. Raymond

OSS文化の特徴は、Eric S. Raymondが『The Cathedral and the Bazaar』で指摘した「バザール型開発」に象徴される。