什麼是「合法」與「正當」的根本差異?

在 AI 技術快速發展的時代,一個根本性的問題浮上檯面:法律允許的行為,是否就代表它是正確的?這個問題在開源社群引發激烈討論,特別是關於 AI 系統是否可以任意重製受 Copyleft 授權保護的軟體。

「合法」指的是行為是否符合法律規範,可能面臨訴訟但不一定違法。而「正當」則涉及道德、倫理和社群期望。當 AI 公司利用开源代码训练模型,却聲稱這是「合理使用」時,法律與道德的衝突便開始顯現。

典型案例包括:AI 模型能夠重現受版權保護軟體的功能,甚至直接使用其源代碼進行訓練。這在技術上或許合法,但在 Copyleft 社群眼中,這可能違背了「共享與回饋」的核心精神。

Copyleft 授權的基本原則與精神

Copyleft 授權(如 GPL、LGPL、AGPL)的核心理念是「如果你修改並發布衍生作品,你必須也以同樣的授權發布」。這與寬鬆的 Permissive 授權(如 MIT、Apache)形成鮮明對比。

Copyleft 的設計初衷是:

  • 保障自由:確保衍生作品同樣保持開源
  • 促進共享:鼓勵社群貢獻與協作
  • 防止剝削:避免商業公司「只拿不給」

以 GPL 為例,若你使用 GPL 程式碼開發新軟體並分發出去,你就必須開放你的源代碼。這種「傳染性」機制正是 Copyleft 保護自由軟體運動的基石。

AI 時代對 Copyleft 的三大衝擊

AI 系統的訓練與運作方式,對傳統版權觀念造成前所未有的挑戰:

1. 訓練資料的灰色地帶

AI 模型需要大量數據訓練。開源軟體的源代碼、文件、甚至 commit 歷史都可能被用於訓練,卻難以追蹤。這是否構成「衍生作品」?目前法律尚未明確。

2. 输输出的著作權歸屬

當 AI 重現或修改了受 Copyleft 保護的程式碼,輸出結果的歸屬變得模糊。AI 公司通常聲稱訓練屬於「合理使用」,但開源社群对此存在分歧。

3. 服務化規避授權

部分 AI 公司將開源軟體作為「服務」提供(如 API 调用),而非分發軟體本身。這可能規避了 Copyleft 的傳染性要求,卻在精神上違背了共享原則。

開發者應對策略:如何在 AI 時代保護開源精神

作為開發者或開源維護者,你可以採取以下具體步驟:

步驟一:選擇更嚴格的授權

考慮使用 AGPL(Affero General Public License)。AGPL 明確規範了透過網路服務使用軟體也必須开源,堵住了傳統 GPL 的漏洞。

步驟二:明確禁止 AI 訓練條款

在 LICENSE 文件中加入明確條款,禁止將你的程式碼用於 AI 訓練。例如:「本軟體明確禁止用於任何 AI 系統的訓練或優化。」

步驟三:使用許可證檢測工具

使用 scanCodeFOSSABlack Duck 等工具定期掃描專案依賴,確保授權合規。

步驟四:參與標準制定

積极參與 OSI(Open Source Initiative)和開源基金的標準討論,推動 AI 時代的新授權規範。

結語:法律是底線,道德是標竿

在 AI 重製與 Copyleft 的議題上,合法是基本要求,但不是終點。作為技術社群的一員,我們需要在法律框架內,重新思考什麼是真正的「公平」與「共享」。

當科技巨頭利用 AI 技術規避數十年的開源努力成果時,沉默就是最大的讓步。唯有持續關注、參與對話,並用行動支持真正開放的生態系統,才能確保開源精神在 AI 時代得以延續。