《加州生成式人工智能訓練數(shù)據(jù)透明度法案》（AB 2013）

2026-04-13 來源：網(wǎng)絡轉(zhuǎn)載瀏覽：301

　　《加州生成式人工智能訓練數(shù)據(jù)透明度法案》(AB 2013)是美國首部專門針對生成式人工智能訓練數(shù)據(jù)進行透明度監(jiān)管的法律。它已于2024年9月28日由州長簽署成為法律，并將于2026年1月1日正式生效。

　　這項法案的核心，是為生成式AI系統(tǒng)的"黑箱"問題引入一束光，通過強制披露訓練數(shù)據(jù)的來源和構(gòu)成，賦予公眾、消費者和創(chuàng)作者前所未有的知情權(quán)。

　　一、核心內(nèi)容：強制披露訓練數(shù)據(jù)

　　AB 2013的核心義務非常簡單直接：要求相關(guān)AI開發(fā)者在其網(wǎng)站上公開其訓練數(shù)據(jù)的"高層級摘要"(high-level summary)。

　　(一)適用對象(誰是"開發(fā)者"?)：法案對"開發(fā)者"的定義非常廣泛，不僅包括從零開始設計、編碼、生產(chǎn)AI系統(tǒng)的實體，也包括那些對現(xiàn)有生成式AI系統(tǒng)進行"實質(zhì)性修改"(substantially modifies)的個人或組織。這里的"實質(zhì)性修改"指通過重新訓練或微調(diào)等方式，顯著改變系統(tǒng)功能或性能的新版本或更新。

　　(二)適用系統(tǒng)：法案適用于所有在2022年1月1日當天及之后首次發(fā)布或經(jīng)過實質(zhì)性修改，并向加州公眾(無論免費或付費)提供的生成式AI系統(tǒng)或服務。

　　(三)披露什么?：開發(fā)者必須在系統(tǒng)發(fā)布或重大更新前，在其網(wǎng)站上公布文檔，詳細說明訓練數(shù)據(jù)。這份"高層級摘要"必須至少包含以下12項信息：

　　1、數(shù)據(jù)來源/所有者：數(shù)據(jù)集的來源方或所有者是誰。

　　2、目的相關(guān)性：數(shù)據(jù)集如何服務于AI系統(tǒng)的預期目的。

　　3、數(shù)據(jù)量級：數(shù)據(jù)集包含的數(shù)據(jù)點數(shù)量(可用大致范圍或動態(tài)數(shù)據(jù)的估算值表示)。

　　4、數(shù)據(jù)類型：數(shù)據(jù)點的類型描述(如使用的標簽類型或未標注數(shù)據(jù)的一般特征)。

　　5、知識產(chǎn)權(quán)狀態(tài)：數(shù)據(jù)集是否包含受版權(quán)、商標或?qū)＠Ｗo的數(shù)據(jù)，或是否完全屬于公共領(lǐng)域。

　　6、獲取方式：數(shù)據(jù)集是否為開發(fā)者購買或獲得授權(quán)。

　　7、個人信息：數(shù)據(jù)集是否包含《加州消費者隱私法案》(CCPA)中定義的"個人信息"。

　　8、聚合信息：數(shù)據(jù)集是否包含"聚合消費者信息"。

　　9、數(shù)據(jù)修改：開發(fā)者是否對數(shù)據(jù)集進行過清理、處理或其他修改，以及這些工作的目的。

　　10、收集時間：數(shù)據(jù)集中數(shù)據(jù)的收集時間段，并說明數(shù)據(jù)收集是否仍在進行。

　　11、首次使用時間：數(shù)據(jù)集在AI系統(tǒng)開發(fā)過程中首次使用的具體日期。

　　12、合成數(shù)據(jù)使用：AI系統(tǒng)的開發(fā)是否使用或持續(xù)使用"合成數(shù)據(jù)生成"技術(shù)。

　　(四)豁免情形：以下三類系統(tǒng)可以免于遵守該法案：

　　唯一目的是確保安全和完整性的系統(tǒng)(如網(wǎng)絡安全防御)。

　　唯一目的是操作國家空域中飛機的系統(tǒng)。

　　為國家安全、軍事或國防目的開發(fā)，且僅提供給聯(lián)邦實體使用的系統(tǒng)。

　　二、具體要求：12項披露內(nèi)容

　　法案明確規(guī)定了其必須包含的12項具體內(nèi)容，詳細列明如下：

　　(一)數(shù)據(jù)集的來源或所有者，明確指出訓練所使用的數(shù)據(jù)集來自哪里，或歸誰所有。

　　(二)數(shù)據(jù)集如何服務于AI系統(tǒng)的預期目的描述，所使用的數(shù)據(jù)集與系統(tǒng) intended purpose 之間的關(guān)聯(lián)性。

　　(三)數(shù)據(jù)集包含的數(shù)據(jù)點數(shù)量可以用大致范圍表示，如果是動態(tài)數(shù)據(jù)集，則提供估算數(shù)字。

　　(四)數(shù)據(jù)集中數(shù)據(jù)點類型的描述，對于有標簽的數(shù)據(jù)集，說明標簽的類型;對于無標簽的數(shù)據(jù)集，說明其一般特征。

　　(五)數(shù)據(jù)集的知識產(chǎn)權(quán)狀態(tài)，明數(shù)據(jù)集是否包含受版權(quán)、商標或?qū)＠Ｗo的數(shù)據(jù)，或者是否完全屬于公共領(lǐng)域。

　　(六)數(shù)據(jù)集是否由開發(fā)者購買或獲得授權(quán)，披露訓練數(shù)據(jù)的獲取方式是否涉及購買或授權(quán)。

　　(七)數(shù)據(jù)集是否包含"個人信息"，此處"個人信息"的定義與《加州消費者隱私法案》(CCPA)中的定義一致。

　　(八)數(shù)據(jù)集是否包含"聚合消費者信息" ，同樣遵循CCPA中的定義。

　　(九)開發(fā)者對數(shù)據(jù)集的修改情況，說明是否對數(shù)據(jù)集進行過清理、處理或其他修改，并闡述這些工作的目的。

　　(十)數(shù)據(jù)收集的時間段，說明數(shù)據(jù)集中數(shù)據(jù)的收集時間跨度，如果數(shù)據(jù)收集仍在進行中，也需注明。

　　(十一)數(shù)據(jù)集首次使用的時間，披露在AI系統(tǒng)開發(fā)過程中，首次使用該數(shù)據(jù)集的具體日期。

　　(十二)是否使用或持續(xù)使用合成數(shù)據(jù)，說明AI系統(tǒng)的開發(fā)是否使用了"合成數(shù)據(jù)生成"技術(shù)。

　　三、重點關(guān)注：法律的不確定性與潛在挑戰(zhàn)

　　盡管AB 2013的意圖明確，但其法律文本中存在一些模糊地帶，成為業(yè)界和法律界關(guān)注的焦點：

　　(一)"高層級摘要"的尺度：這是最大的爭議點。開發(fā)者究竟需要披露多詳細的信息?是一份籠統(tǒng)的匯總，還是需要細化到每個數(shù)據(jù)集的層面?例如，是僅僅列出"我們從某個數(shù)據(jù)經(jīng)紀商那里購買了數(shù)據(jù)"，還是需要說明從該經(jīng)紀商處獲得了哪些具體類型的數(shù)據(jù)?這個尺度將直接決定法案的效力。

　　(二)商業(yè)秘密與知識產(chǎn)權(quán)的沖突：法案沒有為商業(yè)秘密提供明確的豁免。訓練數(shù)據(jù)的構(gòu)成、來源和清洗方式，往往是AI公司的核心商業(yè)機密。強制披露可能導致這些機密外泄，削弱公司的競爭優(yōu)勢。知名AI公司xAI已于2025年底提起訴訟，主張該法案違反了憲法第五修正案的"征收條款"和第一修正案，正是這一沖突的集中體現(xiàn)。

　　(三)"實質(zhì)性修改"的門檻：什么是"實質(zhì)性修改"?法案定義仍不夠清晰。對于一個通過微調(diào)基礎(chǔ)模型來提供特定服務(如客服機器人)的公司，其修改行為是否達到了需要遵守AB 2013的程度，有待進一步澄清。

　　(四)執(zhí)行機制：法案本身未指定執(zhí)行機構(gòu)或處罰措施-1-3。但立法分析指出，它很可能通過加州的《反不正當競爭法》來執(zhí)行，這意味著州檢察長可以提起訴訟，并且可能賦予了私人訴訟的權(quán)利-2-10。這讓企業(yè)面臨潛在的訴訟風險。

　　四、立法背后：重點保護的四大價值

　　AB 2013的出臺，反映了加州立法者在推動AI發(fā)展中尋求平衡的深層考量，其核心保護價值體現(xiàn)在四個方面：

　　(一)消費者知情權(quán)與選擇權(quán)：這是最直接的立法目的。法案發(fā)起人表示，旨在讓消費者能夠"更好地評估他們是否對某個AI系統(tǒng)或服務有信心，并在不同的競爭系統(tǒng)和服務之間進行比較"。通過了解訓練數(shù)據(jù)的來源和質(zhì)量，用戶可以判斷一個AI模型是否可能存在偏見、是否可靠，從而做出更明智的選擇。

　　(二)知識產(chǎn)權(quán)保護：大量AI模型的訓練數(shù)據(jù)中包含了受版權(quán)、商標等保護的作品。法案要求開發(fā)者明確披露訓練數(shù)據(jù)中是否包含受保護的知識產(chǎn)權(quán)。這為版權(quán)所有者(如藝術(shù)家、作家、軟件開發(fā)者)提供了關(guān)鍵信息，讓他們能夠了解自己的作品是否被用于訓練AI，并據(jù)此評估自身權(quán)利是否受到侵害，為潛在的維權(quán)行動提供了基礎(chǔ)。

　　(三)個人隱私保護：通過要求開發(fā)者聲明訓練數(shù)據(jù)中是否包含CCPA定義的"個人信息"或"聚合消費者信息"，法案將AI訓練與既有的消費者隱私保護框架聯(lián)系起來。這使得隱私權(quán)倡導者和監(jiān)管機構(gòu)能夠監(jiān)督，AI公司是否在未經(jīng)授權(quán)的情況下，使用個人數(shù)據(jù)訓練模型。

　　(四)促進負責任的創(chuàng)新：雖然增加了合規(guī)成本，但法案的根本目標并非阻礙創(chuàng)新。通過提高透明度，立法者希望建立一個更具信任度的AI發(fā)展環(huán)境。當公眾對AI的工作原理有更清晰的認識時，可能會更愿意接受和使用它。同時，透明度也能促使開發(fā)者更審慎地選擇訓練數(shù)據(jù)，從源頭減少偏見、歧視等問題的產(chǎn)生，推動AI向更公平、更可靠的方向發(fā)展。

　　五、法案原文獲取

　　您可以訪問加州立法信息官方網(wǎng)站查閱AB 2013的最終章節(jié)版法案全文：官方鏈接：https://leginfo.legislature.ca.gov/faces/billNavClient.xhtml?bill_id=202320240AB2013

　　在該頁面選擇 "10/07/24 - Enrolled" 或 "09/28/24 - Chaptered" 版本，即為最終通過的法律文本。

　　AB 2013代表了AI監(jiān)管從結(jié)果導向到過程透明的重要轉(zhuǎn)變。它像是給每個AI模型建立了一份"成分表"，雖然目前還存在一些爭議和不確定性，但其揭示的趨勢非常明確：透明度將成為未來可信AI的基石。

免責聲明：本網(wǎng)部分文章和信息來源于互聯(lián)網(wǎng)，轉(zhuǎn)載出于傳遞更多信息和學習之目的。如轉(zhuǎn)載稿涉及版權(quán)等問題，請立即聯(lián)系我們，我們會予以更改或刪除相關(guān)文章，保證您的權(quán)利。

狠狠色噜噜狠狠狠777米奇_无码超乳爆乳中文字幕_免费无码午夜福利片69_五十路六十路老熟女a片_国产一区二区三区在线播放不卡_1024国产手机在线_中文资源库官网_免费成人黄漫画网页入口_人妻成人动漫av

數(shù)據(jù)行業(yè)

《加州生成式人工智能訓練數(shù)據(jù)透明度法案》（AB 2013）

最新內(nèi)容

留言咨詢