狠狠色噜噜狠狠狠777米奇_无码超乳爆乳中文字幕_免费无码午夜福利片69_五十路六十路老熟女a片_国产一区二区三区在线播放不卡_1024国产手机在线_中文资源库官网_免费成人黄漫画网页入口_人妻成人动漫av

數(shù)據(jù)行業(yè)

《加州生成式人工智能訓練數(shù)據(jù)透明度法案》(AB 2013)

2026-04-13 來源:網(wǎng)絡轉(zhuǎn)載 瀏覽:301

  《加州生成式人工智能訓練數(shù)據(jù)透明度法案》(AB 2013)是美國首部專門針對生成式人工智能訓練數(shù)據(jù)進行透明度監(jiān)管的法律。它已于2024年9月28日由州長簽署成為法律,并將于2026年1月1日正式生效。

  這項法案的核心,是為生成式AI系統(tǒng)的"黑箱"問題引入一束光,通過強制披露訓練數(shù)據(jù)的來源和構(gòu)成,賦予公眾、消費者和創(chuàng)作者前所未有的知情權(quán)。

  一、核心內(nèi)容:強制披露訓練數(shù)據(jù)

  AB 2013的核心義務非常簡單直接:要求相關(guān)AI開發(fā)者在其網(wǎng)站上公開其訓練數(shù)據(jù)的"高層級摘要"(high-level summary)。

  (一)適用對象(誰是"開發(fā)者"?):法案對"開發(fā)者"的定義非常廣泛,不僅包括從零開始設計、編碼、生產(chǎn)AI系統(tǒng)的實體,也包括那些對現(xiàn)有生成式AI系統(tǒng)進行"實質(zhì)性修改"(substantially modifies)的個人或組織。這里的"實質(zhì)性修改"指通過重新訓練或微調(diào)等方式,顯著改變系統(tǒng)功能或性能的新版本或更新。

  (二)適用系統(tǒng):法案適用于所有在2022年1月1日當天及之后首次發(fā)布或經(jīng)過實質(zhì)性修改,并向加州公眾(無論免費或付費)提供的生成式AI系統(tǒng)或服務。

  (三)披露什么?:開發(fā)者必須在系統(tǒng)發(fā)布或重大更新前,在其網(wǎng)站上公布文檔,詳細說明訓練數(shù)據(jù)。這份"高層級摘要"必須至少包含以下12項信息:

  1、數(shù)據(jù)來源/所有者:數(shù)據(jù)集的來源方或所有者是誰。

  2、目的相關(guān)性:數(shù)據(jù)集如何服務于AI系統(tǒng)的預期目的。

  3、數(shù)據(jù)量級:數(shù)據(jù)集包含的數(shù)據(jù)點數(shù)量(可用大致范圍或動態(tài)數(shù)據(jù)的估算值表示)。

  4、數(shù)據(jù)類型:數(shù)據(jù)點的類型描述(如使用的標簽類型或未標注數(shù)據(jù)的一般特征)。

  5、知識產(chǎn)權(quán)狀態(tài):數(shù)據(jù)集是否包含受版權(quán)、商標或?qū)@Wo的數(shù)據(jù),或是否完全屬于公共領(lǐng)域。

  6、獲取方式:數(shù)據(jù)集是否為開發(fā)者購買或獲得授權(quán)。

  7、個人信息:數(shù)據(jù)集是否包含《加州消費者隱私法案》(CCPA)中定義的"個人信息"。

  8、聚合信息:數(shù)據(jù)集是否包含"聚合消費者信息"。

  9、數(shù)據(jù)修改:開發(fā)者是否對數(shù)據(jù)集進行過清理、處理或其他修改,以及這些工作的目的。

  10、收集時間:數(shù)據(jù)集中數(shù)據(jù)的收集時間段,并說明數(shù)據(jù)收集是否仍在進行。

  11、首次使用時間:數(shù)據(jù)集在AI系統(tǒng)開發(fā)過程中首次使用的具體日期。

  12、合成數(shù)據(jù)使用:AI系統(tǒng)的開發(fā)是否使用或持續(xù)使用"合成數(shù)據(jù)生成"技術(shù)。

  (四)豁免情形:以下三類系統(tǒng)可以免于遵守該法案:

  唯一目的是確保安全和完整性的系統(tǒng)(如網(wǎng)絡安全防御)。

  唯一目的是操作國家空域中飛機的系統(tǒng)。

  為國家安全、軍事或國防目的開發(fā),且僅提供給聯(lián)邦實體使用的系統(tǒng)。

  二、具體要求:12項披露內(nèi)容

  法案明確規(guī)定了其必須包含的12項具體內(nèi)容,詳細列明如下:

  (一)數(shù)據(jù)集的來源或所有者,明確指出訓練所使用的數(shù)據(jù)集來自哪里,或歸誰所有。

  (二)數(shù)據(jù)集如何服務于AI系統(tǒng)的預期目的描述,所使用的數(shù)據(jù)集與系統(tǒng) intended purpose 之間的關(guān)聯(lián)性。

  (三)數(shù)據(jù)集包含的數(shù)據(jù)點數(shù)量可以用大致范圍表示,如果是動態(tài)數(shù)據(jù)集,則提供估算數(shù)字。

  (四)數(shù)據(jù)集中數(shù)據(jù)點類型的描述,對于有標簽的數(shù)據(jù)集,說明標簽的類型;對于無標簽的數(shù)據(jù)集,說明其一般特征。

  (五)數(shù)據(jù)集的知識產(chǎn)權(quán)狀態(tài),明數(shù)據(jù)集是否包含受版權(quán)、商標或?qū)@Wo的數(shù)據(jù),或者是否完全屬于公共領(lǐng)域。

  (六)數(shù)據(jù)集是否由開發(fā)者購買或獲得授權(quán),披露訓練數(shù)據(jù)的獲取方式是否涉及購買或授權(quán)。

  (七)數(shù)據(jù)集是否包含"個人信息",此處"個人信息"的定義與《加州消費者隱私法案》(CCPA)中的定義一致。

  (八)數(shù)據(jù)集是否包含"聚合消費者信息" ,同樣遵循CCPA中的定義。

  (九)開發(fā)者對數(shù)據(jù)集的修改情況,說明是否對數(shù)據(jù)集進行過清理、處理或其他修改,并闡述這些工作的目的。

  (十)數(shù)據(jù)收集的時間段,說明數(shù)據(jù)集中數(shù)據(jù)的收集時間跨度,如果數(shù)據(jù)收集仍在進行中,也需注明。

  (十一)數(shù)據(jù)集首次使用的時間,披露在AI系統(tǒng)開發(fā)過程中,首次使用該數(shù)據(jù)集的具體日期。

  (十二)是否使用或持續(xù)使用合成數(shù)據(jù),說明AI系統(tǒng)的開發(fā)是否使用了"合成數(shù)據(jù)生成"技術(shù)。

  三、重點關(guān)注:法律的不確定性與潛在挑戰(zhàn)

  盡管AB 2013的意圖明確,但其法律文本中存在一些模糊地帶,成為業(yè)界和法律界關(guān)注的焦點:

  (一)"高層級摘要"的尺度:這是最大的爭議點。開發(fā)者究竟需要披露多詳細的信息?是一份籠統(tǒng)的匯總,還是需要細化到每個數(shù)據(jù)集的層面?例如,是僅僅列出"我們從某個數(shù)據(jù)經(jīng)紀商那里購買了數(shù)據(jù)",還是需要說明從該經(jīng)紀商處獲得了哪些具體類型的數(shù)據(jù)?這個尺度將直接決定法案的效力。

  (二)商業(yè)秘密與知識產(chǎn)權(quán)的沖突:法案沒有為商業(yè)秘密提供明確的豁免。訓練數(shù)據(jù)的構(gòu)成、來源和清洗方式,往往是AI公司的核心商業(yè)機密。強制披露可能導致這些機密外泄,削弱公司的競爭優(yōu)勢。知名AI公司xAI已于2025年底提起訴訟,主張該法案違反了憲法第五修正案的"征收條款"和第一修正案,正是這一沖突的集中體現(xiàn)。

  (三)"實質(zhì)性修改"的門檻:什么是"實質(zhì)性修改"?法案定義仍不夠清晰。對于一個通過微調(diào)基礎(chǔ)模型來提供特定服務(如客服機器人)的公司,其修改行為是否達到了需要遵守AB 2013的程度,有待進一步澄清。

  (四)執(zhí)行機制:法案本身未指定執(zhí)行機構(gòu)或處罰措施-1-3。但立法分析指出,它很可能通過加州的《反不正當競爭法》來執(zhí)行,這意味著州檢察長可以提起訴訟,并且可能賦予了私人訴訟的權(quán)利-2-10。這讓企業(yè)面臨潛在的訴訟風險。

  四、立法背后:重點保護的四大價值

  AB 2013的出臺,反映了加州立法者在推動AI發(fā)展中尋求平衡的深層考量,其核心保護價值體現(xiàn)在四個方面:

  (一)消費者知情權(quán)與選擇權(quán):這是最直接的立法目的。法案發(fā)起人表示,旨在讓消費者能夠"更好地評估他們是否對某個AI系統(tǒng)或服務有信心,并在不同的競爭系統(tǒng)和服務之間進行比較"。通過了解訓練數(shù)據(jù)的來源和質(zhì)量,用戶可以判斷一個AI模型是否可能存在偏見、是否可靠,從而做出更明智的選擇。

  (二)知識產(chǎn)權(quán)保護:大量AI模型的訓練數(shù)據(jù)中包含了受版權(quán)、商標等保護的作品。法案要求開發(fā)者明確披露訓練數(shù)據(jù)中是否包含受保護的知識產(chǎn)權(quán)。這為版權(quán)所有者(如藝術(shù)家、作家、軟件開發(fā)者)提供了關(guān)鍵信息,讓他們能夠了解自己的作品是否被用于訓練AI,并據(jù)此評估自身權(quán)利是否受到侵害,為潛在的維權(quán)行動提供了基礎(chǔ)。

  (三)個人隱私保護:通過要求開發(fā)者聲明訓練數(shù)據(jù)中是否包含CCPA定義的"個人信息"或"聚合消費者信息",法案將AI訓練與既有的消費者隱私保護框架聯(lián)系起來。這使得隱私權(quán)倡導者和監(jiān)管機構(gòu)能夠監(jiān)督,AI公司是否在未經(jīng)授權(quán)的情況下,使用個人數(shù)據(jù)訓練模型。

  (四)促進負責任的創(chuàng)新:雖然增加了合規(guī)成本,但法案的根本目標并非阻礙創(chuàng)新。通過提高透明度,立法者希望建立一個更具信任度的AI發(fā)展環(huán)境。當公眾對AI的工作原理有更清晰的認識時,可能會更愿意接受和使用它。同時,透明度也能促使開發(fā)者更審慎地選擇訓練數(shù)據(jù),從源頭減少偏見、歧視等問題的產(chǎn)生,推動AI向更公平、更可靠的方向發(fā)展。

  五、法案原文獲取

  您可以訪問加州立法信息官方網(wǎng)站查閱AB 2013的最終章節(jié)版法案全文:官方鏈接:https://leginfo.legislature.ca.gov/faces/billNavClient.xhtml?bill_id=202320240AB2013

  在該頁面選擇 "10/07/24 - Enrolled" 或 "09/28/24 - Chaptered" 版本,即為最終通過的法律文本。

  AB 2013代表了AI監(jiān)管從結(jié)果導向到過程透明的重要轉(zhuǎn)變。它像是給每個AI模型建立了一份"成分表",雖然目前還存在一些爭議和不確定性,但其揭示的趨勢非常明確:透明度將成為未來可信AI的基石。

免責聲明:本網(wǎng)部分文章和信息來源于互聯(lián)網(wǎng),轉(zhuǎn)載出于傳遞更多信息和學習之目的。如轉(zhuǎn)載稿涉及版權(quán)等問題,請立即聯(lián)系我們,我們會予以更改或刪除相關(guān)文章,保證您的權(quán)利。

留言咨詢

北京市東城區(qū)永定門外大街64號金隅龍順成文化創(chuàng)意產(chǎn)業(yè)園501B

電話:13911525319、010-67231399

E-mail:[email protected]

Copyright 2020 北京知寰律師事務所 網(wǎng)站備案號:京ICP備20007375號-1 技術(shù)支持:律品科技

139-1152-5319

永丰县| 盐山县| 英德市| 合水县| 永寿县| 沁阳市| 西丰县| 房山区| 太仆寺旗| 宜君县| 阿拉尔市| 滨州市| 申扎县| 北流市| 蓝山县| 柯坪县| 阳新县| 吴堡县| 巫溪县| 中宁县| 老河口市| 垦利县| 大足县| 志丹县| 乳山市| 西城区| 轮台县| 无棣县| 武隆县| 苍南县| 安塞县| 成安县| 双城市| 西宁市| 麻江县| 曲水县| 中超| 三江| 崇信县| 河津市| 盐山县|