為訓(xùn)練AI不擇手段!Meta被曝下載數(shù)十TB盜版電子書
快科技2月9日消息,據(jù)媒體報道,一名圖書作者對Meta提起訴訟,指控該公司未經(jīng)授權(quán)下載了大量盜版電子書,用于訓(xùn)練其AI模型。
最新泄露的郵件顯示,Meta承認(rèn)下載了一個有爭議的大型數(shù)據(jù)集LibGen,其中包括數(shù)千萬本盜版書籍。
根據(jù)法庭文件,Meta通過名為“安娜的檔案”(Anna's Archive)的渠道下載了至少81.7TB的數(shù)據(jù),其中包括來自知名盜版網(wǎng)站Z-Library和LibGen的至少35.7TB的內(nèi)容,Meta還被指此前從LibGen下載了額外的80.6TB數(shù)據(jù)。
作者指出,Meta的這一行為構(gòu)成了非法的電子書庫種子下載,且這一數(shù)字可能只是其盜版行為的冰山一角。
作者估計,這些盜版電子書庫可能僅占Meta盜版版權(quán)作品總量的0.008%,這表明Meta的盜版規(guī)??赡苓h(yuǎn)超目前所揭露的。
郵件還顯示,Meta公司員工也意識到其行為的法律風(fēng)險,2023年4月,Meta的研究工程師尼古拉·巴什利科夫在郵件中表示:“用公司的筆記本電腦下BT感覺不妥?!?/p>
到2023年9月,巴什科夫加大了抗議力度,并咨詢了法律團(tuán)隊,他指出,使用Torrents意味著對文件進(jìn)行“播種”,即對外共享內(nèi)容,這在法律上是不允許的。
但Meta仍決定繼續(xù),并試圖通過將數(shù)據(jù)集下載到非Meta服務(wù)器來避免被追溯的風(fēng)險。
最新推薦
閱讀排行榜
欄目索引
相關(guān)內(nèi)容