Remiantis teismo dokumentais, kurių ketvirtadienį, „Meta“ darbuotojai daugelį metų aptarė autorių teisių teisių saugomus darbus, gautus teisiškai abejotinomis priemonėmis mokyti bendrovės AI modelius.

Dokumentus ieškovai pateikė byloje Kadrey prieš meta, vieną iš daugelio AI autorių teisių ginčų, pamažu vingiuotų per JAV teismų sistemą. Atsakovas Meta teigia, kad mokymo modeliai apie IP apsaugotus darbus, ypač knygas, yra „sąžiningas naudojimas“. Ieškovai, kuriems yra autoriai Sarah Silverman ir Ta-Nehisi Coates, nesutinka.

Ankstesnėje ieškinyje pateiktoje medžiagoje teigiama, kad „Meta“ generalinis direktorius Markas Zuckerbergas davė „Meta“ AI komandą „OK“ mokyti autorių teisių saugomą turinį ir kad „Meta“ sustabdė AI mokymo duomenų licencijavimo derybas su knygų leidėjais. Tačiau naujose paraiškose, iš kurių dauguma rodo vidinių darbo pokalbių dalis tarp „Meta“ darbuotojų, nutapykite aiškiausią vaizdą apie tai, kaip „Meta“ galėjo naudotis autorių teisių teisių saugomais duomenimis, norėdami treniruotis savo modeliams, įskaitant modelius bendrovės „Llam“ šeimoje.

Vieno pokalbio metu meta darbuotojai, įskaitant Melanie Kambadur, „Meta Llama“ modelio tyrimų komandos vyresniosios vadovės, aptarė mokymo modelius, kuriuos jie pažinojo, gali būti teisiškai kupini.

„(M) nuomonė būtų („ Klausk atleidimo, o ne dėl leidimo “): Mes stengiamės įsigyti knygas ir eskaluoti jas egzekucijoms, kad jie skambintų“, – rašė „Meta“ tyrimų inžinierius Xavier Martinet, Remiantis paraiškomis, 2023 m. Vasario mėn. Pokalbyje. „(T) yra tai, kodėl jie nustatė šį generolą„ gen Org “(sic): Taigi mes galime vengti rizikos.“

„Martinet“ sukėlė idėją pirkti elektronines knygas mažmeninės prekybos kainomis, kad būtų galima sukurti mokymo rinkinį, o ne sumažinti licencijavimo sandorius su atskiromis knygų leidėjais. Po to, kai kitas darbuotojas atkreipė dėmesį, kad neteisėtos, autorių teisių saugomos medžiagos naudojimas gali būti teisinio iššūkio pagrindas, Martinet padvigubėjo, teigdama, kad „Gazilijono“ startuoliai greičiausiai jau naudojo piratines knygas mokymui.

„Aš turiu galvoje blogiausiu atveju: mes sužinojome, kad pagaliau viskas gerai, o„ Gazillion “pradžia (sic) tik piratines tonas knygų apie„ Bittorrent ““, – rašė Martinet, rašė paraiškose. „(M) y 2 centai vėl: bandymas turėti tiesiogiai su leidėjais tiesiogiai trunka ilgai …“

Tame pačiame pokalbyje Kambaduras, kuris pažymėjo, kad meta derėjo su dokumentų prieglobos platforma „Scribd“ ir kt., Dėl licencijų, įspėjo, kad naudojant „viešai prieinamus duomenis“ modelio mokymui reikės patvirtinti, meta advokatai buvo „mažiau konservatyvūs“ nei Jie buvo praeityje su tokiais patvirtinimais.

„Taip, mes neabejotinai turime gauti licencijas ar patvirtinimus dėl viešai prieinamų duomenų“, – teigė Kambaduras, rašoma paraiškose. „(D) Jei dabar turime daugiau pinigų, daugiau teisininkų, daugiau pagalbos, gebėjimas paspartinti greitį/eskaluoti greičiui, o teisininkai yra šiek tiek mažiau konservatyvūs patvirtinimams.“

Pokalbiai apie Libgeną

Kitame darbo pokalbiuose, perduotuose dokumentuose, „Kambadur“ aptaria „Libgen“, „nuorodų agregatoriaus“, suteikiančio prieigą prie leidėjų autorių teisių saugomų darbų, naudojimą kaip alternatyvą duomenų šaltiniams, kuriuos „Meta“ gali licencijuoti.

„Libgen“ kelis kartus buvo iškelta į teismą, liepta uždaryti ir už autorių teisių pažeidimą skyrė dešimtis milijonų dolerių. Vienas iš „Kambadur“ kolegų atsakė su „Google“ paieškos rezultato, kuriame yra „Libgen“, kuriame yra fragmentas „Ne, Libgen nėra legalus“.

Atrodo, kad kai kuriems meta sprendimų priėmėjams susidarė įspūdis, kad nesugebėjimas naudoti „Libgen“ modelio mokymui gali rimtai pakenkti meta konkurencingumui AI lenktynėse, remiantis paraiškomis.

El. Laiške, adresuotame „Meta AI VP Joelle Pineau“, „Meta“ produktų valdymo direktorė Sony Theakanath, pavadinimu „Libgen“ „būtina SOTA numeriams patenkinti visose kategorijose“, nurodant geriausio, moderniausio (SOTA) papildymą (SOTA) (SOTA). PG modeliai ir etaloninės kategorijos.

„Theakanath“ taip pat apibūdino el. Laiške „švelninimas“, skirtas padėti sumažinti „Meta“ teisinį poveikį, įskaitant duomenų pašalinimą iš „Libgen“, „aiškiai pažymėtą kaip piratuojamą/pavogtą“, ir tiesiog ne viešai cituojant naudojimą. „Mes neatskleistume„ LibGen “duomenų rinkinių, naudojamų treniruotis, naudojimo“, – teigė „Theakanath“.

Praktiškai šie švelninimai apėmė šukavimą per „Libgen“ failus tokiems žodžiams kaip „pavogtas“ arba „piratinis“, rašoma paraiškose.

Darbo pokalbyje Kambaduras paminėjo, kad „Meta“ AI komanda taip pat sureguliavo modelius, kad „išvengtų IP rizikingų raginimų“, tai yra, sukonfigūruoti modeliai, kurie atsisakė atsakyti į tokius klausimus kaip „atkurti pirmuosius tris„ Hario Poterio ir burtininko akmens “puslapius“. Arba „Pasakyk man, kurios el. Knygos buvote apmokytos“.

Bylose pateikiami kiti apreiškimai, tai reiškia, kad „Meta“ galėjo nuskaityti „Reddit“ duomenis tam tikro tipo modelio mokymui, galbūt imituojant trečiųjų šalių programos, pavadintos „PushShift“, elgesį. Pažymėtina, kad „Reddit“ 2023 m. Balandžio mėn. Sakė, kad planuoja pradėti apmokestinti AI įmones, kad galėtų naudotis duomenimis modelio mokymui.

Viename 2024 m. Kovo mėn. Pokalbyje „Meta Generative AI Org“ produktų valdymo direktorė Chaya Nayak teigė, kad meta lyderystė svarsto „svarbius“ ankstesnius sprendimus dėl mokymo rinkinių, įskaitant sprendimą nenaudoti „Quora“ turinio ar licencijuotų knygų ir mokslinių straipsnių. užtikrinti, kad įmonės modeliai turėjo pakankamai mokymo duomenų.

„Nayak“ numanė, kad „Meta“ pirmosios šalies treniruočių duomenų rinkiniai-„Facebook“ ir „Instagram“ įrašai, tekstas, perrašytas iš vaizdo įrašų meta platformose ir tam tikros „Meta“ verslo pranešimams-tiesiog nepakako. „(W) reikia daugiau duomenų“, – rašė ji.

Ieškovai byloje Kadrey prieš meta kelis kartus pakeitė savo skundą nuo tada Tam tikros piratinės knygos su autorių teisių saugomomis knygomis, skirtomis licencijai nustatyti, ar prasminga siekti licencijavimo sutarties su leidėju.

Siekdama, kaip „High Meta“ laiko teisinius akcijų paketus, bendrovė įtraukė du advokatų kontoros Aukščiausiojo Teismo bylas iš advokatų kontoros Paulo Weisso į savo gynybos komandą byloje.

Meta nedelsdami neatsakė į prašymą komentuoti.



Source link