stiinta

Modul revoltător prin care o companie își antrenează Inteligența Artificială

Iată modul revoltător prin care o companie își antrenează Inteligența Artificială! Anthropic a distrus milioane de cărți tipărite pentru a-și antrena modelul de Inteligență Artificială Claude, iar documente apărute recent sugerează că firma era pe deplin conștientă cât de prost ar fi arătat totul dacă informația ar fi devenit publică.

Modul revoltător prin care o companie își antrenează Inteligența Artificială. Inițiativa secretă, numită Project Panama, a ieșit la iveală vara trecută, în urma unui proces intentat de un grup de autori împotriva Anthropic. Compania a acceptat în cele din urmă să închidă cazul în august, printr-o înțelegere de 1,5 miliarde de dolari.

De atunci, au apărut noi detalii despre ce s-a întâmplat în culise, după ce un judecător federal a dispus desecretizarea mai multor documente din dosar, potrivit unui material publicat de Washington Post, citat de Futurism.

Documentele arată că liderii Anthropic considerau cărțile „esențiale” pentru antrenarea modelelor AI, unul dintre cofondatori afirmând că acestea ar învăța sistemele „cum să scrie bine”, în loc să imite „limbajul de slabă calitate de pe internet”.

Modul revoltător prin care o companie își antrenează Inteligența Artificială: de ce distrugea Anthropic cărțile în acest proces?

O soluție a fost cumpărarea, scanarea și apoi distrugerea a milioane de cărți second-hand, o metodă care avea avantajul de a fi ieftină și, foarte probabil, legală. Practica se baza pe doctrina primei vânzări, un principiu juridic care le permite cumpărătorilor să facă ce doresc cu un produs achiziționat, fără intervenția deținătorului drepturilor de autor. (Acesta este și motivul pentru care există piața de produse media la mâna a doua.) În plus, conversia cărților din format fizic în format digital a fost considerată „transformatoare” de către un judecător, care a subliniat că Anthropic nu a creat copii fizice suplimentare și nu a redistribuit materialele. Acest lucru a fost suficient pentru a se încadra la utilizare corectă, permițându-i companiei să evite plata autorilor.

Din documentele procesului reiese că Anthropic a transformat literalmente distrugerea cărților într-un proces bine pus la punct. A folosit o „mașină de tăiere acționată hidraulic” pentru a „tăia ordonat” volumele cumpărate, după care paginile erau scanate cu „scanere de mare viteză și calitate, la nivel industrial”. Ulterior, o firmă de reciclare era chemată să ridice resturile.

Dacă totul pare etic discutabil, nu sunteți singurii care gândesc așa. Chiar Anthropic părea conștientă de imaginea negativă pe care ar fi putut-o genera această practică, devenind un simbol al modului în care tehnologia este percepută ca distrugând artele.

„Nu vrem să se știe că lucrăm la asta”, se arată într-un document intern de planificare din 2024, citat de Washington Post.

De ce a ales Anthropic să-și antreneze AI-ul pe cărți fizice?

Înainte de a apela la cărți fizice, compania a folosit inițial cărți digitale. În 2021, cofondatorul Anthropic Ben Mann a descărcat milioane de volume de pe LibGen, o „bibliotecă din umbră” care oferă gratuit texte piratate. Un an mai târziu, Mann lăuda un site numit Pirate Library Mirror, care recunoștea deschis că „încalcă în mod deliberat” legea drepturilor de autor în majoritatea țărilor, comentând entuziast lansarea acestuia: „fix la timp!!!”. Anthropic a negat că ar fi folosit aceste cărți piratate pentru modelele sale comerciale, însă utilizarea lor a fost considerată ilegală, contribuind la acordul de 1,5 miliarde de dolari.

Anthropic nu a fost singura companie implicată în astfel de practici. Într-un alt proces intentat de autori, documentele au arătat că și Meta, compania lui Mark Zuckerberg, a obținut milioane de cărți din biblioteci piratate precum LibGen, fapt care a stârnit îngrijorări chiar în rândul angajaților.

„Descărcarea de torrente de pe un laptop corporativ nu pare în regulă”, a scris un inginer Meta în 2023, adăugând un emoji zâmbitor.

Un alt angajat, atent la imaginea publică, avertiza asupra reacțiilor negative care ar putea urma dacă informațiile ar deveni publice.

„Dacă apar materiale de presă care sugerează că am folosit un set de date despre care știm că este piratat, precum LibGen, acest lucru ne-ar putea submina poziția de negociere cu autoritățile de reglementare”, se arată într-o comunicare internă.

Vă recomandăm să citiți și:

Studiu-pilot fără precedent în Marea Britanie privind limitarea accesului copiilor la rețelele sociale

Logoterapia – 15 principii care te pot ajuta să găsești sens în situații limită din viață

De ce visăm atât de des că fugim, cădem sau că suntem urmăriți?

Este adevărat că pierdem cel mai mult din căldura corpului prin cap?

Articolul Modul revoltător prin care o companie își antrenează Inteligența Artificială apare prima dată în Descopera.

Această știre a fost preluată de pe portalul amintit
Această informație preluată de pe portalul mai sus amintit, nu reprezintă o informație oficială a unei autorități, însă în latura de știre prezintă o informație veridică. potrivit legii 8/1996 știrile pot fi preluate chiar de la un portal la altul, nefiind opere sau lucrări ce necesită drept de autor, însă din spirit deontologic oferim sursa acestora.

Leontiuc Marius – senior editor




Împotriva articolelor redacției noastre, persoanele nemulțumite pot formula Contestație în termen de 10 zile de la publicarea articolului, la judecătoria Orășenească nr. 1 München Bayern Deutschland, in conformitate cu Legea federală Germană. Considerăm că nu se pot formula acțiuni la instanțele din România deoarece nici o persoană care activează în trustul nostru nu poate fi extrasă de sub jurisdicția federală germană. Considerăm că redacția noastră nu răspunde în fața autorităților din România ci doar celor federale sau civile germane. deoarece legea română nu are efecte de extraneitate asupra redacției chiar dacă subiectul știrilor face obiectul unor evenimente sau persoane din România și sunt scrise în limba română. Limba română nu este izvor de extraneitate a legii.

(Visited 2 times, 1 visits today)
Avatar
Marius Leontiuc
absolvent WEB DESIGN Academia Britanică de Comunicare Iasi - absolvent COMUNICARE IN AFACERI Academia Britanica de Afaceri si Comunicare -absolvent JURNALISM EDITORIAL - London School University - 2019 inscris la echivalare diploma la Universitatea Politehnica Timisoara - absolvent studii de Drept Universitatea Europeană Drăgan, cursuri in Drept la Universitatea de Vest Timisoara, absolvent studii de proiectare, pastor coordonator in Biserica Protestanta Evanghelica, Android Developer pe Google Play și plugin developer la Oxwall, creator de teme Wordpress și Oxwall, operator Wordpress, Drupal, Oxwall, Osclass, Moodle, tehnologii HTML și PHP
http://www.leontiucmarius.wordpress.com/cv

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *