Un nou studiu academic a șocat sectorul tehnologic, punând sub semnul întrebării una dintre cele mai invocate apărări legale din industria inteligenței artificiale: afirmația că modelele lingvistice de top nu păstrează efectiv datele utilizate în procesul de antrenament, ci doar învață tipare statistice din acestea. Concluziile, provenite din cercetări realizate de echipe ale universităților Stanford și Yale, sugerează însă că aceste modele pot reproduce texte protejate prin drepturi de autor cu o acuratețe și fidelitate surprinzătoare, chiar și pentru fragmentări extinse. O descoperire care ar putea reconfigura fundamentul legal pe care se bazează în prezent sectorul AI.
### Modele AI și riscul de copiere directă a materialelor protejate
Pentru ani de zile, marile companii de tehnologie, precum OpenAI, Google sau Meta, au susținut vehement că modelele lor de inteligență artificială nu stochează și nu reproduc conținutul surselor de antrenament. În schimb, acestea spun, modelele ar învăța doar „tipare” și „structuri”, similar cu modul în care ar putea să funcționeze un creier uman în procesul de învățare. Această explicație a fost frecvent invocată în instanțe, inclusiv de către directorul general al OpenAI, Sam Altman, care a avertizat că restricțiile în accesul la date ar putea bloca complet progresul industriei.
Însă ultimele rezultate ale studiului indică altceva. În cercetare, cercetătorii au testat patru modele majore — GPT-4.1, Gemini 2.5 Pro, Grok 3 și Claude 3.7 Sonnet — observând că aceste sisteme pot reproduce fragmente lungi din opere protejate, precum cărți, cu o fidelitate uimitoare. În unele cazuri, Claude a redat aproape identic pasaje întregi din literatura clasică și contemporană, cu rate de acuratețe care depășesc 94-95%. Gemini, de exemplu, a reprodus secțiuni extinse din „Harry Potter și Piatra Filozofală”, ceea ce sugerează o stocare directă a conținutului original, nu doar învățare statistică.
### Implicații legale și asupra viitorului industriei AI
Descoperirile acestea pot avea implicații devastatoare pentru modalitatea în care industriei AI i se apără acum în fața acuzelor privind încălcarea drepturilor de autor. La momentul actual, argumentul predominant în instant, atât în SUA, cât și în alte jurisdicții, este acela că modelele rețin doar tipare de învățare și nu copiază efectiv conținutul protejat. Însă dacă cercetarea confirmă faptul că modelele pot reproduce în mod fidel fragmente extinse din opere, se remarcă o posibilă schimbare de paradigmă legală.
Potrivit unor experți în drept, această descoperire ar putea diminua considerabil specificațiile de „fair use”, justificarea adusă de companiile AI pentru utilizarea materialelor protejate fără acord. În plus, dacă se va dovedi că modelele stochează efectiv și redau conținut original, companiile ar putea fi pârâte pentru încălcări majore, fiind expuse unor despăgubiri de miliarde de dolari.
Un aspect crucial rămâne însă nerezolvat: dacă aceste modele redau conținutul protejat prin reproducere directă sau dacă generează în mod dinamic fragmente noi, inspirate de învățarea lor, precum „improvizația” umană. Această incertitudine juridică menține, deocamdată, pozițiile oficiale ale companiilor care continuă să nege stocarea și copierea materialelor protejate.
### Ce se întâmplă în prezent și perspectivele viitoare
Pe măsură ce cercetările avansează și se adâncesc în detalii, se conturează un tablou mai complex al modului în care inteligența artificială stochează și utilizează date. În timp ce companiile de profil încearcă să-și adapteze pozițiile și strategiile legale, noile descoperiri atrag atenția autorităților și instanțelor în privința riscurilor sporite legate de încălcare a drepturilor de autor și de eventualele riscuri financiare masive.
Deocamdată, industria AI pare a fi în fața unui moment de răscruce, în care trebuie să-și regândească modelele de funcționare și, cel mai important, să clarifice dacă si în ce condiții pot fi considerate lipsite de risc copierea și reproducerea fragmentelor extinse din opere protejate. În toate cazurile, perspectiva unei reglementări mai stricte și a unor controale mai riguroase devine tot mai reală, iar aceste cercetări pot accelera schimbarea actualului echilibru fragil între inovație și respectarea drepturilor de autor.
