Necesitatea unui pas crucial pentru securitatea AI și protecția datelor

Diana Gheorghiu 5 February 2026, 07:15 4 min citire 2 vizualizari 0 comentarii

microsoft-inteligenta-artificiala-1.jpg - JurnalUrban

Microsoft lansează un instrument inovator de securitate dedicat inteligenței artificiale, menită să pună capăt riscului reprezentat de „backdoor-uri” în modelele mari de limbaj (LLM-uri), mai ales cele open-weight, cu parametri accesibili public. Acest scanner reprezintă un pas important în procesul de protejare a sistemelor AI, care devin tot mai integrate în cercetare, industrie și aplicații comerciale, și în același timp, tot mai vulnerabile la atacuri sofisticate. În condițiile în care modelele de limbaj pot fi compromise prin diverse metode, Microsoft pare să fi dezvoltat o metodă de detectare subtilă, dar eficientă, a acestor amenințări.

### Cum funcționează scanner-ul Microsoft și ce semnale urmărește

Pentru a înțelege importanța acestei inițiative, trebuie să analizăm modul în care modele de limbaj pot fi otrăvite, sau “poisoned”. Atacatorii pot introduce comportamente ascunse în parametrii de antrenare, fără ca acestea să fie vizibile în modul normal de utilizare. Aceste comportamente pot fi activate doar de anumite expresii-cheie sau structuri de input, transformând modelul într-un fel de agent latent, capabil să răspundă diferit în situații specifice, fără ca utilizatorul să își dea seama.

Microsoft a identificat trei tipare clare prin care pot fi detectați acești backdoor-uri. Primul reprezintă un anumit tipar de atenție în cadrul rețelei interne, declanșat de fraze specifice, care determină modelul să se concentreze excesiv pe elemente izolate. Al doilea semnal vine din comportamentul de memorie: modelele compromise pot “scurge” fragmente din datele de otrăvire, inclusiv trigger-urile, nu ca rezultat al învățării generale, ci ca o formă de memorare în detaliu. Ultimul indicator este activarea backdoor-urilor prin variații de fraze sau „declanșatori aproximați”, care deformează sau incompletează expresiile originale, dar pot produce același răspuns ascuns.

Scannerul dezvoltat de Microsoft analizează aceste comportamente, extrage conținutul memorat, și aplică evaluări pentru a cuantifica nivelul de suspiciune al fiecărui fragment. În final, generează o listă ierarhizată a potențialilor trigger-i, pe care echipele de securitate AI le pot verifica ulterior.

### Limitările și perspectivele noii tehnologii de securitate

Chiar dacă promisiunea este mare, tehnologia nu poate fi aplicată universal. Faptul că necesită acces la fișierele interne ale modelelor o face inutilizabilă pentru sistemele closed-source. În plus, funcționează cel mai bine în identificarea backdoor-urilor bazate pe declanșatori și răspunsuri deterministe, limitând astfel aria de aplicare a acesteia.

Recunoașterea acestor limite nu stârnește însă îngrijorare, ci indică faptul că Microsoft consideră această metodă un prim pas pragmatic în cadrul unui efort mai amplu de securizare a sistemelor AI. Compania extinde acum strategia Secure Development Lifecycle (SDL), pentru a include riscuri specifice inteligenței artificiale, precum prompt injection, contaminare a datelor de antrenare, manipularea pluginurilor sau atacuri prin API-uri externe.

În acest context, devine tot mai clar că securitatea AI nu se va mai baza pe delimitări tradiționale între zone de încredere și potențiale amenințări. Inputurile pot proveni din multiple surse, de la prompturi și actualizări automate, până la date externe sau servicii terțe, creând multiple puncte de intrare pentru activități malițioase. În aceste condiții, protecția devine un proces continuu, nu o etapă izolată care se face o singură dată.

Deși tehnologia actuală reprezintă o evoluție semnificativă, perspectivele pentru viitor includ dezvoltarea unor sisteme tot mai sofisticate, capabile să detecteze și să reactiveze la multiple forme de atacuri asupra modelelor AI. Într-un peisaj digital în care vulnerabilitățile evoluează rapid, efortul de a crea „scuturi” eficiente devine o prioritate esențială pentru companii și cercetători, pentru a asigura încrederea și siguranța utilizatorilor în aceste tehnologii din ce în ce mai integrate în viața noastră.

Articole Similare

nasa-pd4lo70ldbi-unsplash-scaled.jpg - JurnalUrban

Tehnologie

NASA amână misiunea spre Lună din cauza temperaturilor scăzute, data următoare neprecizată

Amânare neașteptată a misiunii Artemis: lansarea programată pentru începutul lui februarie, cu două zile mai târziu decât planificat inițial O nouă jumătate de veste pentru...

31 January 2026 10

elon-musk-cumpara-ryanair.jpg - JurnalUrban

Tehnologie

Ryanair confirmă că oferta de cumpărare, făcută “în glumă”, nu este serioasă

Elon Musk a reaprins interesul mediatic internațional, de această dată printr-un gest care pare a fi o glumă, dar care a atras atenția asupra unui...

21 January 2026 7

8048182-hepta_mediafax_foto-abacapress_hepta-scaled.jpg - JurnalUrban

Tehnologie

Musk anunță reducerea utilizării Starlink de către Rusia via SpaceX

Eforturi de a bloca accesul Rusiei la sistemul Starlink în contextul războiului din Ucraina Guvernele și companiile implicate în conflictul din Ucraina par să fi...

2 February 2026 5

samsung-a57-design-specificatii.jpg - JurnalUrban

Tehnologie

Samsung lansează inovări în gama mid-range în 2026

Samsung își continuă strategia de a consolida segmentul mid-range cu noua serie Galaxy A5x, având în vedere succesul modelului Galaxy A56, lansat în 2025. Aceasta...

24 January 2026 9

Articole Similare

NASA amână misiunea spre Lună din cauza temperaturilor scăzute, data următoare neprecizată

Ryanair confirmă că oferta de cumpărare, făcută “în glumă”, nu este serioasă

Musk anunță reducerea utilizării Starlink de către Rusia via SpaceX

Samsung lansează inovări în gama mid-range în 2026

Lasa un comentariu Anuleaza raspunsul