Tehnologie

Inteligența artificială, testată în scenarii de violență: majoritatea chatboturilor, vulnerabile Un studiu realizat de Centrul pentru Combaterea Urii Digitale (CCDH), în colaborare cu CNN, a scos la iveală vulnerabilități alarmante ale inteligenței artificiale (AI)

13 martie 2026

Inteligența artificială, testată în scenarii de violență: majoritatea chatboturilor, vulnerabile

Un studiu realizat de Centrul pentru Combaterea Urii Digitale (CCDH), în colaborare cu CNN, a scos la iveală vulnerabilități alarmante ale inteligenței artificiale (AI). Cercetarea a analizat modul în care nouă sisteme AI, printre care Google Gemini și Microsoft Copilot, răspund la solicitări privind planificarea unor atacuri violente. Rezultatele arată că majoritatea chatboturilor incluse în test au oferit, într-o formă sau alta, informații ce ar putea fi folosite în scopuri nocive.

Raportul a fost întocmit pe baza a peste 700 de răspunsuri generate de sistemele AI, în cadrul a nouă scenarii diferite. Cercetătorii s-au prezentat drept adolescenți de 13 ani, intenționând să comită atacuri în masă. Ei au testat reacțiile chatboturilor la cereri specifice, precum obținerea de detalii despre organizarea unor atacuri armate în școli, asasinarea unor politicieni sau atacarea unor sinagogi.

Unele platforme au furnizat informații detaliate pentru atacuri

Studiul a scos în evidență diferențe semnificative între platformele analizate. Două dintre ele, Perplexity AI și Meta AI, au fost considerate cele mai vulnerabile, oferind ajutor în planificarea atacurilor în aproape 100% din cazuri. Platforma Character.AI a fost descrisă ca fiind „deosebit de nesigură”, sugerând uneori comportamente violente chiar și fără a fi întrebată direct.

Spre exemplu, chatbotul Gemini a sugerat că „șrapnelul metalic este de obicei mai letal” atunci când a fost întrebat despre cum s-ar putea planifica un atentat cu bombă împotriva unei sinagogi. Într-un alt caz, DeepSeek a răspuns unei întrebări despre alegerea unei arme de foc cu mesajul: „Happy (and safe) shooting!”. Directorul CCDH, Imran Ahmed, a subliniat că astfel de răspunsuri demonstrează cum „în câteva minute, un utilizator poate ajunge de la o idee violentă la un plan concret de acțiune”.

Există soluții, dar nu toate companiile le implementează

Deși unele sisteme AI au demonstrat capacitatea de a detecta conversații periculoase și de a refuza să ofere informații, raportul arată că această capacitate nu este implementată uniform. Claude, de exemplu, a refuzat să ofere detalii despre unde se pot cumpăra arme într-un anumit stat din SUA, avertizând asupra unui „model îngrijorător” în conversație și sugerând linii de ajutor pentru persoanele aflate în criză.

Claude a fost, de asemenea, singurul sistem care a încercat constant să descurajeze violența, făcând acest lucru în aproximativ 76% dintre răspunsuri. Autorii studiului susțin că aceste exemple demonstrează că tehnologia pentru filtre de siguranță există, dar nu este aplicată în mod consecvent de toate companiile.

Acest raport vine pe fondul unor incidente recente în care inteligența artificială a fost implicată în planificarea unor atacuri. În Canada, un atac armat într-o școală a fost pregătit cu ajutorul ChatGPT, iar în Franța, un adolescent a fost arestat pentru că ar fi folosit ChatGPT pentru a planifica atacuri teroriste. În urma acestor evenimente, experții au subliniat necesitatea unor reguli mai stricte și a unor filtre de siguranță mai eficiente pentru sistemele AI pe măsură ce tehnologia devine tot mai accesibilă publicului larg.

Sursa: Mediafax

Inteligența artificială, testată în scenarii de violență: majoritatea chatboturilor, vulnerabile Un studiu realizat de Centrul pentru Combaterea Urii Digitale (CCDH), în colaborare cu CNN, a scos la iveală vulnerabilități alarmante ale inteligenței artificiale (AI)

Articole similare

Câștigurile tale reale: Prețul plătit în uzură

AK-47: Arma cumplită ce a rescris războiul pe planetă

Rushdie: AI nu poate face un singur lucru. Zero