Protectiile AI dezvoltate de Meta si Google pot fi eliminate in cateva minute: Mii de versiuni modificate circula deja online si raspund la solicitari extrem de periculoase

Zf 24

Protectiile AI dezvoltate de Meta si Google pot fi eliminate in cateva minute: Mii de versiuni modificate circula deja online si raspund la solicitari extrem de periculoase

25.05.2026, 15:09 Sursa: zf.ro

Aplicatia Orange Sport este gratuita si poate fi descarcata din Google Play si App Store

Instrumente software care elimina sistemele de protectie integrate in modelele de inteligenta artificiala dezvoltate de companii precum Meta si Google sunt folosite pentru a crea mii de versiuni modificate ale acestor sisteme, lipsite de restrictiile originale de siguranta, informeaza Financial Times.

Potrivit unor teste realizate de FT impreuna cu grupul de siguranta AI Alice, modelele modificate au oferit raspunsuri la solicitari legate de arme biologice, malware si exploatarea sexuala a copiilor.

O versiune modificata a modelului open-source Gemma 3 de la Google a raspuns la intrebari privind dispersarea unui gaz nociv intr-un spatiu aglomerat, a generat cod pentru furtul informatiilor de pe carduri bancare si a produs texte care descriau abuzuri sexuale asupra minorilor.

Dezvaluirile amplifica temerile legate de dificultatea controlarii sistemelor AI open-source pe masura ce acestea devin tot mai performante.

Cercetatorii avertizeaza ca problema s-a agravat odata cu cresterea capacitatilor modelelor de ultima generatie. In aprilie, Anthropic sustinea ca modelul sau Claude Mythos identificase vulnerabilitati in aproape toate marile sisteme de operare si browsere web.

Expertii spun ca raspandirea modelelor modificate complica eforturile guvernelor si companiilor de a reglementa AI-ul direct la sursa, deoarece aceste sisteme pot fi copiate, descarcate si alterate in afara controlului creatorilor lor.

Companiile din domeniu au investit miliarde pentru dezvoltarea unor mecanisme de protectie, asa-numitele "guardrails", menite sa impiedice utilizarile periculoase ale inteligentei artificiale.

Totusi, tehnici precum cea numita "abliteration" permit eliminarea rapida a acestor protectii din modelele open-source, care pot fi descarcate si modificate liber de dezvoltatori.

Astfel de metode sunt mult mai dificil de aplicat sistemelor proprietare precum ChatGPT sau Claude, deoarece codul lor intern nu este accesibil publicului.

In schimb, modelele open-source reduc constant diferenta fata de sistemele comerciale avansate, uneori in doar sase pana la douasprezece luni.

Financial Times a relatat ca a reusit sa foloseasca un instrument disponibil public pe GitHub pentru a elimina restrictiile modelului Llama 3.3 dezvoltat de Meta.

Versiunea modificata a raspuns ulterior la intrebari pe care modelul original le refuza, inclusiv solicitari legate de substante toxice precum ricina.

Potrivit publicatiei, intregul proces nu a necesitat hardware specializat, a folosit instrumente gratuite si a fost realizat in mai putin de zece minute.

Legal disclaimer:

Acesta este un articol informativ. Produsele descrise pot sa nu faca parte din oferta comerciala curenta Orange. Continutul acestui articol nu reprezinta pozitia Orange cu privire la produsul descris, ci a autorilor, conform sursei indicate.

Zf 24

Protectiile AI dezvoltate de Meta si Google pot fi eliminate in cateva minute: Mii de versiuni modificate circula deja online si raspund la solicitari extrem de periculoase

Articole asemanatoare