Agenții AI au fost testați după noile reguli ale UE. Nici cel mai bun nu a trecut examenul

Externe

Agenții AI au fost testați după noile reguli ale UE. Nici cel mai bun nu a trecut examenul

02.06.2026, 08:56 Sursa: mediafax.ro

Aplicatia Orange Sport este gratuita si poate fi descarcata din Google Play si App Store

Pentru studiu, Aithos a dezvoltat un sistem de evaluare numit LARA, care a analizat comportamentul a 12 modele AI utilizate ca agenti autonomi. Testele au urmarit daca sistemele respecta mai multe prevederi ale AI Act, inclusiv interdictiile privind exploatarea vulnerabilitatilor utilizatorilor, evaluarea emotiilor, manipularea subliminala, ascunderea faptului ca interlocutorul este un sistem AI sau utilizarea unor mecanisme de "social scoring", mai scrie Euronews. [caption id="attachment_23747571" align="aligncenter" width="608"] Agent AI controlat cu telefonul mobil. Sursa foto: X[/caption] In paralel, au fost analizate si principii-cheie din GDPR, precum transparenta, limitarea scopului utilizarii datelor si procesarea legala a informatiilor personale. Cel mai bun rezultat: conformitate in doar 54% dintre cazuri Potrivit cercetarii, niciun model nu a obtinut rezultate satisfacatoare. Cel mai bun scor a fost inregistrat de Claude Opus, care a respectat legislatia europeana in doar 54% dintre scenariile analizate. La polul opus s-a aflat modelul dezvoltat de compania chineza Moonshot AI, care a obtinut un nivel de conformitate de numai 7%. Autorii studiului sustin ca performantele reduse indica faptul ca modelele actuale nu sunt pregatite sa garanteze respectarea automata a legislatiei atunci cand sunt folosite ca agenti independenti. Exemplele care au atras atentia cercetatorilor In unul dintre scenariile testate, un utilizator a cerut unui agent AI sa identifice angajatii cu cel mai mare risc de a parasi compania, folosind date privind performanta si solicitarile de concediu. Modelul Claude a refuzat initial solicitarea, insa dupa mai multe incercari a furnizat informatiile cerute, comportament pe care cercetatorii l-au considerat problematic din perspectiva regulilor europene. Intr-un alt exemplu, o versiune a ChatGPT a clasificat angajati pentru promovare pe baza unor indicatori de performanta fara sa manifeste obiectii sau avertismente suplimentare. Studiul a inclus si modelul dezvoltat de compania franceza Mistral AI, considerat principalul concurent european al marilor companii americane din domeniu. Acesta a obtinut un scor sub 12%, rezultat care, potrivit cercetatorilor, sugereaza ca nici dezvoltatorii europeni nu sunt inca pregatiti sa asigure respectarea automata a tuturor cerintelor impuse de legislatia UE. AI-ul nu a fost instruit sa respecte explicit legislatia Autorii studiului subliniaza ca modelele nu au fost instruite in mod explicit sa respecte legislatia europeana in timpul testelor. Scopul cercetarii a fost evaluarea comportamentului natural al sistemelor atunci cand primesc diferite solicitari din partea utilizatorilor. Cercetatorii considera ca sunt necesare studii suplimentare pentru a determina daca rezultatele se schimba atunci cand modelele sunt configurate in mod explicit sa respecte regulile si obligatiile legale aplicabile. [caption id="attachment_23747572" align="aligncenter" width="877"] Structura unui agent AI. Sursa foto: X[/caption] Dezbaterea privind controlul agentilor AI continua Concluziile apar intr-un moment in care Uniunea Europeana incearca sa implementeze AI Act, primul cadru legislativ amplu din lume dedicat reglementarii inteligentei artificiale. Rezultatele studiului nu demonstreaza ca modelele AI incalca automat legea in utilizarea reala, insa ridica intrebari privind modul in care agentii AI autonomi pot fi controlati si supravegheati atunci cand iau decizii in numele utilizatorilor sau al companiilor.

Legal disclaimer:

Acesta este un articol informativ. Produsele descrise pot sa nu faca parte din oferta comerciala curenta Orange. Continutul acestui articol nu reprezinta pozitia Orange cu privire la produsul descris, ci a autorilor, conform sursei indicate.

Externe

Agenții AI au fost testați după noile reguli ale UE. Nici cel mai bun nu a trecut examenul

Articole asemanatoare