|
15.04.2026, 16:02 Sursa: zf.ro
Aplicatia Orange Sport este gratuita si poate fi descarcata din Google Play si App Store
¬ Anthropic a redus "nivelul de efort" al modelului Claude de la "ridicat" la "mediu" fara sa anunte utilizatorii - o schimbare care face modelul mai rapid si mai ieftin de operat, dar mai imprecis pe sarcini complexe ¬ Stella Laurenzo, director senior de inteligenta artificiala la AMD, a publicat in nume propriu o analiza bazata pe 6.852 de sesiuni Claude Code ale echipei sale si a concluzionat ca modelul citeste codul de trei ori mai rar inainte de a-l modifica si abandoneaza sarcini la un ritm care anterior era zero ¬ Anthropic neaga ca ar degrada intentionat modelele, dar nu raspunde la intrebari specifice ale presei despre capacitatea de calcul
Anthropic, compania americana de inteligenta artificiala fondata in 2021 de fosti directori ai OpenAI si evaluata in februarie 2026 la 380 de miliarde de dolari, se confrunta cu o revolta a utilizatorilor sai cei mai activi. Nemultumirile au izbucnit dupa ce compania a redus fara anunt public nivelul implicit de "efort" al modelului Claude - in esenta, cat de mult gandeste modelul inainte de a raspunde - de la "ridicat" la "mediu". Schimbarea face modelul mai rapid si mai ieftin de operat, dar, sustin dezvoltatorii, semnificativ mai imprecis pe sarcini complexe.
"Claude a regresat in punctul in care nu mai poate fi de incredere pentru sarcini complexe de inginerie", a scris Stella Laurenzo, director senior de inteligenta artificiala la AMD, intr-o analiza publicata pe platforma GitHub pe 2 aprilie 2026. Analiza nu este un raport oficial AMD - Laurenzo a publicat-o in nume propriu - dar se bazeaza pe datele echipei sale de inginerie de la AMD si greutatea concluziilor vine tocmai din pozitia pe care o ocupa si din volumul de date pe care le prezinta.
Ce arata datele: o scadere masurabila
Analiza lui Laurenzo se bazeaza pe 6.852 de sesiuni Claude Code - instrumentul de programare al Anthropic, lansat la inceputul lui 2025, care functioneaza ca un agent autonom capabil sa citeasca, scrie si execute cod in mediul de lucru al dezvoltatorului. Datele acopera 234.760 de apeluri de instrumente si 17.871 de blocuri de gandire, masurate pe parcursul a mai multor luni. Concluziile: modelul citeste codul de trei ori mai rar inainte de a-l modifica (frecventa de citire a scazut de la 6,6 la 2 operatii pe sarcina), rescrie fisiere intregi de doua ori mai des, iar rata de abandonare a sarcinilor - care anterior era zero - a urcat la 10 cazuri pe zi in a doua jumatate a lunii martie. "Cand gandirea este superficiala, modelul alege implicit actiunea cea mai ieftina: editeaza fara sa citeasca, se opreste fara sa termine, evita responsabilitatea", a scris Laurenzo. Ea a adaugat ca echipa sa a trecut la un furnizor concurent care "realizeaza o munca de calitate superioara", fara a oferi detalii din cauza unor acorduri de confidentialitate. Formularea ei - "am trecut" - sugereaza ca decizia a fost luata la nivelul echipei sau al diviziei sale de inteligenta artificiala din cadrul AMD, dar nu este clar daca reprezinta o migrare la nivel de companie. Laurenzo nu este singura voce critica. "Am avut sesiuni incredibil de frustrante cu Claude Code in ultimele doua saptamani", a scris pe platforma X Dimitris Papailiopoulos, cercetator principal la Microsoft. "Am setat efortul la maxim, dar modelul ramane extrem de neglijent, ignora instructiunile si repeta aceleasi greseli."
Ce spune Anthropic: efortul redus, nu capacitatea
Boris Cherny, directorul produsului Claude Code la Anthropic, a raspuns plangerilor online spunand ca compania a redus nivelul implicit de efort la "mediu" la inceputul lunii martie, ca raspuns la feedback-ul utilizatorilor care reclamau ca modelul consuma prea multi "tokeni" - unitatile de date pe care le proceseaza modelul - pentru fiecare sarcina. Cu cat mai multi tokeni per sarcina, cu atat mai multa putere de calcul consumata. Cherny a contestat concluzia centrala a analizei lui Laurenzo. El a explicat ca o modificare din februarie 2026 care ascunde "urmele de gandire" ale modelului din interfata este doar o schimbare vizuala care "nu afecteaza gandirea in sine, bugetele de gandire sau modul in care functioneaza rationamentul extins". Separat, el a mentionat ca modelul Opus 4.6 a introdus pe 9 februarie o functie de "gandire adaptiva" care ii permite modelului sa decida singur cat de profund rationeaza.
Pentru a rezolva unele dintre probleme, Cherny a anuntat ca Anthropic va testa trecerea utilizatorilor din planurile Teams si Enterprise la nivelul ridicat de efort in mod implicit, "chiar daca asta vine cu un cost suplimentar de tokeni si latenta". Cherny a respins si acuzatiile de lipsa de transparenta, sustinand ca schimbarea nivelului de efort a fost semnalata utilizatorilor prin intermediul unui mesaj pop-up in interfata Claude Code. Anthropic a refuzat insa sa raspunda la intrebarile specifice ale publicatiei Fortune privind plangerile utilizatorilor.
Un contraargument vine din testele independente: firma de evaluare Margin Lab, care ruleaza benchmarkul SWE-Bench-Pro - un test standardizat de performanta pentru instrumente de programare -, raporteaza ca modelul Opus 4.6 a aratat "variatii, dar fara schimbare de substanta" de la introducerea sa. Cu alte cuvinte, pe teste controlate, modelul nu pare degradat - ceea ce sugereaza ca diferenta dintre experienta utilizatorilor si benchmark-uri poate tine de tipul de sarcini: cele repetitive si controlate versus cele complexe, cu mai multi pasi, unde efortul de gandire conteaza mai mult.
Contextul face criza mai acuta. Anthropic a anuntat saptamana recent ca veniturile sale anuale recurente au ajuns la 30 de miliarde de dolari - in crestere de la 9 miliarde la finalul lui 2025 si de la un miliard de dolari cu doar 14 luni in urma. Compania beneficiaza de o avalansa de noi utilizatori, intai datorita popularitatii Claude Code in randul programatorilor, apoi datorita unui val de simpatie publica generat de un conflict cu Departamentul american al Apararii . Aceasta crestere pune presiune pe infrastructura de calcul. Anthropic a suferit o serie de caderi recente - inclusiv una pe 13 aprilie care a afectat atat claude.ai, cat si Claude Code timp de circa 50 de minute - si a introdus limite de utilizare mai stricte in orele de varf. Disponibilitatea API-ului Anthropic a fost de 98,95%, sub standardul de industrie de 99,99%.
Intr-un memo intern raportat de CNBC, directorul de venituri al OpenAI - competitorul direct al Anthropic - a sustinut ca Anthropic a facut o "eroare strategica" prin faptul ca nu a asigurat suficienta capacitate de calcul si ca "opereaza pe o curba semnificativ mai mica" decat concurenta. Anthropic nu a comentat nici aceste afirmatii.
Diferenta de infrastructura este cuantificabila. Potrivit estimarilor din industrie, Anthropic a incheiat anul 2025 cu aproximativ 1,4 GW de capacitate de calcul, comparativ cu 1,9 GW pentru OpenAI. Proiectiile pentru 2026 amplifica decalajul: Anthropic vizeaza 7-8 GW, in timp ce OpenAI ar urma sa ajunga in de "zeci" de GW, potrivit declaratiilor proprii.
Situatia este agravata de anuntul Anthropic din saptamana trecuta privind Mythos - un nou model, inca nelansat public, prezentat ca semnificativ mai capabil decat actualul Opus, dar si mai mare si mai costisitor de operat. Anthropic invoca motive de securitate pentru amanarea lansarii, dar unii analisti pun sub semnul intrebarii daca compania are capacitatea de calcul necesara pentru a sustine o distributie larga.
Reuters a raportat, separat, ca Anthropic analizeaza posibilitatea de a-si proiecta propriile cipuri de calcul - un semn ca presiunea pe infrastructura nu este doar o perceptie a utilizatorilor. Criza de performanta vine la un moment critic. Anthropic - fondata de Dario si Daniela Amodei, fosti directori OpenAI - s-a diferentiat de la inceputuri prin promisiunea de transparenta si de aliniere la interesele utilizatorilor. Acuzatia recurenta din partea comunitatii de dezvoltatori nu este doar ca modelul s-a degradat, ci ca
Anthropic nu a fost sincera in legatura cu motivele.
"Reclamatiile ca Anthropic nu a fost sincera in privinta schimbarilor pe care le-a facut modului in care Claude opereaza sunt deosebit de amenintatoare pentru companie, tocmai pentru ca, mai mult decat orice alta firma de inteligenta artificiala, a incercat sa-si construiasca reputatia pe faptul ca este mai transparenta si mai aliniata la interesele utilizatorilor", noteaza Fortune.
Compania pregateste, potrivit mai multor surse, o listare pe bursa Nasdaq in octombrie 2026, cu Goldman Sachs si JPMorgan ca banci coordonatoare, la o evaluare tinta de 400-500 de miliarde de dolari si o emisiune de peste 60 de miliarde. Pe langa problemele de performanta ale modelelor, utilizatorii Cowork - interfata desktop a lui Claude, aflata in stadiu de previzualizare - raporteaza pe GitHub probleme separate de afisare: mesajele lui Claude dispar din chat daca utilizatorul navigheaza in alta parte in timpul generarii raspunsului, iar istoricul conversatiilor apare trunchiat sau corupt. Sunt probleme de interfata, nu de model, dar contribuie la perceptia generala de instabilitate.
Legal disclaimer:
Acesta este un articol informativ. Produsele descrise pot sa nu faca parte din oferta comerciala curenta Orange. Continutul acestui articol nu reprezinta pozitia Orange cu privire la produsul descris, ci a autorilor, conform sursei indicate.
15.04.2026, 16:02