Anthropic își prezintă cel mai avansat model de inteligență artificială: Claude 3.5 Sonnet

June 25, 2024

By aurora

Pe măsură ce lumea inteligenței artificiale generative continuă să evolueze rapid, una dintre cele mai importante companii din domeniu, Anthropic, a lansat recent cel mai recent model emblematic al său, Claude 3.5 Sonnet. Acest nou model își propune să își depășească predecesorii și să provoace concurenții majori, cum ar fi OpenAI și modelul său GPT-4o. Dar este oare într-adevăr un pas înainte atât de semnificativ pe cât pretinde Anthropic? Haideți să analizăm mai îndeaproape caracteristicile și implicațiile acestui nou model de inteligență artificială.

Performanță impresionantă la testele de referință

Potrivit Anthropic, Claude 3.5 Sonnet oferă performanțe de referință semnificativ mai bune decât modelele anterioare din seria Claude. Printr-o serie de teste privind sarcini de citire, codificare, matematică și viziune, noul model s-a dovedit a fi mai performant nu numai decât predecesorul său, Claude 3 Sonnet, ci și decât modelul emblematic anterior al companiei, Claude 3 Opus. Deși criteriile de referință nu sunt neapărat cel mai bun etalon pentru progresul AI, aceste rezultate sunt totuși demne de luat în seamă și indică o îmbunătățire tangibilă a capacităților modelului.

Îmbunătățiri cheie

În plus față de rezultatele de referință, Claude 3.5 Sonnet are câteva îmbunătățiri cheie față de versiunile anterioare. În special, modelul are o mai bună înțelegere a instrucțiunilor mai subtile și mai complexe, precum și a unor concepte precum umorul – un lucru care este în mod notoriu dificil de stăpânit de către AI. În plus, modelul este semnificativ mai rapid, cu o viteză de aproximativ două ori mai mare decât cea a lui Claude 3 Opus, ceea ce îl face mai potrivit pentru aplicațiile care necesită răspunsuri rapide, cum ar fi chatbots pentru serviciul clienți.

Îmbunătățiri în domeniul viziunii artificiale

Un alt domeniu de îmbunătățire semnificativă pentru Claude 3.5 Sonnet este capacitatea de analiză a imaginilor. Noul model poate interpreta cu mai multă acuratețe grafice și diagrame, precum și să transcrie text din imagini “imperfecte”, cum ar fi cele cu distorsiuni și artefacte vizuale. Acest lucru reprezintă un progres major față de capacitățile de viziune computerizată din Claude 3 Opus.

Secretele despre formarea modelelor

Deși Anthropic nu a dezvăluit în detaliu datele de formare utilizate pentru Claude 3.5 Sonnet, Michael Gerstenhaber, liderul de produs, a declarat că modelul își extrage o mare parte din puterea sa din aceste seturi de date, care includ și date generate chiar de AI. Această alegere ar putea fi motivată de rațiuni concurențiale, dar și pentru a evita potențiale provocări juridice legate de utilizarea datelor protejate prin drepturi de autor.

Alinierea cu intențiile utilizatorilor

Pe lângă datele de antrenament, Anthropic a lucrat, de asemenea, la alinierea Sonetului Claude 3.5 cu intențiile utilizatorilor, în speranța de a preveni generarea de texte toxice sau problematice. Acest efort de “aliniere” este un aspect important al dezvoltării unor modele de inteligență artificială sigure și fiabile.

Context și disponibilitate

Modelul Claude 3.5 Sonnet păstrează același context de 200.000 de token-uri (aproximativ 150.000 de cuvinte) ca și predecesorii săi. În prezent, noul model este disponibil gratuit pentru utilizatorii clientului web Anthropic și ai aplicației Claude iOS, în timp ce abonații la planurile cu plată Claude Pro și Claude Team au limite de viteză mai mari. Claude 3.5 Sonnet este, de asemenea, disponibil prin intermediul API-ului Anthropic și pe platforme gestionate, cum ar fi Amazon Bedrock și Google Cloud’s Vertex AI.

Artefacte: o nouă interfață pentru interacțiunea cu modelul

Odată cu lansarea lui Claude 3.5 Sonnet, Anthropic a introdus o nouă caracteristică numită Artifacts. Această interfață dedicată permite utilizatorilor să editeze și să adauge conținut generat de modelele Anthropic, cum ar fi fragmente de cod, documente de text sau proiecte de site-uri web. Artifacts oferă dezvoltatorilor un instrument pentru a itera și rafina conținutul generat de AI.

Progres incremental și nerevoluționar

Deși Claude 3.5 Sonnet reprezintă o îmbunătățire față de modelele anterioare, Gerstenhaber recunoaște că este mai degrabă un progres incremental decât o descoperire revoluționară. Acest lucru reflectă tendința actuală în domeniul inteligenței artificiale generative, unde jucători importanți precum Google și OpenAI au lansat în ultimele luni actualizări marginale ale modelelor lor emblematice.

Provocări legate de arhitectura și formarea modelelor

Potrivit lui Gerstenhaber, lipsa unor salturi de performanță comparabile cu cele de la GPT-3 la GPT-4 se datorează rigidității arhitecturilor actuale ale modelelor și cantității enorme de calcul necesare pentru a le antrena. Aceste limitări tehnice par să împiedice realizarea unor progrese mai radicale în AI generativă.

Prioritate acordată eficienței și accesibilității

În loc să se concentreze doar pe modele din ce în ce mai puternice, Anthropic pare să fi adoptat o abordare mai strategică, investind în dezvoltarea unor produse precum Claude 3.5 Sonnet pentru a oferi performanțe ușor mai bune la prețuri accesibile. Această alegere reflectă importanța de a oferi dezvoltatorilor și companiilor instrumente de inteligență artificială eficiente și accesibile, indiferent de specificațiile tehnice.

Sursa articolului aici.