Meta ka publikuar një koleksion të ri të modeleve të AI, Llama 4, në familjen e saj Llama.
Janë katër modele të reja në total: Llama 4 Scout, Llama 4 Maverick dhe Llama 4 Behemoth. Të gjithë u trajnuan për “sasi të mëdha tekstesh, imazhesh dhe videosh të paetiketuara” për t’u dhënë atyre “kuptim të gjerë vizual”, thotë Meta.
Suksesi i modeleve të hapura nga laboratori kinez i AI DeepSeek, të cilat performojnë në të njëjtin nivel ose më mirë se modelet e mëparshme të flamurit Llama të Metës, thuhet se e shtyu zhvillimin e Llama në tepricë. Thuhet se Meta ka gërvishtur dhomat e luftës për të deshifruar se si DeepSeek uli koston e funksionimit dhe vendosjes së modeleve si R1 dhe V3.
Scout dhe Maverick janë hapur të disponueshëm në Llama.com dhe nga partnerët e Metës, duke përfshirë platformën e zhvillimit të AI Hugging Face, ndërsa Behemoth është ende në stërvitje.
Meta thotë se Meta AI, asistenti i saj i fuqizuar nga AI në aplikacionet përfshirë WhatsApp, Messenger dhe Instagram, është përditësuar për të përdorur Llama 4 në 40 vende. Për momentin, veçoritë multimodale janë të kufizuara në SHBA në anglisht.
Disa zhvillues mund të kenë probleme me licencën Llama 4. Përdoruesve dhe kompanive “me vendbanim” ose me “vend kryesor biznesi” në BE u ndalohet përdorimi ose shpërndarja e modeleve, me gjasë rezultat i kërkesave të qeverisjes të vendosura nga ligjet e rajonit për AI dhe privatësinë e të dhënave.
Për më tepër, si me publikimet e mëparshme të Llama, kompanitë me më shumë se 700 milionë përdorues aktivë mujorë duhet të kërkojnë një licencë të veçantë nga Meta, të cilën Meta mund ta japë ose ta refuzojë sipas gjykimit të saj.
“Këto modele Llama 4 shënojnë fillimin e një epoke të re për ekosistemin Llama”, shkruan Meta në një postim në blog. “Ky është vetëm fillimi për koleksionin Llama 4.”
Meta thotë se Llama 4 është grupi i saj i parë i modeleve që përdor një përzierje të arkitekturës së ekspertëve (MM), e cila është më efikase nga ana llogaritëse për trajnimin dhe përgjigjen e pyetjeve.
Arkitekturat e MM në thelb zbërthejnë detyrat e përpunimit të të dhënave në nën-detyra dhe më pas i delegojnë ato te modele “eksperte” më të vogla dhe të specializuara.
Maverick, për shembull, ka 400 miliardë parametra gjithsej, por vetëm 17 miliardë parametra aktivë në 128 “ekspertë”. Scout ka 17 miliardë parametra aktivë, 16 ekspertë dhe 109 miliardë parametra gjithsej.
Sipas testimit të brendshëm të Metës, Maverick, për të cilin kompania thotë se është më e mira për rastet e përdorimit të “asistentit të përgjithshëm dhe bisedës”, si shkrimi kreativ, tejkalon modele të tilla si GPT-4o i OpenAI dhe Gemini 2.0 i Google në disa standarde kodimi, arsyetimi, shumëgjuhësh, me kontekst të gjatë dhe imazhe.
Sidoqoftë, Maverick nuk i përshtatet mjaft modeleve më të afta të fundit si Gemini 2.5 Pro i Google, Soneti Claude 3.7 i Anthropic dhe GPT-4.5 i OpenAI, transmeton KosovaPress.
Pikat e forta të Scout qëndrojnë në detyra si përmbledhja e dokumenteve dhe arsyetimi mbi baza të mëdha kodesh. Në mënyrë unike, ajo ka një dritare konteksti shumë të madhe: 10 milion argumente.
“Tokens” përfaqësojnë pjesë të tekstit të papërpunuar – p.sh. fjala “fantastike” e ndarë në “fan”, “tas” dhe “tic.” Në anglisht të thjeshtë, Scout mund të marrë imazhe dhe deri në miliona fjalë, duke e lejuar atë të përpunojë dhe të punojë me dokumente jashtëzakonisht të gjata.
Scout mund të funksionojë në një GPU të vetme Nvidia H100, ndërsa Maverick kërkon një sistem Nvidia H100 DGX ose ekuivalent, sipas llogaritjeve të Meta.
Behemoth-i i pa publikuar i Metës do të ketë nevojë për pajisje edhe më të forta. Sipas kompanisë, Behemoth ka 288 miliardë parametra aktivë, 16 ekspertë dhe gati dy trilion parametra gjithsej. Vlerësimi i brendshëm i Meta-s ka Behemoth që tejkalon GPT-4.5, Claude 3.7 Sonnet dhe Gemini 2.0 Pro (por jo 2.5 Pro) në disa vlerësime që matin aftësitë STEM si zgjidhja e problemeve matematikore.
Vlen të përmendet, asnjë nga modelet Llama 4 nuk është një model i duhur “arsyetimi” përgjatë linjave të o1 dhe o3-mini të OpenAI.
Modelet e arsyetimit i kontrollojnë faktet përgjigjet e tyre dhe në përgjithësi u përgjigjen pyetjeve me më shumë besueshmëri, por si pasojë kërkojnë më shumë kohë se modelet tradicionale “jo arsyetuese” për të dhënë përgjigje.
Interesante, Meta thotë se i ka akorduar të gjitha modelet e saj Llama 4 për të refuzuar t’u përgjigjet pyetjeve “kontestuese” më rrallë.
Sipas kompanisë, Llama 4 u përgjigjet temave “të debatuara” politike dhe sociale që nuk do t’i bënte modelet e mëparshme të Llama. Për më tepër, thotë kompania, Llama 4 është “dramatikisht më i balancuar” me çka bën që ai të mos argëtohet.
