Meta a lansat cea mai mare versiune versiune a modelelor de AI Llama 3
Meta Platforms a lansat marti cea mai noua versiune a modelelor sale de inteligenta artificiala, Llama 3, cea mai mare pana acum, cu majoritatea modelelor fiind gratuite. Noul model, Llama 3, poate vorbi in opt limbi, programa cod de nivel superior si rezolva probleme complexe de matematica, a anuntat compania-mama Facebook in postarile sale pe blog si in documentul de cercetare asociat. Modelul are 405 de miliarde de parametri, mult peste versiunea anterioara, desi nu se ridica la standardele unor modele mai mari oferite de concurenti. Modelul OpenAI GPT-4 are 1.000 de miliarde de parametri, iar Amazon investeste intr-un model cu 2.000 de miliarde de parametri.
Lansarea vine intr-un moment cand gigantii tehnologici incearca sa demonstreze ca portofoliile lor de modele de limba, insatiabile in resurse, ofera avantaje suficiente pentru a justifica investitiile uriase. Pe langa modelul sau de 405 miliarde de parametri, Meta lanseaza si modele mai mici, Llama 3 cu 8 miliarde si 70 de miliarde de parametri, toate fiind multilingve si capabile sa gestioneze cereri mari datorita unei „ferestre de context” extinse. Ahmad Al-Dahle, directorul AI generative de la Meta, a declarat ca aceasta va imbunatati experienta de scriere a codurilor.
Meta isi deschide modelele Llama aproape gratuit pentru dezvoltatori, o miscare pe care Mark Zuckerberg spune ca va duce la produse noi si angajament mai profund pe retelele sociale ale companiei. Unii investitori si-au exprimat ingrijorarea cu privire la costuri, insa compania ar castiga daca dezvoltatorii folosesc modelele gratuite in locul celor platite, subminand modelele concurentilor.
Meta a oferit date de testare pentru matematica si cunostinte de baza care arata ca modelul Llama 3 este aproape egal si in unele cazuri depaseste modelul Sonnet Claude 3.5 de la Anthropic si GPT-4o de la OpenAI. Modelul a obtinut 73.8 la proba MATH si 88.6 la MMLU, comparativ cu 76.6 si 88.7, respectiv, pentru GPT-4o.
Meta a mentionat si viitoarele iteratii „multimodale” ale modelelor, care se asteapta sa fie lansate la sfarsitul acestui an, aducand abilitati de imagine, video si vorbire la modelul de baza Llama 3 text. Experimentele preliminare sugereaza ca aceste modele vor fi competitive cu alte modele multimodale, cum ar fi Gemini 1.5 de la Google si Claude 3.5 Sonnet de la Anthropic.