
Startup-ul DeepSeek sustine ca raportul teoretic cost profit este 545 la suta pe zi
Startupul chinez de inteligenta artificiala DeepSeek a dezvaluit sambata unele date despre costuri si venituri legate de modelele sale V3 si R1, sustinand un raport teoretic cost-profit de pana la 545% pe zi. Compania a precizat, insa, ca veniturile reale sunt semnificativ mai mici, transmite Reuters.
Este pentru prima data cand compania din Hangzhou ofera informatii despre marjele sale de profit din sarcinile de ”inferenta”, etapa ulterioara antrenarii, in care modelele de AI deja pregatite efectueaza previziuni sau indeplinesc sarcini, cum ar fi interactiunile prin chatbot.
Aceasta dezvaluire ar putea amplifica ingrijorarile pe pietele de actiuni AI din afara Chinei, care au suferit pierderi in ianuarie, dupa ce chatbot-urile bazate pe modelele DeepSeek R1 si V3 au cunoscut un succes rapid la nivel global.
Vanzarile masive de actiuni au fost partial determinate de afirmatiile DeepSeek ca a cheltuit mai putin de 6 milioane de dolari pe cipuri pentru antrenarea modelului, mult sub costurile raportate de rivalii americani, precum OpenAI.
Cipurile utilizate de DeepSeek, Nvidia H800, sunt, de asemenea, mult mai putin performante decat cele la care au acces companiile americane de AI, punand sub semnul intrebarii strategiile acestora de a investi miliarde de dolari in cipuri avansate.
Intr-o postare pe GitHub publicata sambata, DeepSeek a detaliat calculele sale: presupunand ca inchirierea unui cip H800 costa 2 dolari pe ora, costul total zilnic al inferentei pentru modelele V3 si R1 ar fi de 87.072 de dolari. In schimb, venitul zilnic teoretic generat de aceste modele s-ar ridica la 562.027 de dolari, rezultand un raport cost-profit de 545%.
Pe parcursul unui an, acest lucru ar echivala cu peste 200 de milioane de dolari in venituri. Totusi, compania a subliniat ca ”veniturile reale sunt considerabil mai mici” din mai multe motive: costul utilizarii modelului V3 este mai mic decat cel al modelului R1, doar anumite servicii sunt monetizate, iar accesul prin web si aplicatii ramane gratuit, iar dezvoltatorii platesc mai putin in afara orelor de varf.