
Un nou AI va putea sa modeleze si proiecteze codurile genetice ale mai multor specii
In colaborare cu Nvidia si reunind cercetatori de la Universitatea Stanford, UC Berkeley si UC San Francisco, Arc Institute a creat cel mai mare model AI pentru biologie, numit Evo 2.
Noul AI a fost antrenat pe ADN-ul a peste 100.000 de specii din intregul arbore al vietii. Datorita intelegerii profunde a vietii pe care o poseda, acesta poate identifica modele in secventele genetice pentru care cercetatorii ar avea nevoie de ani de zile pentru a le descoperi.
Modelul poate identifica cu precizie mutatiile cauzatoare de boli in genele umane si este capabil sa proiecteze noi genomuri similare genomului bacteriilor simple.
AI-ul poate, de asemenea, procesa secvente genetice de pana la 1 milion de nucleotide simultan, permitandu-i sa inteleaga relatiile dintre parti indepartate ale aceluiasi genom.
Bazandu-se pe predecesorul sau Evo 1, care a fost antrenat in intregime pe genomuri unicelulare, Evo 2 este cel mai mare model de AI din biologie, antrenat cu peste 9,3 trilioane de nucleotide, 128.000 de genomuri intregi, precum si date metagenomice.
Evo 2 a fost antrenat vreme de mai multe luni pe platforma NVIDIA DGX Cloud AI prin Amazon Web Services, folosind peste 2.000 de placi video NVIDIA H100.
Codul Evo 2 a fost publicat pe contul de GitHub al institutului, in speranta ca poate fi folosit si in alte domenii pentru a accelera cercetarea stiintifica.