Meta a lansat o versiune de AI care traduce si transcrie vorbirea in zeci de limbi
Compania a declarat intr-o postare pe blog ca modelul sau SeamlessM4T ar putea suporta traduceri intre text si vorbire in aproape 100 de limbi, precum si traducere orala pentru 35 de limbi, combinand tehnologia care era disponibila anterior in modele separate.
CEO-ul Mark Zuckerberg a spus ca are in vedere astfel de instrumente care sa faciliteze interactiunile intre utilizatorii de pe tot globul in metaverse, setul de lumi virtuale interconectate pe care pariaza viitorul companiei.
Meta pune modelul la dispozitia publicului pentru uz necomercial, se arata in postarea de pe blog.
Cea mai mare companie de socializare din lume a lansat in acest an o serie de modele AI, in cea mai mare parte gratuite, inclusiv un model de limbaj larg numit Llama, care reprezinta o provocare serioasa pentru modelele proprietare vandute de OpenAI, sustinut de Microsoft, si Google, parte a grupului Alphabet.
Zuckerberg spune ca un ecosistem AI deschis functioneaza in avantajul Meta, deoarece compania are mai mult de castigat prin aprovizionarea efectiva a crearii de instrumente destinate consumatorilor pentru platformele sale sociale, decat prin taxarea pentru accesul la modele.
Cu toate acestea, Meta se confrunta cu intrebari legale similare cu restul industriei in jurul datelor de formare ingerate pentru a-si crea modelele.
In iulie, comedianta Sarah Silverman si alti doi autori au intentat procese pentru incalcarea drepturilor de autor, atat impotriva Meta, cat si impotriva OpenAI, acuzand companiile ca le folosesc cartile ca date de antrenament fara permisiune.
Pentru modelul SeamlessM4T, cercetatorii Meta au spus intr-o lucrare de cercetare ca au adunat date de antrenament audio din 4 milioane de ore de ”audio brut provenit dintr-un depozit disponibil public de date web accesate cu crawlere”, fara a specifica care depozit.
Un purtator de cuvant al Meta nu a raspuns la intrebarile privind provenienta datelor audio.
Datele text provin din seturi de date create anul trecut, care au extras continut de pe Wikipedia si site-uri web asociate, se arata in lucrarea de cercetare.