Sari la conținut Treci la bara laterală Sari la subsol

Google lucrează la un sistem de învățare automată care poate genera grafică din introducerea textului. Utilizatorii pot trimite orice cuvinte descriptive, pe care AI-ul le va transforma într-o imagine. Modelul de difuzie Imagen, dezvoltat de Google Research Brain Team, oferă un grad extraordinar de fotorealism și un nivel profund de înțelegere a limbajului.

Nu este prima dată când apar astfel de modele AI. Datorită capacității sale de a transforma cuvintele în grafică, OpenAI DALL-E (și succesorul său) a generat titluri, precum și imagini. Versiunea Google, pe de altă parte, încearcă să producă imagini mai realiste.

Cercetătorii au construit un benchmark numit DrawBench pentru a compara Imagen cu alte modele text-to-image (cum ar fi DALL-E 2, VQ-GAN+CLIP și modele de difuzie latentă). Fiecare model a fost programat cu un set de 200 de mesaje text. Fiecare fotografie a fost evaluată de evaluatori umani. „În comparațiile una lângă alta, ei aleg Imagine față de alte modele, atât în ceea ce privește calitatea eșantionului, cât și alinierea imagine-text”, a adăugat Google.

Imagen Imagini generate de AI

Un creier călare pe o rachetă care se îndreaptă spre lună.
Mascota Android realizată din bambus.
O fotografie a unui raton purtând o cască de astronaut, privind noaptea pe fereastră.

Imagine, ca DALL-E, nu este disponibil publicului larg. Din mai multe motive, Google consideră că nu este încă potrivit pentru utilizare de către publicul larg. Pentru început, modelele text-to-image sunt de obicei antrenate pe seturi de date masive care sunt răzuite de pe web și nu sunt curatate, ceea ce provoacă o serie de probleme.

Cu toate acestea, cercetătorii pot permite într-o zi membrilor publicului să introducă text într-o versiune a modelului pentru a-și crea propriile imagini. „Vom investiga un cadru pentru externalizarea responsabilă în lucrările viitoare”, au declarat cercetătorii, „care echilibrează utilitatea auditului extern cu pericolele accesului deschis nerestricționat”.

Puteți, totuși, să încercați Imagen pentru o perioadă limitată de timp. Puteți construi o descriere folosind termeni preselectați pe site-ul lor. Utilizatorii pot alege dacă imaginea este o fotografie sau o pictură în ulei, precum și tipul de animal văzut, ținuta lor, acțiunea pe care o desfășoară și scena. Așadar, dacă ți-ai dorit vreodată să vezi o versiune a unei picturi în ulei care prezintă un panda neclar care face skateboarding pe o plajă în timp ce purta ochelari de soare și o jachetă de piele neagră, acum este șansa ta.

Adauga un Comentariu

> Newsletter <
Vă interesează Știrile tehnice și multe altele?

Abonati-va