„Google“ eksperimentuoja su nauju vaizdų generatoriumi, kuris permaišo tris vaizdus į vieną kūrinį

„Google Labs“, „Google“ eksperimentinė grupė, išbando naują vaizdo generatorių, vadinamą „Whisk“. Šis įrankis leidžia žmonėms raginti naudoti vaizdus, o ne tekstą, leidžiant jiems permaišyti nuotrauką keičiant objektą, sceną ir stilių.

„Whisk“ naudoja „Google“ vaizdų generavimo modelį „Imagen 3“, kad sujungtų tris vaizdus: vieną – objektui, kitą – scenai, o kitą – stiliui. Pavyzdžiui, galite pasirinkti savo nuotrauką kaip objektą, futuristinį kraštovaizdį kaip sceną ir anime stilių, kad sukurtumėte galutinį vaizdą.

Modelis automatiškai sugeneruoja išsamią jūsų vaizdų antraštę, kuri vėliau naudojama kaip 3 vaizdas kuriant nuotraukos remiksą. Taip pat galite įvesti teksto raginimus, kad toliau apibrėžtumėte norimą rezultatą, įskaitant išsamius aprašymus, pvz., „Tema važiuoja skraidančiu dviračiu“.

Kadangi „Whisk“ sutelkia dėmesį tik į kelias pagrindines kiekvieno vaizdo charakteristikas, bendrovė paaiškina, kad rezultatai ne visada gali atitikti jūsų lūkesčius. Pavyzdžiui, sukurtas objektas gali skirtis ūgiu, svoriu, šukuosena arba odos atspalviu. „Google“ teigia, kad galite bet kada peržiūrėti ir redaguoti pagrindinius raginimus.

Šiuo metu eksperimentas pasiekiamas tik JAV gyvenantiems naudotojams adresu labs.google/whisk.

Source link

Paskutinės naujienos

Kredito unijų sektorius pirmąjį ketvirtį – pelno daugiau nei prieš metus

„Sony“ „Žmogus-voras“ perkrovimas oficialiai prasidės šią savaitę

2026 SKY RANCH TAGAYTAY Travel Guide • Entrance Fee, Rides & More Attractions!

Robinhoodo pastaba dėl 10 % atleidimų rodo, kad AI kaltinimas nesumažina jo