„Google Labs“, „Google“ eksperimentinė grupė, išbando naują vaizdo generatorių, vadinamą „Whisk“. Šis įrankis leidžia žmonėms raginti naudoti vaizdus, o ne tekstą, leidžiant jiems permaišyti nuotrauką keičiant objektą, sceną ir stilių.
„Whisk“ naudoja „Google“ vaizdų generavimo modelį „Imagen 3“, kad sujungtų tris vaizdus: vieną – objektui, kitą – scenai, o kitą – stiliui. Pavyzdžiui, galite pasirinkti savo nuotrauką kaip objektą, futuristinį kraštovaizdį kaip sceną ir anime stilių, kad sukurtumėte galutinį vaizdą.
Modelis automatiškai sugeneruoja išsamią jūsų vaizdų antraštę, kuri vėliau naudojama kaip 3 vaizdas kuriant nuotraukos remiksą. Taip pat galite įvesti teksto raginimus, kad toliau apibrėžtumėte norimą rezultatą, įskaitant išsamius aprašymus, pvz., „Tema važiuoja skraidančiu dviračiu“.
Kadangi „Whisk“ sutelkia dėmesį tik į kelias pagrindines kiekvieno vaizdo charakteristikas, bendrovė paaiškina, kad rezultatai ne visada gali atitikti jūsų lūkesčius. Pavyzdžiui, sukurtas objektas gali skirtis ūgiu, svoriu, šukuosena arba odos atspalviu. „Google“ teigia, kad galite bet kada peržiūrėti ir redaguoti pagrindinius raginimus.
Šiuo metu eksperimentas pasiekiamas tik JAV gyvenantiems naudotojams adresu labs.google/whisk.