Paslaptingas naujos vaizdų kartos modelis aplenkia „Midjourney“, „Black Forest Labs“ ir „OpenAI“ modelius pagal minios šaltinių teikiamą dirbtinės analizės etaloną.
Modelis, pavadintas „red_panda“, apytiksliai 40 Elo taškų lenkia kitą geriausią modelį Black Forest Labs „Flux1.1 Pro“ dirbtinės analizės teksto į vaizdą lyderių sąraše. Dirbtinė analizė naudoja Elo – reitingavimo sistemą, kuri iš pradžių buvo sukurta santykiniam šachmatininkų įgūdžių lygiui apskaičiuoti, kad būtų galima palyginti įvairių testuojamų modelių našumą.
Panašiai kaip bendruomenės AI etalonas „Chatbot Arena“, „Artificial Analysis“ modelius reitinguoja pasitelkdama sutelktinį šaltinį. Vaizdo modeliams dirbtinė analizė atsitiktinai parenka du modelius ir pateikia jiems unikalų raginimą. Tada jis pateikia raginimus ir gautus vaizdus, o vartotojai pasirenka, kuris, jų nuomone, geriau atspindi raginimą.

Tiesa, šiame balsavimo procese esama tam tikro šališkumo. Dirbtinės analizės rinkėjai dažniausiai yra AI entuziastai, todėl jų pasirinkimas gali neatspindėti platesnės generatyvaus AI naudotojų bendruomenės pageidavimų.
Tačiau red_panda taip pat yra vienas iš geresnių modelių lyderių sąraše pagal generavimo greitį. Modelis vidutiniškai užtrunka maždaug 7 sekundes, kad sukurtų vaizdą – daugiau nei 100 kartų greičiau nei OpenAI DALL-E 3.
Taigi, iš kur atsirado red_panda? Kuri įmonė tai padarė? Ir kada galime tikėtis, kad jis bus išleistas? Visi geri klausimai. Tačiau dirbtinio intelekto laboratorijos vis dažniau naudoja bendruomenės etalonus, kad padidintų lūkesčius prieš paskelbiant, todėl gali praeiti neilgai trukus, kol tai sužinosime.