Videotöötlusest reklaamide automaatse loomiseni: üheksa lihtsat masinõppel põhinevat tööriista visuaalseks sisuturunduseks

GPT-3 keelemudelil põhineva veebirakenduse Dall-E nägemus visuaalses sisuturunduses toetavast AI-st.Foto: Kreedix Grupp

AI ja tehisintellekt on moesõnad – neid lisatakse nüüd vist küll juba igale poole ja vahel ehk ka õigustamatult. Samas on valdkondi, kus masinõppe mudelid ja algeline AI aitavad juba mõnda aega tööd efektiivsemaks teha, näiteks aitavad need ressursse säästa kõikvõimalike lihtsamate visuaalide loomisel.

Inforegistri ja ScoreStorybooki äriinfo portaalide arendamisega tegelevas Kreedix Grupis on tehisintellekti ja masinõppe lahenduste kasutamine “tavaline teisipäev.” Näiteks brändilehtede loomiseks kasutatakse seal erinevaid tööriistu, millede hulgast paljud töötavad AI ja masinõppe toel. Kui artiklite automaatseks kirjutamiseks on ettevõte loonud ise mudeleid, siis kasutusele on võetud ka kõikvõimalikke lihtsamaid ja keerukamaid vahendeid alates vestlusrobotitest kuni graafika ja videote loomise rakendusteni.

Ning ehkki viimasel ajal on enamasti pildil olnud juturobotid, pakuvad paljudele tegelikult ehk rohkemgi kasu just visuaalide loomise ja redigeerimise tööriistad. Võimalusi pakutakse alates kunsti ja fotorealistlike piltide loomisest kuni logode ja videote valmistamise, fototöötluse ja reklaamide automaatse loomiseni.

(Originaalsete?) visuaalide loomine poole kunagi lihtsam olnud

Visuaalne looming on käinud paljuski ikka nii, et kellelgi tuleb mõte, ta vormistab selle oma peas mingi tasemeni ära ja seejärel jõuab kätte teostuse hetk: siis peab kunstnik võtma vahendid ja praktilise tegevusega pihta hakkama. Tööriistadeks võivad olla näiteks pintslid ja värvid, kaamera ja objektiivid või kasvõi graafiline laud või sülearvuti puuteplaat arvutigraafika loomiseks.

Seega mõnes mõttes ei olegi uus reaalsus, kus arvutile kirjutatakse sõnadega ette, mida looma peaks, ehk midagi eripärast, sest “AI” tööriistu mingi teose loomiseks kasutades on vahendid siiski olemas: sõnad, täpsemalt prompt’id ehk päringud. Teisisõnu, arvutile tuleb promptide keeles kirjeldada, mida looma peaks. Erinevate rakenduste puhul on protsess mõnevõrra erinev, aga paljuski siiski sarnane.

Näiteks Stable diffusion tekst-pildiks rakenduse puhul on võimalus kirjeldada nii seda, mida pildil näha tahad, kui seda, mida kindlasti mitte. Kui tahad genereerida visuaali iidsest sõjast rüütlitega, kirjeldad soovitud tulemust märksõnade abil. Kui aga ei soovi, et pildil oleks verd, saab kirjutada negative prompti Blood.

Edasi on võimalik seadistada mitu korda mootor üritab ühte pilti parandada või üle genereerida, võimalik on muuta, millise suurusega pilti tahad, mitu piltide grupeeringut mudel genereerima peaks ja mitu pilti igas grupeeringus on. Lisaks saab määrata, kui rangelt AI promptist kinni peab: mida suurem on number, seda rangemalt päringut jälgitakse, kuid sellega tavaliselt langeb ka pildi kvaliteet.

Keskkonnas on võimalik olemasolevat pilti muuhulgas sõnadega kirjeldamise abil ka töödelda. Lihtsalt lohistad pildi töölauale ja seejärel saad pildi peal mingi ala ära kustutada või vastavalt soovile parandusi ja muudatusi teha.

Küllaltki sarnase ja samuti väga tuntud tööriista on loonud näiteks ChatGPT (mis nüüdseks on jõudnud tasulise versiooni pakkumiseni) loojana tuntud OpenAI. Tegu on GPT-3 keelemudelil põhineva veebirakendusega Dall-E, mis sarnaselt võimaldab luua eri stiilis visuaale, näiteks pilte sisuturunduse artiklitele või miks mitte logosid, äärmiselt kiiresti. Need mõlemad annavad väga veenvaid tulenusi, kuid kuna masin pole siiski inimene, võib piltidelt teinekord kummalisi detaile leida.

Lisaks tasub taoliste vahenditega visuaalide loomisel arvestada, et tegu pole originaalsete loojatega, vaid masinõppe mudelitega, mis on algoritmide treenimiseks eelnevalt läbi töötanud väga suurel hulgal inimeste tehtud kunsti ja fotosid. Seetõttu on kriitikud leidnud, et vähemalt mõningad pildigeneraatorid võivad rikkuda õiguseid intellektuaalomandile.

Masinõpe ja tehisintellekt ei aita ainult luua, vaid ka parandada ja täiustada. Näiteks – tegelikult juba umbes 15 aastat turul olnud ning küllap paljudele tuttav – pilditöötluse tööriist Pixlr kasutab tehisintellekti piltidelt ebasoovitud objektide eemaldamiseks. Samas on rakenduse arendajad hüpanud AI-genereeritud piltide rongile ning see võimaldab nüüd promptide abil pilte ka luua.

Sarnaselt on väikesed tööriistade komplektid loonud Magic Studio ja AI. Image Enlarger, mis lisaks AI pildigeneraatoritele pakuvad muuhulgas veel võimalusi piltide eraldusvõime tõstmiseks ning neilt tausta või objektide kustutamiseks.

Stable diffusion rakendusega on võimalik olemasolevat pilti muuhulgas sõnadega kirjeldamise abil ka töödelda. Foto: Kreedix Grupp

Videoid ja reklaame saab luua peaaegu automaatselt

Liikuvate piltide puhul pole trendidest maha jäädud ning video tegemine näiteks reklaami, tootetutvustuse või kasutusjuhendi loomise eesmärgil on kaasaegsete tööriistadega äärmiselt lihtne ja kiire protsess. Üks selline veebirakendus on Synthesia, mis võimaldab sobivate mallide põhjal luua vägagi kvaliteetseid videosid, kus AI loodud isikud üsna veenvalt näiteks teenuseid tutvustavad.

Natuke algajasõbralikum alternatiiv on FlexClip, mis laseb tuhandete olemasolevate mallide abil ilusaid videoid luua praktiliselt igaühel, kuid on samas tehniliselt võimekas rakendus, mis loob vajadusel ise ka subtiitrid või kaotab videost tausta. Mõnevõrra huvitavam lahendus on Elai.io, milles on taas GPT-3 keelemudeli abil videote tegemine juba peaaegu täielikult automatiseeritud. Täpsemalt saab vajaliku video luua näiteks esitluse faili üles laadides või soovitud veebilehele linkides ning tööriist loob analüüsi põhjal juba ise sisule vastava video. Seegi tööriist võimaldab kasutada AI inimest videos kõnelejana.

Ja muidugi on võimalik luua reklaame, näiteks AdCreative abil, mis genereerib sobivad kujundused, kasutades sellele antud pilti või pilte. Reklaami peale minevad tekstid saab lasta automaatselt genereerida ja seejärel pakutud valikutest sobiv leida. Muidugi on võimalik muudatusi piltidel ka ise teha, muuhulgas vahetada fondi tüüpi, teksti sisu või kujunduse värve. Sobivad reklaamid saab postitada näiteks otse soovitud sotsiaalmeedia kanalisse ning hiljem isegi nende efektiivsust analüüsida.

Populaarsed lood mujal Geeniuses

Igal argipäeval

Ära jää ilma päeva põnevamatest lugudest

Saadame sulle igal argipäeval ülevaate tehnoloogia-, auto-, raha- ja meelelahutusportaali olulisematest lugudest.