Atslēgas līdzņemšanai
- DALL·E ir jauns neironu tīkls, kas var zīmēt attēlus, pamatojoties uz tekstu.
- Tīkls ir viens no pieaugošajiem mākslīgā intelekta projektiem, kas var atdarināt cilvēku radošo darbību.
- Eksperti saka, ka AI zīmētie attēli nav oriģināli radījumi.
Pāriet, Pikaso. Jauns neironu tīkls var zīmēt attēlus, pamatojoties uz tekstu.
DALL·E, mākslinieka Salvadora Dalī un Pixar WALL·E vārdu portfelis, var uzņemt jebkuru tekstu un izveidot no tā attēlu. Sistēma izmanto neironu tīklu, kas ir apmācīts miljardiem attēlu un teksta piemēru. Tas ir viens no pieaugošajiem mākslīgā intelekta projektiem, kas var atdarināt, bet ne atkārtot cilvēku radošo darbu.
"Tā kā dabiskā valoda nepārtraukti attīstās un ir ļoti atkarīga no konteksta niansēm, ļoti nozīmīgs sasniegums ir iemācīt mašīnai pietiekami labi saprast valodu, lai uzzīmētu attēlu," sacīja Tamāra Švarca, Pensilvānijas Jorkas koledžas kiberdrošības profesore., teikts e-pasta intervijā. "Iedomājieties policijas skiču mākslinieku, kas ir rets talants, kuram ir iespēja izveidot attēlu, pamatojoties uz liecinieka aprakstu."
Lieldatu izmantošana attēlu iegūšanai
DALL-E izveidoja AI izpētes uzņēmums OpenAI, un tas darbojas, uzkrājot milzīgus datu apjomus no interneta. Pēc tam datus apstrādā dabiskās valodas modelis un apmāca veidot attēlus no teksta. DALL-E darbojas līdzīgi kā nesen izlaistais GPT-3 - OpenAI izveidots valodas modelis, kas var tikt aicināts ģenerēt oriģinālās teksta daļas. GPT-3 tika apmācīts, izmantojot pustriljonu vārdu interneta teksta, un tas var radīt pārsteidzoši reālistisku tekstu.
Iemācīt mašīnu pietiekami labi saprast valodu, lai uzzīmētu attēlu, ir ļoti nozīmīgs sasniegums.
Maikls Juruškins, datu zinātnes uzņēmuma BroutonLab dibinātājs un CTO, e-pasta intervijā sacīja, ka DALL-E ir "viens no retajiem veiksmīgajiem cilvēces centieniem līdzināties mūsu radošumam un iztēlei". Viņš piebilda: "Ir vieglāk saprast, kā mākslīgais intelekts kaut ko paredz, pārbaudot attiecīgos datus, taču ir grūtāk saprast, kā tas spēj ģenerēt zīmējumus no lietām, par kurām tas iepriekš nav "dzirdējis".
Schwartz rūpīgi ņem vērā, ka mākslīgais intelekts nerada informāciju, bet gan ņem valodas datus un pārveido tos attēlos.
"Sākotnējais radošums nāk no cilvēka, kurš konstruēja uzdevumu," sacīja Švarcs. "Ir zināma "radošums" no AI puses, jo tas eksperimentē ar dažādām datu kombinācijām un pēc tam izvēlas no vairākiem potenciālajiem rezultātiem. Tomēr cilvēks pārbauda rezultātus un māca AI, kā izvēlēties no daudzajām kombinācijām."
Robotu detektīvu darbs?
Mašīna var eksperimentēt ar šo datu un objektu kombināciju daudz ātrāk nekā mākslinieks. Švarcs atzīmēja, ka DALL-E kādu dienu varētu sadarboties ar detektīvu, kurš mēģinās rekonstruēt nozieguma vietu, izmantojot skici, pamatojoties uz aculiecinieku liecībām.
"Tā kā liecinieki sniedz savus liecības, dators var uztvert šo runāto, dabiskās valodas informāciju un izveidot ainas zīmējumu vai daudzus ainas zīmējumus," viņa sacīja. "Pēc tam šīs vizualizācijas varētu integrēt, lai izveidotu precīzāku pazaudētu pierādījumu attēlu. Šo vizualizāciju varētu bagātināt, integrējot iepriekšējos vietas attēlus pirms nozieguma."
Vairākas citas AI vadītas programmas var radīt mākslu. Piemēram, Ai-Da mākslas radīšanai izmanto robotu roku sistēmu un sejas atpazīšanas tehnoloģiju, kas savienota ar mākslīgo intelektu. Sistēma var analizēt attēlu, kas novietots mašīnas priekšā, un tas tiek ievadīts algoritmā, lai radītu robota roku kustības.
Tomēr māksliniekiem nevajadzētu uztraukties, ka viņus aizstās robotu kungi, pagājušajā gadā laikrakstā The New York Times apgalvoja Ratgersas universitātes Mākslas un mākslīgā intelekta laboratorijas direktors Ahmeds Elgamāls.
"Lai gan mākslas definīcija pastāvīgi attīstās, tās pamatā ir saziņas veids starp cilvēkiem," viņš rakstīja. "Ja aiz mašīnas nav cilvēka mākslinieka, mākslīgais intelekts var darīt tikai spēlēties ar formu, neatkarīgi no tā, vai tas nozīmē manipulēt ar pikseļiem ekrānā vai notīm mūzikas virsgrāmatā. Šīs darbības var būt saistošas un uztveres intriģējošas, taču tām trūkst jēgas bez mijiedarbības starp mākslinieks un publika."
Apskatot DALL-E darbu, es saprotu Elgammal viedokli, ka mākslīgā intelekta radītie attēli nav māksla. No otras puses, tie ir labāki par jebkuru mākslu, ko es varētu radīt. Tātad, kāda ir atšķirība?