Você está na página 1de 6
Cortine Wtnae [=> /E3 Ooriande Miingn/=> <3 Carton’ Wenge = esrb 23 VY mc vote Storie 23 euita-t Wed Uo) “stn NTELIGENCIA NRISHIGA POCO eC eC uC M ste ty mL eye es e o Midjourney fabricam imagens inéditas a sO nee Le SCC ee ee OR CDC m TC PO ee Se rd cy pees ey . errs Ener Perey roars ed pans eer oo . ee eee ey os Perot ceed Pao ren = Rio de Janeiro pose Esse vocé nao vai achar_ O Dall-E é um programa de inteligéncia artificial. ibiied peamensde Sagas en ental seme rine buscas (nds tentamos). sonoridade de “Dali”, o pintor espanhol, ¢ a grafia de Nat cirearstaee SWalLE” o roboznko aa Por bn out als, maneira de conseguir trata-se de uma maquina que faz arte. Basta digitar eighties swrraiere tins desi quar e spar ental, 1 | Faca um cadastro no si- © Dall-E encontra-se em sua segunda versio, ¢ est genres Opal Spon aud ps Jee serosa e procure pela pagina O programa foi desenvolvido pela OpenAl, em- do Dall-E 2. Dai, é sé presa fundada por um grupo de engenheiros, cien- NAO PENSE EM UM ele- digitar a frase acima, e a tistas e investidores - dentre eles, Elon Musk (0 Ree ca eee CanteglE ccleeben é_| Sitansco no fon mas parte on organiza ms disso, vejaum:dandoum “gerar". Em menos de permanece como doador). Em pouco tempo, tornou- google rapido, vocé en- um minuto aparecerao z ~se uma das principais referéncias em pesquisa e contra imagens editadas quatro imagens inéditas, desenvolvimento na area de Inteligéncia Artificial e desenhos do mamife- produzidas na hora. Nao (ou LA), dando o pontapé para o surgimento das Seems co idettins mentors Rosalia pematie Da ones propel Agora, um passo além: _ por tras: cada detalhe é dependentes lancaram suas proprias IAs geradoras nao pense em um ele- “pintado” pelo compu- de imagem, caso do Midjourney e do Stable Diffu- fante cor-de-rosa usan- tador. A qualidade nao sion. Esses dois podem ser acessados por meio de (a ccsles ates -ceccitan Soran ore Distal tana errna ie ae jornal em uma cafeteria. 0 exemplo na pagina 36. edudio utilizada pela comunidade gamer). La, vocé encontra outros usuirios gerando centenas de ima- gens a cada minuto. ‘A maioria das gerages tem fins recreativos (afinal, quem nio gostaria de ver uma ilustragao do sonho que teve na noite passada’), mas as IAs também sao titeis em diferentes areas do design. Entenda como essa tecnologia funciona ~ e as polémicas que a envolve. Por sinal: todas as imagens que vocé vera nas pr6xi- ‘mas paginas foram criadas com o Dall-E 2 e Midjourney. © que um engenheiro de dados e um professor do ensino infantil tém em comum? Ambos ensinam ‘mini-cérebros a reconhecer padres. Nao é toa que todasas alas de maternal sao repletas de figuras: isto aqui é uma maga, aquilo Ié é uma banana. Depois de conhecer varias imagens de frutas,a crianca aprende a diferenciar e nomear cada uma dela. ‘Uma maquina de IA também é como uma crianga escobrindo o mundo. A primeira etapa ¢ensiné-la a reconhecer imagens. Para isso, os cientistas usam tum método chamado “rede neural’, inspirado no processamento do cérebro humano. A rede possui “neuronios’ artificiais interigados entre si (0s "nés". Isso permite que ela aprenda por reconhecimento de padres, e com os préprios ertos. Imagine o Cebolinha, da Turma da Ménica,diante deum assistente de voz. Um sistema ‘duro’, sem rede neural, vai morrer sem obedecer quando ele pedir para tocar Racionais MC’, pois Cebolinha diré“Lacionais. Um sistema de rede neural nao. Grosso modo, um “neurdnio" saberd que o grupo de rappers de SP tem. tum nome que termina com “nais’. Outro saberd que a combinagao de letras “acio" também faz parte. De cara o input ‘Lacionais’ nfo levard ao output de tocar Racionais. Dard erro. Mas, aso Cebotinha siga pedindo,arede neural comegaa trabalhar. Os 6s conversam entre i “concluemt que, na auséncia de uma banda chamada "Lacionais’, o melhor é tocar Ra- cionais mesmo. Pronto. O sistema aprendeu algo nove. Do nada. Tal qual um ser humano faz.o tempo todo. Isso nio acontece em tempo real nos assistentes de-voz, como a Alexa. O fato é que os desenvolve- dores treinam inserindo termos falados com varios sotaques. A‘a rede neural vai pescando as diferentes formas de promincia e as novas verses do software vio chegando mais espertas, Softwares de reconhecimento de imagens funcio- nam da mesma forma. F 0 caso do YOLO, usado em sistemas de cartos autnomos: ele aprendeadiferenciar postes de pedestres, por exemplo Para isso, as TAs sao treinadas com bancos gigan- tescos de imagens, associadas a suas respectivas des- crigbes. Ao longo dos anos 200, quando os bancos estavam sendo criados, a tarefa de olhar e descrever cada imagem era feita manualmente, por pessoas do ‘mundo todo que recebiam cerca de USS 93 por foto Esse servigo ainda acontece, mas hoje ha outras formas de treinarredes neurais de reconhecimento de imagem. Quando um site mostra varios quadradi: nhos e te pede para clicar, digamos, nos semaforos, vocé esti associando a imagem a descricéo e abastecendo o banco de dados do Google. Nao a 10a, 0 Google possui um potencial de treinamento: imenso e esta desenvol vendo sua prépria IA de geracdo de imagens (cha- ‘mada Imagen). Aindanio hd previsio de quando ela staré disponivel ao piblco. Em 2015 surgiram as primeiras IAs capazes de gerar descrigdes so- zinhas, apenas “olhando" para a imagem e compa: rando com as descrigdes (que ja existiam em seus ancos de dados. O que elas fazem ¢ traduzir os pixels em uma lingua- gem que o computador saiba processar ~ tarefa chamada “embedar’, no jargio da programa- cio. Palavras também PALAVRA AIMAGEM IAs como 0 Dell-E Midjourney utilizen un processo de geracdo de imagens chamado difuséo. Entenda como ele funciona. Oe OSH XK % TREINAMENTO 'APRENDIZAGEN MM ESPACO LATENTE can Pe ‘ Antes de treinar 0 mo- : delo,é preciso seecio nar os bancos de ima- r gens com descrigdes que irdo alimentar a maquina. Quanto mais vatlagbes de contetdo estilo, melhor. Améquinatraduzospi- selsepalavrasparauma Uinguagem matemitica EntSobuscaligaraima- gemadescrigdocorreta Aldaprendeoquec: palavra representa por Eondeestiocodiicados ‘osconcetorecaracters- ticasqueseriousadospa- ra geraraimager. Coda ‘model possulum espace ia latente diferente, ent3o ‘ummesm promptpode ‘gerar imagens distintas. © computador comeca ‘com varios pixels ba- guncados. Apés voce descrever a imagem {que quer criar, 05 pi xels séoreorganizados parase aproximar da ‘quele conceito A reorganizagae dos pixels é feita varias, vezes, um process chamado iteracao. Eles ficam cada ver mais nitidas, até che garam a uma imagem final satisfatéria, ele 8 Oe podem ser embedadas, e dai fica facil comparar imagens e frases. Ou criar ‘uma a partir da outra. Bom, se ja podemos ‘transformar imagem em texto... por que nao fazer ‘camino contrétic? Essa foi ideia que martelouna cabeca dos programadores da OpenAl e outras em- presas pelos cinco anos seguintes. Mas antes de criar imagens inéditas a partir de texto, a tecnolo- gia passou por uma fase intermedisria: a utiliza- fo de redes neurais para estilizar imagens que jé existem. Essas redes sio treinadas com obras de es- tilo marcante (Van Gogh, or exemplo) ¢ 0 transfe~ re para uma foto comm. Em 2016 aplicativos como Prisma e DeepArt virali- zaram nas redes sociais chamaram a atencao de quem queria ver suas préprias fotos pintadas como obras de arte, Talvez um outro aplica- tivo esteja mais fresco na sua meméria:o Lensa. No final de 2022, é provavel que vocé tenha cruzado com retratos dos seus caer paren avers i Os apli- cativos usam redes neurais, capa- zes de apren- der com os pré- prios erros. amigos que pareciam ter sido pintados por artistas profissionais, Por R$ 35, 0 usuario faz 0 upload de algumas fotos no app e recebe 100 imagens do préprio rosto em diferentes estilos. O Lensa foi desenvvolvido pela mesma empresa do Prisma, e¢ basicamente uma versio mais sofisticada de transferéncia de estilo USS 435 mil. Eo tanto que um colecionador anénimo agou para obter um quadro gerado por uma inteli- géncia artificial em 2018. A casa de leildes Christie's (@ mais tradicional do mundo) anunciou a obra como primeira imagem feita por um algoritmo a entrar em leildo. O*Retratotedmond’Belamiy? mostra um ho- mem de temo com o rosto um pouco borrado, pintado como um quadro do século 28. Ela foi leiloada ao lado dos trabalhos de Andy Warhol e Roy Lichtenstein. ‘Sé que obra ndo impressiona quando comparada ao ‘que viria depois. Em quatro anos, as IAs deixaram de produzir imagens borradas e passaram aser sinnimo de ilustracdes e fotos hiperdetalhadas. A questio é: ‘como elas criam imagens inéditas do nada? ODall-E 2, o Midjourney e o Stable Diffusion uti- lizam uma técnica chamada “difusio’. Para entendé-la, vale relembrar o conceito de entropia, das aulas de fi sica. Quando vocé pinga tinta em um copo de égua, inicialmente o pingo ficara concentrado em meio ao liquid. Dizemos que esse é um estado “organizado’ de baixa entropia. Com o tempo, as moléculas da tinta se espalham até atingirem um aspecto homogéneo com, a dgua, ou de alta entropia. Na natureza, é impossivel reverter a entropia daquele conjunto, retornando ao estado inicial e comportado da gota ‘Sé que & possivel fazer isso no computador. O pro- e580 de difusio é inspirado na reverséo da entropia, Ele comeca com uma imagem que contém virios pixels aleatérios ~ um estado de caos, OS NOVOS FOTOGRAFOS As inteligéncias artificiais também geram fotos inéditas - séo pinturas de altissima resolucéo, E 0 resultado é preciso. A esquerda, temos fotos reais. A direita, imagens inéditas geradas por IA. Compare. Foto real, Imagen TA to de coragio, vista de cima. Una foto de un prato de sushi visto de cima. Une foto do ‘Arco do Triunfo pela sanha. ere) rane umn esbuta cee eet ree Peers re caer eee) ces es ern ei pares Pee ae) cae reer forte, flogratia de esti, ‘Castelo da Cin Pree arnt ease frase (por exemplo, “um, gato feliz.cozinhando um bolo), amdquina organiza aqueles pixels em um esta- domenos castico, mas que ainda no éa imagem final. Ele repete esse processo varias vezes, formando imagens cada vez mais “organizadas' até chegar, de fato, no cozinheiro felino, Ou seja: em vez de pescar imagens prontas de gatos e de bolos em seu banco de dados, ele parte do caos total para produzir figuras comple- tamente novas. As frases que guiam a A até essas, imagens inéditas sao chamadas “prompts”. Pegue a palavra “bol por exemplo. A méquina aprendeu a associar uma série de caracteristicas a esse termo:ele ¢ redondo, tem textura fofa e parece apetitoso. Essas ideias es- tio codificadas no “espago latente" do modelo, e vao desde conceitos objetivos (mais ou menos redondo) até mais abstratos, como “apetitoso” (que pode re- meter a uma cobertura). Como cada IA foi treina- da com bancos de dados distintos, seus espacos la- tentes sio tinicos ~ e um ‘mesmo prompt dé origem a imagens completamente diferentes no Dall-E 2 e no Midjourney. Por mais facil que seja criar imagens com boas imagens nao € tao simple Eprecieo sabe usar 0s prompts, como as palavras mégicas de um feitico. Desde 0 lanca~ ‘mento dessas IAs, muitos internautas tém passado horas em busca da melhor linguagem para se comu- nicar com a maquina. Ja descobriram que adicio- nar expressdes como “iso- métrico” e “fotografia de estiidio” geram imagens mais precisas. E alguns até encon- ‘traram uma renda ai. site PromptBase vende ndo as imagens, mas os pardgrafos de texto para que vocé gere a imagem no Dall-E 2, Midjour- ney ou Stable Diffusion. Como a IA sempre cria imagens inéditas, vocé ganha um acervo infi- nito de produgdes com ‘o mesmo tema ou estilo. Um prompt que prome- te construgées feitas de Lego, por exemplo, custa ‘Seno ¢ isso que voce procura, site ainda oferece a op¢io de contratar um engenheiro de prompts para traduzir a sua ideia da melhor forma para a maquina. Mas enquanto alguns aprovei- tam para inventar profissdes, essas IAs nao estariam ameacando o emprego de artistas de carne e osso? Em setembro de 2022, Jason Allen foi rechacado nas redes sociais. Ele havia acabado de vencer acompeti¢a0 de arte da Feira Estadual do Colorado, na categoria de fotografia manipulada digitalmente. E inegavel que a obra "Teatrode Opera Espacial’é digna de primeiro lugar. ‘Mas ha um detalhe: Allen usoua plataforma Midjourney para gerar a imagem. Ele nao revela as palavras exatas ‘que usou para criar a obra ~ elas sdo sua receita secreta. Mesmo assim, é como entrar em uma maratona e competir com uma Ferrari: enquanto artistas passam anos aprimorando seu estilo, as maquinas entregam uma imagem deslumbrante a partir de meia-duizia de palavras. Com o treinamento certo, essas [As podem ‘copiar 0 estilo de qualquer artista vivo hoje. Nomes de ilustradores famosos, como Greg Rutkowski e Si- mon Stalenhag, sio usados todos os dias para gerar imagens no Stable Diffusion. Ou seja: é como se vocé encomendasse o trabalho deles sem pagar por isso. Ainda nao ha uma legislacao especifica sobre 0 as- ‘sunto. Uma IA treinada com diferentes estilos esta pla- giando os artistas originais? Ou isso seria o equivalente a um artista que se inspira em referéncias anteriores para criar um estilo proprio? Com a disseminagao da tecnologia, esses debates deverao fazer parte de novas regulamentacées sobre direitos autorais. Mas nao significa que as [As nao possam ajudar os artistas. “A gente pensava que outras tecnologias do passado iam roubar nosso emprego, mas elas mo- dificaram o mercado de trabalho”, diz Luiz Zanotello, professor na Universidade das Artes de Berlim. Temia- ~se que a camera fotografica, por exemplo, acabasse com a pintura, Isso nao aconteceu, e a fotografia em si desencadeou novos movimentos artisticos. “Essas ferramentas ja estao senido usadas como impulso cria~ tivo. A maquina pode nos ajudar a pensar em coisas que nao imaginariamos tao rapido.” Isso pode produzir insights para a criacio de logotipos, layouts de website, design de produtos, de interiores, fachadas... é s6 pedir. Depois de dias utilizando a ferramenta, descobrimos uma pequena ~ mas significativa - limitagao da A. A pagina inicial do Dall-E 2 sugere algumas cenas surre- alistas para testar na ferramenta, como um astronauta andando a cavalo. Resolvemos pedir 0 contrario: um. cavalo andando em um astronauta. Vocé nunca viu, mas consegue imaginar a cer Dall-E, nao. E exatamente a criatividade e a capacidade de abstracdo humana que diferencia a nossa mente de uma maquina. A automatizacao de alguns trabalhos, no fim das contas, pode até dar mais tempo livre Para a criacao de obras ainda mais originais - que nao podem ser reproduzidas em cddigo, pelo menos. Por enquanto.

Você também pode gostar