Você está na página 1de 20

Manual: Criação de artes utilizando Leonardo.

ai
Autor: Stênio Nobre e Comunicação 2023.1B

1. Objetivo
Este relatório tem como objetivo principal a apresentação de uma
nova ferramenta que vem se mostrando muito competente e útil nos
últimos meses, conhecida como Leonardo. Esta é uma inteligência artificial
voltada à criação de artes e design gráfico, um novo tipo de ferramenta que
vem sendo desenvolvida recentemente que gera imagens a partir de
prompts de comando.
A utilização desta na comunicação pode ser proveitosa em inúmeros
sentidos, mas neste relatório será abordada principalmente a criação de
vetores de imagens utilizando IA.

2. O que são Inteligências Artificiais?


As inteligências artificiais (IA) simulam o raciocínio e aprendizado
humano para executar tarefas autônomas e eficientes. Podem ser usadas
em áreas complexas que exigem processamento avançado de dados e
tomada de decisões. Reconhecimento de padrões, processamento de
linguagem natural, direção autônoma de veículos e diagnóstico médico
são algumas das tarefas que as IA podem realizar. Por meio de algoritmos
e modelos de machine learning, as IA analisam informações, aprendem
com exemplos passados e adaptam seu comportamento para melhorar o
desempenho ao longo do tempo. Seu uso é benéficos significativos, mas
também levanta questões éticas e de segurança.
As IA podem ser classificadas em IA baseadas em regras, que
seguem instruções predefinidas, e IA baseadas em aprendizado de
máquina, que aprendem com dados. Podem ser IA estreita, especializadas
em uma tarefa específica, ou IA geral, com habilidades comparáveis às
humanas em várias áreas. As IA já têm impacto em nossa vida diária, como
assistentes virtuais e sistemas de recomendação personalizados.

2.1. Inteligências Artificiais para criação de imagens


A inteligência artificial aplicada à criação de imagens é um campo
em crescimento rápido. Combina algoritmos de aprendizado de máquina e
processamento de imagem para gerar conteúdo visual automatizado. Isso
permite que as IAs aprendam a reconhecer e reproduzir elementos visuais,

1
como formas, cores, texturas e estilos artísticos. Um exemplo notável é o
uso de redes neurais convolucionais para gerar imagens realistas. Elas são
treinadas com conjuntos de dados contendo exemplos reais e podem criar
novas imagens no mesmo estilo. O projeto DeepArt é um exemplo prático
disso, transformando fotografias em obras de arte no estilo de pintores
famosos.
Além disso, a inteligência artificial é usada para criar imagens
sintéticas, como paisagens, personagens e objetos inexistentes na
realidade. Essas imagens são empregadas em entretenimento, jogos
digitais e simulações científicas. As redes generativas adversariais (GANs)
são utilizadas nesse contexto. Elas consistem em duas redes neurais que
competem entre si: uma gera imagens sintéticas e a outra avalia sua
autenticidade. Com treinamento adequado, as GANs são capazes de gerar
imagens altamente realistas e convincentes.
O Midjourney é um impressionante exemplo de inteligência artificial
focada na geração de imagens realistas a partir de descrições textuais.
Utilizando técnicas avançadas de deep learning, essa plataforma permite
que os usuários forneçam uma descrição e, como resposta, o Midjourney
gera uma imagem correspondente. Essa ferramenta versátil pode ser
aplicada em diversas áreas, como arte gerada por computador e criação de
personagens para jogos, oferecendo uma forma inovadora de dar vida a
ideias visuais. Outro exemplo notável é o BlueWillow, uma ferramenta de
edição de imagens impulsionada pela inteligência artificial, projetada para
simplificar o trabalho de designers e editores. Essa plataforma oferece
recursos automatizados, como ajuste de cores, remoção de objetos
indesejados e aplicação de efeitos. Além disso, o BlueWillow possibilita a
transformação de esboços em imagens realistas por meio do uso de redes
neurais, proporcionando uma maneira ágil e eficiente de criar ilustrações
detalhadas a partir de desenhos simples.

3. O que é Leonardo.ai?

Leonardo.ai é uma nova inteligência artificial que surgiu


primeiramente com ideia de auxiliar aos desenvolvedores de jogos
facilidade em criação de ativos de alta qualidade, este, oferece a
capacidade de especialização em diversos temas, permitindo aos usuários
escolher o modelo mais adequado às suas necessidades. É possível
personalizar o resultado, selecionando o modelo desejado e especificando
a prioridade da solicitação. Uma vantagem única do Leonardo.ai é a

2
possibilidade de treinar modelos de imagem personalizados, algo que
outras ferramentas similares não oferecem. Além disso, é possível
compartilhar os modelos com a comunidade, tornando a ferramenta
colaborativa. Embora o Midjourney seja atualmente líder em qualidade de
imagem, o Leonardo.ai representa um avanço significativo na geração de
imagens por computador e é especialmente útil para designers que
desejam ter controle total sobre seus modelos exclusivos. No entanto, é
importante lembrar que o uso final de cada ferramenta é determinado
pelo usuário.

4. Cadastro no site
Para utilização da IA, primeiro é necessário o cadastro no site para
ganhar acesso antecipado, lembrando que esta ferramenta está em fase
Beta, sendo necessário entrar numa lista de espera para acessá-la. Para
efetuar o cadastro deve-se acessar o site oficial do Leonardo, e inserir seu
e-mail que deseja ser vinculado e esperar, o mais interessante seria inserir
um e-mail que você tenha vinculado ao Discord, por motivos que serão
mais comentados a frente.
Figura 1: Área de cadastro no site

Fonte: Captura de tela gerada em Leonardo.ai

Ao se cadastrar para o acesso antecipado haverá um tempo de


análise de seu e-mail, por haver uma ordem de prioridade do acesso. Você
receberá um e-mail em sua caixa de entrada que conterá algumas
informações sobre a ferramenta e a comunidade e também um link que
redireciona para o servidor de Discord da IA, o qual pode ser utilizado para
ganhar prioridade no acesso antecipado.

3
4.1. Servidor de Discord
Ao adentrar no servidor você terá acesso à comunidade, que contará
com um suporte e canal próprio para falantes da língua portuguesa, o qual
pode ser utilizado para pedir dicas, interagir, compartilhar e ver imagens
que outros compartilharam, etc.
Figura 2: Servidor do Leonardo.ai

Fonte: Captura de tela gerada em Discord

Para ganhar o acesso prioritário se deve acessar o canal “Guia do


Servidor” no canto superior direito. Ao acessar haverá o acesso direto ao
tutorial de como obter esta prioridade.
Figura 3: Tutorial acesso prioritário

Fonte: Captura de tela gerada em Discord

4
Ao acessar haverá uma descrição do passo a passo e o link de um
formulário Google, o qual deve ser respondido, este não pede muitas
informações, apenas o e-mail que quer receber a prioridade, nickname do
Discord e um nome
Uma vez que isso for feito é só aguardar o e-mail que avisará que já é
possível o acesso.

4.2. Apresentação do Site


Com o acesso em mãos, deve-se de novo acessar o site principal e
realizar o login com o Google utilizando o e-mail inserido anteriormente.
Com o login efetivado, o site irá lhe perguntar o nome de usuário que
deseja utilizar no site, algumas áreas de interesse para melhorar um “feed”
que o site possui.
Na aba “Home” já se pode ver os “Featured Models”, que são como
inteligências separadas que geram estilos de imagens diferentes mesmo
utilizando os mesmos prompts de comando, estas, serão comentadas e
detalhadas quando a aba “Finetuned Models” for explorada.
Além disso, também há as “Featured Creations”, na qual é possível as
artes geradas que estão em tendência no momento (aba “Trending”),
também é possível as últimas artes que vem sido geradas (aba “New”) e
também as artes com mais curtidas do site (aba “Top”), também há um
mecanismo de busca que pode ser usado para buscar artes específicas que
podem já ter sido criadas. Na aba “Community Feed” se tem basicamente o
mesmo da parte de “Featured Creations" da aba “Home”.
Figura 4: Aba Home e Community Feed

Fonte: Captura de tela gerada em Leonardo.ai

5
Na aba “Personal Feed” é possível ver as suas últimas criações
utilizando a IA, como também é possível ver as artes que você curtiu como
também um feed com as criações dos perfis que você seguiu no site.
Figura 5: Aba Personal Feed

Fonte: Captura de tela gerada em Leonardo.ai

Já na aba “Training & Datasets” é possível criar conjuntos de imagens


para treinar a inteligência artificial e obter eventuais melhores resultados
em suas criações, na qual você pode realizar o upload de até 40 imagens e
a IA irá processar essas imagens e aprender traços em comum, estilo, etc. O
treinamento da IA e o tempo de treinamento irá variar dependendo das
imagens que você fizer o upload, imagens mais pesadas e realísticas terão
um gasto computacional maior.
Figura 6: Aba Training & Datasets

Fonte: Captura de tela gerada em Leonardo.ai

6
Por fim, temos a aba “Finetuned Models”, onde conseguimos ver
várias opções de modelos de criação de arte, que funcionam como
datasets pré-definidos com um estilo específico de imagem, onde o
mesmo prompt gerado com modelos diferentes resultarão em estilos
diferentes.
Figura 7: Aba Finetuned Models

Fonte: Captura de tela gerada em Leonardo.ai

Dependendo do que se quer obter, alguns modelos são mais


propícios que outros, como, por exemplo, o “Cute Characters” que funciona
melhor para personagens 3D em traço “Disney”, ou o DreamShaper que
pode ser mais versátil em relação a ambientes e personagens, mas não
consegue ser tão ultrarrealista.
Figura 8: Alguns modelos de Finetuned

Fonte: Captura de tela gerada em Leonardo.ai

7
Além dos disponibilizados pelo próprio site, também há os modelos
feitos pela comunidade, a partir dos treinamentos por Datasets de outros
usuários incluindo você.
Figura 9: Modelos da comunidade

Fonte: Captura de tela gerada em Leonardo.ai

5. Criação de artes usando AI Image Generation


Para começar a criação das imagens, você deve se dirigir para a aba
“AI Image Generation”, que abrirá um menu com diversas opções para
configurar e assim moldar a sua criação, o qual vamos explorar a frente:
Figura 10: Área de criação de imagens

Fonte: Captura de tela gerada em Leonardo.ai

8
5.1. Sistema de Tokens

O site possui uma mecânica de Tokens, que funciona como uma


moeda na qual é gasta quando gera uma imagem, diariamente você
começa com um total de 150 Tokens, o qual pode ser gasto livremente até
o fim do dia, ao atingir o horário de virada do dia, todos os seus tokens são
ressarcidos de volta ao valor inicial.
Figura 31: Remove Background

Fonte: Captura de tela gerada em Leonardo.ai

O custo por imagem é variável e depende das configurações


escolhidas, por exemplo, tanto a função “Prompt Magic” quanto a função
“Image Prompt” aplicam um multiplicador de duas vezes no valor
consumido por imagem, a resolução escolhida também pode aplicar um
modificador no valor de token gasto por imagem, por isso deve-se tomar
bastante cuidado na escolha das configurações.
Figura 32: Demonstração custo de Tokens

Fonte: Captura de tela gerada em Leonardo.ai

9
5.2. Barra lateral de opções:
5.2.1. Number of Images
Na esquerda temos diversas opções para criar nossas imagens, como
“Number of Images”, onde escolhemos quantas imagens vamos gerar a
partir do mesmo prompt.
Figura 11: Número de imagens

Fonte: Captura de tela gerada em Leonardo.ai

5.2.2. Image Dimensions


Também temos a parte de “Image Dimensions”, que podemos
escolher o tamanho das imagens, escalas, etc. Dependendo do tamanho
da imagem, o número de imagens fica limitado devido ao gasto
computacional, por exemplo: a partir de 726 x 726 o máximo de imagens
geradas é 4 (quatro).
Figura 12: Dimensão das imagens

Fonte: Captura de tela gerada em Leonardo.ai

10
5.2.3. Prompt Magic & High Contrast
Além disso, há a função “Prompt Magic”, que faz com que a IA
otimize melhor o output do prompt inserido, utilizar esta opção multiplica
o custo de tokens da sua criação em 2 (dois), o sistema de tokens será
explicado mais adiante, o impacto desta opção é tão grande que é
recomendado deixar a mesma ativa sempre, segue um exemplo de
imagens geradas onde acima a opção está ligada e embaixo a desligada,
seguindo o mesmo prompt de comando:
Figura 13: Exemplo de Prompt Magic ligado

Fonte: Captura de tela gerada em Leonardo.ai

Nesta opção você ainda consegue regular a força também a força do


prompt para permitir a IA criar mais ou manter centrado no prompt que
você digitou. Juntamente com a opção de “Prompt Magic” há a opção de
“High Contrast”, que cria imagens com mais sombras e mais escuras.
Figura 14: Menu de Prompt Magic e High Contrast

Fonte: Captura de tela gerada em Leonardo.ai

11
5.2.4. Guidance Scale e Tiling
Mais abaixo, temos a opção de “Guidance Scale”, que controla o
quanto o processo de geração de imagem segue o texto inserido no
prompt, sendo controlável e variando a força entre 1 e 20, porém, valores
muito altos ou muito baixos podem acabar causando irregularidades nas
imagens mesmo se o “Prompt Magic” estiver habilitado, então é
recomendado pelo site utilizar com o valor de 7 (sete).
Figura 15: Função Guidance Scale

Fonte: Captura de tela gerada em Leonardo.ai


Já a ferramenta Tiling é útil quando se necessita criar imagens que
há padrões se repetindo, como backgrounds e coisas do gênero, para
funcionar com maior eficácia é ideal haver no prompt um termo de
“pattern tiling”.
Figura 16: Função Tiling

Fonte: Captura de tela gerada em Leonardo.ai

5.2.5. Image Prompt, Image to Image & ControlNet


Abaixo da função de “Tiling” temos um painel com duas opções,
sendo estas a “Image Prompt” e a “Image to Image”, que nos permitem
direcionar a criação, mas sem a utilização de datasets.
A começar pela “Image Prompt”, onde permite você inserir imagens
de seu explorador de arquivos, estas vão direcionar a IA e mostrar com a
criação deve se parecer ao final do processo, isso aplica um multiplicador

12
de 2x na quantidade de tokens por imagem. Ainda é possível alterar o
“Image Weight”, que faz com que a criação se pareça mais com a imagem
de referência, também é possível alterar o “Prompt Magic Strenght”, que
modifica o quanto a função “Prompt Magic” também influência na criação.
Figura 17: Image Prompt

Fonte: Captura de tela gerada em Leonardo.ai

No outro lado, temos a função “Image to Image” que utiliza uma


imagem como base e a altera baseada no prompt inserido, onde é possível
alterar a “Init Strenght”, que permite controlar o quanto será preservado da
imagem principal.
Figura 18: Image to Image

Fonte: Captura de tela gerada em Leonardo.ai

13
A função “Image to Image” também habilita o “ControlNet”, que
influencia as criações baseado em fatores da imagem inserida no “Image
to Image”, como a pose da imagem, a profundidade e os contornos,
também é possível utilizar o “ControlNet Weight” para regular o peso do
quanto esses fatores vão influenciar.
Figura 19: Control Net

Fonte: Captura de tela gerada em Leonardo.ai

5.2.6. Seeds
Por fim, na parte de “Advanced Settings”, temos a opção de “Fixed
Seed” a qual podemos utilizar a semente utilizada para gerar outra
imagem como base para gerar outras imagens, muito útil para gerar
imagens a partir de outras, como no “Image to Image”.
Figura 20: Função Fixed Seed

Fonte: Captura de tela gerada em Leonardo.ai

Também pode servir para otimizar criações de forma iterativa da


seguinte maneira: gerar uma série de imagens com um prompt, escolher a
mais promissora e copiar a semente, adicionar na “Fixed Seed” e gerar
novamente, por fim repetir este processo até que se encontre satisfeito
com o resultado.

5.3. Prompts, Negative Prompts e Prompt Generation


Na parte superior central há a parte de inserir o prompt de comando,
o qual é o texto que a inteligência artificial irá se basear e construir a arte,
realizando uma vasta busca utilizando as redes neurais. É possível inserir o
prompt em qualquer idioma, mas é mais preciso para prompts em língua

14
inglesa. É imperativo salientar também que quanto mais preciso for a
descrição, melhor será o resultado da imagem, então não hesite em
inserir detalhes. Ainda há a opção de “Negative Prompt”, que permite você
adicionar um prompt secundário de elementos que você não deseja em
sua arte, a qual a IA irá contornar.
Figura 21: Menu de Prompt

Fonte: Captura de tela gerada em Leonardo.ai

Abaixo do espaço de prompt temos o Finetune Model que será


utilizado para gerar a imagem, onde há alguns já pré-estabelecidos e
também a opção de escolher um personalizado ou da comunidade.
Figura 22: Menu de Models

Fonte: Captura de tela gerada em Leonardo.ai

15
Por fim, temos a opção de “Prompt Generation”, aonde a IA vai gerar
sugestões de prompts mais detalhados e complexos (ideais para imagens
precisas) partir de um prompt básico digitado pelo usuário, interessante
quando você tem ideias, mas não sabe como colocar descrever para a IA,
porém cuidado, você só tem direito a 1000 Prompt Generation.
Figura 23: Menu de Prompt Generation

Fonte: Captura de tela gerada em Leonardo.ai

5.3.1. Botões de Imagem

Ao criar sua imagem, ao passar o mouse por cima algumas opções


adicionais aparecerão, entre elas opções de remover o fundo (transformar
em PNG), realizar Upscale, etc. Estas serão descritas nos próximos tópicos
com mais detalhes.
Figura 24: Botões adicionais

Fonte: Captura de tela gerada em Leonardo.ai

16
5.3.2. Unzoom e Remove Background

A função de “Unzoom” é bastante útil para expandir uma criação


caso eventualmente ache que está num plano muito fechado, a
inteligência artificial irá trabalhar para preencher o resto da imagem sem o
“zoom”. Por exemplo, na imagem abaixo à esquerda temos a imagem
original e à direita temos a imagem “Unzoomed”.
Figura 25: Comparação de Unzoom

Fonte: Captura de tela gerada em Leonardo.ai

Também há a função de “Remove Background”, que não precisa de


muitas explicações, apenas remove o fundo da imagem utilizando IA, só se
deve tomar cuidado com imagens muito realistas com detalhes muito
“esvoaçadas”, pois independente da ferramenta utilizada, é muito
complicado apagar fundo dessas imagens.
Figura 26: Remove Background

Fonte: Captura de tela gerada em Leonardo.ai

17
5.3.3. Upscaling

O upscaling de imagens é o processo de aumentar a resolução ou


tamanho de uma imagem digital. Ele é usado quando uma imagem de
baixa resolução ou pequeno tamanho precisa ser ampliada para uma
versão maior ou de maior qualidade.
O objetivo do upscaling é melhorar a aparência visual da imagem
ampliada, adicionando detalhes e mantendo a nitidez tanto quanto
possível. Isso pode ser feito por meio de métodos como interpolação, que
adiciona píxeis entre os existentes, ou super-resolução, que utiliza
algoritmos para reconstruir a imagem em uma resolução mais alta com
base no conteúdo original.
Nesta ferramenta, devido a gerar imagens de no máximo 1024 x 1024
de tamanho, nos disponibiliza a opção de realizar três tipos de Upscaling,
que possuem entre si algumas diferenças que serão comentadas
individualmente. É importante ressaltar também que todas as opções têm
um custo de 5 tokens.
Figura 27: Exemplo de Upscaling

Fonte: Imagem disponível em:


https://www.redsharknews.com/this-new-ai-system-could-be-science-fiction-but-it
s-very-real-indeed

Começando pelo “HD Smooth Upscaling”, um upscaler que funciona


bem com objetos únicos e em foco, mas não é indicado para imagens com
muitos detalhes finos, pois na suavização pode acabar os corrigindo.

18
Figura 28: Smooth Upscaling

Fonte: Captura de tela gerada em Leonardo.ai

Também temos o “HD Crisp Upscaling”, um ótimo upscaler


balanceado que retém uma boa quantidade de detalhes e nitidez da
imagem original.
Figura 29: Crisp Upscaling

Fonte: Captura de tela gerada em Leonardo.ai

19
Por fim, no plano gratuito temos o “Upscale Image Alternate”, que
além de melhorar a resolução, refaz alguns detalhes da imagem original,
como sendo uma imagem “alternativa”.
Figura 30: Alternative Upscaling

Fonte: Captura de tela gerada em Leonardo.ai

20

Você também pode gostar