Escolar Documentos
Profissional Documentos
Cultura Documentos
ai
Autor: Stênio Nobre e Comunicação 2023.1B
1. Objetivo
Este relatório tem como objetivo principal a apresentação de uma
nova ferramenta que vem se mostrando muito competente e útil nos
últimos meses, conhecida como Leonardo. Esta é uma inteligência artificial
voltada à criação de artes e design gráfico, um novo tipo de ferramenta que
vem sendo desenvolvida recentemente que gera imagens a partir de
prompts de comando.
A utilização desta na comunicação pode ser proveitosa em inúmeros
sentidos, mas neste relatório será abordada principalmente a criação de
vetores de imagens utilizando IA.
1
como formas, cores, texturas e estilos artísticos. Um exemplo notável é o
uso de redes neurais convolucionais para gerar imagens realistas. Elas são
treinadas com conjuntos de dados contendo exemplos reais e podem criar
novas imagens no mesmo estilo. O projeto DeepArt é um exemplo prático
disso, transformando fotografias em obras de arte no estilo de pintores
famosos.
Além disso, a inteligência artificial é usada para criar imagens
sintéticas, como paisagens, personagens e objetos inexistentes na
realidade. Essas imagens são empregadas em entretenimento, jogos
digitais e simulações científicas. As redes generativas adversariais (GANs)
são utilizadas nesse contexto. Elas consistem em duas redes neurais que
competem entre si: uma gera imagens sintéticas e a outra avalia sua
autenticidade. Com treinamento adequado, as GANs são capazes de gerar
imagens altamente realistas e convincentes.
O Midjourney é um impressionante exemplo de inteligência artificial
focada na geração de imagens realistas a partir de descrições textuais.
Utilizando técnicas avançadas de deep learning, essa plataforma permite
que os usuários forneçam uma descrição e, como resposta, o Midjourney
gera uma imagem correspondente. Essa ferramenta versátil pode ser
aplicada em diversas áreas, como arte gerada por computador e criação de
personagens para jogos, oferecendo uma forma inovadora de dar vida a
ideias visuais. Outro exemplo notável é o BlueWillow, uma ferramenta de
edição de imagens impulsionada pela inteligência artificial, projetada para
simplificar o trabalho de designers e editores. Essa plataforma oferece
recursos automatizados, como ajuste de cores, remoção de objetos
indesejados e aplicação de efeitos. Além disso, o BlueWillow possibilita a
transformação de esboços em imagens realistas por meio do uso de redes
neurais, proporcionando uma maneira ágil e eficiente de criar ilustrações
detalhadas a partir de desenhos simples.
3. O que é Leonardo.ai?
2
possibilidade de treinar modelos de imagem personalizados, algo que
outras ferramentas similares não oferecem. Além disso, é possível
compartilhar os modelos com a comunidade, tornando a ferramenta
colaborativa. Embora o Midjourney seja atualmente líder em qualidade de
imagem, o Leonardo.ai representa um avanço significativo na geração de
imagens por computador e é especialmente útil para designers que
desejam ter controle total sobre seus modelos exclusivos. No entanto, é
importante lembrar que o uso final de cada ferramenta é determinado
pelo usuário.
4. Cadastro no site
Para utilização da IA, primeiro é necessário o cadastro no site para
ganhar acesso antecipado, lembrando que esta ferramenta está em fase
Beta, sendo necessário entrar numa lista de espera para acessá-la. Para
efetuar o cadastro deve-se acessar o site oficial do Leonardo, e inserir seu
e-mail que deseja ser vinculado e esperar, o mais interessante seria inserir
um e-mail que você tenha vinculado ao Discord, por motivos que serão
mais comentados a frente.
Figura 1: Área de cadastro no site
3
4.1. Servidor de Discord
Ao adentrar no servidor você terá acesso à comunidade, que contará
com um suporte e canal próprio para falantes da língua portuguesa, o qual
pode ser utilizado para pedir dicas, interagir, compartilhar e ver imagens
que outros compartilharam, etc.
Figura 2: Servidor do Leonardo.ai
4
Ao acessar haverá uma descrição do passo a passo e o link de um
formulário Google, o qual deve ser respondido, este não pede muitas
informações, apenas o e-mail que quer receber a prioridade, nickname do
Discord e um nome
Uma vez que isso for feito é só aguardar o e-mail que avisará que já é
possível o acesso.
5
Na aba “Personal Feed” é possível ver as suas últimas criações
utilizando a IA, como também é possível ver as artes que você curtiu como
também um feed com as criações dos perfis que você seguiu no site.
Figura 5: Aba Personal Feed
6
Por fim, temos a aba “Finetuned Models”, onde conseguimos ver
várias opções de modelos de criação de arte, que funcionam como
datasets pré-definidos com um estilo específico de imagem, onde o
mesmo prompt gerado com modelos diferentes resultarão em estilos
diferentes.
Figura 7: Aba Finetuned Models
7
Além dos disponibilizados pelo próprio site, também há os modelos
feitos pela comunidade, a partir dos treinamentos por Datasets de outros
usuários incluindo você.
Figura 9: Modelos da comunidade
8
5.1. Sistema de Tokens
9
5.2. Barra lateral de opções:
5.2.1. Number of Images
Na esquerda temos diversas opções para criar nossas imagens, como
“Number of Images”, onde escolhemos quantas imagens vamos gerar a
partir do mesmo prompt.
Figura 11: Número de imagens
10
5.2.3. Prompt Magic & High Contrast
Além disso, há a função “Prompt Magic”, que faz com que a IA
otimize melhor o output do prompt inserido, utilizar esta opção multiplica
o custo de tokens da sua criação em 2 (dois), o sistema de tokens será
explicado mais adiante, o impacto desta opção é tão grande que é
recomendado deixar a mesma ativa sempre, segue um exemplo de
imagens geradas onde acima a opção está ligada e embaixo a desligada,
seguindo o mesmo prompt de comando:
Figura 13: Exemplo de Prompt Magic ligado
11
5.2.4. Guidance Scale e Tiling
Mais abaixo, temos a opção de “Guidance Scale”, que controla o
quanto o processo de geração de imagem segue o texto inserido no
prompt, sendo controlável e variando a força entre 1 e 20, porém, valores
muito altos ou muito baixos podem acabar causando irregularidades nas
imagens mesmo se o “Prompt Magic” estiver habilitado, então é
recomendado pelo site utilizar com o valor de 7 (sete).
Figura 15: Função Guidance Scale
12
de 2x na quantidade de tokens por imagem. Ainda é possível alterar o
“Image Weight”, que faz com que a criação se pareça mais com a imagem
de referência, também é possível alterar o “Prompt Magic Strenght”, que
modifica o quanto a função “Prompt Magic” também influência na criação.
Figura 17: Image Prompt
13
A função “Image to Image” também habilita o “ControlNet”, que
influencia as criações baseado em fatores da imagem inserida no “Image
to Image”, como a pose da imagem, a profundidade e os contornos,
também é possível utilizar o “ControlNet Weight” para regular o peso do
quanto esses fatores vão influenciar.
Figura 19: Control Net
5.2.6. Seeds
Por fim, na parte de “Advanced Settings”, temos a opção de “Fixed
Seed” a qual podemos utilizar a semente utilizada para gerar outra
imagem como base para gerar outras imagens, muito útil para gerar
imagens a partir de outras, como no “Image to Image”.
Figura 20: Função Fixed Seed
14
inglesa. É imperativo salientar também que quanto mais preciso for a
descrição, melhor será o resultado da imagem, então não hesite em
inserir detalhes. Ainda há a opção de “Negative Prompt”, que permite você
adicionar um prompt secundário de elementos que você não deseja em
sua arte, a qual a IA irá contornar.
Figura 21: Menu de Prompt
15
Por fim, temos a opção de “Prompt Generation”, aonde a IA vai gerar
sugestões de prompts mais detalhados e complexos (ideais para imagens
precisas) partir de um prompt básico digitado pelo usuário, interessante
quando você tem ideias, mas não sabe como colocar descrever para a IA,
porém cuidado, você só tem direito a 1000 Prompt Generation.
Figura 23: Menu de Prompt Generation
16
5.3.2. Unzoom e Remove Background
17
5.3.3. Upscaling
18
Figura 28: Smooth Upscaling
19
Por fim, no plano gratuito temos o “Upscale Image Alternate”, que
além de melhorar a resolução, refaz alguns detalhes da imagem original,
como sendo uma imagem “alternativa”.
Figura 30: Alternative Upscaling
20