Visao Computacional Nas Midias Sociais e

Visão Computacional nas Mídias Sociais:
estudando imagens de #Férias no Instagram1
Tarcízio Silva2
Brunno Apolonio3
Pedro Meirelles4
Resumo: Recursos de inteligência artificial, tais como processamento de linguagem natural e

reconhecimento de imagens, estão ficando cada dia mais acessíveis graças ao oferecimento das
APIs (ou Interface de Programação de Aplicações) de serviços de computação em nuvem, tais
como Google Cloud Platform, IBMWatson, Microsoft Azure e Amazon Web Services. Este
artigo apresenta contextualização, discussão e aplicação de um serviço de reconhecimento de
imagens, através de scripts Python, à pesquisa de mercado nas mídias sociais através do estudo
de cerca de 8,5 mil imagens publicadas com a hashtag #férias no Instagram. Como resultado,
apontamos a relevância dos recursos na compreensão de uma esfera de comportamento relevante
para segmentos de marketing turístico, entretenimento e consumo.
Palavras-chave: reconhecimento de imagens; inteligência artificial; Google Vision; Instagram;

mídias sociais
MÍDIAS SOCIAIS, DADOS E INTELIGÊNCIA
A análise de dados aplicada a fins mercadológicos explodiu em frequência e escopo nos

últimos 15 anos, graças ao aumento da oferta de traços e rastros deixados por cidadãos e
consumidores na internet, particularmente nas mídias sociais. Kennedy (2016) revisa definições
1
Artigo enviado para o I Encontro Norte e Nordeste da ABCiber no GT Comunicação Organizacional.
2
Mestre em Comunicação pela Universidade Federal da Bahia, Diretor de Pesquisa e Cofundador do Instituto Brasileiro de
Pesquisa e Análise de Dados. Email: tarcizio@ibpad.com.br
3
Graduado em Publicidade e Propaganda pela Universidade da Amazônia e Pesquisador no IBPAD. Email:
brunnoapolonio@gmail.com
4
Graduado em Estudos de Mídia pela Universidade Federal Fluminense e Pesquisador no IBPAD. Email:
pedrorcmeirelles@gmail.com
de mídias sociais focando nas características definidoras de participação, compartilhamento,
intimidade e monetização construídas nas plataformas. A convergência destas características
transforma radicalmente as possibilidades de medição, análise e acionamento das realidades
sociais através da dataficação de mais e mais esferas sociais:
“a dataficação das coisas que não eram previamente dados e a abertura das APIs
das mídias sociais, que permitem acesso à sua matéria, não apenas torna a
lógica de mídias sociais difusiva como também torna a mineração de dados de
mídias sociais uma possibilidade real para muito mais atores comuns que
podem acessar outras formas de dados e participar na sua mineração”5
(KENNEDY, 2016, p. 38)
Em torno do mundo, a mineração de dados em mídias sociais tem sido utilizada por
pesquisadores acadêmicos e de mercado para estudar os mais diferentes fenômenos, tais como
controvérsias online sobre questões sociais - os direitos das mulheres, por exemplo (BATISTA et
al, 2016), epidemiologia (RABELLO et al, 2018), o papel das mídias sociais em eventos
históricos - na Guerra da Síria, por exemplo (LYNCH et al, 2014), o monitoramento sobre
questões de saúde pública (CORLEY et al, 2010) e até mesmo a construção de um “índice de
felicidade” automatizado a partir de tweets (DODD & DANFORTH, 2010), entre outros.
Em seus desdobramentos estritamente mercadológicos, a mineração de dados em mídias

sociais engendrou o mercado referenciado através de termos como “monitoramento de mídias
sociais” (SILVA, 2010), social listening (MACNAMARA, 2015), ou até neologismos como
“social big data” (GUELLIL & BOUKHALFA, 2015). A construção deste mercado vai muito
além do que é oferecido automaticamente pelas plataformas como Facebook, YouTube e afins
em seus sistemas de anúncios, gerando categorias específicas de atores organizacionais e práticas
de análise. Este mercado inclui data brokers (como GNIP e Datasift); ferramentas de
monitoramento e coleta de dados acadêmicas (Netlytic, Netvizz, NodeXL, Uberlink e outras) e
comerciais (Sysomos, Sprinklr, Stilingue, Scup, etc.); empresas especializadas na análise e
interpretação dos dados (IBPAD, Scup, f.biz, Isobar, etc.); além das próprias organizações
comerciais interessadas nos resultados. Tais atores estão frequentemente ávidos pela construção
e aplicação de novas metodologias de pesquisa, comumente adaptadas de inovações acadêmicas,
como foi o caso da análise de redes e visualização de grafos (cf. SILVA, 2017).
5
“datafication of things that were not previously data and the openness of social media APIs, which allows access to
datafied matter, not only make social media logic pervasive but also make social media data mining a real possibility for many
more ordinary actors than can access other forms of data and engage in their mining” (tradução nossa, 2018).
2
Inúmeras metodologias e abordagens são aplicadas aos dados de mídias sociais, tais como
métricas e mensuração quantitativa com a aplicação de estatística descritiva; análise de
conteúdo; análise de texto; etnografia; análise de redes e hyperlinks; análise geoespacial e outras
(cf. FRAGOSO, RECUERO & AMARAL, 2011; ACKLAND, 2013; HALFPENNY &
PROCTER, 2015; SLOAN & QUAAN-HAASE, 2017). Algumas das fronteiras ainda presentes
para as práticas mercadológicas de análise de dados em mídias sociais são delimitadas pela
dificuldade com a coleta, manejo e análise de imagens, como fotografias.
A tipologia oferecida por Laestadius (2017) de estudos no Instagram propõe quatro

abordagens. As primeiras, abordagens quantitativas, são estudos de big data que se calcam
sobretudo na capacidade computacional das ferramentas de processamento para analisar padrões
de uso, utilização de tags, likes, comentários e hashtags, além de metadados. Amostras pequenas
(small data) combinadas com abordagens qualitativas, análise, codificação e interpretação das
imagens e textos de amostras humanamente gerenciáveis valoriza a granularidade na segunda
abordagem. A terceira, por sua vez, trata do estudo dos significados e apropriação da plataforma
Instagram através da interação direta com os usuários (através de entrevistas, questionários
grupos focais, etnografia, etc.).
Por fim, as abordagens das Humanidades Digitais trazem similaridades com a abordagem
quantitativa, mas aqui a distinção está em duas variáveis únicas: 1) são aplicadas técnicas de
computação visual e processamento de imagens para focar na mídia visual em si e não apenas
nos metadados; 2) como resultado frequente, visualizações interativas permitem o leitor interagir
com os conteúdos e padrões de forma viva. Segundo Laestadius, “Uma vez coletadas,
processadas, e visualizadas, imagens podem ser mapeadas e organizadas [...] para descobrir
novos padrões. Muito desses dados podem ser gerados automaticamente utilizando técnicas de
reconhecimento de imagem, enquanto outros itens devem ser criados ou validados
manualmente”6 (LAESTADIUS, 2017, p.580). Como aponta a autora, o trabalho de Manovich é
uma dos exemplos mais famosos e característicos desta quarta abordagem. Segundo o autor, “a
análise computacional de grandes amostras de conteúdo em plataformas de mídia como o
Instagram pode quantificar várias estratégias e padrões fotográficos, de design e de narrativa dos
6
“Once collected, processed, and visualized, images can be mapped and sorted [...] to discern novel patterns. Much of
this data can be generated automatically using image recognition techniques, while other items must be created or validated by
hand” (tradução nossa, 2018).
3
usuários”7 (MANOVICH, 2017, p.22). Em diversos trabalhos, abordagens similares aplicaram
técnicas como estas ao estudo de selfies através de diferentes culturas (TIFENTALE &
MANOVICH, 2015), protestos de ativistas (MANOVICH, TIFENTALE & YAZDANI, 2014),
mapeamento semântico e geoespacial de cidades (RYKOV et al, 2016; REDI et al, ) entre outros.
Porém, ao falarmos da comunicação mercadológica, em um panorama que o uso de

fotografias, ilustrações, memes visuais e conteúdo audiovisual ganha cada vez mais espaço,
como incluir as imagens como fonte de dados de forma criativa e escalável? Como aponta
Zandavalle (2018), os estudos públicos com fins mercadológicos sobre imagens de mídias
sociais ainda são raros. Apontamos, como principais motivos, três pontos: a escassa capacitação
teórico-metodológica em métodos de pesquisa, assim como capacidade computacional; o alto
valor necessário, em termos de recursos humanos, para codificação e análise de imagens; e o
caráter ainda recente de tecnologias que apoiem a classificação automatizada.
No atual contexto, que permite a aplicação de recursos de computação visual de um modo

mais acessível, como veremos a seguir, urge a necessidade, pelos comunicadores, da
apropriação, crítica e desenvolvimento de produtos de inteligência com aqueles recursos.
Descreveremos os conceitos e aplicações básicas da visão computacional para, em seguida,
apresentar estudo de caso desenvolvido pelos autores.
VISÃO COMPUTACIONAL: CONCEITOS E POSSIBILIDADES
A chamada “Visão Computacional” se refere à coleta, análise e síntese de dados visuais

através de computadores, com objetivos diversos como a identificação de rostos e biometria, a
análise de representações de objetos, entidades, conceitos e contextos em imagens, entre outros
(WANG, ZHANG & MARTIN, 2015). Tem sido aplicada em variadas áreas da indústria,
serviços e comércio para fins relacionados a controle e gestão, monitoramento, otimização de
logística e afins. Na área das Comunicações, como os mercados publicitários e de gestão da
comunicação organizacional, ainda são raras as aplicações.
As exceções – de larga escala – são os usos pervasivos destes recursos nas plataformas de
mídias sociais tais como Facebook, que utilizam recursos de computação visual para filtrar
7
“computational analysis of large samples of content on media platform such as Instagram can quantify many
photographic, design, and narrative user strategies and patterns” (tradução nossa, 2018).
4
conteúdo violento, pornográfico ou malicioso, além de aplicações para gerar mais engajamento e
tempo de visita dos usuários, como o reconhecimento de rostos de amigos em fotografia.
Entretanto, nos últimos anos, grandes empresas de tecnologia passaram a ofertar seus
serviços de inteligência artificial, aprendizado de máquina e análise estatística massiva através de
APIs (Application Programming Interfaces – Interfaces de Programação de Aplicações), que
permitem que desenvolvedores e analistas “pluguem” as capacidades destas empresas em seus
próprios projetos, a custos aplicados sob demanda. Quanto à computação visual e
reconhecimento de imagens, os recursos foram lançados nos últimos quatro anos, tais como
Imagga e Alchemy (2014), Google Cloud Vision, IBMWatson Visual Insights e Clarifai
(lançados em 2015), Amazon Rekognition (2016), Microsoft Computer Vision (2017).
A consultora Susan Etlinger chama de inteligência imagética (image intelligence) “a

habilidade de extrair significados de imagens, detectar padrões e usar esses insights em
conjunção a outros dados para fazer previsões sobre o futuro” (ETLINGER, 2016, p.13). A
autora aponta seis áreas para geração de valor a partir da análise de conteúdo visual: Inovação;
Saúde de Marca; Otimização de Marketing; Geração de Receita; Performance Operacional;
Experiência do Consumidor. As aplicações são inúmeras nestas áreas e podemos destacar:
marketing de conteúdo gerado pelo consumidor que permite “conteúdo de fonte coletiva, seja de
shows, eventos esportivos, cotidiano, e depois obter conteúdo de fãs, clientes e fotógrafos para
uso criativo ou em comércio digital”8 (ETLINGER, 2015, p.19); afinidades de marca, ao
identificar “maneiras interessantes nas quais clientes/consumidores utilizam seu produto de
maneira na qual você nunca planejou, e como eles o associam com outra coisa” 9 (ETLINGER,
2015, p.19); ou ainda analisar o storytelling, ao comparar “imagens de uma marca ao passar do
tempo para identificar mudanças visuais na história da marca”10 (ETLINGER, 2015, p.18).
Para o estudo em questão, foi escolhida por conveniência a aplicação da plataforma de

recursos de computação visual chamada Google Vision. Em seu website, a apresentação dos
serviços possíveis de inteligência de imagens é bem clara, com a possibilidade aberta, a qualquer
visitante, de realizar um “teste” da API. Como exemplo, as imagens 1 e 2 abaixo representam,
8
“crowdsource content, whether from concerts, sporting events, daily life, then obtain content from fans, customers
and photographers for use in creative or in digital commerce” (tradução nossa, 2018)
9
“interesting ways in which customers/consumers use your product in ways you never intended, and how they may
pair it with something else” (tradução nossa, 2018).
10
“images of a brand over time to identify visual changes in the brand story” (tradução nossa, 2018).
5
respectivamente, a identificação de Labels (Marcadores) e Web Labels (Marcadores Web) de
uma imagem extraída de nosso próprio conjunto de dados11.
Figura 1: Resultados na Google Vision API na opção Labels (Marcadores).
Figura 2: Resultados na Google Vision API na opção Web Labels (Marcadores Web).
Como pudemos ver acima na Figura 1, na categoria Labels, o recurso consegue

identificar categorias e conceitos como Paisagem Urbana (Cityscape), Cidade (City), Área
Urbana (Urban Area), Sky (Céu), Monumento (Landmark), Torre (Tower) e outros com alta
precisão. Esta lista de marcadores se baseia apenas na análise da imagem em si, independente de
contexto e referências. Por sua vez, a opção Web Labels (Figura 2) utiliza informações
11
Foto do blog “Vou na Janela”, publicada em seu perfil no Instagram de mesmo nome.
6
semânticas na web retiradas do contexto (websites) onde a foto e fotos visualmente similares
foram publicadas, conseguindo identificar também itens como bairros e endereços neste caso.
A Google Vision ainda oferece recursos de reconhecimento de texto, propriedades de cor,

sugestão de recorte, descoberta e contagem de rostos, posicionamento dos rostos, busca por
imagens iguais e visualmente semelhantes na web e outros.
Como pudemos inferir através dos exemplos, a amplitude de aplicações do

reconhecimento de imagens envolve tanto a identificação para fins de contabilização e controle
quanto a identificação para fins de descoberta. É útil aqui a proposta de Mintz (2016), que
apresenta diferenciação analítica entre dois modos de operação da visão computacional. O
primeiro, que estaria mais associado aos campos de vigilância, seleção e monitoramento no
sentido estrito, é chamado pelo autor de operações de localização-acionamento. O
reconhecimento de imagens para fins policiais, por exemplo, aproxima-se deste conjunto de
operações, uma vez que busca ligar a descoberta de indivíduos em determinado espaço físico
ligado a também determinadas ações e eventos que se tornam suscetíveis à ligação criminal, de
responsabilidade ou simplesmente de controle, como marcação de corpos em pontos de fluxo e
registro como aeroportos. Poderíamos dizer que o campo de monitoramento de imagens através
da identificação de logotipos aproxima-se deste modo, uma vez que os objetivos de
comunicadores é comumente encontrar “pontos cegos” do monitoramento de mídias sociais. Ao
mesmo tempo reforça a impressão o fato de que um consumidor, ao postar uma foto de um tênis
que tenha a marca Nike visualmente, mas não marcada ou com a hashtag correspondente não
está, explicitamente, querendo ser “visto” pela corporação.
O segundo modo apontado por Mintz é chamado de reconhecimento-conexão, debruçado

sobre o espaço delimitado pela imagem em si, através apenas de seu dispositivo de registro
(como câmera fotográfica) ou produção (ilustração, pintura, etc.). Para o autor, trata-se de
“reconhecer padrões registrados pela imagem (como rostos e objetos) e conectá-los a redes
semânticas de dimensões variáveis, pela qual os programas realizam diferentes percursos
interpretativos do visível” (MINTZ, 2016, p. 160). Neste sentido, as redes semânticas podem ser
exploradas pelos analistas de comunicação e marketing com fins de estudar um universo de
atividades – férias, no caso de nosso estudo a seguir.
7
ESTUDANDO #FÉRIAS NO INSTAGRAM
Como estudo de caso de realização de produto de inteligência comercial baseado na

computação visual, apresentamos estudo realizado pelo IBPAD partindo das seguintes questões
de pesquisa: como usar a computação visual para entender como os brasileiros representam as
férias no Instagram e qual sua relevância para estudos de mídias sociais?12. A relevância da
imagem do produto turístico (localidade, transporte aéreo, hotelaria, atração, etc.) é essencial no
momento de consideração da viagem:
a imagem de um produto turístico, a maneira pela qual o produto é apresentado
ou sua promessa básica são fundamentais para a decisão de compra do turista,
que compra uma experiência impossível de ser avaliada, antes de ser
efetivamente vivida. Ele compra, na maioria das vezes, uma imagem que
significa uma promessa de performance (NOGUEIRA, 2016, p.11).
Durante o processo de compra, os dois domínios básicos de sentido da imagem como
representação se confundem – como a abordagem acima da imagem em torno da representação
mental intangível (visões, fantasias, imaginações e modelos) e as imagens como representações
visuais em seus aspectos tangíveis em formatos específicos, como fotografias publicadas no
Instagram. Estas imagens que circulam nas mídias sociais produzidas por usuários comuns
construindo suas representações da atividade “férias” cria pontos de criação de desejo e normas
de consumo, “em virtude de o produto turístico compor-se de elementos e percepções
intangíveis, sendo sentido como experiência” (NOGUEIRA, 2016, p.37).
Com estas questões e pressupostos em mente, a ferramenta Netlytic foi utilizada para
coletar imagens publicadas com a hashtag #férias no Instagram, resultando nas informações,
métricas e URLs de cerca de 10 mil imagens. Em seguida, depois da limpeza do dataset, o
arquivo .csv resultante foi processado através do script Memespector originalmente desenvolvido
por Bernard Rieder (2017) e adaptado para Python por Mintz (2017a), para consultar a API da
Google Vision através de procedimentos metodológicos propostos por Mintz (2018). As imagens
acessíveis publicamente totalizaram 8.591 imagens processadas.
Com o processamento das imagens no Instagram através do script, cada linha de dados
referente a uma imagem recebe novas camadas informacionais a depender dos recursos
solicitados para processamentos, tais como Marcadores, Marcadores Web, Detecção de
Logotipos, Detecção Facial, etc.
12
O estudo completo em formato de apresentação pode ser acessado em https://www.ibpad.com.br/blog/comunicacao-
digital/estudando-imagens-com-inteligencia-artificial-ferias-nas-midias-sociais
8
Figura 3: Exemplo de marcadores (Labels) atribuídas às imagens através da Google Vision API.
Os dados resultantes na planilha anotada (Figura 3) possuem inúmeras aplicações para o

analista de comunicação e marketing. O mais simples trata simplesmente do resgate de imagens
que contenham um determinado aspecto. Por exemplo, as imagens que incluam “neve” podem
ser comparadas às imagens sobre “mar” em categorias quantitativas ou qualitativas. Também é
simples a quantificação destes marcadores, de modo que representem os objetos, conceitos e
entidades mais salientes sobre determinada atividade.
A proximidade dos marcadores nas fotos permite encontrar agrupamentos de entidades e

temas nas imagens analisadas. Através da lógica relacional dos dados, a co-ocorrência dos
marcadores nas mesmas fotos os aproximam, permitindo construir redes bi-modais, composta de
ligações entre nós que representam imagens e nós que representam os marcadores. A Figura 4
abaixo mostra alguns dos marcadores posicionados em visualização do Gephi.
Figura 4: Detalhe da rede bi-modal entre imagens e marcadores, visualizada no Gephi. Os rótulos sem legenda
representam links para as imagens coletadas e processadas.
Uma vez que esta rede foi construída, unindo imagens e marcadores de acordo com suas
similaridades conceituais, foi aplicado o script Imagenet Plotter (Mintz, 2017b) que acessa as
imagens coletadas e os dispõe em uma página para a exploração e visualização posterior, em um
9
arquivo vetorial de extensão SVG, que pode ser aberto e editado em programas como Inkscape e
Adobe Illustrator. Como os nós foram distribuídos com o recurso do algoritmo Force Atlas 2 do
Gephi, a visualização dispõe as imagens de forma significante, permitindo ao analista descobrir
os agrupamentos temáticos de forma quase intuitiva.
A visualização resultante pode ser vista na Figura 5, já com as indicações dos

agrupamentos descobertos. Ao menos 13 clusters puderam ser identificados na rede: Selfies em
Paisagens; Selfies no Lar e Close Up de rostos; Praia, Mar e Piscinas; Consumo na Praia;
Arquitetura Turística; Pôr-do-Sol; Mobilidade; Cachoeira / Trilhas; Modas / Trajes de Banho;
Feiras; Alimentação; Bebidas; Cachorros e Pets.
Figura 5: Rede de Imagens resultante da análise, com as temáticas agrupadas em destaque.
Vale destacarmos como a análise automatizada das imagens e decorrente agrupamento

pode permitir o surgimento de recortes analíticos posteriores para os profissionais de
comunicação. O agrupamento de Bebidas, por exemplo, traz evocações dos usuários ao lazer
10
mais acessível e à quebra da rotina de regulação de horários. Em um contexto de mercado, o
entendimento da relação de consumo de bebidas com momentos de lazer tem potencial para as
marcas identificarem em quais contextos elas estão sendo consumidas e a percepção das pessoas
com relação ao produto.
O período de férias está bastante associado com viagens e passeios de todos os tipos, e é
possível perceber as tipologias de destinos/atrações mais presentes: centros históricos das
cidades, prédios ou monumentos importantes, parques, lagoas, montanhas, rios,
casa/sítio/fazenda construídos para momentos de lazer. Muitas das fotos para viagens na Europa
se agrupam nesse cluster, devido à surpresa de viajantes ao se depararem com estilos clássicos de
arquitetura e prédios históricos, além de condições climáticas que podem apresentar novas
experiências para quem vive em regiões com climas diferentes.
É interessante também perceber as potenciais aplicações desse tipo de estudo para a

auxiliar a gestão pública, principalmente àquelas ligadas ao turismo e planejamento urbano e
bem-estar social, uma vez que a análise de conteúdo no Instagram tem potencial para apontar
características de usufruto da cidade e análise de sentimentos a partir da visão centrada no ser
humano - os próprios cidadãos. Alguns estudos já demonstram a utilização de monitoramento de
mídias sociais, em especial em ferramentas de microblogging, como o Twitter, para entender os
potenciais deste métodos de pesquisa para estudar as cidades (HOLLANDER et al, 2016).
A presença de imagens com meios de locomoção está ligada a meios para chegar ou
voltar de viagens e passeios, como carros na estrada, ônibus e avião. A descoberta de marcadores
de meios de transporte através da Google Vision permitiu a clusterização destas imagens, fonte
rica para compreensão da construção da experiência de viagem e turismo em várias fases desta
jornada e não necessariamente com foco na principal atração. E ainda que o cluster “mobilidade”
pareça elementar, é preciso levar em consideração que “os aspectos visuais no planejamento
destas experiências são fontes de inspiração e informação para a tomada de decisões referentes
às fases da jornada que antecedem a viagem” (TERTUNNEN, 2016, p. 53) - respondendo a
questões como “qual é o meio de transporte mais comum no local de origem? como se
parece?”) -; nas horas seguintes após a fotografia ser feita, ou após o retorno para a cidade de
origem, com destaque para a associação das hashtags #tbt a #férias, usadas em conjunto para
lembrar de uma sensação vivida durante o período e que servem de referência para outras
pessoas que podem estar interessadas nos destinos e atrações presentes imagens.
11
Há também a esfera na qual o próprio meio de locomoção faz parte do evento, como é o
caso de road trips e passeios de buggy em praias (que podem ser acessadas para responder a
questões como “qual é qualidade do conforto no percurso? o trajeto é visualmente convidativo?
como as pessoas dizem se sentir?”), bem como para os amantes de corridas e passeios de
moto/bicicleta com aspirações semi-profissionais e que vão além dos passeios casuais, pois
demonstram certo preparo - seja físico ou de equipamentos.
A partir da análise conseguimos identificar as principais temáticas visuais relacionadas ao

usufrutos das férias por meio de treze agrupamentos principais e a partir disso entender algumas
peculiaridades de comportamento do brasileiro com este momento, como por exemplo a forte
presença de imagens em praias e balneários, que está ligado a geografia brasileira - para citar
apenas um fator; identificar e elaborar potenciais relações de consumo que podem ser analisadas
com maior foco em determinadas categorias, a exemplo de “moda praia” e “gastronomia”; e
enxergar com mais clareza a aplicabilidade da computação visual para o desenvolvendo
hipóteses que possam gerar futuros estudos focados na compreensão do usos de espaços públicos
e na percepção de bem estar social a partir de narrativas visuais geradas pelos usuários.
CONSIDERAÇÕES FINAIS
Técnicas para realização de análise automatizada de imagens através de recursos como

Google Vision API e similares abrem novas fronteiras tecnológicas para os profissionais de
comunicação e marketing. Compreender o modo pelo qual estes recursos prontos podem ser
utilizados para a construção de produtos de inteligência analítica, resumo, descrição e síntese de
grandes volumes de dados pode gerar a incorporação criativa da inteligência artificial e
computação visual no cotidiano do analista de comunicação.
A metodologia também ganha relevância no contexto cada vez mais visual que se faz
presente nas mídias sociais, visto que as marcas devem se preparar para um cenário no qual a já
consolidada análise textual deve seguir paralela à métodos de pesquisa relacionados a imagens.
Nesse cenário, as técnicas aqui apresentadas também podem - e devem - ser adaptadas à análise
visual de vídeos, utilizando como base as sequências de frames que compõe uma obra
audiovisual. Esta é uma possibilidade bastante interessante que já tem, em trabalhos internos,
gerado frutos de inteligência estratégica para clientes dos mais diversos segmentos.
12
Por fim, porém não menos importante, atentamos também para as limitações e os perigos
da utilização de APIs em temáticas sensíveis e/ou complexas demais. A técnica de machine
learning, utilizada pela Google Vision e demais ferramentas citadas neste trabalho, segue um
pressuposto de aprendizado constante que, muitas vezes, pode não dar conta da complexidade
sociocultural de teias de significados a qual se amarram os seres humanos. Ao mesmo tempo,
vale ratificar também o quanto esse contexto abre espaço para a replicabilidade de valores e
preconceitos interiores àqueles que desenvolvem este trabalho. Vários casos já foram noticiados
de como máquinas e produtos de inteligência artificial atuam dentro da estrutura social que
sustenta a opressão de certos grupos em comparação a outros. Na academia, pesquisadores
responsáveis têm dedicado seus trabalhos à investigação dessa “nova” forma de opressão
(NOBLE, 2018).
Isso significa, na prática, que especificidades culturais de grupos específicos ficar de fora
da lista de interpretações que a máquina já desenvolveu. Isso abre espaço para uma realidade na
qual a inteligência das máquinas terá que ser abastecida por pessoas reais que, em sua total,
plural e complexidade, consigam ensiná-las as nuances de diferentes culturas. A ideia de
machine teaching se soma aos poucos à popularização do machine learning e abre
oportunidades, ameaças e demandas tanto mercadológicas quanto éticas aos profissionais da
comunicação e ciências sociais aplicada.
REFERÊNCIAS
ACKLAND, Robert. Web social science: Concepts, data and tools for social scientists in the digital age. Sage, 2013.
BATISTA, Deborah C.; SILVA, Tarcízio; STABILE, Max; PAEZ, Paula C.; KEARNEY, Matthew C.. Insights from Social
Media on Gender in Latin America. Inter-American Development Bank, 2017.
CORLEY, C.D.; COOK, D.J.; MIKLER, A.R.; SINGH, K.P. Text and Structural Data Mining of Influenza Mentions in Web and
Social Media. Int. J. Environ. Res. Public Health 2010, 7, 596-615.
DODDS, Peter Sheridan; DANFORTH, Christopher M. Measuring the happiness of large-scale written expression: Songs, blogs,
and presidents. Journal of happiness studies, v. 11, n. 4, p. 441-456, 2010.
ETLINGER, Susan. Image Intelligence: Making Visual Content Predictive. Altimeter Group. Online. Disponível em:
<https://www.prophet.com/2016/07/image-intelligence-making-visual-content-predictive>
FRAGOSO, Suely; RECUERO, Raquel; AMARAL, Adriana. Métodos de pesquisa para internet. Porto Alegre: Sulina, v. 1,
2011.
GUELLIL, Imene; BOUKHALFA, Kamel. Social big data mining: A survey focused on opinion mining and sentiments analysis.
In: Programming and Systems (ISPS), 2015 12th International Symposium on. IEEE, 2015. p. 1-10.
HOLLANDER, Justin; GRAVES, Erin.; RENSKI, Henry.; FOSTER-KARIM, Cara.; WILEY, Andrew; DAS, Dibyendu. Urban
Social Listening Potential and Pitfalls for Using Microblogging Data in Studying Cities. Palgrave Macmillan, London, 2016.
13
KENNEDY, Helen. Post, Mine, Repeat. Ebook: Palgrave Macmillan, 2016.
LAESTADIUS, L. Instagram. IN: A. Quan-Haase et L. Sloan (org.). The SAGE Handbook of Social Media Research Methods,
Sage Publications: Thousand Oak, 2017.
LYNCH, Marc; FREELON, Deen; ADAY, Sean. Syria's Socially Mediated Civil War. United States Institute of Peace,
Washington: 2014. Disponível em https://www.usip.org/sites/default/files/PW91-
Syrias%20Socially%20Mediated%20Civil%20War.pdf
MACNAMARA, J. Creating an ‘architecture of listening’ in organizations: The basis of engagement, trust, healthy
democracy, social equity, and business sustainability. Sydney, NSW: University of Technology Sydney, 2015.
MANOVICH, Lev. Instagram and Contemporary Image. Disponível em http://manovich.net/content/04-projects/147-
instagram-and-contemporary-image/instagram_book_manovich.pdf
MANOVICH, Lev et al. The exceptional and the everyday: 144 hours in kiev. In: Big Data (Big Data), 2014 IEEE
International Conference on. IEEE, 2014. p. 72-79.
MINTZ, André. Máquinas que veem: visão computacional e agenciamentos do visível. In: MENOTTI, Gabriel; BASTOS,
Marcus; MORAN, Partrícia (orgs.). Cinema apesar da imagem. São Paulo: Intermeios, 2016.
MINTZ, André. Memespector. Software. Disponível no Github em < https://github.com/amintz/memespector-pythonr>. 2017a.
Acesso em abril de 2018.
MINTZ, André. Imagenet plotter. Software. Disponível no Github em < https://github.com/amintz/imagenet-plotter-py> 2017b.
MINTZ, André. Image Networks: Automated Analysis of Visual Content. Workshop realizado no #DigitalMedia Winter
Institute, promovido pelo iNOVA Media Lab. Lisboa, Portugal, 2018.
NOBLE, Safiya Umoja. Algorithms of Oppression: How search engines reinforce racism. NYU Press, 2018.
NOGUEIRA, Adinan. A Imagem no Marketing Turístico: conceitos metodologias de medição. São Paulo: Clube dos Autores,
2016.
RABELLO, Elaine T.; MATTA, Gustavo C. Visualising engagement on Zika epidemic. Online, 2018. Disponível em:
https://smart.inovamedialab.org/smart-2018/project-reports/visualising-engagement-on-zika-epidemic/
REDI, Miriam; CROCKETT, Damon; MANOVICH, Lev; OSINDERO, Simon. What Makes Photo Cultures Different?.
In: Proceedings of the 2016 ACM on Multimedia Conference. ACM, 2016. p. 287-291.
RIEDER, Bernhard. Memespector. Software. Disponível no Github em < https://github.com/bernorieder/memespector>. 2017.
RYKOV, Yuri; NAGORNYY, Oleg; KOLTSOVA, Olessia; NATTA, Herbert; KREMENETS, Alexander; MANOVICH, Lev;
CERRONE, Damiano; CROCKETT, D. Semantic and Geospatial Mapping of Instagram Images in Saint-Petersburg. power, v.
2607, p. 75, 2016.
SILVA, Tarcízio. Monitoramento de Marcas e Conversações: alguns pontos para discussão. In: SILVA, Tarcizio et al.
#MidiasSociais: perspectivas, tendências e reflexões. Florianópolis: Bookess, 2010.
SILVA, Tarcízio; STABILE, Max (org.). Pesquisa e Monitoramento de Mídias Sociais: metodologias, aplicações e inovações.
São Paulo: Uva Limão, 2016.
SILVA, Tarcízio. Inovação em Software as a Service: funcionalidades em ferramentas de monitoramento de mídias
sociais. Animus. Revista Interamericana de Comunicação Midiática, v. 16, n. 31, 2017.
TERTTUNEN, Anna. The influence of Instagram on consumers’ travel planning and destination choice. Tese de Mestrado
na University of Applied Sciences Haaga-Helia, 2017.
TIFENTALE, Alise; MANOVICH, Lev. Selfiecity: Exploring photography and self-fashioning in social media. In: Postdigital
Aesthetics. Palgrave Macmillan, London, 2015. p. 109-122.
VAN RAAIJ, W. Fred; FRANCKEN, Dick A. Vacation decisions, activities, and satisfactions. Annals of Tourism Research, v.
11, n. 1, p. 101-112, 1984.
WANG, JuHong; ZHANG, SongHai; MARTIN, Ralph R. New advances in visual computing for intelligent processing of visual
media and augmented reality. Science China Technological Sciences, v. 58, n. 12, p. 2210-2211, 2015.
ZANDAVALLE, Ana Claudia. O mercado de inteligência de mídias sociais. In: SILVA, Tarcízio; STABILE, Max (org.).
Pesquisa e Monitoramento de Mídias Sociais: metodologias, aplicações e inovações. São Paulo: Uva Limão, 2016.
14
ZANDAVALLE, Ana Claudia. Análise de Dados Visuais no Instagram: perspectivas e aplicações. IN: SILVA, Tarcízio;
BUCKSTEGGE, Jaqueline (orgs.). Estudando Cultura e Comunicação com Mídias Sociais. Brasília: IBPAD, 2018. (no
prelo).
15

Visao Computacional Nas Midias Sociais e

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Visao Computacional Nas Midias Sociais e

Enviado por

Direitos autorais:

Formatos disponíveis

Visão Computacional nas Mídias Sociais:

estudando imagens de #Férias no Instagram1

Resumo: Recursos de inteligência artificial, tais como processamento de linguagem natural e

Palavras-chave: reconhecimento de imagens; inteligência artificial; Google Vision; Instagram;

MÍDIAS SOCIAIS, DADOS E INTELIGÊNCIA

A análise de dados aplicada a fins mercadológicos explodiu em frequência e escopo nos

Em seus desdobramentos estritamente mercadológicos, a mineração de dados em mídias

A tipologia oferecida por Laestadius (2017) de estudos no Instagram propõe quatro

Porém, ao falarmos da comunicação mercadológica, em um panorama que o uso de

No atual contexto, que permite a aplicação de recursos de computação visual de um modo

VISÃO COMPUTACIONAL: CONCEITOS E POSSIBILIDADES

A chamada “Visão Computacional” se refere à coleta, análise e síntese de dados visuais

A consultora Susan Etlinger chama de inteligência imagética (image intelligence) “a

Para o estudo em questão, foi escolhida por conveniência a aplicação da plataforma de

Figura 1: Resultados na Google Vision API na opção Labels (Marcadores).

Como pudemos ver acima na Figura 1, na categoria Labels, o recurso consegue

A Google Vision ainda oferece recursos de reconhecimento de texto, propriedades de cor,

Como pudemos inferir através dos exemplos, a amplitude de aplicações do

O segundo modo apontado por Mintz é chamado de reconhecimento-conexão, debruçado

Como estudo de caso de realização de produto de inteligência comercial baseado na

Os dados resultantes na planilha anotada (Figura 3) possuem inúmeras aplicações para o

A proximidade dos marcadores nas fotos permite encontrar agrupamentos de entidades e

A visualização resultante pode ser vista na Figura 5, já com as indicações dos

Figura 5: Rede de Imagens resultante da análise, com as temáticas agrupadas em destaque.

Vale destacarmos como a análise automatizada das imagens e decorrente agrupamento

É interessante também perceber as potenciais aplicações desse tipo de estudo para a

A partir da análise conseguimos identificar as principais temáticas visuais relacionadas ao

Técnicas para realização de análise automatizada de imagens através de recursos como

Você também pode gostar