Watson PSI

17/09/2019 A ciência por trás do serviço
A ciência por trás do serviço

Última atualização em: 2019-03-07
Uma teoria bem aceita de psicologia, marketing e outros campos é que a linguagem humana reflete
personalidade, estilo de pensamento, ligações sociais e estados emocionais. A frequência com que as pessoas
usam determinadas categorias de palavras pode fornecer pistas para essas características. Vários pesquisadores
descobriram que variações de uso de palavra em escritos como blogs, ensaios e tweets podem prever aspectos
de personalidade (Fast e Funder, 2008; Gill e outros, 2009; Golbeck e outros, 2011; Hirsh e Peterson,
2009 e Yarkoni, 2010).
A IBM conduziu um conjunto de estudos para entender se as características de personalidade que são inferidas
por meio de dados de mídia social podem prever o comportamento e as preferências das pessoas. A IBM
descobriu que pessoas com características de personalidade específicas responderam e efetuaram retweet em
números mais altos em tarefas de coleção de informações e de difusão. Por exemplo, as pessoas que pontuam
alto em busca de excitação são mais propensas a responder, enquanto as pessoas que pontuam alto na cautela
são menos propensas a fazer isso (Mahmud e outros, 2013). Da mesma forma, as pessoas que pontuam alto em
modéstia, abertura e simpatia são mais propensas a difundir informações (Lee e outros, 2014).
IBMtambém descobriu que pessoas com alta abertura e baixo alcance emocional (neuroticismo), como inferido da
linguagem de mídia social, responderam de forma mais favorável (por exemplo, clicando em um link de
propaganda ou em uma conta). Esses resultados são corroborados por verificação baseada em pesquisa de
opinião, baseada em verdade. Por exemplo, fazer o direcionamento para os 10% de usuários em termos de maior
abertura e menor escala emocional resultou em aumentos na taxa de clique de 6,8% para 11,3% e na taxa de
acompanhamento de 4,7% para 8,8%.
Vários estudos recentes divulgaram resultados semelhantes para características que foram calculadas de dados
de mídia social. Um estudo recente com os dados de armazenamento de varejo descobriu que as pessoas que
pontuam alto em ordem, autodisciplina e cautela e baixa na imoderação são 40% mais propensas do que a
população aleatória a responder aos cupons. Um segundo estudo descobriu que pessoas com valores
específicos mostraram interesses de leitura específicos (Hsieh e outros 2014). Por exemplo, pessoas com um
valor mais alto de autotranscendência demonstraram interesse em ler artigos sobre o ambiente e pessoas com
um valor mais alto em autoaprimoramento mostraram interesse em ler artigos sobre o trabalho. Um terceiro
estudo de mais de 600 usuários do Twitter identificou que as características da personalidade de uma pessoa
podem prever sua preferência de marca com precisão de 65 por cento.
As seções a seguir se aprofundam nessas descobertas de alto nível para descrever a pesquisa e o
desenvolvimento por trás do serviço do Personality Insights. Para obter mais informações sobre estudos que
aplicam o serviço a cenários tangíveis, consulte O serviço em ação.
https://cloud.ibm.com/docs/services/personality-insights?topic=personality-insights-science&locale=pt-br 1/8
Entendendo os modelos de personalidade

Para o serviço do Personality Insights, a IBM desenvolveu modelos para inferir pontuações para dimensões e
aspectos do Big Five, Necessidades e Valores de informações textuais. Os modelos relatados pelo serviço são
baseados em pesquisas nos campos da psicologia, psicolinguística e marketing:
Big Five é um dos mais estudados dos modelos de personalidade que foram desenvolvidos por psicólogos
(Costa e McCrae, 1992 e Norman, 1963). É o modelo de personalidade mais amplamente usado para
descrever como uma pessoa geralmente se envolve com o mundo. O serviço calcula as cinco dimensões
e os trinta aspectos do modelo. As dimensões são geralmente chamadas pelo mnemônico OCEAN, em
que Orepresenta Abertura, C Estado consciente, E Extroversão, A Afabilidade e N Neuroticismo. (Como o
termo Neuroticismo pode ter um significado clínico específico, o serviço apresenta esses insights sob o
título aplicável de Escala emocional.)
Necessidades é um aspecto importante do comportamento humano. A literatura de pesquisa sugere que
vários tipos de necessidades humanas são universais e influenciam diretamente o comportamento do
consumidor (Kotler e Armstrong, 2013 e Ford, 2005). As doze categorias de necessidades que são
relatadas pelo serviço são descritas na literatura de marketing como desejos que as pessoas esperam
atender quando consideram um produto ou um serviço.
Valores transmitem o que é mais importante para um indivíduo. Eles são "objetivos desejáveis e de
transição situacional, variando em importância, que servem como princípios de orientação na vida das
pessoas" (Schwartz, 2006). Schwartz resume cinco recursos que são comuns a todos os valores:
Valores são crenças.
Os valores são uma construção motivacional.
Os valores transcendem ações e situações específicas.
Os valores orientam a seleção ou avaliação de ações, políticas, pessoas e eventos.
Os valores variam por importância relativa e podem ser classificados por importância.
O serviço calcula os cinco valores humanos básicos que foram propostos por Schwartz e que foram
validados em mais de vinte países (Schwartz, 1992).
Como características da personalidade são inferidas
O serviço do Personality Insights infere características da personalidade de informações textuais com base em
uma abordagem de vocabulário aberto. Esse método reflete a tendência mais recente na pesquisa sobre
inferência de personalidade ( Arnoux e outros, 2017, Schwartz e outros, 2013 e Plank e Hovy, 2015).
O serviço primeiro converte o texto de entrada em tokens para desenvolver uma representação em um espaço n-
dimensional. O serviço usa uma técnica de integração de palavras de software livre, GloVe , para obter uma
representação de vetor para as palavras no texto de entrada (Pennington e outros, 2014). Em seguida, alimenta
essa representação em um algoritmo de aprendizado de máquina que infere um perfil de personalidade com
característica do Big Five, Necessidades e Valores. Para treinar o algoritmo, o serviço usa pontuações de
pesquisas que foram conduzidas entre milhares de usuários juntamente com dados de suas alimentações do
Twitter.
A IBM desenvolveu os modelos para todos os idiomas suportados de maneira idêntica. Os modelos foram
desenvolvidos independentemente de dados demográficos do usuário como idade, sexo ou cultura. No futuro, a
IBM poderá desenvolver modelos que sejam específicas para diferentes categorias demográficas.
Versões anteriores do serviço usavam o dicionário psicolinguístico Linguistic Inquiry and Word Count (LIWC) com
seu modelo de aprendizado de máquina. No entanto, a abordagem de vocabulário aberto supera o modelo
baseado em LIWC. Para obter mais informações sobre a precisão do serviço para cada idioma em termos de Erro
Médio Absoluto (MAE) e correlação médios, consulte Qual é a precisão do serviço. Para obter orientação sobre
como fornecer texto de entrada para obter os resultados mais precisos, consulte Fornecendo entrada suficiente.
Qual é a precisão do serviço

A IBM realizou um estudo de validação para entender a precisão abordagem do serviço para inferir um perfil de
personalidade. A IBM coletou respostas à pesquisa e feeds do Twitter de 1500 a 2000 participantes para todas as
características e idiomas. Para estabelecer verdade absoluta, os participantes fizerem quatro conjuntos de testes
psicométricos padrão:
Um Big Five de 50 itens derivado do International Personality Item Pool (IPIP)
Um Facet de 120 itens derivado do Neuroticismo IPIP, Extraversão e Abertura (IPIP-NEO)
Necessidades fundamentais de 52 itens desenvolvidos pela IBM

Valores Básicos de 26 itens desenvolvidos por Schwartz
A IBM então comparou as pontuações que foram derivadas por seus modelos com as pontuações baseadas em
pesquisas para os usuários do Twitter. Com base nesses resultados, a IBM determinou o Erro Médio Absoluto
médio e a correlação média entre as pontuações inferidas e reais para as diferentes categorias de características
da personalidade. MAE e correlação médios por idioma fornecem os valores estatísticos para cada idioma
suportado.
Erro Médio Absoluto médio

Erro Médio Absoluto (MAE) é uma métrica que é usada para medir a diferença entre os valores reais e os
previstos. Para o serviço do Personality Insights, o valor real ou a verdade absoluta é a pontuação de
personalidade que foi obtida realizando uma pesquisa de personalidade. O valor previsto é a pontuação que os
modelos do serviço produzem.
A IBM calculou o MAE fazendo a média do valor absoluto da diferença entre as pontuações reais e as previstas.
A IBM usou o valor absoluto porque prever mais ou menos de valor real é irrelevante. Contanto que exista uma
diferença, o modelo é penalizado pela magnitude do erro. Quanto menor o MAE, melhor o desempenho do
modelo. A IBM usa uma escala de 0 a 1 para o MAE, em que 0 significa nenhum erro (o valor previsto é
exatamente o mesmo que o valor real) e 1 significa erro máximo.
Correção média
Correlação média é um termo estatístico que mede a interdependência das duas variáveis. Com essa métrica, a
IBM mediu a correlação entre pontuações inferidas e reais para as diferentes categorias de características da
personalidade. Se a pontuação prevista estiver muito próxima dos resultados reais, a pontuação de correlação é
alta; caso contrário, a pontuação é baixa.
A IBM mede a correlação em uma escala de -1 para 1:
1 indica um relacionamento linear perfeito direto (crescente).
-1 indica um relacionamento linear perfeito inverso (decrescente).
Em todos os outros casos, o valor fica entre esses extremos. Se as variáveis forem independentes (elas não terão
qualquer relação), a correlação será 0.
A IBM procura números mais próximos de 1 para melhores previsões. Mas as personalidades são difíceis de
prever com base exclusivamente em texto e é raro ver correlações que excedem 0,4 para esses tipos de modelos
psicológicos. Na literatura de pesquisa para esse domínio, as correlações maiores que 0,2 são consideradas
aceitáveis.
MAE e correlação médios por idioma

A tabela a seguir mostra os resultados de MAE e correlação médios por idioma para o serviço do Personality
Insights. Os resultados colocam o serviço na vanguarda da inferência de personalidade de dados textuais
conforme indicado por Schwartz e outros (2013) e Plank e Hovy (2015).
Cinco principais Cinco principais
Idioma dimensões aspectos Necessidades Valores
Árabe
Média de MAE 0,09 0,12 0,11 0,10
Correção 0,17 0,14 0,13 0,14

média
Inglês
Média de MAE 0,12 0,12 0,11 0,11
Correção 0,33 0,28 0,22 0,24

média
Japonês
Média de MAE 0,11 0,12 0,11 0,11
Correção 0,27 0,22 0,25 0,19

média
Coreano
Média de MAE 0,11 0,12 0,11 0,11
Correção 0,21 0,21 0,13 0,12

média
Espanhol
Média de MAE 0,10 0,12 0,12 0,11
Correção 0,35 0,21 0,24 0,19

média
Tabela 1. MAE e correlação médios por idioma
Para calcular as pontuações de percentil, a IBM coletou um conjunto de dados muito grande de usuários do
Twitter e calculou os seus retratos de personalidade:
Um milhão de usuários para inglês
Duzentos mil usuários para coreano
Cem mil usuários para cada um de árabes e japoneses
Oitenta mil usuários para espanhol
A IBM, então, comparou as pontuações brutas de cada perfil calculado com a distribuição de perfis dos conjuntos
de dados para determinar os percentis.
Para entrada em árabe e coreano, o serviço é incapaz de produzir percentis significativos e pontuações
brutas para algumas características de personalidade. Para obter mais informações, veja Limitações
para entrada em árabe e coreano.
Entendendo as preferências de consumo

O relacionamento entre personalidade e comportamento de compra foi estudado em vários produtos e serviços:
Chen (2007), ao testar as preferências por alimentos orgânicos, indicou que as características da
personalidade de um indivíduo desempenham um papel importante no estabelecimento de critérios
pessoais de escolha de alimentos.
Schlegelmilch e outros (1996) exploraram o relacionamento entre as variáveis de personalidade e o

comportamento de compra pró-ambiental. Os autores mostram que a consciência ambiental geral dos
consumidores tem um impacto positivo nas decisões de compras ecológicas.
Hymbaugh e Garrett (2007) investigaram a relação entre personalidade e paraquedismo e descobriram

que pessoas que pontuam alto em aventura e busca por entusiasmo geralmente se satisfazem em
paraquedismo. (Para obter mais informações, consulte Criação de perfil de risco.)
A aplicação dessas relações conhecidas entre comportamentos de consumo e personalidade é um desafio. A

maioria das obras usou dados de personalidade derivados de pesquisas, e seus modelos não estão publicamente
disponíveis. Portanto, a IBM decidiu aprender esses modelos de preferência de consumo diretamente. Quando
ela estava treinando os modelos, a IBM usou pontuações de personalidade que foram retornadas do serviço
Personality Insights como recursos. Como resultado, ao aplicar esses modelos para calcular as características da
personalidade de um usuário com o serviço, as previsões provavelmente serão mais precisas.
Como preferências de consumo são inferidas
O serviço do Personality Insights infere preferências de consumo com base nos resultados do seu perfil de
personalidade para o autor do texto de entrada. Na literatura existente, a IBM identificou 104 preferências de
consumo que provaram estar correlacionadas à personalidade. Estas incluem preferências que estão
relacionadas a compras, filmes, música e outras categorias. A IBM criou então uma pesquisa psicométrica para
avaliar a inclinação de um indivíduo para cada comportamento de consumo.
A IBM obteve respostas para sua pesquisa de cerca de 600 indivíduos para os quais ela também tinha dados do
Twitter (mais de 200 tweets de autoria própria para cada usuário). A IBM enviou os tweets ao serviço para reunir
um perfil de personalidade para cada indivíduo. Em seguida, construiu um classificador para cada preferência de
consumo, em que o conjunto de recursos de entrada era as informações de personalidade.
Para inclusão no serviço, a IBM selecionou apenas aquelas preferências de consumo para as quais a
classificação baseada em personalidade teve um desempenho pelo menos de 9 por cento melhor do que a
classificação aleatória. Das 104 preferências originais, 42 satisfizeram esse critério e são expostas como
preferências de consumo pelo serviço.
Notas sobre pesquisas de personalidade

Quando ela desenvolveu o serviço Personality Insights, a IBM confiou em pesquisas de opinião de personalidade
para estabelecer dados de verdade básica para inferência de personalidade. Verdade absoluta refere-se aos
dados factuais obtidos por meio de observação direta em vez de por meio de inferência. Uma medida típica de
precisão para qualquer modelo de aprendizado de máquina é comparar as pontuações que são inferidas pelo
modelo com dados de verdade básica. As seções prévias descrevem como a IBM usou pesquisas de opinião
para validar a precisão do serviço.
As notas a seguir esclarecem o uso de pesquisas de personalidade e a estimação de personalidade baseada em

pesquisa:
Pesquisas de personalidade são longas e demoradas para concluir. Os resultados da pesquisa de opinião
são restritos pelo número de usuários do Twitter que estavam disponíveis para participar do estudo da
IBM. A IBM planeja realizar estudos de validação com mais usuários, assim como com usuários de outras
mídias on-line, como e-mail, blogs e fóruns.
A estimação de personalidade baseada em pesquisa é baseada em relatório automático, o que pode nem
sempre ser um reflexo verdadeiro da personalidade de alguém: alguns usuários podem dar respostas
ruidosas a essas pesquisas. Para reduzir o ruído, a IBM filtrou as respostas da pesquisa incluindo
perguntas de verificação de atenção e descartando pesquisas que foram concluídas muito rapidamente.
Embora a correlação entre pontuações inferidas e baseadas em pesquisa seja positiva e significativa, os
resultados sugerem que pontuações inferidas podem nem sempre se correlacionar com resultados
baseados em pesquisa. Pesquisadores de fora da IBM também realizaram experimentos para comparar
quão bem inferidas as pontuações combinam com pontuações obtidas de pesquisas de opinião e nenhum
relatou uma correspondência totalmente consistente:
Golbeck e outros (2011) relataram uma taxa de erro de 10% a 18% para pontuações inferidas
correspondidas com pontuações baseadas em pesquisa de opinião.
Sumner e outros (2012) relataram aproximadamente 65% de precisão para a predição de

personalidade.
Mairesse e Walker (2006) relataram precisão de 60 a 70 por cento para predição de personalidade
do Big Five.
Em geral, é amplamente aceito na literatura de pesquisa que pontuações de relatório automático de pesquisas de
personalidade nem sempre correspondem totalmente a pontuações que são inferidas de texto. O que é mais
importante, no entanto, é que a IBM descobriu que as características que são inferidas do texto geralmente
podem prever com segurança o comportamento real.

Watson PSI

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Watson PSI

Enviado por

Direitos autorais:

Formatos disponíveis

17/09/2019 A ciência por trás do serviço

A ciência por trás do serviço

Entendendo os modelos de personalidade

Valores são crenças.

Os valores são uma construção motivacional.

Os valores transcendem ações e situações específicas.

Os valores orientam a seleção ou avaliação de ações, políticas, pessoas e eventos.

Como características da personalidade são inferidas

Qual é a precisão do serviço

Um Big Five de 50 itens derivado do International Personality Item Pool (IPIP)

Um Facet de 120 itens derivado do Neuroticismo IPIP, Extraversão e Abertura (IPIP-NEO)

Necessidades fundamentais de 52 itens desenvolvidos pela IBM

Erro Médio Absoluto médio

A IBM mede a correlação em uma escala de -1 para 1:

1 indica um relacionamento linear perfeito direto (crescente).

-1 indica um relacionamento linear perfeito inverso (decrescente).

MAE e correlação médios por idioma

Cinco principais Cinco principais

Idioma dimensões aspectos Necessidades Valores

Média de MAE 0,09 0,12 0,11 0,10

Correção 0,17 0,14 0,13 0,14

Média de MAE 0,12 0,12 0,11 0,11

Correção 0,33 0,28 0,22 0,24

Média de MAE 0,11 0,12 0,11 0,11

Correção 0,27 0,22 0,25 0,19

Média de MAE 0,11 0,12 0,11 0,11

Correção 0,21 0,21 0,13 0,12

Média de MAE 0,10 0,12 0,12 0,11

Correção 0,35 0,21 0,24 0,19

Tabela 1. MAE e correlação médios por idioma

Um milhão de usuários para inglês

Duzentos mil usuários para coreano

Cem mil usuários para cada um de árabes e japoneses

Oitenta mil usuários para espanhol

Entendendo as preferências de consumo

Schlegelmilch e outros (1996) exploraram o relacionamento entre as variáveis de personalidade e o

Hymbaugh e Garrett (2007) investigaram a relação entre personalidade e paraquedismo e descobriram

A aplicação dessas relações conhecidas entre comportamentos de consumo e personalidade é um desafio. A

Como preferências de consumo são inferidas

Notas sobre pesquisas de personalidade

As notas a seguir esclarecem o uso de pesquisas de personalidade e a estimação de personalidade baseada em

Sumner e outros (2012) relataram aproximadamente 65% de precisão para a predição de

Você também pode gostar