Você está na página 1de 9

Métricas

Comportamentais e
Fisiológicas

Joaquim Almeida
Disciplina | Engenharia Informática | 31/10/2022

Conteúdo
7.1 Observar e codificar os comportamentos explícitos...........................................................2
7.1.1 Comportamentos verbais.............................................................................................2
7.1.2 Comportamentos não verbais......................................................................................3
7.2 Comportamentos que requerem equipamentos para avaliar................................................3
7.2.1 Expressões faciais........................................................................................................3
7.2.2 Eye-Tracking...............................................................................................................4
7.2.3 Resposta pupilar..........................................................................................................5
7.2.4 Condutividade da pele e frequência cardíaca...............................................................6
7.2.5 Outros instrumentos de medição.....................................................................................7
7.3 Resumo..................................................................................................................................7
Métricas Comportamentais e Fisiológicas

Durante um teste de usabilidade/viabilidade, uma amostra de participantes para além de


executar as suas tarefas e preencher questionários, adotam vários comportamentos, como por
exemplo, fazer caretas e olhar sem qualquer propósito para toda a sala. Estes
comportamentos são quantificáveis, isto é, permite-nos observar o ponto de vista do utilizador
sobre a usabilidade/viabilidade do produto. De uma forma geral, a linguagem corporal e a
verbalização são observadas por um administrador de testes extremamente atento e
qualificado, apesar de que há comportamentos que são complexos e torna-se difícil a análise.
As expressões faciais, são um bom exemplo de análise complexa, os participantes rapidamente
mudam as suas expressões faciais, para auxiliar o administrador de testes faz-se uma gravação
do participante a testar o produto.

Respostas não planeadas no laboratório de usabilidade/viabilidade

Recentemente, o laboratório recebeu uma participante grávida de 8 meses que estava a testar
um protótipo de uma app interna, que a determinado momento insinuou que a interface era
extremamente má que até lhe estava a causar dares de parto.

7.1 Observar e codificar os comportamentos explícitos


Certamente, existem variadas formas de avaliar o comportamento dos participantes durante
um teste de usabilidade/viabilidade, cada avaliador usa a prática que lhe for mais conveniente
para o teste em questão. Existe várias maneiras de abordar, por exemplo, uma delas é a
utilização de formulários. Todas as abordagens são válidas, mas é necessário ter em
consideração o objetivo de estudo para que a avaliação seja mais completa.

Durante um teste de viabilidade, os participantes podem adotar dois tipos de


comportamentos: os verbais e os não verbais. Os comportamentos verbais dizem respeito às
afirmações dos participantes, enquanto os não verbais assentam nos comportamentos que
estes possam ter. Ambos os comportamentos poderão vir a ser úteis para o um administrador
de testes.

7.1.1 Comportamentos verbais


Os comportamentos verbais fornecem informações do sobre o emocional e mental de cada
participante enquanto testam o produto. Muitos dos comentários que o participante fará,
alguns irão ser negativos e positivos que serão de fácil interpretação, enquanto os comentários
neutros (por exemplo, “isto é interessante” tornam a análise muito mais complexa.

A métrica mais relevante poderá ser o rácio positivo a comentários negativos, para esta análise
é necessário começar por relacionar todos os comportamentos verbais e depois classificá-los
como positivo, negativo ou neutro, apesar de ser desafiante. Seguidamente, olhamos para a
proporção de comentários positivos a negativos para podermos obter conclusões.

Este tipo de dados, são analisados de acordo com a categorização dos comentários. É
importante, partilhar ideias com outros especialistas para chegarem a conclusões mais
assertivas sobre a categorização dos comentários.
7.1.2 Comportamentos não verbais
Os comportamentos não verbais podem ser informativos sobre a experiência do participante
com o produto, estes incluem expressões faciais ou linguagem corporal. Em algumas situações,
os comportamentos não verbais podem ser indicadores de frustração ou impaciência por parte
do participante através de expressões e gestos, o que não deixa de ser revelante para a
avaliação. Estes comportamentos, são de extrema utilidade quando o produto apresenta
exigências físicas, percetivas ou cognitivas (como por exemplo, inserir o número de série de
um equipamento para instalar um software).

É importante não esquecer que, tanto os comportamentos verbais como os não verbais,
mudam quando existem diferentes interações de designs ou se compara variados produtos

7.2 Comportamentos que requerem equipamentos para avaliar


Enquanto o capítulo anterior se focou em analisar comportamentos através de observação
feito por uma pessoa devidamente qualificada, neste capítulo vamos analisar avaliações que
exigem equipamentos específicos. Esta avaliação faz uma análise detalhada das expressões
faciais, diâmetro da pupila, entre outros.

7.2.1 Expressões faciais


O reconhecimento e interpretação facial é uma parte fundamental para a avaliação, permite-
nos perceber o que é que as pessoas estão a sentir, o que muita das vezes falta quando
comunicamos com alguém via telefónica. Nos nos 70, Paul Ekman e Wallace Friensen,
conceberam o Sistema de Codificação da Ação Facial (FACS) que permite captar 46 ações
específicas envolvendo os músculos faciais. Recentemente, desenvolveram o FACS Affect
Interpretation Dictionary (FACSAID), relaciona as ações faciais com a resposta emocional. Este
tipo de análise, apresenta um nível de complexidade elevado, o que levou os investigadores a
investigar formas automatizadas para medir as expressões faciais, sendo elas: sistemas
baseados em vídeo que tentam reconhecer expressões faciais específicas e sensores de
eletromiografia (EMG) que medem a atividade de músculos específicos do rosto.

Sistemas baseados em vídeo

Os sistemas baseados em vídeos fazem análises computacionalmente mais desafiantes, devido


às aparências e expressões faciais. Há investigadores que tiveram sucesso nestas áreas, é caso
de Essa e Pentland, que desenvolveram um sistema capaz de reconhecer seis expressões
faciais estáticas: raiva, repugnância, felicidade, surpresa, levantar a sobrancelha, e neutro;
mais recentemente, den Uyl e van Kuilenburg testaram o sistema FaceReader contra uma base
de dados que tinham uma referência de 980 imagens de expressões faciais, eles perceberam
que o sistema foi capaz de ter uma precisão de 89% numa de seis emoções: feliz, zangado,
triste, surpreendido, assustado, enojado, e neutro

A chave do sucesso está em descobrir como registar e tratar da informação de forma eficiente.
Sensores EMG

Richard Hazlett, da Escola de Medicina da Universidade Johns Hopkins, fez um estudo no qual
ele usou sensores EMG nos músculos corrugadores de 28 participantes enquanto eles
realizavam cinco tarefas num dos dois sites: Jones of New York e Tylenol (Hazlett, 2003).

No cálculo de cada participante, ele concluiu que o Índice de Frustração médio foi
significativamente maior para as tarefas respondidas de forma incorreta do que corretamente.
O Índice de Frustração, que é uma medida contínua que ajudou a identificar páginas
específicas nos sites.

Recentemente, Hazlett uniu-se a Joey Benedek da Microsoft para avaliar o valor da EMG facial
na medição de reações ao software. Num estudo, os participantes que usaram sensores faciais
de EMG fizeram uma demonstração de possíveis novos recursos de um sistema operacional de
desktop. Após a demonstração, os pesquisadores calcularam a ‘‘Classificação de
Desejabilidade’’ a partir dos dados EMG enquanto os participantes visualizaram cada um dos
recursos do sistema. Esta classificação, baseou-se nos casos em que o EMG zigomático foi pelo
menos um desvio padrão acima da linha de base e não havia corrugador acompanhante EMG.

A elevação tensão foi a medida defendida por eles, como o número de segundos que o
participante teve um valor EMG do corrugador maior que um desvio padrão acima do
corrugador geral daquele participante. Eles olharam a correlação entre tempo na tarefa e
tensão elevada, onde foi encontrado apenas uma correlação moderada (r = 0,55). A explicação
para essas três tarefas foi que os participantes estavam apenas a divertirem-se enquanto
demoram mais para realizar as tarefas.

Medir expressões faciais em testes de usabilidade diários

A medição das expressões faciais através de testes de usabilidade diários, não está pronto para
o horário nobre testes de usabilidade, a menos que haja acesso a equipamentos EMG e que
não haja problema de enviar os seus participantes para ele, ou se está disposto a dedicar
tempo e esforço a análises detalhadas de gravações de vídeo.

7.2.2 Eye-Tracking
O infravermelho fontes de luz criam reflexos na superfície do olho do participante e as rotinas
de análise comparam a localização desse reflexão para a localização da pupila do participante.

É usado um aparelho montado na cabeça, para permitir o movimento da cabeça, enquanto


que outros sistemas usam um sistema ótico ou magnético para rastrear a cabeça do
participante e acompanhar os seus olhos remotamente.

Proportion of Users Looking at a Specific Element or Region

A análise mais simples pode ser feita através de um sistema de rastreamento ocular, que
consiste em determinar qual é a percentagem de participantes num teste de usabilidade que
fixou num só elemento específico ou região de interesse.
O nosso objetivo é ver quais desenhos resultaram em mais fixações neste bricklet. A análise
desses dados é bastante simples, mas devemos de ter algumas coisas em mente:

1. Definir o elemento específico de interesse em termos de coordenadas x, y na página. A


maioria dos programas de análise de rastreamento ocular torna isso fácil de fazer. Esses
elementos são geralmente chamados de “áreas de interesse”, “zonas de visão” ou algo
semelhante.

2. Definir um tempo mínimo total de fixação para o elemento de interesse.

Tempo utilizado a olhar para uma região ou um elemento específico

De acordo com o estudo desenvolvido por Albert (2002), para perceber qual é a melhor
localização para colocar um anúncio numa página web, ele conseguiu recolher dados e chegar
a conclusão de que os utilizadores dão preferência cerca de sete vezes mais a anúncios abaixo
da marca superior comparativamente com os acima, o que é um dado valioso para quem
posiciona anúncios na web. De ressalvar que o estudo teve algumas considerações em mente
em que cada região estava bem definida, a análise do tempo gasto em percentagem e apenas
considerar o tempo em que o participante esta a olhar para o anúncio.

Tempo necessário para reparar num elemento em específico

Ao longo do desenvolvimento de uma página web é útil saber se os botões que colocamos
estão bem localizados, principalmente os que incorporam funções essenciais como é o caso do
botão de Login, para o utilizador poder utilizar o serviço de uma forma rápida. Para termos
acesso a estes dados, os participantes devem ser testados de forma que encontrem o
elemento em menos de cinco segundos. É possível que alguns participantes não consigam
encontrar o elemento em cinco segundos, por isso a forma mais realista é selecionar o
intervalo de tempo que queremos analisar e verificar se o participante encontrou ou não o
objeto.

Scan Paths

No que toca ao rastreamento do olhar, existem dois métodos que podem ser utilizados sendo
a duração dos movimentos oculares e o tempo de fixação. Estes métodos foram testados em
páginas web com horários do metro em utilizadores com faixa etária mais jovem e outra mais
idosa. Foi possível perceber que, em páginas em que a duração dos movimentos oculares era
curta, os utilizadores movimentam menos os olhos para visualizarem a informação que
necessitam. O contrário foi verificado com o tempo de fixação, uma vez que tempos de
elevados significam que os utilizadores tiveram dificuldade em obter a informação que
necessitavam, o que geralmente aconteceu quando eram utilizadas fontes pequenas.

7.2.3 Resposta pupilar


O rastreio dos olhos é cada vez mais utilizado em estudos de usabilidade. Geralmente, as
pessoas reconhecem que a pupila ocular reage à luz ambiente, mas são raras as pessoas que
sabem que a pupila também reage à excitação e ao aumento de interesse, por exemplo.
O estudo da resposta da pupila começou na década de 60 e foi evoluindo até aos anos 2000. O
importante salientar que, este estudo que foi evoluindo ao longo dos anos, quer pela mudança
dos tempos, quer pela evolução tecnológica. Por isso, o último estudo em 2004, teve o foco de
estudo enquanto eram executadas algumas tarefas, tais como manipulação de objetos, leitura,
raciocínio e pesquisa. Estas ações foram divididas em dois graus de dificuldade, fácil e difícil, e
foi possível chegar a conclusão as pupilas abriram mais significativamente nas tarefas com um
grau de dificuldade mais elevado comparativamente às tarefas de grau menor.

Pupillometry in Everyday Usability Testing

Como anteriormente verificado, percebemos que o aumento ou diminuição do diâmetro da


pupila não esta relacionado apenas com um aspeto, existem várias variáveis que dependem
até do estado emocional que uma pessoa possa estar a passar num determinado momento.
Por isso se quisermos, através de uma página web tentar mudar, até quem sabe a excitação
emocional de uma pessoa, podemos medir a pupila antes de entrar no mesmo e depois e
verificar, com uma média dos participantes, se existiu alguma alteração significativa nesta
determinada função.

7.2.4 Condutividade da pele e frequência cardíaca


A condutividade da pele e a frequência cardíaca são duas medidas que são bastante usadas
para casos de estudo sobre o stress. A condutividade da pele está associada a quantidade de
humidade adicional que esta presente na pele, uma vez que quando estamos stressados o
nosso corpo produz mais suor, logo quanto mais humidade presente na pele mais existência a
mesma vai fazer. A responsável por fazer esta medição e a resposta galvânica da pele (GSR) O
mesmo acontece com a frequência cardíaca, quanto mais stressados estamos, mais o ritmo do
nosso coração acelera. A variabilidade da frequência cardíaca é frequentemente chamada
HRV. Em 2003, Ward e Marsden usaram a GSR e a HVR para medirem o impacto que dois
websites distintos tinham nos utilizadores e que reações eles desenvolviam perante os
mesmos. Um era um website bem desenvolvido e outro mal desenvolvido, sendo que o mal
desenvolvido tinha vários pop-ups e anúncios que interrompem a fluidez de uso dos mesmos e
claro, prevê-se que os resultados fossem muito diferentes. E assim foi, no site mal desenhado
foi possível aferir um aumento da GSR e da HRV logo nos 5 minutos iniciais ainda que apos
esse período tende a manter-se. Já no site bem desenhado tende para um relaxamento logo
apos o primeiro minuto. Assim foi possível concluir que a HVR e a GSR têm variações maiores
no site mal desenvolvidos o que causa um stress adicional desnecessário no utilizador.

Num outro estudo que decorreu em 2005, o objetivo era os participantes jogarem um
videojogo 3D em que o foco mais uma vez era analisar o nível de stress ao longo de
determinadas tarefas. As tarefas tinham de ser desenvolvidas o mais rápido possível podendo
ser repetidos o número necessário de vezes ao longo de 10 minutos. Como é possível verificar,
quanto mais complexa fica a tarefa, mais elevado é o nível de stress com base nos dois
indicadores (GSR e HVR).

As duas principais medidas fisiológicas que estão relacionadas com o stress são a
condutividade da pele e o ritmo cardíaco. Relativamente à primeira esta é medida utilizando o
Galvanic Skin Response, ou GSR, que mede a resistência elétrica. (a humidade na pele aumenta
a condutividade). Quanto mais rápido o nosso coração bate este está sob mais stress, daí o
aumento do ritmo cardíaco, o que se pode relacionar com a HRV, a variabilidade da frequência
cardíaca. Estas respostas que auxiliam a calcular as medidas fisiológicas são formas que
permitem que a pessoa em si consiga monitorar os níveis e que aprenda a “controlá-los”. Um
exemplo prático onde esta questão pode ser aplicada é nos jogos virtuais, onde a partir de um
cenário criado ou até mesmo no design do jogo, quer este esteja bem desenhado ou não, é
estudado como o jogador reage e, consequentemente, como estão os seus níveis de stress. De
forma geral, e segundo um estudo, os participantes que tiveram mais sucesso nos jogos
virtuais tendiam a ter níveis de GRS mais baixos, o que significa que a falha estava associada a
níveis mais elevados de stress. Como podemos ver na imagem existe uma forte correlação
entre o nível do stress de cada tarefa e a GSR.

Medir o stress nos testes de utilidade diária

Outra forma do stress fisiológico ser estudado poderá ser a partir do tempo de espera para
uma página da internet ser carregada. Aqui, conseguiu-se observar que quanto mais tempo
passa o ritmo cardíaco do participante aumenta.

7.2.5 Outros instrumentos de medição


Mais tarde, apareceram dois novos dipositivos que permitiam medir o ritmo cardíaco, como a
cadeira EMFI, ou medir a condutância da pele usando uma luva, luva GALVACTIVATOR.

Alguns investigadores também consideravam relevante avaliar o nível de frustração ou de


envolvimento por parte do participante quando este interage com o computador. Assim,
nasceram duas técnicas o PressureMouse (rato de pressão com sensores), trata-se de uma
espécie de rato de computador com 6 sensores de pressão que detetam o quanto o utilizador
está a agarrar o rato, durante o estudo, foi percetível que os utilizadores agarram mais o rato
quando algum erro ocorre, e a Posture Analysis Seat(analise da postura/ forma como se senta),
é um assento que analise a postura e que mede a pressão a que o utilizador está a exercer
sobre o assento, ex cadeira. Ou seja, dependendo da forma como o participante está irá
influenciar o seu nível de envolvimento e de interesse.

Este é apenas um dos exemplos onde estas novas tecnologias podiam ser aplicadas. Estas
podem ser recorridas no quotidiano, para as crianças, avaliando a paciência ou para medir o
nível de envolvimento dos adolescentes nas redes sociais.

7.3 Resumo
Em suma, este capítulo refere-se às formas como existem várias possibilidades de medir
comportamentos e fisionomias (aparências). Estas técnicas podem passar pela observação ou
ter algum equipamento mais adequado. As técnicas permitem dar mais conhecimento que
ajudam a identificar partes que estejam a funcionar bem ou que estejam a dar frustração ao
utilizador.

Pontos chave:

1.O número de comentários, quer seja negativo ou positivo, podem ser fontes adicionais à
análise;

2. Os olhares dos participantes ajudam a perceber o que eles estão a ver e a sentir;
3 e 4. O rastreio ocular prova que os utilizadores interessados pelo tema têm mais atenção a
pormenores como as cores e o diâmetro que o sistema consegue captar;

5. Tanto a condutância da pele como o ritmo cardíaco permitem detetar partes onde os
utilizadores consideram frustrantes;

6. A técnica do rato é só uma das que poderão ser acrescentadas e úteis à bateria de
ferramentas para a utilização no uso de testes.

Você também pode gostar