Escolar Documentos
Profissional Documentos
Cultura Documentos
São Luis
2013
SUMÁRIO
2
1. TIPOS DE VARIÁVEIS
Gênero;
Faixa etária;
Produtos;
Percentis (Antropometria), dentre outros;
3
1.2. Variáveis Dependentes
Segundo Tullis e Albert (2008), ao se planejar um estudo, deve-se ter ideia clara do que
se pretende manipular (variáveis independentes) e do que se pretende medir (variáveis
dependentes). Se não existe uma ideia clara disso, deve-se voltar para os objetivos da
pesquisa. Se é possível desenhar uma conexão lógica entre os objetivos da pesquisa e suas
variáveis dependentes e independentes, este estudo será bem sucedido (TULLIS; ALBERT,
2008).
2. TIPOS DE DADOS
Cada tipo de dado tem suas próprias forças e limitações. Ao coletar e analisar dados de
usabilidade, deve-se conhecer quais tipos de dados se está lidando e o que é possível ou não
fazer com cada tipo (TULLIS; ALBERT, 2008).
Além disso, cada tipo de dado requer um tratamento estatístico específico, os quais
também serão apresentados.
4
2.1. Dados nominais
Entre as estatísticas que podem ser usadas com dados nominais encontram-se as
simples estatísticas descritivas como contagens e frequências. Por exemplo, pode-se dizer que
45% dos participantes são do sexo feminino, ou 95% foram bem sucedidos em uma
determinada tarefa, dentre outras (TULLIS; ALBERT, 2008).
Para este caso, a contagem pode ser feita utilizando uma fórmula de contagem no
Excel, como CONT.SE. Para isso, digite na célula onde deverá constar o resultado a seguinte
formula: =CONT.SE(<selecione os dados>;”critério”). O critério deve ser sempre o que se
deseja contar, se for o número de sujeitos femininos que estão identificados por F, coloque “F”
entre aspas, sempre (Figura 1).
2.2. Ordinais
Dados ordinais são ordenados em grupos ou categorias. Como o nome indica, os dados
são organizados de modo que intervalos entre as medições não são significativos. Podem ser
avaliados como dados classificados. A lista dos 100 melhores filmes, avaliado pelo American
Film Institute (AFI), mostra que o décimo melhor filme de todos os tempos, “Singing in the
Rain”, é melhor do que vigésimo melhor filme de todos os tempos, “One Flew Over the
Cuckoo’s”. Entretanto, essa avaliação não diz que “Singing in the Rain” é duas vezes melhor
que “One Flew Over the Cuckoo’s”. Um filme é apenas melhor do que o outro, pelo menos de
acordo com a AFI (TULLIS; ALBERT, 2008).
Isto se deve ao fato de que distância entre as fileiras não é significativa, não é possível
afirmar que uma categoria é duas vezes melhor que outra. Dados ordinais podem ser
verificados nas avaliações de “melhor ou pior”, “mais satisfeitos ou menos satisfeitos”, ou,
“mais grave ou menos grave”. A classificação relativa (a ordem do ranking) é a única
informação que importa (TULLIS; ALBERT, 2008).
2.3. Intervalares
Dados de intervalo são dados contínuos em que as diferenças entre as medições são
significativas, mas não há ponto natural zero. Um exemplo de dados de intervalo familiares
para a maioria de nós é a temperatura, em Celsius, no qual o “zero” é definido como ponto de
congelamento, entretanto esse valor é arbitrário, pois zero grau não significa a ausência de
calor, mas identifica apenas um ponto significativo na escala de temperaturas (TULLIS; ALBERT,
2008).
À primeira vista, pode-se dizer que as duas escalas são as mesmas, mas a diferença de
apresentação as torna diferentes. Colocar etiquetas explícitas sobre os itens da primeira escala
a torna com dados ordinais. Deixar os rótulos fora, na segunda escala e apenas rotular o ponto
final torna os dados como intervalos. Essa é a razão para que escalas mais subjetivas rotulem
os fins, ou “âncoras”, e não cada ponto de dados.
Agora, considere uma versão ligeiramente diferente da segunda escala (Figura 3)
(TULLIS; ALBERT, 2008).
Apresentando-o desta forma, com 10 pontos ao longo da escala, torna ainda mais
evidente que os dados podem ser tratados como se fossem dados de intervalo. A
interpretação razoável da escala por um usuário é que as distâncias entre todos os pontos de
dados ao longo da escala são iguais. A questão a se perguntar quando decidir se você pode
tratar alguns dados como intervalo ou não, é se um ponto no meio do caminho entre
quaisquer dois dos pontos de dados definidos faz sentido. Se isso acontecer, então não faz
sentido analisar os dados como dados de intervalo (TULLIS; ALBERT, 2008).
2.4. De relação
São os mesmos que os dados de intervalo, com a adição de um zero absoluto. Estes
dados significam que o valor de zero, não é arbitrário, como acontece com os dados de
intervalo, mas tem algum significado inerente. Com dados de taxa, as diferenças entre as
medidas são interpretadas como uma razão/relação. Exemplos de dados de relação são a
idade, altura e peso. Em cada exemplo, zero indica ausência de idade, altura, ou peso (TULLIS;
ALBERT, 2008).
3. PROCEDIMENTOS ESTATÍSTICOS
Beiguelman (2002) explica que é impraticável o estudo com toda uma população,
sendo possível tirar conclusões a respeito das características populacionais através de valores
numéricos obtidos na análise de amostras. Denomina-se Inferência estatística, a parte da
estatística que se dedica à criação e emprego de métodos para obter conclusões a respeito de
uma amostra retirada de uma população.
8
3.1.1. Estatísticas descritivas
Estatísticas descritivas, como o nome indica, descrevem os dados sem dizer nada sobre
a população maior. Já a Estatística inferencial permite você tirar algumas conclusões ou inferir
sobre uma população maior acima e além de sua amostra (TULLIS; ALBERT, 2008).
Histogram: Var1
Shapiro-Wilk W=,98611, p=,45674
Expected Normal
40
35
30
25
No. of obs.
20
15
10
0
0 1 2 3 4 5 6 7
Passo 3: Clique em Variables. Selecione a coluna com os dados (var1) e (var2), clique
em Ok (Figura 8).
10
Figura 9 – Passo 3 para realizar teste de homogeneidade.
A interpretação do resultado deve ser feita da seguinte forma. Quando o valor de “p”
for maior que 0,05 a amostra é homogênea.
Voltando aos Histogramas, estes também permitem que se localize a Mediana, isto é,
a medida central do conjunto analisado. 50% dos dados se localizará à esquerda da Mediana e
os outros 50% à direita (BEIGUELMAN, 2002).
11
No Excel, para calcular a Mediana utilize a formula =MED(selecione o intervalo de
dados). E para calcular a Moda, =MODO(selecione o intervalo de dados). Para o caso dos dados
apresentados no Polígono de frequências da Figura 5 a mediana e a moda são apresentados
abaixo (Figura 7) .
Histogram: Var1
Mediana 3,58
Shapiro-Wilk W=,98611, p=,45674
Expected Normal
Moda 3,84
40
35
30
25
No. of obs.
20
15
10
0
0 1 2 3 4 5 6 7
Passo1: Digite o número de casas e variáveis necessárias para digitar os dados e clique
em OK, ou clique em Ok e copie e cole os dados previamente digitados no Excel (Figura 9).
12
Figura 14 – Passo 1 para verificação da normalidade.
13
unimodal pode-se fazer a sua Descrição Aritmética, que torna as informações descritivas
ainda mais precisas, além de facilitar a comparação de diferentes amostras. Essa descrição é
feita pela Média Aritmética, ou simplesmente Média, que é simbolizada geralmente por (lê-
se x barra). A média calculada a partir dos dados amostrais serve para estimar, isto é, avaliar
o valor da média da população da qual foi extraída a amostra. Outra descrição que pode ser
realizada é o conhecimento da variação dos dados em relação a essa média, o Desvio padrão,
o qual representa a dispersão dos dados em torno da média (BEIGUELMAN, 2002).
Segundo Tullis e Albert (2008), estas estatísticas, também conhecidas como Medidas
de tendência central são a primeira coisa que deve ser observado ao executar estatística
descritiva. Tendência central é simplesmente o meio, ou parte central de qualquer
distribuição. As três medidas mais comuns de tendência central são estas, a média, mediana e
moda. Os autores apresentam um exemplo de análise de testes de usabilidade, na análise dos
dados de tempo para a realização de uma tarefa (Figura 18).
14
Figura 18 – Medidas de tendência central na análise de dados de tempo para execução de uma tarefa em teste de
usabilidade. FONTE: Tullis e Albert (2008).
Na Figura 18, a média é de 35,1 segundos, de modo que o tempo médio para concluir
esta tarefa foi de pouco mais de 35 segundos. A média das métricas de usabilidade é
extremamente útil e é, provavelmente, a estatística mais comum citada em nos relatórios
(TULLIS; ALBERT, 2008).
Já a moda, que é o valor mais comumente ocorre, na figura 13 observa-se que esta é
de 22 segundos. Dois participantes completaram a tarefa em 22 segundos. Não é comum
relatar a moda em resultados de testes de usabilidade, mas pode ser útil esta informação.
Quando os dados são contínuos ao longo de um amplo espectro, tais como os tempos de
conclusão apresentados na Figura 18, a moda é geralmente menos útil. Quando os dados têm
um conjunto mais limitado de valores (como escalas de avaliação subjetiva), a moda é mais útil
(TULLIS; ALBERT, 2008).
15
evidência que coletamos podemos ter confiança no que concluímos sobre o grande grupo no
qual somente poucos objetos foram observados. Um problema comum em inferência
estatística é determinar, em termos de uma probabilidade, se diferenças observadas entre
duas amostras significam que as populações correspondentes são realmente diferentes entre
si (SIEGEL; CASTELLAN, 2006).
No desenvolvimento dos métodos de estatística moderna, as primeiras técnicas de
inferência, as Paramétricas, foram baseadas na suposição de que os dados foram extraídos de
uma população com Distribuição Normal. Um pouco mais recente assistiu-se o
desenvolvimento de um grande número de técnicas de inferência, as quais não fazem
suposições restringentes sobre a população da qual os dados são extraídos, essas técnicas são
as Não paramétricas, ou livres de Distribuição Normal (SIEGEL; CASTELLAN, 2006).
a) Teste t de Student
Segundo Arango (2005, p. 253) o teste t de Student “é o método mais usado para se
avaliarem as diferenças entre as médias de dois grupos”, desde que “seja admitido que as
populações que deram origem às amostras, tenham distribuição normal e variabilidades não
significativamente diferentes”.
16
Figura 19 – Passo 1 para execução do Test t de “Student”.
Selecione as variáveis, clique em Ok. Finalmente, clique em Summary T-test (Figura 21).
17
A tela seguinte apresentará os resultados (Figura 22).
b) ANOVA
a) Wilcoxon
b) Mann-Whitney
É utilizado para comparar duas amostras independentes (grupos), como por exemplo,
diferenças entre gêneros. Conforme Arango (2005) é apropriado “quando se tem um par de
amostras independentes e se deseja testar se as populações que deram origem a essas
amostras podem ser consideradas semelhantes ou não” (p. 277), ou seja, se entre elas
existem, ou não, diferenças estatisticamente significativas (p≤0,05).
18
Quando há normalidade nas amostras, mas apenas uma delas a serem comparadas for
homogênea para amostras independentes aplica-se o Mann-whitney para amostras
emparelhadas aplica-se o Wilcoxon.
c) Friedman
É utilizado para comparar múltiplas amostras emparelhadas (três ou mais). Pode ser
utilizada na comparação de mais de duas situações verificadas para o mesmo sujeito, antes x
durante x depois, ou produto A x B x C. Assim como na ANOVA o teste de Friedman apresenta
se há diferenças significativas nas comparações, entretanto não apresenta onde estas
diferenças ocorrem. Para isso é necessário aplicar o teste Post-Hoc de Dunn.
d) Kruskal-Wallis
Tipo de
Tipos de Dados Procedimento estatístico
variável
Dependente Nominal Estatística Descritiva
Independente Ordinais Estatística Descritiva
Intervalares e de Estatística Descritiva, Comparações de amostras
Relação (Testes paramétricos e Não paramétricos)
O procedimento para a escolha do teste estatístico adequado a cada tipo amostra, pode
ser verificado no diagrama a seguir (Figura 23).
19
Teste t de Student
(duas amostras)
Homogeneidade
(Levene)
ANOVA (três ou mais
amostras)
Normal
Man-Whitney (Duas amostras
independentes)
Não homogêneo
Wilcoxon (Duas amostras
Normalidade emparelhadas)
das amostras
Man-Whitney (Duas
(Shapiro-Wilk)
amostras independentes)
REFERÊNCIAS
FIELD, A. Discovering statistics using SPSS for Windows. London: Sage, 2000.
LAKATOS, E. M.; MARCONI, M.A. Metodologia Científica. – 2ed. – São Paulo: Atlas, 1991.
SHAPIRO, S. S.; WILK, M. B.; CHEN, H. J. A comparative study of various tests of normality.
Journal of the American STATISTICA®l Association, 63, 1343-1372, 1968.
20
SIEGEL, S.; CASTELLAN, N.J. Estatística não-paramétrica para ciências do comportamento.
Porto Alegre: Artmed, 2006.
TULLIS, T.; B. ALBERT. Measuring the user experience: collecting, analyzing and presenting
usability metrics. Burlington: Morgan Kaufmann, 2008.
21