Escolar Documentos
Profissional Documentos
Cultura Documentos
Conceitos fundamentais
Uma análise estatística estuda uma ou várias variáveis, mas analisa sempre conjuntos de
elementos (que podem ser amostras ou populações).
Numa variável, as suas categorias/valores são exaustivas (têm de incluir todos os valores
possíveis) e são mutuamente exclusivas (a resposta de cada indivíduo só pode ser uma).
Tipos de variável
↙ ↓ ↘
Univariada Bivariada Multivariada
-Uma variável ou um conjunto - Duas variáveis - Mais de duas variáveis
de variáveis analisados em separados
Conceitos:
↙ ↘
Estatística indutiva Estatística descritiva
-Amostra é representativa (conhecem-se todos - Amostra não é representativa (não se
os valores). conhecem todos os valores).
-É possível fazer extrapolações para a população -Não é possível fazer extrapolações para
com base na amostra. a população .
Tipos de variável
↙ ↓ ↘
Quantitativa Nominal Qualitativa Ordinal Quantitativa
-Não medem quantidades -Não medem quantidades -Medem quantidades
-Não apresentam ordem entre si -Apresentam ordem entre si -Apresentam uma ordem
Exemplo: Exemplo: -São representados por nº
-Género; Preferência partidária -Grau de satisfação; Exemplo :
-idade; peso; salário
↙ ↘
Contínuas Discretas
-nº de valores –nº de valores
é limitado é ilimitado
-As décimas são -Não existem
possíveis. décimas.
Ex: Tempo Ex: nº filhos
Variáveis quantitativas
- Nas variáveis quantitativas com “poucos valores”, é possível apresentar uma tabela de
frequências e percentagens com todos os valores possíveis.
-Nas variáveis quantitativas com “muitos valores”, é usual apresentar tabelas de frequências
e percentagens, com valores agregados em classes.
- Nesta situação, os resultados são apresentados em classes, definidas a partir dos limites
inferior e superior. Os cálculos a efetuar (média, desvio padrão…) devem usar o centro de
classe (ou seja de 501 a 770 é representado por 600)
Moda
-Indica o valor mais comum da amostra
-Pode ser calculada por todas as variáveis
-Identifica-se através da freq. simples ou da % simples
Problemas da Moda
Mediana
- Aponta para a posição central da distribuição (50%/50%)
- Calculada pelas variáveis quantitativas e qualitativas ordinais.
Vantagens da mediana
- Não é afetada pela assimetria nem pela existência de valores extremos (outliers)
- Quando a distribuição é assimétrica, aponta melhor o centro da distribuição, porque não é
sensível aos enviesamentos.
nº ímpar nº par
- É o nº central - Média dos nº centrais
Exemplo: 3 elementos (med=2) Exemplo: 4 elementos (med=2.5)
Média
- Indica o centro da distribuição
-Calculada pela variável quantitativa
- É medida mais usada nas variáveis quantitativas
- Pode ter um valor abstrato (3,4)
Medidas de dispersão
↙ ↓ ↓ ↘
AIV AIQ DP CV
(amplitude do intervalo (amplitude do intervalo (variância e desvio (coeficiente
de variação) interquartil) padrão) de variação)
Medidas de dispersão
-Servem para verificar a heterogeneidade ou a homogeneidade do grupo.
-Quanto mais elevadas são as medidas de dispersão maior é a heterogeneidade
(diversidade) e quanto mais baixa a dispersão maior a homogeneidade do grupo.
Cálculo:
↘
(valor mais alto) - (valor mais baixo)
Exemplo:
maior dispersão ← AIV= (15-6)= 13 AIV=(19-9)= 10 → menor dispersão
AIQ ( amplitude do intervalo interquartil)
-É a medida de dispersão face à mediana, ou seja, utiliza-se quando se usa a mediana como
medida de tendência central para caracterizar o centro de uma distribuição.
Cálculo:
↘
Q3 - Q1
Exemplo:
Cálculo:
↘
Exemplo:
- Assim, no primeiro caso a variância é de 2 valores e o desvio padrão de 1.4 valores,
enquanto no segundo caso a dispersão é maior: a variância é de 7.36 valores e o
desvio-padrão de 2.7 valores.
CV ( coeficiente de variação)
-Deve-se usar quando as variáveis têm valores muito diferentes uma da outra( por exemplo,
se se comparar a dispersão dos salários ou da dimensão das casas) ou quando as médias são
muito diferentes (por exemplo, o peso de bebês e de adultos).
- O coeficiente de variação relativiza o Desvio-Padrão face à Média e é expresso em %.
Cálculo:
↘ S = Desvio Padrão
X= Média
Exemplo:
- O CV varia entre zero (se o desvio padrão fosse zero, o que só aconteceria se a variável
não tivesse dispersão num grupo) mas não tem um limite superior máximo. Geralmente,
aponta-se os 50%, como indicando uma dispersão muito elevada.
Conclusão:
- Na análise de uma variável quantitativa é necessário combinar uma medida de tendência
central e uma medida de dispersão.
- Se a variável for muito assimétrica, pode ser preferível utilizar a mediana como base de
análise, por apontar para o centro da distribuição. No entanto, se a distribuição tiver poucos
valores é possível também utilizar a média como base de análise.
Gráficos para as variáveis quantitativas:
-Um gráfico habitual é o gráfico de barras, que no caso de uma variável quantitativa é,
usualmente, um histograma.
-Este tipo de gráficos, permite ver a forma da distribuição, mas não representa pontos
específicos desta distribuição, como acontece com o gráfico de extremos e quartis.
-Os gráficos de Extremos e Quartis permitem representar para um, ou para vários grupos,
diversas medidas de ordem da distribuição.
Estes gráficos representam:
- Os dois gráficos seguintes representam a mesma variável idade, mas agora apenas a partir
do mínimo, máximo, mediana e quartis (neste caso não existem outliers)
Outliers
- Os outliers são valores que se afastam muito do conjunto de valores centrais (as que
estão dentro dos limites da AIQ).
- Estes valores podem afetar a média, e, por consequência, o desvio-padrão. O seu efeito
sobre estas medidas depende de serem mais ou menos afastados, e da dimensão da
amostra.
SPSS
-Sinaliza os outliers a partir de círculos ou asteriscos:
- São outliers moderados quando se afastam mais de 1,5 AIQ do 3º quartil ou do 1º quartil
- São outliers severos quando se afastam mais de 3 AIQ do 3º quartil ou do 1º quartil
Medidas de Assimetria
↙ ↘
Distribuição Simétrica Distribuição Assimétrica
↙ ↘
Positiva Negativa
Distribuição simétrica
-Numa distribuição simétrica unimodal todas as medidas de tendência central são iguais.
X = Me = Mo
Distribuição Assimétrica
Positiva
- As três medidas de tendência central são diferentes
Negativa
- As três medidas de tendência central são diferentes
O tipo de assimetria :
- próximo de zero se a distribuição for simétrica
- negativo significa que a assimetria é negativa
- positivo significa que a distribuição é assimétrica positiva
a intensidade da assimetria:
-Refere-se apenas ao grupo analisado (amostra ou população)
Análise Bivariada
- Utiliza-se o eta quando analisamos a relação entre uma variável nominal e uma variável
quantitativa.
- Este coeficiente é utilizado quando se considera que a variável quantitativa tem o estatuto
de variável dependente (sempre que não seja evidente qual das variáveis é independente e
qual é dependente, deve evitar-se este indicador).
Valor do Eta
-Tal como no caso do V de Cramer, o coeficiente Eta varia entre 0 e 1.
- O seu valor indica a proporção da variável dependente que é explicada pela variável
independente.
-Esta variável varia entre 0 e 1 (quanto mais próximo de 1 mais variabilidade é explicada).
Por exemplo:
- No caso de duas variáveis serem quantitativas, não faz sentido colocar uma tabela com
medidas comparativas por grupos, porque nenhuma das variáveis forma grupos, mas deve
ser dada indicação sobre cada uma das variáveis como por exemplo pode ser colocada uma
tabela que indique os valores mínimo e máximo, a média e o desvio-padrão.
Diagrama de dispersão
- O diagrama de dispersão é um gráfico em que cada uma das variáveis é representada num
eixo (se uma das variáveis tiver o estatuto causa e outra de efeito, a primeira fica no eixo
horizontal e a segunda no vertical) e os pontos representam a posição de cada uma das
observações nas duas variáveis.
Exemplo de análise:
-Nestes dois casos é perceptível a existência de uma relação entre as duas variáveis. No
primeiro caso pode considerar-se que existe uma relação em sentido directo/positivo (isto
é: quando uma das variáveis aumenta, a outra também), enquanto no segundo caso existe
uma relação inversa/negativa (quando uma variável aumenta a outra diminui).
Coeficiente de Correlação de Pearson (r)
-Tal como o coeficiente de correlação de Spearman, este coeficiente de Pearson varia entre
-1 e +1 e permite conhecer o sentido e medir a intensidade da relação entre as variáveis.
-O sentido da correlação é dado pela orientação da nuvem de pontos e pelo sinal do
coeficiente de correlação.
Exemplo de análise:
Exemplo:
Ao realizar um trabalho, o António recebe 5€ por cada tarefa que completa.
Variável dependente: é a quantia em dinheiro que recebe porque esta quantia depende do
número de tarefas que completa.
Variável independente:é o número de tarefas que completa porque esta é a variável sobre a
qual tem controlo.