Escolar Documentos
Profissional Documentos
Cultura Documentos
AULAS SEMANA 1
INTRODUÇÃO E CONCEITOS BÁSICOS
❖ Parâmetros:
Universo
população Amostra
𝑋̅ 𝑀𝑒; 𝑀𝑜 Indicadores
µ (localização)
ou medidas
σ (dispersão) 𝑆′ estatísticas
N
𝑛
❖ Nota:
• µ - lê-se miú (média populacional)
• σ - lê-se sigma (desvio padrão populacional)
• 𝑋 ̅ – lê-se média amostral
❖ MEDIDAS DE LOCALIZAÇÃO
1. Qualitativa nominal: Medida de localização
(tendência central) – MODA = sexo
masculino.
A moda é o valor que foi mais vezes observado. Pode ser calculada qualquer que
seja o tipo de variável, esta representa a modalidade da variável que ocorre mais
vezes. Esta vê-se nas frequências absolutas simples ou nas frquências relativas
simples.
2. Qualitativa ordinal
2.1 Medidas de localização de
tendência central:
Mo = (30-34) → moda
Me = (30-34) → mediana
1
Média: (𝑋̅ = ∑𝑛𝑖=1 𝑥𝑖 ): pode ser um valor não
𝑛
assumido pela variável (contrariamente à moda) e
tem a desvantagem ser fortemente influenciada
por valores extremos e outliers da distribuição.
∑𝑖 𝑋𝑖 ∑𝑖 𝑥𝑖 𝐹𝑖
𝑋̅ = = = ∑𝑖 𝑥𝑖 𝑓𝑖 , onde 𝐹𝑖 é a
𝑛 𝑛
𝑋̅= (30 × 0,09) + (45 × 0,12) + (50 × 0,04) + (60 × 0,19) + (75 × 0,08) + (90 × 0,12)
+(105 × 0,06) + (120 × 0,12) + (135 × 0,02) + (150 × 0,06) + (165 × 0,02) +(180 ×
0,06) + (195 × 0,02) = 2,7 + 5,4 + 2 + 11,40 + 6 + 10,8 + 6,3 + 14,4 + 2,7 + 9 + 3,3
+ 10,8 + 3,9 = 88,7 𝑚𝑖𝑛
2º VIA: dados não classificados (rol de dados)
∑𝑖 𝑋𝑖 8870
𝑋̅ = = = 88,7 min
𝑛 100
❖ Resumo
NOTA:
• Tendência central: média, média aparada, mediana e moda.
• Tendência não central: quartis, decis, percentis, mínimo e máximo.
AULAS SEMANA 2
MEDIDAS DESCRITIVAS
3.1 Medidas de localização (cont.)
3.1.2 MÉDIA APARADA A 5%
3.1.3 MODA
❖ Mo= 60 min, i.e., o tempo de leitura do semanário preferido mais frequentemente
registado é de 60 minutos.
3.1.4 QUARTIS
❖ Q1 = 52,5 min → 25% dos leitores demoram, no máximo, 52,5 min a ler o
semanário preferido.
❖ Q2 = Me = 75 min, i.e., metade dos leitores demoram, no máximo, a ler o seu
semanário preferido 75 min.
❖ Q3 =120 min → 75% dos leitores demoram, no máximo, 120 min a ler o
semanário preferido.
Intervalo
interquartil
Intervalo de
(Q3 – Q1) = variação
120-55 = 65 ou
67,5 (Vmáx-
(dependendo Vmin.) = 195-
do critério que 30 = 165 min
escolhermos
Os outliers são valores anómalos e, por isso mesmo, afastam-se do padrão
considerado (entre Q3 e Q1), sendo classificados em moderados e severos:
• Outlier moderado- há dois outliers sobrepostos, que não se distinguem no
respetivo gráfico, e que estão identificados por um círculo.
𝑄3 + 1,5 × (𝑄3 − 𝑄4 ) < 𝑋𝑖 ≤ 𝑄3 + 3 × (𝑄3 − 𝑄1 ) OU 𝑄3 + 1,5 × (𝑄3 −
𝑄4 ) < 𝑋𝑖 ≤ 𝑄3 + 3 × (𝑄3 − 𝑄1 )
• Outlier severo- identificado no gráfico por um asterisco:
𝑋𝑖 > 𝑄3 + 3 × (𝑄3 − 𝑄1) OU 𝑋𝑖 < 𝑄1 − 3 × (𝑄3 − 𝑄1 )
Se não soubermos onde está o outlier, fazendo as contas abaixo, se sair fora dos
valores que nos deu é porque é um outlier
Intervalo interquartilico:
3.2.2 RELATIVAS
Coeficiente de variação:
GRÁFICOS
Box-plot:
AULAS SEMANAS 3 E 4
CONCEITOS E EXPLICAÇÕES + DADOS BIVARIADOS
❖ Medidas descritivas:
• As medidas descritivas (ou de síntese) resumem os valores da variável (dos
dados) num só valor e estão classificadas em diversos tipos: localização de
tendência central; localização de tendência não central; dispersão e
concentração; assimetria; e achatamento.
• No entanto, para descrever corretamente o comportamento duma variável
são necessárias sempre mais do que uma medida, sendo fundamental
apresentar, pelo menos, uma de localização de tendência central e uma de
dispersão.
• No SPSS Statistics existem vários comandos que permitem calcular as
principais medidas descritivas. Por exemplo: Analyze → Descriptive
Statistics → Frequencies.
Percentis:
Enviesamento:
1. GRÁFICOS ADEQUADOS
1.1. Duas variáveis qualitativas nominais
Gráfico circular:
❖ As percentagens do total
❖ Interpretação: a tabela revela que:
• Do grupo dos leitores que preferem o Expresso, 28% são do sexo feminino.
• Do grupo dos leitores so sexo masculino, 30,3% preferem o regional.
• Do grupo dos leitores que preferem o sol, 60% são do sexo feminino.
• A percentagem do total de leitores do sexo masculino são 66% (em 100).
• Os leitores que preferem o regional são 25% do total.
• 36 leitores inquiridos de um total de 100 são do sexo masculino e preferem
o expresso (ocorrência simultânea).
AULAS SEMANA 5
HISTOGRAMAS
❖ No SPSS só se conseguem fazer histogramas com classes de igual amplitude e,
em alguns casos, apresentar as frequências absolutas (contagem de leitores),
situações estas que restringem a utilidade destes gráficos para caracterizar a
relação entre 2 variáveis, uma quantitativa contínua e outra qualitativa.
Apresentam-se dois casos: histograma estilo pirâmide e histograma em painel.
Gráfico de medidas:
❖ Interpretação do boxplot:
• Vê-se perfeitamente que a dispersão do número de semanários lidos por
mês no grupo das leitoras é menor que no grupo do sexo masculino →
maior dispersão no grupo dos leitores do sexo masculino (o intervalo de
variação no grupo das leitoras é de 7 enquanto que no outro grupo é de
13).
• Quer a mediana, quer o 1º e o 3º quartil do grupo de leitoras do sexo
feminino são inferiores à mediana, 1º e 3º quartis do grupo de leitores do
sexo masculino.
• Há mais leitores do sexo masculino que leem mais semanários por mês.
• O número máximo de semanários lidos por mês no grupo das leitoras é 9
enquanto que no grupo dos leitores é 16 → há uma diferença.
• Nas leitoras do grupo feminino a mediana aproximava-se mais do 1º quartil,
tal como nos leitores do sexo masculino e portanto era assimétrica positiva.
• O número mínimo de semanários lidos por mês no grupo das leitoras é de
2 enquanto o correspondente mínimo no outro grupo é 3.
• Enquanto que a mediana do número de semanários lidos por mês no grupo
das leitoras é 5,5, a mediana da mesma variável no outro grupo é de 7
semanários lidos por mês.
• O 1º quartil é 4 e 5 (feminino e masculino respetivamente) e o 3º quartil é 8
e 10 respetivamente.
• O intervalo interquartilico no grupo das leitoras é 4 (8-4) e no grupo dos
leitores é 5 (10-5).
• A distribuição do número de semanários lidos por mês em ambos os grupos
é assimétrica positiva (skewness fem. = 0,029; skewness mas. = 0,967).
• A distribuição do número de semanários lidos por mês em ambos os grupos
é menos achatada que a distribuição normal, no grupo das leitoras é
platicúrtica (-1,185) enquanto que no outro grupo é leptocúrtica (0,073).
• Não há valores anómalos (outliers) em ambos os grupos.
❖ Interpretação do gráfico:
• A dispersão do número de semanários lidos por mês é maior para o
expresso a comparar com os outros 2 semanários, se bem que a diferença
para o regional não é tão grande quanto a diferença para o sol.
• O expresso e o sol têm a mesma mediana e o mesmo 1º quartil, só diferem
no 3º quartil, enquanto que o expresso e o regional têm o mesmo 3º quartil.
• O semanário mais lido por mês é o expresso e o menos lido é o sol.
• A distribuição do número de semanários lidos por mês é assimétrica
positiva no expresso (1,203), no regional (0,696) e no sol (0,309).
• A distribuição do número de semanários lidos por mês é platicúrtica no
grupo regional (-0,259), e leptocúrtica nos outros dois semanários,
expresso e sol (1,104 e 0,112 respetivamente).
• Existem outliers, 32 e 68.
• (Podia dizer mais coisas).
❖ Interpretação tabela:
• Há uma relação forte e positiva (0,988 ou 0,953 se atendermos aos
empates).
❖ Interpretação:
• O Rho de Spearman, sendo igual a 0,582, já vamos dizer que é uma relação
moderada, enquanto que na tabela anterior havia uma relação forte entre
as variáveis.
• A relação entre estas variáveis é moderada (0,582 ou 0,520 se atendermos
aos empates).
AULAS SEMANA 6
INSERIR TÍTULO
1.6 Uma variável métrica (quantitativa) e uma variável qualitativa nominal
(ou tratada como tal)
Gráfico de linhas ou perfil de médias
❖ Interpretação do gráfico:
• Os níveis médios da concordância no grupo dos leitores do sexo masculino,
são quase sempre superiores aos níveis médios de concordância do outro
grupo, com exceção do “lê-se facilmente”; “temas tratados de grande
interesse”; “informação atualizada”.
• Ambos os sexos atribuem o mesmo nível médio de concordância à “leitura
agradável”.
• Relativamente aos atributos “leitura agradável”, “assuntos/temas bem
arrumados”, “tem boa ilustração”, “informação atualizada” e “temas tratados
de grande interesse” têm médias muito idênticas. Ou seja, os sexos dos
leitores têm as mesmas preferências nestes atributos.
❖ Interpretação da tabela:
• Registam-se 36 leitores que preferem o semanário Expresso e que são do
sexo masculino.
• Dos leitores que preferem o expresso, 72% são do sexo masculino.
• Dos leitores do sexo masculino, 54,5% preferem o Expresso como
semanário preferido.
• 50% dos leitores preferem o semanário Expresso.
• 66% dos leitores são do sexo masculino.
• 14% dos leitores são do sexo feminino e preferem o semanário expresso.
• 50 leitores preferem o semanário expresso.
• 34 leitores são do sexo feminino.
• 100 leitores responderam a ambas as questões, isto é, ao sexo e ao
semanário (neste caso corresponde ao total de indivíduos alvo do estudo).
• Identifica-se uma potencial relação entre o semanário preferido e o sexo
uma vez que dos 66 leitores que são do sexo masculino, 36 preferem o
expresso (54,5%), enquanto que, dos 34 leitores do sexo feminino, 44,1%
preferem o sol e 41,2% preferem o expresso.
• De outra forma, verificam-se algumas alterações nas preferências do
semanário quando se passa da análise dos leitores para a análise das
leitoras.
❖ Interpretação da tabela:
• A média do tempo de leitura do semanário Expresso é maior (118,2
minutos) do que as médias dos tempos de leitura dos outros dois
semanários (Regional = 61,4 minutos e Sol = 57 minutos).
• Os desvios padrão, quando comparados com as respetivas médias, são
menos de metade em todos estes semanários, o que leva a concluir-se que
a dispersão do tempo de leitura dos semanários preferidos, Expresso,
Regional e Sol, em torno da sua média, é fraca.
• Assim, conclui-se pela existência de uma relação moderada entre o tempo
de leitura e o semanário preferido, já que os leitores que preferem o
Expresso se diferenciam dos leitores que preferem os outros dois
semanários, embora estes dois grupos de leitores não se diferenciem muito
em termos do tempo médio de leitura.
❖ São mais adequadas para caracterizar a relação entre uma variável quantitativa e
uma qualitativa, em que se calculam as medidas descritivas para a quantitativa em
cada grupo definido pela qualitativa.
ALFA DE CRONBACH
❖ É um coeficiente que vai medir as correlações parciais e totais entre as variáveis.
❖ Às vezes temos alfa de cronbach’s entre 4 itens → vai considerar as correlações
totais entre cada par de combinações.
❖ Vai medir estas relações para medir o grau de consistência dadas às respostas
daqueles itens.
❖ Quando esta medida é baixa quer dizer que uma parte dos respondentes
respondeu num sentido, e outra parte respondeu noutro sentido → não há
consistência entre respostas e por isso não podemos avançar com o compute.
❖ Grau de consistência interna de um grupo de variáveis ou itens e isso é dado pelas
respostas que cada inquirido dá.
EXERCÍCIO
P (A / T)
(probabilidade
de A sabendo
T)
❖ A)
𝑃 (𝐸𝑥𝑝𝑟𝑒𝑠𝑠𝑜 ∩𝑀)
Nota: na probabilidade condicionada ficaria 𝑃 (𝐸𝑥𝑝𝑟𝑒𝑠𝑠𝑜)
❖ B)
34
❖ C) 100 = 0,34 = 34%
25
❖ D) 100 = 0,25 = 25%
❖ E)
5
❖ F) 𝑃 (𝐹 ∩ 𝑅𝑒𝑔𝑖𝑜𝑛𝑎𝑙) = 100 = 0,05 = 5%
Perfil de Medianas
❖ Interpretação do gráfico:
• O grupo dos leitores do sexo masculino, atribuem uma concordância
mediana sempre superior ao do outro grupo, nos itens “papel de boa
qualidade”, “periodicidade correta”, e “lê-se facilmente”.