Escolar Documentos
Profissional Documentos
Cultura Documentos
Estatstica
1 Semestre 2016/2017
Estatstica
A Estatstica no quotidiano
1
23-02-2017
Estatstica
Estatstica
2
23-02-2017
Estatstica
Estatstica
3
23-02-2017
Estatstica
Estatstica - definio
4
23-02-2017
Estatstica
Estatstica
5
23-02-2017
Estatstica - Erros
O problema do mau uso da matemtica pelos profissionais de comunicao foi
identificado h j vrias dcadas, em especial nos EUA. Apesar disso e da
crescente importncia que a informao matemtica assume na sociedade
atual, s atualmente o problema se encontra em estudo no que se refere
imprensa portuguesa.
Susana Simes Pereira, Jos Manuel Pereira Azevedo, Antnio Jos de Oliveira Machiavelo
Estatstica - Erros
6
23-02-2017
Estatstica - Erros
Publicado a 23-06-2002
www.publico.pt/noticias/jornal/ha-gato-nas-estatisticas-do-emprego-qualificado-74755
Estatstica - Erros
Dirio Econmico
2 de Junho de 2011
7
23-02-2017
Programa
Parte 1 Parte 2 Parte 3
Recolha e
Recolha e preparao
preparao dos dos Apresentao dos dados Generalizao dos
dados
dados resultados
8
23-02-2017
Avaliao
Ponderao
AVALIAO PERIDICA
Avaliao Individual
60%
Nota mnima no teste de 8.5 valores.
Para o bter apro vao necessrio que a Mdia Final ponderada seja superior o u igual a
9.5.
Bibliografia
9
23-02-2017
Bibliografia
Estatstica
10
23-02-2017
Tipos de Estudos
Parte 1 Parte 2 Parte 3
recolha de informao j
Estudos de Gabinete ou Estudos
existente
Documentais
dados secundrios
Estudos Documentais
Exemplo: dados secundrios
11
23-02-2017
Estudos Documentais
Exemplo: dados secundrios
Estudos de Campo
Dados Primrios
Acesso a toda a populao Censo ou Recenseamento
12
23-02-2017
Lei n. 10/2000
Regime jurdico da publicao ou difuso de sondagens e inquritos de opinio
13
23-02-2017
Artigo 2.
Definies
Para os efeitos da presente lei, entende-se por:
a) Inqurito de opinio, a notao dos fenmenos relacionados com o disposto no
artigo anterior, atravs de um mero processo de recolha de informao junto de
todo ou de parte do universo estatstico;
b) Sondagem de opinio, a notao dos fenmenos relacionados com o disposto no
artigo anterior, cujo estudo se efetua atravs do mtodo estatstico quando o
nmero de casos observados no integra todo o universo estatstico,
representando apenas uma amostra.
- 27 - Estatstica 1 Ano 1 Semestre
2. Mtodo de amostragem
Amostragem aleatria
Amostragem no aleatria
14
23-02-2017
Vantagens
Possibilidade de deixar ver, sentir e/ou saborear um produto;
Possibilidade de encontrar a populao-alvo mais facilmente;
Desvantagens
Geralmente custam mais por entrevista que outros mtodos;
Cada local tem as suas prprias caratersticas, podendo criar uma
amostra no representativa.
Desvantagens
Telemarketing, a prtica massiva de falsas pesquisas levou a uma taxa de
recusa mais elevada;
O horrio restrito de disponibilidade da maioria da populao ativa;
Impossibilidade de mostrar produtos por telefone.
15
23-02-2017
Vantagens
Pesquisas por correio esto entre os menos caros;
O questionrio pode incluir fotos - algo que no possvel atravs do
telefone;
Permitir que o entrevistado responda quando lhe for conveniente.
Desvantagens
Tempo! Pesquisas por correio demoram muito mais do que outros tipos;
Em populaes de menor escolaridade e alfabetizao, taxas
de resposta a inquritos de correio so muitas vezes
demasiado pequenas para serem teis.
Vantagens
A eliminao virtual dos custos de edio;
Respostas mais precisas s questes sensveis;
Velocidade. Podem obter-se vrios milhares de respostas em pouco tempo;
Quase sem custos envolvidos, uma vez que a criao foi concluda;
Podem anexar-se fotos e arquivos de som.
16
23-02-2017
Desvantagens
Necessidade de uma lista de endereos de email;
Possibilidade de responderem vrias vezes ou passar questionrios junto aos
amigos para responder, caso no haja mecanismos de controle;
Muitas pessoas no gostam de email no solicitados e tambm podem ser
filtrados como SPAM;
Impossibilidade de generalizar resultados de pesquisas de email para as
populaes inteiras.
Email e inquritos online so os mtodos mais rpidos, bem como por telefone.
Velocidade
Inquritos postais so os mais lentos
Utilizao de Email e inquritos online tm evidente vantagem, mas os seus resultados no podem
Internet ser generalizados
Habilitaes Pessoas com menos formao raramente respondem a inquritos postais ou pela
literrias internet
Imagens, sons,
No possvel em inquritos telefnicos e com limitaes nos postais
sabores
17
23-02-2017
Mtodos de Amostragem
Mtodos de Amostragem
Tipos de erros:
Erro Amostral = | estatstica parmetro |
Erro de Enviesamento
18
23-02-2017
Resultado da eleio:
Alf Landon (40%)
Franklin Roosevelt (60%)
19
23-02-2017
Amostragem
Estudos Quantitativos
Estudos
Recenseamento Amostragem
Aleatria No aleatria
20
23-02-2017
Processos de Seleo
Aleatrios (probabilsticos)
Cada elemento da populao tem uma probabilidade conhecida de
pertencer amostra;
possvel determinar a preciso das estimativas;
No h interferncia nem do entrevistador nem do investigador.
Processos Aleatrios
Vantagens
Cada elemento da populao tem uma certa probabilidade
(calculvel e diferente de zero) de pertencer amostra;
possvel determinar a preciso das estimativas;
possvel determinar matematicamente a dimenso da amostra a
recolher em funo da preciso e do grau de confiana associado
ao estudo;
No h interferncia do entrevistador nem do investigador (no
enviesamento).
21
23-02-2017
Processos Aleatrios
Desvantagens
Por vezes necessrio a obteno de uma listagem completa e
atualizada de todos os elementos que constituem a populao;
(muitas vezes impossvel porque as populaes podem ser infinitas, )
Processos No aleatrios
Vantagens
No necessita base de referncia
Tempo
Custo
Desvantagens
Normalmente geram amostras no representativas da populao, o que
pode causar enviesamentos e interpretaes erradas.
22
23-02-2017
Processos aleatrios
Populao
1 grupo 2 ou mais
grupos
Processos no aleatrios
Populao
2 ou mais
1 grupo
grupos
Snowball
23
23-02-2017
Amostragem Aleatria
Amostragem Aleatria
Simples
Sistemtica
Rotas Aleatrias
Estratificada
Por Clusters
Multi-etapas
Amostra
N n
elementos elementos
24
23-02-2017
Mtodo
aleatrio
Caratersticas:
Processo moroso e caro, se a amostra for grande;
Muitas vezes impraticvel por exigir a enumerao de todos os
elementos da populao;
No caso de uma populao pequena pode ser til e fcil de aplicar se
a base de sondagem for credvel;
A seleo dos elementos pode fazer-se atravs de tabelas de nmeros
aleatrios, mtodo da lotaria, etc.
25
23-02-2017
26
23-02-2017
Amostra
N n
elementos elementos
De forma
sequencial
Etapas:
N
1. Calcular o intervalo da amostra: K = int
n
Caratersticas:
Processo semelhante ao da amostragem aleatria simples.
27
23-02-2017
Exemplo:
N = 200 ; n = 50 => K = 4
Escolher um nmero aleatrio x : 1 < x < 4. Por exemplo, 3
Os indivduos selecionados sero:
3, 7, 11, 15, ..., 195, 199
Problema:
Vendas mensais de determinada empresa;
Calcular o valor de K;
Quando os elementos tm comportamentos cclicos tem que se
ter ateno ao valor de K. Por exemplo, ao selecionar
aleatoriamente o nmero correspondente a um determinado
ms, escolher-se-ia sempre o mesmo ms todos os anos =>
Enviesamento dos resultados obtidos.
28
23-02-2017
Etapas:
1. Selecionar aleatoriamente um ponto de partida Ponto de
amostragem;
2. Definir critrios de escolha dos elementos Definir as regras de
orientao para o entrevistador;
3. Reunir os elementos selecionados para constiturem a amostra.
Exemplo:
A partir de uma determinada rua, virar na 1 direita e depois na 2 rua
esquerda.
Quando se vira direita entrevistam -se os moradores das casas mpares;
quando se vira esquerda entrevistam -se os moradores das casas pares.
29
23-02-2017
Exemplo:
Seleo de edifcios
Exemplo:
Seleo de edifcios (cont.)
30
23-02-2017
N1 elementos
Amostra n elementos
N2 elementos
n2 n1
. elementos elementos
n = n1 + n2 +
N = N1 + N2 + .
Etapas:
1. Definir os estratos;
2. Escolher aleatoriamente os elementos de cada estrato;
3. Reunir os elementos selecionados em cada estrato para constiturem
a amostra
Exemplo:
Estudo sobre caratersticas mais importantes num carro.
31
23-02-2017
Amostragem Estratificada
Caratersticas:
Os estratos devem ser exaustivos (cobrir toda a populao) e
mutuamente exclusivos (no haver elementos que pertenam a mais do
que um estrato);
A diviso da populao deve ser feita de acordo com as caratersticas
da populao em estudo;
O ideal que a variabilidade dentro dos estratos seja pequena e grande
entre os estratos;
A amostragem estratificada pode ser proporcional ou no proporcional.
32
23-02-2017
Etapas:
1. Especificar os Clusters (Conglomerados);
2. Escolher aleatoriamente um conjunto de clusters;
3. Construir a amostra com todos os elementos de cada cluster
selecionado.
33
23-02-2017
Exemplos:
34
23-02-2017
Caratersticas:
Etapas:
1. Definir os Clusters;
2. Escolher aleatoriamente um conjunto de clusters. De acordo com o
nmero de etapas que se considerarem, vo-se definindo e
selecionando os novos clusters at se obterem as unidades
elementares;
3. Construir a amostra com todos os elementos de cada cluster
selecionado.
35
23-02-2017
Exemplo:
Numa sondagem sobre estudantes de ensino secundrio a nvel nacional:
1. Selecionar localidades;
2. Selecionar escolas secundrias;
3. Selecionar turmas dentro das escolas secundrias;
4. Entrevistar todos os alunos das turmas selecionadas.
Caratersticas:
Mtodo geralmente econmico.
Amostragem No Aleatria
Amostragem No Aleatria
Intencional
Snowball
Por Convenincia
Por Quotas
36
23-02-2017
Amostragem Intencional
Exemplo:
Num estudo sobre o futuro da Televiso pblica, escolher uma amostra de
especialistas no sector audiovisual.
Caratersticas:
Mtodo geralmente usado em estudos exploratrios;
Obteno de amostras de dimenso reduzida;
Impossibilidade de se conseguir uma amostra aleatria;
Conseguir deliberadamente uma amostra enviesada.
Amostragem Snowball
Exemplo:
Populaes com caratersticas especficas:
Deficientes, emigrantes, imigrantes, etc.
37
23-02-2017
Exemplos:
Pessoas que passam no local onde o entrevistador faz inquritos.
Etapas:
1. Definir as quotas;
2. Escolher os elementos respeitando as quotas;
3. Reunir os elementos selecionados para constiturem a amostra.
38
23-02-2017
Quotas independentes
Idade
15-24 18
Gnero
25-34 25
Masculino 48
35-44 30
Feminino 52
Mais de 44 27
Total 100
Total 100
Quotas interrelacionadas
Idade
15-24 25-34 35-44 Mais de 44 Total
Gnero
Masculino 10 11 12 15 48
Feminino 8 14 18 12 52
Total 18 25 30 27 100
39
23-02-2017
Dimenso da amostra
40
23-02-2017
Dimenso da Amostra
Amostras no aleatrias:
Oramento disponvel
Dimenso da Amostra
Amostras aleatrias:
Dimenso da populao
Custo
41
23-02-2017
Dimenso da Amostra
P (1 - P )
e = 1 , 9 6 x
n
Dimenso da Amostra
P(1- P) P(1- P)
n= n=
e
2
2
Erro mximo
e
que se
pretende + P(1-P )
1.96
1,96
z
N
42
23-02-2017
2% 3% 5%
Partido Proporo Amostra Amostra Amostra
PSD (38,63%) 0,3863 2277 1012 365
PS (28,05%) 0,2805 1939 861 311
CDS-PP (11,71%) 0,1174 996 442 160
PCP-PEV (7,90%) 0,0790 703 311 112
BE (5,17%) 0,0517 473 210 76
Introduo ao software
SPSS
43
23-02-2017
Start
IBM SPSS Statistics
IBM SPSS Statistics 21
44
23-02-2017
45
23-02-2017
Barra de Ferramentas:
46
23-02-2017
Qualitativo
Representam qualidades associadas aos indivduos.
Podem ser representadas por nmeros, mas estes no tm qualquer
significado matemtico.
Quantitativo
Representam quantidades associadas aos indivduos.
So representadas por nmeros, e esses nmeros tm significado
matemtico (por exemplo, 4 o dobro de 2).
Nominais
Qualitativos
Ordinais
Dados
Quantitativos
47
23-02-2017
Nominal
Os dados so identificados pela atribuio de um nome que se
designa por categoria (classe ou modalidade).
As categorias so exaustivas e mutuamente exclusivas.
Apenas permite caraterizar algum aspeto qualitativo da caraterstica
que est a ser estudada.
No existe qualquer relao de ordem entre as categorias (apenas
permite dizer se uma modalidade igual ou diferente de outra).
Podem ser representadas por nmeros, mas estes no tm qualquer
significado matemtico.
varivel nominal
policotmica
48
23-02-2017
1 2 3 4 5
49
23-02-2017
LEGENDA:
Genero: Masculino, Feminino
Ano Curso: 1 ano, 2 ano
Presenas: N de presenas s aulas (0-12)
TPC: N de TPC realizados (0-8)
Teste_1: Classificao no 1 teste (0-20)
Teste_2: Classificao no 2 teste (0-20)
50
23-02-2017
LEGENDA:
Gnero:Gnero do funcionrio (Fem, Masc)
Idade: Idade do funcionrio (em anos)
N_Filh: Nmero de Filhos do funcionrio
C_Trab: Condies de trabalho (Pess, Ms, Mdias, Boas, Exc)
A_Emp: Antiguidade na empresa (< 3, 3 a 5, 6 a 8, > 8)
D_Casa: Distncia do emprego a casa (em Km)
51
23-02-2017
52
23-02-2017
53
23-02-2017
54
23-02-2017
55
23-02-2017
56
23-02-2017
Como proceder?
Transforme
Compute Variable
57
23-02-2017
Nome
da nova
varivel
58
23-02-2017
Como proceder?
Seleccione os comandos:
Transforme
Compute Variable
59
23-02-2017
Como proceder?
Seleccione os comandos:
Transforme
Compute Variable
60
23-02-2017
Situao Final:
Reprovado se nota final < 9.5
Aprovado se nota final 9.5
Como proceder?
61
23-02-2017
Nome
da nova
varivel
62
23-02-2017
63
23-02-2017
64
23-02-2017
65
23-02-2017
O que a estatstica?
Para que serve a estatstica?
Grupo 1 Grupo 2
6 4 1 12 7 5 6 9 2 12 8 4
3 6 5 8 11 5 3 11 1 10 9 3
2 9 7 9 4 10 4 5 4 7 3 9
8 6 6 7 5 7 5 8 10 2 9 3
66
23-02-2017
Grupo 1 Grupo 2
x x x x x
x x x x x x
x x x x x x x x x x x x x
x x x x x x x x x x x x x x x x x x x x x x x x
1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12
67
23-02-2017
Como proceder?
1 - listar todas as categorias da varivel em estudo
2 - contar os elementos pertencentes a cada modalidade (ou classe).
x1 n1 f1 = n 1/N
Modalidade x2 n2 f2 = n 2/N
ou classe
xk nk fk = n k/N
68
23-02-2017
Gnero ni fi
Masculino 13 13/30 = 0.43
Feminino 17 17/30 = 0.57
69
23-02-2017
70
23-02-2017
Cada ou corresponde
a 5 indivduos
71
23-02-2017
72
23-02-2017
73
23-02-2017
Como proceder?
1 - listar todas as categorias da varivel em estudo e orden-las
2 - contar os elementos pertencentes a cada modalidade (ou classe).
74
23-02-2017
X ni fi Ni Fi
x1 n1 f1 = n 1/N n1 f1
xk nk fk = n k/N N 1k
Total N 1
75
23-02-2017
76
23-02-2017
N de Irmos ni fi Ni Fi
0 8 8/30 = 0.27 8 0.27
1 12 12/30 = 0.40 20 0.67
2 6 6/30 = 0.20 26 0.87
3 4 4/30 = 0.13 30 1.00
77
23-02-2017
78
23-02-2017
79
23-02-2017
Ponto mdio da X ni fi Ni Fi
classe
x'1=(l1+l2)/2 [l1, l2[ n1 f1 = n 1/N n1 f1
Total N 1
Frequncia Frequncia
Frequncia Frequncia absoluta relativa
absoluta (ni ) relativa (fi ) acumulada (N i ) acumulada (F i )
80
23-02-2017
81
23-02-2017
82
23-02-2017
Distribuies de Frequncia e
Representaes Grficas - Exerccios
Considere o novamente o conjunto de
dados referente avaliao contnua de
27 estudantes.
Descreva cada uma das variveis atravs
de distribuies de frequncia e de
representaes grficas. LEGENDA:
Gnero:Gnero do
funcionrio (Fem, Masc)
Idade: Idade do funcionrio
LEGENDA: (m anos)
N_Filh: Nmero de Filhos
Genero: Masculino, Feminino do funcionrio
Ano Curso: 1 ano, 2 ano, 3 ano C_Trab: Condies de
Presenas: N de presenas s aulas (0-12) trabalho (Pess, Ms,
Mdias, Boas, Exc)
TPC: N de TPC realizados (0-8) A_Emp: Antiguidade na
Teste_1: Classificao no 1 teste (0-20) empresa (< 3, 3 a 5, 6 a
Teste_2: Classificao no 2 teste (0-20) 8, > 8)
D_Casa: Distncia do
emprego a casa (em Km)
Estatsticas Descritivas
Os dados tambm podem ser caraterizados pela obteno de medidas
estatsticas designadas por Estatsticas Descritivas.
b) Medidas de disperso:
Permitem quantificar a variabilidade dos dados.
83
23-02-2017
Medidas de Localizao
As medidas de localizao podem ser classificadas em
Propriedades da Moda:
A moda bastante simples de calcular, no entanto tem o inconveniente de
poder no ser nica ou mesmo no existir.
A moda depende da frequncia das observaes.
A moda no afetada por valores extremos.
84
23-02-2017
A Moda da varivel
Gnero corresponde ao
gnero Feminino.
85
23-02-2017
A mediana s pode ser determinada para dados expressos numa escala pelo
menos ordinal.
Propriedades da Mediana:
A mediana nica.
A mediana depende das posies ocupadas pelas observaes.
A mediana depende unicamente das observaes centrais.
86
23-02-2017
87
23-02-2017
Assim, Me = 1 irmo
Propriedades da Mdia:
A mdia nica.
A mdia depende do valor de cada observao.
A mdia afetada por valores extremos.
88
23-02-2017
Medidas de Posio
De uma forma geral as medidas de posio so designadas por quantis, isto ,
so medidas que permitem dividir (uma amostra ordenada) em vrias partes
iguais.
Decis (D 1, D 2, , D 9)
Dividem a amostra em 10 partes iguais
89
23-02-2017
Medidas de Posio
Dizemos que o percentil de ordem p toma o valor a (Pp = a), quando p% das
observaes que so inferiores ou iguais a a e (100-p )% das observaes so
superiores ou iguais a a.
Me = Q2 = P50
90
23-02-2017
1 quartil:
O 1 Quartil corresponde a Zero irmos
2 quartil:
O 2 Quartil ou mediana corresponde a 1 irmo
3 quartil:
O 3 Quartil corresponde a 2 irmos
91
23-02-2017
Escala
Medida de localizao Nominal Ordinal Quantitativa
Moda
Central Mediana
Tendncia
Mdia
No central Quantis
Medidas de Disperso
As medidas de disperso quantificam a disperso, isto , a variabilidade dos
dados amostrais. Estas medidas, juntamente com as medidas de localizao,
permitem uma melhor descrio das amostras.
Amostra 1 14 15 18 18 25 Mo = 18 Me = 18
Amostra 2 10 18 18 18 26 Mo = 18 Me = 18
Amostra 3 18 18 18 18 18 Mo = 18 Me = 18
92
23-02-2017
Medidas de Disperso:
Amplitude de variao total
A amplitude de variao total pode ser calculada para dados expressos numa
escala quantitativa.
AVT
Amostra 1 14 15 18 18 25 11.0
Amostra 2 10 18 18 18 26 16.0
Amostra 3 18 18 18 18 18 0.00
Medidas de Disperso:
Amplitude de Variao Quartlica
As amplitudes de variao interquartlica e semi-interquartlica podem ser
calculadas para dados expressos numa escala quantitativa.
93
23-02-2017
Medidas de Disperso:
Amplitude de Variao Quartlica - exemplo
AVT AIQ ASIQ
Amostra 1 14 15 18 18 25 11.0 3.00 1.50
Amostra 2 10 18 18 18 26 16.0 0.00 0.00
Amostra 3 18 18 18 18 18 0.00 0.00 0.00
Medidas de Disperso:
Varincia e desvio-padro
A varincia mede a disperso das observaes em torno da mdia, isto ,
uma medida de disperso relativamente mdia.
Este tipo de medidas de disperso s pode ser calculado para dados do tipo
quantitativo.
Propriedades da varincia:
A varincia mede a disperso dos valores em relao mdia.
A varincia depende do valor de cada observao.
A varincia nica.
A varincia sempre um valor no negativo.
94
23-02-2017
Medidas de Disperso:
Varincia e desvio-padro
Medidas de Disperso:
Coeficiente de Variao - Exemplo
O Coeficiente de Variao uma outra medida de disperso que pode ser
determinada pelo quociente entre o desvio-padro e a mdia, isto ,
95
23-02-2017
Medidas de Disperso
Escala
Medida de disperso Nominal Ordinal Quantitativa
Amplitude de variao
total (Max-Min)
Amplitude de variao
semi-interquartlica
Varincia
Desvio-padro
Coeficiente de variao
96
23-02-2017
Moderado inferior:
Moderado superior:
Severo inferior:
Severo superior:
Outliers Outliers
Outliers
severos Outliers severos
moderados
inferiores moderados superiores
superiores
inferiores
97
23-02-2017
98
23-02-2017
Ou alternativamente, atravs de
99
23-02-2017
LEGENDA:
Genero: Masculino, Feminino
Ano Curso: 1 ano, 2 ano
Presenas: N de presenas s aulas (0-12)
TPC: N de TPC realizados (0-8)
Teste_1: Classificao no 1 teste (0-20)
Teste_2: Classificao no 2 teste (0-20)
100
23-02-2017
minimo Q1 Q2 Q3 mximo
101
23-02-2017
assimtrica assimtrica
simtrica
negativa positiva
102
23-02-2017
assimetria
negativa
103
23-02-2017
LEGENDA:
Genero: Masculino, Feminino
Ano Curso: 1 ano, 2 ano, 3 ano
Presenas: N de presenas s aulas (0-12)
TPC: N de TPC realizados (0-8)
Teste_1: Classificao no 1 teste (0-20)
Teste_2: Classificao no 2 teste (0-20)
104
23-02-2017
105
23-02-2017
Exerccio:
106
23-02-2017
a) Para cada uma das variveis, indique a sua escala de medida e as medidas
de localizao e de disperso mais adequadas para as caraterizar.
b) Construa uma tabela de frequncias para a varivel Antig.
c) Represente graficamente os valores associados varivel Antig.
d) Determine os percentis de ordem 10 e 50 para as variveis Antig e
Conf_Emp e interprete esses valores.
e) Estude a existncia de possveis outliers para a varivel Cred_Emp e
construa o diagrama de extremos e quartis.
f) Comente a seguinte afirmao O nvel de confiana dos funcionrios
relativamente empresa apresenta uma maior variabilidade de valores
do que o nvel de credibilidade da empresa transmitido ao pblico por
parte dos seus funcionrios.
g) O que pode concluir sobre a assimetria e achatamento das variveis
Cred_Emp e Conf_Emp?
Estatstica Descritiva
Bivariada
107
23-02-2017
Cruzamento de variveis
Tabelas de Contingncia
O resumo de dados bivariados depende do nvel de mensurao das variveis.
Os dados bivariados podem ser representados atravs de tabelas de dupla
entrada designadas por tabelas de contingncia.
108
23-02-2017
Tabelas de Contingncia
O nmero de classes a considerar para cada uma das variveis pode no ser o
mesmo e a amplitude das classes de uma varivel no necessariamente igual
amplitude das classes considerada para a outra varivel.
NOTA: Estes dados encontram-se no ficheiro de dados do SPSS com o nome 1_educacao.sav
109
23-02-2017
[6.6;9.2[ 3 3 1 7
[9.2;11.8[ 1 2 0 3
[11.8;14.4[ 0 1 4 5
[14.4;17.0[ 1 2 1 4
[17.0;19.6[ 0 2 3 5
total 8 12 10 30
110
23-02-2017
do EE
do EE
Associao Estatstica
a sua intensidade
forte, mdia ou fraca
o seu sentido
positivo ou negativo
111
23-02-2017
Associao Estatstica
negativa
se as variveis variarem em sentidos opostos, isto , a valores elevados
de uma varivel esto associados valores baixos da outra varivel e
vice-versa.
Associao Estatstica
Diagramas de Disperso
A existncia (ou no) de associao estatstica entre duas variveis pode
ser analisada graficamente atravs de diagramas de disperso:
58
58
57
57
56
56
55
55
54
54
53 53
52 52
51 51
50 50
7 9 11 13 15 17 19 21 7 9 11 13 15 17 19 21
60
58
58
57
56
56
55
54
54
53
52 52
51
50 50
7 9 11 13 15 17 19 21 7 9 11 13 15 17 19 21
112
23-02-2017
Associao Estatstica
Diagramas de Disperso
58 60
57
58
56
55 56
54
54
53
52 52
51
50
7 9 11 13 15 17
7 9 11 13 15 17 19 21
61 58
59
56
57
54
55
53 52
51
50
49
48
47
0 5 10 15 20 25
7 9 11 13 15 17 19 21 23
113
23-02-2017
Exerccios
Considere o seguinte ficheiro de dados SPSS 2_avaliao_continua_exerccio,
referente avaliao contnua de 27 estudantes a uma cadeira de estatstica:
114
23-02-2017
Exerccios
Inferncia Estatstica
115
23-02-2017
Populao Seleco da
Amostra
Amostra
Estatsticas
descritivas
Inferir para
a populao
Probabilidade
de erro
116
23-02-2017
Parmetro Estatstica
Caraterstica
(Populacional) (amostral)
Dimenso N n
Valor mdio
Desvio padro s
Proporo p
Coeficiente de
r
Correlao
Mtodos de Estimao
Estimao Pontual:
Obter um valor numrico nico (a partir da amostra) para estimar o correspondente
parmetro populacional.
Estimao Intervalar:
Obter um intervalo de valores que contenha o(s) parmetro(s) desejado(s) com uma
probabilidade especificada.
Testes de hipteses:
Avaliar, atravs de tcnicas estatsticas apropriadas, se uma determinada hiptese
ou conjetura que se faz sobre os valores possveis do(s) parmetro(s) tem ou no
razo de existir.
117
23-02-2017
Estimao Pontual
Este mtodo tem bastantes desvantagens, uma vez que no existe nenhum
grau de certeza relativamente qualidade da estimativa obtida.
2,
A estimao pontual de e vai depender da amostra que se extrai:
118
23-02-2017
Estimao Intervalar
Exemplo:
A classificao mdia num teste de matemtica situa-se entre os 8 e 11
valores, com uma probabilidade de 95%.
Estimao Intervalar
119
23-02-2017
Estimao Intervalar
Estimao Intervalar
Margem de Erro:
metade da amplitude do intervalo de confiana
a medida da preciso
120
23-02-2017
p (1 p ) p (1 p )
IC 95 %
p 1 , 96 ; p 1 , 96
n n
121
23-02-2017
Testes de Hipteses
122
23-02-2017
Teste de Hiptese
Objetivo:
Avaliar se uma determinada hiptese ou conjetura que se faz sobre um
parmetro ou populao tem ou no razo de existir.
Nota:
Os testes de hipteses s devem ser aplicados a amostras aleatrias.
123
23-02-2017
1) Identificao do Teste:
124
23-02-2017
Exemplo:
Pretende-se analisar se a mdia das notas de acesso dos alunos de
PM no difere da mdia das notas de acesso dos alunos de RPCE.
H0 :
vs
H1 :
4) Deciso:
Quando se realiza um teste de hipteses, pode-se tomar uma de duas
decises:
125
23-02-2017
Situao real
H0 Verdadeira H0 Falsa
Rejeitar H0 Erro tipo I Deciso correta
Deciso
No rejeitar H0 Deciso correta Erro tipo II
Nvel de significncia
Grau de Confiana
Potncia do teste
126
23-02-2017
Situao real
H0 Verdadeira H0 Falsa
Rejeitar H0 Erro tipo I Deciso correta
( ) (1- )
Deciso
No rejeitar H0 Deciso correta Erro tipo II
(1- ) ( )
5) Concluso:
se a hiptese nula no rejeitada, diz-se que os dados sobre os quais o
teste foi realizado no apresentam evidncias suficientes para levar
rejeio desta hiptese;
se a hiptese nula rejeitada, diz-se que os dados em estudo no so
compatveis com a hiptese nula.
127
23-02-2017
Testes de Hipteses
Testes de independncia
Testes de Independncia do
Qui-Quadrado
128
23-02-2017
Condies de aplicabilidade:
As variveis podem estar expressas em qualquer escala, desde que
categorizadas;
A dimenso da amostra deve ser superior a 30 elementos;
no pode haver mais de 20% das clulas com frequncia esperada
inferior a 5;
cada clula tem de ter frequncia esperada igual ou superior a 1.
Hipteses:
Count
Acredita na astrologia?
129
23-02-2017
130
23-02-2017
Chi-Square Tests
Asymp. Sig.
Value df (2-sided)
a
Pearson Chi-Square 39,966 3 ,000
Likelihood Ratio 39,371 3 ,000
Linear-by-Linear
36,334 1 ,000
Association
131
23-02-2017
4) Deciso do teste
Como Sig < 0.001 < 0,05 Rejeita-se H0
132
23-02-2017
Anlise de resduos:
Se H0 for verdadeira, ou seja, se houver independncia, os resduos
estariam entre -2 e 2.
A existncia de no independncia explicada pelos resduos que
se afastam muito de -2 e 2.
133
23-02-2017
4) Deciso
Anlise de resduos
Acredita na astrologia?
5) Concluso
H uma maior tendncia para os indivduos do gnero feminino
serem mais crentes na astrologia. O inverso verificado
relativamente aos indivduos do gnero masculino que se mostram
menos crentes.
134
23-02-2017
Exemplos:
Considere a base de dados 4_Consumo.sav
135
23-02-2017
Associao Estatstica
a sua intensidade
forte, mdia ou fraca
o seu sentido
positivo ou negativo
Associao Estatstica
negativa
se as variveis variarem em sentidos opostos, isto , a valores elevados
de uma varivel esto associados valores baixos da outra varivel e
vice-versa.
136
23-02-2017
Associao Estatstica
58 58
57 57
56
56
55
55
54
54
53
53
52
52
51
51
50
50
7 9 11 13 15 17 19 21
7 9 11 13 15 17 19 21
60 58
57
58
56
55
56
54
54
53
52
52 51
50
50 7 9 11 13 15 17 19 21
7 9 11 13 15 17 19 21
Associao Estatstica
58 60
57
58
56
55 56
54
54
53
52 52
51
50
7 9 11 13 15 17
7 9 11 13 15 17 19 21
61 58
59
56
57
54
55
53 52
51
50
49
48
47
0 5 10 15 20 25
7 9 11 13 15 17 19 21 23
137
23-02-2017
Associao Estatstica
Spearman (S)
Caso de variveis pelo menos ordinais
138
23-02-2017
Teste de Pearson
1) Identificao do teste
Pretende-se avaliar se existe associao estatstica entre duas
variveis definidas numa escala quantitativa. O teste a realizar o
teste ao coeficiente de correlao de Pearson.
ou ento,
H0: =0
vs
H1: 0
139
23-02-2017
Teste de Pearson
Exemplo:
Existir alguma associao entre a cilindrada e as rotaes de um
automvel?
1) Identificao do teste
Pretende-se avaliar se existe associao estatstica entre duas
variveis definidas numa escala quantitativa. O teste a realizar o
teste ao coeficiente de correlao de Pearson.
Teste de Pearson
3) Determinao da significncia do teste
140
23-02-2017
Teste de Pearson
Teste de Pearson
Correlatio ns
Cilindrada Rotaes
(cm cbicos) por minuto
Cilindrada (cm cbicos) Pearson Correlation 1 -,442**
Sig. (2-tailed) ,000
N 125 125
Rotaes por minuto Pearson Correlation -,442** 1
Sig. (2-tailed) ,000
N 125 125
4) Deciso do teste
Como sig < 0.001 (inferior a 0.05) rejeita-se a hiptese nula,
5) Concluso:
Existe associao (do tipo linear) entre a cilindrada e as rotaes de um
automvel.
O valor do coeficiente de correlao de Pearson -0,442, logo a
associao negativa mdia. Ou seja, os automveis com mais rotaes
tm menos cilindrada
- 282 - Estatstica 1 Ano 1 Semestre
141
23-02-2017
142
23-02-2017
Teste de Spearman
O grau de associao entre duas variveis definidas numa escala pelo
menos ordinal pode ser estudado atravs do teste de associao de
Spearman:
ou ento,
H0: S =0
vs
H1: S 0
Teste de Spearman
Exemplo:
Ser que as pessoas mais comunicadoras tm tendncia para ser mais
eloquentes?
1) Identificao do teste
Pretende-se avaliar se existe associao estatstica entre duas
variveis definidas numa escala qualitativa ordinal. O teste a
realizar o teste ao coeficiente de correlao de Spearman.
143
23-02-2017
Teste de Spearman
3) Determinao da significncia do teste
Teste de Spearman
Correlatio ns
Comunicador Eloquente
Spearman's rho Comunicador Correlation Coefficient 1,000 ,418**
Sig. (2-tailed) . ,000
N 209 206
Eloquente Correlation Coefficient ,418** 1,000
Sig. (2-tailed) ,000 .
N 206 206
4) Deciso do teste
Como sig < 0.001 (inferior a 0.05) rejeita-se a hiptese nula,
5) Concluso:
Rejeita-se a hiptese nula, logo existe associao do tipo linear entre
as variveis Comunicador e Eloquente.
O valor do coeficiente ordinal de Spearman 0,418, logo a associao
positiva mdia. Ou seja, as pessoas mais comunicadoras so mais
eloquentes.
- 288 - Estatstica 1 Ano 1 Semestre
144
23-02-2017
b) Ser que se pode admitir que quanto mais velhas so os inquiridos menos
satisfeitos esto com a sua situao financeira actual?
145
23-02-2017
146
23-02-2017
Teste t-Student
147
23-02-2017
Kolmogorov-Smirnov ou Shapiro-Wilk
Hipteses:
148
23-02-2017
Teste t-Student
Hipteses
ou H0: 1= 2 vs H1: 1 2
Testes t-Student
Exemplo 1:
Teste a seguinte hiptese:
A Valorizao do estudo difere entre as raparigas e os rapazes que
frequentam a ESCS.
Hipteses:
Ho: O valor mdio da valorizao do estudo no difere entre as raparigas e
os rapazes.
vs
H1: O valor mdio da valorizao do estudo difere entre as raparigas e os
rapazes.
149
23-02-2017
Testes t-Student
No SPSS
Teste t-Student
Outputs da anlise:
150
23-02-2017
Teste t-Student
Resoluo:
Validao de Pressupostos:
v. dependente Valorizao do Estudo Quantitativa
v. independente Gnero Qualitativa nominal com 2 grupos: feminino e
masculino
Amostras independentes
n Fem =182; n Mas= 71 (ver output Teste t-Student) assume-se que a
distribuio assinttica Normal
Hipteses:
151
23-02-2017
Hipteses:
Deciso:
Como a sig.= 0.304 >0.05, no se rejeitar H0.
Concluso:
As varincias populacionais da valorizao do estudo so homogneas em
ambos os gneros.
152
23-02-2017
Testes t-Student
Anlise do teste t-Student:
Deciso:
Como a sig.< 0.001< 0.05, rejeitar-se H0.
Concluso:
A valorizao mdia do estudo difere consoante o gnero.
Testes t-Student
Concluiu-se que:
A mdia da valorizao do estudo difere significativamente entre rapazes e
raparigas que frequentam a ESCS.
153
23-02-2017
Testes t-Student
Exerccio:
Com base nos outputs apresentados, teste a seguinte hiptese:
O n mdio de anos de escolaridade difere consoante o gnero.
ANOVA one-way
154
23-02-2017
ANOVA one-way
Objetivo:
A ANOVA usada quando se quer perceber se as diferenas amostrais
observadas so causadas por diferenas significativas entre as populaes
ou se so consequncia da variabilidade amostral, partindo do pressuposto
que a variabilidade decorrente da anlise de amostras s pode ser
responsvel por pequenos desvios.
Nota:
Esta tcnica estatstica, a ANOVA, usada para averiguar se os valores
mdios so estatisticamente diferentes e no para ver se as varincias so
diferentes!
ANOVA one-way
mas se precisamos comparar k grupos porque no usamos o teste t-
Student vrias vezes?
155
23-02-2017
ANOVA one-way
Quando se aplica? (Pressupostos)
i) varivel dependente quantitativa;
ii) amostras independentes;
iii) varivel dependente com distribuio normal em todos os grupos
em estudo (Teste de Kolmogorov-Smirnov ou Shapiro-Wilk);
iv) varivel dependente com varincias homogneas nos grupos em
estudo (teste de Levene)
Hipteses
H0: No existem diferenas significativas entre as mdias das k
populaes
vs
H1: Existe pelo menos um par de mdias significativamente diferentes
ou
H0: 1= 2== k vs H1: i,j: i j (i j; i.j=1.....k)
ANOVA one-way
Para identificar quais as mdias que diferem entre si preciso fazer testes
Post-Hoc: O teste de Scheff dos mais utilizados, pois dos mais potentes!
156
23-02-2017
Teste de Scheff
Pressupostos:
Os mesmos da ANOVA one-way
Hipteses:
H0: i= j vs. H1: i j para todos os pares i,j de mdias possveis
Deciso :
Rejeita-se H0 se sig. 0,05 concluindo assim que existem diferenas
significativas entre os grupos i e j.
ANOVA one-way
Exemplo 1:
Considere o ficheiro de dados 1_educao.sav.
Utilize a metodologia mais adequada para averiguar se a Competncia Leitora
difere consoante o grau de escolaridade do encarregado de educao.
Resoluo:
1)Validao de Pressupostos:
v. dependente Competncia Leitora Quantitativa
v. independente Grau de Escolaridade do encarregado de educao
Qualitativa ordinal (define 3 grupos independentes)
Amostras independentes
Normalidade (verificar usando o Teste de Kolmogorv-Smirnov ou o Teste de
Shapiro-Wilks)
Homogeneidade de varincias (verificar usando o Teste Levene)
- 314 - Estatstica 1 Ano 1 Semestre
157
23-02-2017
ANOVA one-way
vs
ANOVA one-way
No SPSS:
158
23-02-2017
ANOVA one-way
Outputs parciais:
Deciso:
Em todos os graus de escolaridade, a significncia do teste de Shapiro-Wilk para
a varivel Competncia leitora sempre superior a 0,05 No Rejeitar H0.
Concluso:
A Competncia Leitora segue distribuio normal em todos os grupos graus de
escolaridade em estudo (grau de escolaridade dos EE).
ANOVA one-way
2. Homogeneidade de varincias:
Hipteses:
Ho: As varincias populacionais da varivel Competncia Leitora so
homogneas/no diferem nos diferentes Graus de escolaridade .
vs
H1: Existe pelo menos um Grau de Escolaridade para o qual a varivel
Competncia Leitora apresenta varincia populacional diferente dos
restantes.
159
23-02-2017
ANOVA one-way
No SPSS:
ANOVA one-way
Outputs parciais:
Deciso:
Como a sig.=0.372 >0.05 No Rejeitar H0.
Concluso:
A varivel Competncia Leitora apresenta varincias homogneas nos
diferentes Graus de Escolaridade.
160
23-02-2017
ANOVA one-way
Outputs parciais:
ANOVA one-way
Deciso:
sig.= 0.041<0.05 Rejeitar H0.
Concluso:
A mdia da Competncia Leitora difere significativamente entre pelo
menos dois dos graus de escolaridade dos pais.
Teste de Scheff
161
23-02-2017
ANOVA one-way
Teste de Scheff 3 hipteses a testar:
Ho: A mdia da Competncia Leitora no difere em crianas com EE com
instruo bsica e secundria.
vs
H1: A mdia da Competncia Leitora diferente em crianas com EE com
instruo bsica e secundria.
e
Ho: A mdia da Competncia Leitora no difere em crianas com EE com
instruo bsica e superior.
vs
H1: A mdia da Competncia Leitora diferente em crianas com EE com
instruo bsica e superior.
e
Ho: A mdia da Competncia Leitora no difere em crianas com EE com
instruo secundria e superior.
vs
H1: A mdia da Competncia Leitora diferente em crianas com EE com
instruo secundria e superior.
- 323 - Estatstica 1 Ano 1 Semestre
ANOVA one-way
No SPSS: Teste de Scheff
162
23-02-2017
ANOVA one-way
Outputs parciais:
Deciso:
Apenas na comparao entre o grupo com o ensino primrio e com o ensino
superior se observa uma sig. inferior a 0.05 (0.042). Pelo que apenas neste
caso se rejeita a H0
Concluso:
A Competncia Leitora mdia difere significativamente entre crianas com
EE com o ensino primrio das que tm EE com o ensino superior. A compreenso
mdia das crianas com EE com o ensino superior significativamente superior
(Mdia Ens_Sup=13.5; DPEns_Sup =4.249) mdia das crianas com EE com o ensino
bsico ( MdiaEns_Bas=8.0; DPEns_Bas=3.546)
- 325 - Estatstica 1 Ano 1 Semestre
ANOVA one-way
Exemplo 2:
Considere o ficheiro de dados 6_novos_alunos_13_15.sav.
Utilize a uma metodologia mais adequada para averiguar se: O Prazer de
estudar idntico entre os alunos que frequentam as diferentes
licenciaturas da ESCS
Resoluo:
1) Validao de Pressupostos:
v. dependente Prazer de estudar Quantitativa
v. independente Curso Qualitativa nominal (define 4 grupos
independentes)
Amostras independentes
Normalidade (Teste de Kolmogorv-Smirnov ou Teste de Shapiro-Wilk)
Homogeneidade de varincias (Teste Levene)
163
23-02-2017
ANOVA one-way
1. Normalidade:
Para verificar se uma varivel provm de uma populao com
distribuio Normal usa-se o teste de:
Kolmogorov-Smirnov ou Shapiro-Wilk
Hipteses:
ANOVA one-way
No SPSS:
164
23-02-2017
ANOVA one-way
Outputs parciais:
Deciso:
O Prazer de estudar segue distribuio normal em todos os cursos
(sig>0.05) excepto no curso de jornalismo (sig.= 0.017<0.05).
Concluso:
A varivel prazer de estudar no segue distribuio normal em
todos os cursos pelo que se dever recorrer a uma alternativa no
paramtrica (teste de Kruskal-Wallis).
Testes de Hipteses no
Paramtricos
Teste de Kruskal-Wallis
165
23-02-2017
Teste Kruskal-Wallis
Para que serve?
Comparar as distribuies populacionais de uma mesma varivel dependente
em dois ou mais grupos independentes.
Alternativa no paramtrica ao teste t-Student para duas amostras
independentes e ANOVA one-way (a utilizar quando falham os pressupostos
de aplicao)
Hipteses:
H0: No existem diferenas significativas entre as distribuies populacionais
nos diferentes grupos em estudo
vs
H1: Existe pelo menos um grupo cuja distribuio populacional difere dos
restantes.
- 331 - Estatstica 1 Ano 1 Semestre
Pressupostos
Os mesmos do teste de Kruskal-Wallis;
Este procedimento s se deve realizar quando se rejeita H0 do teste de K-W .
Hipteses
O teste de Dunn realiza todas as comparaes duas a duas para identificar
entre que grupos existem as diferenas detetadas pelo teste de KrusKal-
Wallis . Assim, vamos ter tantos conjuntos de hipteses quantos os necessrios
para comparar os grupos 2 a 2:
166
23-02-2017
Teste Kruskal-Wallis
Exemplo 1:
Considere o ficheiro de dados 6_novos_alunos_13_15.sav.
Utilize a metodologia mais adequada para averiguar se: O Prazer de
estudar idntico entre os alunos que frequentam as diferentes
licenciaturas da ESCS.
Resoluo:
Validao de Pressupostos:
v. dependente Prazer de estudar Quantitativa
v. independente Curso Qualitativa nominal (define 4 grupos
independentes)
As amostras so independentes
Normalidade - verificar usando o Teste de Shapiro-Wilk ou o Teste de
Kolmogorv-Smirnov, se a dimenso do grupo for menos ou igual a 30 ou
superior a 30 respetivamante
Homogeneidade de varincias - verificar usando o Teste de Levene
Teste Kruskal-Wallis
Hipteses:
H0: A varivel Prazer de estudar provm de uma populao com
distribuio Normal no curso Y.
vs
H1: A varivel Prazer de estudar no provm de uma populao com
distribuio Normal no curso Y.
Y={PM, RPCE, AM, JOR}
167
23-02-2017
Teste Kruskal-Wallis
No SPSS
Teste Kruskal-Wallis
Deciso:
O Prazer de estudar segue distribuio normal em todos os cursos
(sig>0.05) exceto no curso de jornalismo (sig.= 0.017<0.05).
Concluso:
A varivel prazer de estudar no segue distribuio normal em todos
os cursos pelo que se dever recorrer a uma alternativa no
paramtrica (teste de Kruskal-Wallis).
168
23-02-2017
Teste Kruskal-Wallis
Teste de Kruskal-Wallis:
Hipteses:
H0: No existem diferenas significativas entre as distribuies
populacionais do Prazer de estudar nos diferentes cursos
ministrados na ESCS.
vs
H1: Existe pelo menos um curso cuja distribuio populacional do
Prazer de estudar difere dos restantes.
Teste Kruskal-Wallis
No SPSS:
169
23-02-2017
Teste Kruskal-Wallis
Output:
Deciso:
Como a significncia do teste 0.064 que superior a 0.05, ento no se
rejeita H0.
Concluso:
No existem diferenas estatisticamente significativas na distribuio dos
valores do Prazer de Estudar nos diferentes cursos.
Teste Kruskal-Wallis
Exerccio:
Considere o ficheiro de dados 7_valores_humanos_2016.sav.
Averige se os indivduos das diferentes regies identificam-se de igual
forma com a afirmao Importante sentir-se bem
Resoluo:
Validao de Pressupostos:
v. dependente Importante sentir-se bem Qualitativa ordinal
v. independente Regio Qualitativa (define 5 grupos independentes)
Amostras independentes
Hipteses:
H0: No existem diferenas significativas entre as distribuies populacionais
de Importante sentir-se bem nas diferentes Regies.
vs
H1: Existe pelo menos uma Regio cuja distribuio populacional de
Importante sentir-se bem difere dos restantes.
170
23-02-2017
Teste Kruskal-Wallis
Resoluo:
No SPSS:
Teste Kruskal-Wallis
Output:
Deciso:
sig.< 0.001<0.05 Rejeitar H0.
Concluso:
Existem diferenas estatisticamente significativas na distribuio dos
valores da Importante sair-se bem em pelo menos um par de regies.
171
23-02-2017
Teste Kruskal-Wallis
Teste de Dunn
Deciso:
Apenas h diferenas entre as regies:
Algarve e Centro sig. =0.023 < 0.05
Algarve e Norte sig. =0.005 < 0.05
Lisboa e Centro sig. =0.004 < 0.05
Lisboa e Norte sig. <0.001 < 0.05
Concluso:
As regies Norte e Centro registam diferenas estatisticamente significativas
das regies de Lisboa e Algarve quanto distribuio dos valores de ser
Importante sair-se bem.
172