Você está na página 1de 172

23-02-2017

Estatstica

1 Semestre 2016/2017

Ana Lcia Maroco


Ana Meireles
Cludia Silvestre
Paula Louso

Estatstica 1 Ano 1 Semestre

Estatstica

A Estatstica no quotidiano

Quem vai ganhar as eleies?


Como vai estar o tempo amanh?
Estudo do comportamento do mercado de valores de uma bolsa.
Qual o valor do seguro de vida a pagar?
Hoje chego a horas ESCS?
As estatsticas de um jogo de futebol.

-2- Estatstica 1 Ano 1 Semestre

1
23-02-2017

Estatstica

-3- Estatstica 1 Ano 1 Semestre

Estatstica

-4- Estatstica 1 Ano 1 Semestre

2
23-02-2017

Estatstica

-5- Estatstica 1 Ano 1 Semestre

Estatstica

-6- Estatstica 1 Ano 1 Semestre

3
23-02-2017

Estatstica

-7- Estatstica 1 Ano 1 Semestre

Estatstica - definio

Estatstica - Ramo das matemticas aplicadas cujos princpios derivam da


teoria das probabilidades, que tem por objecto o agrupamento metdico
assim como o estudo de sries de factos ou de dados numricos.
"estatstica", in Dicionrio Priberam da Lngua

Estatstica - cincia que se ocupa da recolha e tratamento de informao


tendo a capacidade de sintetizar, prever e fazer inferncias sobre dados.

-8- Estatstica 1 Ano 1 Semestre

4
23-02-2017

Estatstica

Censos: a forma mais antiga e direta de conhecer o nmero de pessoas


que, em dado momento, habitam um determinado territrio, consiste em
realizar, literalmente, uma contagem, atravs duma inquirio exaustiva
(habitualmente denominada recenseamento, ou censo) dos indivduos.
INE Instituto Nacional de Estatstica

-9- Estatstica 1 Ano 1 Semestre

Estatstica

Pobreza em Portugal O risco nas famlias (2013)

Publico online, publicado a 30-01-2015


www.publico.pt/sociedade/noticia/portugal-voltou-aos-niveis-
de-pobreza-de-ha-dez-anos-1684583

- 10 - Estatstica 1 Ano 1 Semestre

5
23-02-2017

Estatstica - Erros
O problema do mau uso da matemtica pelos profissionais de comunicao foi
identificado h j vrias dcadas, em especial nos EUA. Apesar disso e da
crescente importncia que a informao matemtica assume na sociedade
atual, s atualmente o problema se encontra em estudo no que se refere
imprensa portuguesa.
Susana Simes Pereira, Jos Manuel Pereira Azevedo, Antnio Jos de Oliveira Machiavelo

Foi selecionada uma amostra do conjunto das edies


impressas publicadas entre 1 de janeiro de 2013 e 31 de maro
de 2013.

- 11 - Estatstica 1 Ano 1 Semestre

Estatstica - Erros

O estudo completo pode ser consultado em:


http://www.lasics.uminho.pt/ojs/index.php/cecs_ebooks/article/view/2261/2178

- 12 - Estatstica 1 Ano 1 Semestre

6
23-02-2017

Estatstica - Erros

Maria de Lurdes Rodrigues aponta dois estudos recentemente noticiados em


Portugal, efectuados com base em dados que o INE fornece ao Eurostat, que
apontam - a seu ver "erradamente" - para um decrscimo do emprego
qualificado em Portugal na dcada de 90.
A presidente do OCT, que tambm membro do Conselho Superior de
Estatstica, explicou ao PBLICO que o INE efectuou uma renovao da sua
amostra a partir de 1998, reconhecendo que a anterior, que tinha como base
os Censos de 1991, "encontrava-se envelhecida". Esse facto provocou uma
quebra nas sries estatsticas, no sendo por isso legtimo comparar os dados
apurados antes de 1997 e depois de 1998, pois resultam de amostras distintas.

Publicado a 23-06-2002
www.publico.pt/noticias/jornal/ha-gato-nas-estatisticas-do-emprego-qualificado-74755

- 13 - Estatstica 1 Ano 1 Semestre

Estatstica - Erros

Dirio Econmico
2 de Junho de 2011

- 14 - Estatstica 1 Ano 1 Semestre

7
23-02-2017

Programa
Parte 1 Parte 2 Parte 3
Recolha e
Recolha e preparao
preparao dos dos Apresentao dos dados Generalizao dos
dados
dados resultados

Estatstica Descritiva Inferncia Estatstica

Amostragem Tabelas de Frequncias Testes Estatsticos:


- Testes de associao
Definio das Tabelas de Contingncia - Testes de correlao
Variveis - Testes para a compa-
Representaes grficas rao de 2 ou mais
Construo da base grupos
de dados Medidas Descritivas
Intervalos de confiana

- 15 - Estatstica 1 Ano 1 Semestre

Objetivos da Unidade Curricular

Conhecer os mtodos e as tcnicas utilizadas na recolha de dados


quantitativos.
Ler os resultados de uma sondagem.
Utilizar a aplicao SPSS (Statistical Package for Social Sciences)
Identificar qual o grfico, tabela ou medida estatstica mais adequada
aos diferentes conjuntos de dados, bem como constru-los atravs do
SPSS.
Fazer uma leitura correta dos diferentes tipos de grficos, tabelas e
indicadores estatsticos.
Identificar o teste estatstico mais adequado em cada situao,
execut-lo no SPSS e interpretar os seus resultados.
Fazer estimao de indicadores sobre uma populao.

- 16 - Estatstica 1 Ano 1 Semestre

8
23-02-2017

Avaliao
Ponderao
AVALIAO PERIDICA

Avaliao Individual
60%
Nota mnima no teste de 8.5 valores.

Avaliao em Grupo 40%

AVALIAO POR EXAME 100%

Para o bter apro vao necessrio que a Mdia Final ponderada seja superior o u igual a
9.5.

- 17 - Estatstica 1 Ano 1 Semestre

Bibliografia

o Hill, Manuela Magalhes; Hill, Andrew (2000) Investigao por Questionrio.


Edies Slabo.
o Maroco, Joo (2011) Anlise estatstica com o SPSS Statistics. ReportNumber
o Martinez, Lus Fructuoso; Ferreira, Aristides Isidoro (2008). Anlise de dados
com SPSS, primeiros passos. Escolar Editora
o Martins, Carla (2011) Manual de Anlise de Dados Quantitativos com recurso ao
IBM SPSS. Ed. Slabo
o Murteira, Bento (1993) Anlise Exploratria de Dados, Estatstica Descritiva.
McGraw-Hill.
o Pestana, Maria Helena e Gageiro, Joo Nunes (2005) Anlise de Dados para
Cincias Sociais A Complementaridade do SPSS. Edies Slabo.
o Reis, Elizabete; Melo, Paulo; Andrade, Rosa e Calapez, Teresa; (1996)
Estatstica Aplicada. Edies Slabo.

- 18 - Estatstica 1 Ano 1 Semestre

9
23-02-2017

Bibliografia

o Pereira, Alexandre (2008). SPSS Guia Prtico de Utilizao em Anlise de


Dados para Cincias Sociais e Psicologia. Slabo
o Sapsford, Roger ; Jupp, Victor et al (1998) Data Collection and Analysis.
Sage Publications Ltd.
o Silva, Ceclia Moura da (1994) Estatstica Aplicada Psicologia e Cincias
Sociais. McGraw-Hill.
o Vicente, Paula; Reis, Elizabete e Ferro, Ftima (1998) Sondagens. Edies
Slabo.
o Quantitative Applications in the Social Sciences, Sage Publications:
o Jacoby, William G., S tatistical Graphics for Univariate and Bivariate Data,
n 117
o Jacoby, William G., Statistical Grapics for Visualizing Multivariate Data, n
120

- 19 - Estatstica 1 Ano 1 Semestre

Estatstica

Amostragem e Estudos de Opinio

Estatstica 1 Ano 1 Semestre

10
23-02-2017

Tipos de Estudos
Parte 1 Parte 2 Parte 3

Recolha e preparao Apresentao dos


dos dados Generalizao dos
dados resultados

recolha de informao j
Estudos de Gabinete ou Estudos
existente
Documentais
dados secundrios

recolha de nova informao Estudos de Campo


dados primrios

- 21 - Estatstica 1 Ano 1 Semestre

Estudos Documentais
Exemplo: dados secundrios

- 22 - Estatstica 1 Ano 1 Semestre

11
23-02-2017

Estudos Documentais
Exemplo: dados secundrios

- 23 - Estatstica 1 Ano 1 Semestre

Estudos de Campo
Dados Primrios
Acesso a toda a populao Censo ou Recenseamento

Acesso a parte da populao Estudo por amostragem

- 24 - Estatstica 1 Ano 1 Semestre

12
23-02-2017

Amostragem e Estudos de Opinio

Exemplos de Estudos por amostragem

O mercado potencial para um novo produto ou servio

Avaliao de produtos ou servios

Atitudes dos empregados

Nveis de satisfao dos clientes

Opinies sobre governantes ou polticos


Legislao
Inteno de voto especfica

- 25 - Estatstica 1 Ano 1 Semestre

Amostragem e Estudos de Opinio

Lei n. 10/2000
Regime jurdico da publicao ou difuso de sondagens e inquritos de opinio

Regula a realizao e a publicao ou difuso pblica de sondagens e


inquritos de opinio cujo objeto se relacione, direta ou indiretamente, com:
- rgos constitucionais;
- referendos nacionais;
- regionais ou locais;
- associaes polticas ou partidos polticos;
- previses ou simulaes de voto.

- 26 - Estatstica 1 Ano 1 Semestre

13
23-02-2017

Amostragem e Estudos de Opinio


Lei n. 10/2000
Regime jurdico da publicao ou difuso de sondagens e inquritos de opinio

Artigo 2.
Definies
Para os efeitos da presente lei, entende-se por:
a) Inqurito de opinio, a notao dos fenmenos relacionados com o disposto no
artigo anterior, atravs de um mero processo de recolha de informao junto de
todo ou de parte do universo estatstico;
b) Sondagem de opinio, a notao dos fenmenos relacionados com o disposto no
artigo anterior, cujo estudo se efetua atravs do mtodo estatstico quando o
nmero de casos observados no integra todo o universo estatstico,
representando apenas uma amostra.
- 27 - Estatstica 1 Ano 1 Semestre

Amostragem e Estudos de Opinio

1. Mtodos de recolha da informao


Entrevista pessoal direta
Entrevista telefnica
Inqurito postal
Inqurito por correio eletrnico ou online

2. Mtodo de amostragem
Amostragem aleatria
Amostragem no aleatria

- 28 - Estatstica 1 Ano 1 Semestre

14
23-02-2017

Mtodos de recolha da informao

Entrevista pessoal direta

Vantagens
Possibilidade de deixar ver, sentir e/ou saborear um produto;
Possibilidade de encontrar a populao-alvo mais facilmente;

Entrevistas mais longas so, por vezes, toleradas.

Desvantagens
Geralmente custam mais por entrevista que outros mtodos;
Cada local tem as suas prprias caratersticas, podendo criar uma
amostra no representativa.

- 29 - Estatstica 1 Ano 1 Semestre

Mtodos de recolha da informao


Entrevista telefnica
Vantagens
Contato mais rpido do que com outros mtodos (sobretudo com sistema
CATI);
Facilidade de obter contatos aleatrios;
Software CATI permite questionrios complexos, por exemplo
modificar perguntas com base nas respostas s questes anteriores.

Desvantagens
Telemarketing, a prtica massiva de falsas pesquisas levou a uma taxa de
recusa mais elevada;
O horrio restrito de disponibilidade da maioria da populao ativa;
Impossibilidade de mostrar produtos por telefone.

- 30 - Estatstica 1 Ano 1 Semestre

15
23-02-2017

Mtodos de recolha da informao


Inqurito postal

Vantagens
Pesquisas por correio esto entre os menos caros;
O questionrio pode incluir fotos - algo que no possvel atravs do
telefone;
Permitir que o entrevistado responda quando lhe for conveniente.

Desvantagens
Tempo! Pesquisas por correio demoram muito mais do que outros tipos;
Em populaes de menor escolaridade e alfabetizao, taxas
de resposta a inquritos de correio so muitas vezes
demasiado pequenas para serem teis.

- 31 - Estatstica 1 Ano 1 Semestre

Mtodos de recolha da informao


Inqurito por correio eletrnico

Vantagens
A eliminao virtual dos custos de edio;
Respostas mais precisas s questes sensveis;
Velocidade. Podem obter-se vrios milhares de respostas em pouco tempo;
Quase sem custos envolvidos, uma vez que a criao foi concluda;
Podem anexar-se fotos e arquivos de som.

- 32 - Estatstica 1 Ano 1 Semestre

16
23-02-2017

Mtodos de recolha da informao


Inqurito por correio eletrnico

Desvantagens
Necessidade de uma lista de endereos de email;
Possibilidade de responderem vrias vezes ou passar questionrios junto aos
amigos para responder, caso no haja mecanismos de controle;
Muitas pessoas no gostam de email no solicitados e tambm podem ser
filtrados como SPAM;
Impossibilidade de generalizar resultados de pesquisas de email para as
populaes inteiras.

- 33 - Estatstica 1 Ano 1 Semestre

Mtodos de recolha da informao


Resumo dos mtodos de recolha

Email e inquritos online so os mtodos mais rpidos, bem como por telefone.
Velocidade
Inquritos postais so os mais lentos

Entrevista pessoal direta e por telefone so os mais dispendiosos, no polo oposto


Custo
esto o email e os inquritos online

Utilizao de Email e inquritos online tm evidente vantagem, mas os seus resultados no podem
Internet ser generalizados

Habilitaes Pessoas com menos formao raramente respondem a inquritos postais ou pela
literrias internet

Questes Sensveis Maior probabilidade de responder a questes sensveis em inquritos online

Imagens, sons,
No possvel em inquritos telefnicos e com limitaes nos postais
sabores

- 34 - Estatstica 1 Ano 1 Semestre

17
23-02-2017

Mtodos de Amostragem

Cuidados a ter na escolha da amostra


Em relao s amostras, deve assegurar-se a sua representatividade
relativamente populao de onde foram retiradas.

O objetivo que os resultados obtidos possam ser prximos dos da


populao.

- 35 - Estatstica 1 Ano 1 Semestre

Mtodos de Amostragem

Tipos de erros:
Erro Amostral = | estatstica parmetro |

Erro de Enviesamento

Erro de Medida ou Sistemtico

- 36 - Estatstica 1 Ano 1 Semestre

18
23-02-2017

Amostragem e Estudos de Opinio


Exemplos de Erro de Enviesamento
Amostra Provvel enviesamento Razo

No seriam clientes se estivessem insatisfeitos,


Clientes Favorvel contudo pode ser importante saber porque esto
satisfeitos.
Se estivessem satisfeitos no seriam ex -clientes,
Ex-clientes Desfavorvel contudo pode ser importante saber porque ficaram
insatisfeitos.

Auto-seleo So sobretudo as pessoas com uma opinio forte


Pontos de vista extremos sobre determinado assunto que se mobilizam para
(Televoto)
participar, muitas vezes mais que uma vez.
A maioria das pessoas que se encontra em casa
Horrio de durante o horrio normal de trabalho no est
Reformados, desempregados
trabalho empregada, pelo que o estudo no reflete a opinio
da populao ativa.

Limitado a pessoas com acesso a internet, apesar da


Internet Cidado atpico crescente utilizao desta, estas pessoas no so
representativas da populao em geral, por exemplo
em termos de idade, classe social, instruo, etc.

- 37 - Estatstica 1 Ano 1 Semestre

Amostragem e Estudos de Opinio


Sondagem do -Dimenso da amostra:
-cerca de 2,4 milhes de
Literary Digest
eleitores
relativa s eleies
presidenciais norte Alf Landon (57%)
americanas de 1936. Franklin Roosevelt (43%)

Resultado da eleio:
Alf Landon (40%)
Franklin Roosevelt (60%)

Enviesamento de amostragem: a base de sondagem foi a lista de telefone, de


membros de clubes, assinantes da revista, registos de propriedade automvel.,
etc.

Enviesamento de no resposta: a proporo de no respondentes era maior entre


os democratas.

- 38 - Estatstica 1 Ano 1 Semestre

19
23-02-2017

Amostragem

Estatstica 1 Ano 1 Semestre

Estudos Quantitativos

Estudos

Recenseamento Amostragem

Aleatria No aleatria

- 40 - Estatstica 1 Ano 1 Semestre

20
23-02-2017

Processos de Seleo

Aleatrios (probabilsticos)
Cada elemento da populao tem uma probabilidade conhecida de
pertencer amostra;
possvel determinar a preciso das estimativas;
No h interferncia nem do entrevistador nem do investigador.

No aleatrios (no probabilsticos)


No se conhece a probabilidade dos elementos integrarem a amostra nem
a preciso das estimativas;
A seleo dos elementos pode basear-se nos critrios do entrevistador ou
do investigador.

- 41 - Estatstica 1 Ano 1 Semestre

Processos Aleatrios

Vantagens
Cada elemento da populao tem uma certa probabilidade
(calculvel e diferente de zero) de pertencer amostra;
possvel determinar a preciso das estimativas;
possvel determinar matematicamente a dimenso da amostra a
recolher em funo da preciso e do grau de confiana associado
ao estudo;
No h interferncia do entrevistador nem do investigador (no
enviesamento).

- 42 - Estatstica 1 Ano 1 Semestre

21
23-02-2017

Processos Aleatrios

Desvantagens
Por vezes necessrio a obteno de uma listagem completa e
atualizada de todos os elementos que constituem a populao;
(muitas vezes impossvel porque as populaes podem ser infinitas, )

Custo e tempo necessrios para realizar o estudo muito elevado;

Taxa de no respostas pode ser muito elevada.

- 43 - Estatstica 1 Ano 1 Semestre

Processos No aleatrios

Vantagens
No necessita base de referncia

Acessibilidade dos entrevistados

Tempo

Custo

Desvantagens
Normalmente geram amostras no representativas da populao, o que
pode causar enviesamentos e interpretaes erradas.

- 44 - Estatstica 1 Ano 1 Semestre

22
23-02-2017

Processos aleatrios

Populao

1 grupo 2 ou mais
grupos

Simples Sistemtica Estratificada Por Clusters

- 45 - Estatstica 1 Ano 1 Semestre

Processos no aleatrios

Populao

2 ou mais
1 grupo
grupos

Convenincia Intencional Quotas

Snowball

- 46 - Estatstica 1 Ano 1 Semestre

23
23-02-2017

Amostragem Aleatria

Amostragem Aleatria
Simples
Sistemtica
Rotas Aleatrias
Estratificada
Por Clusters
Multi-etapas

- 47 - Estatstica 1 Ano 1 Semestre

Amostra Aleatria Simples


Populao

Amostra

N n
elementos elementos

Qualquer elemento do universo tem igual probabilidade de ser selecionado


(p=n/N).
Cada uma das combinaes possveis de n elementos dos N tem a mesma
probabilidade de ser escolhida.

- 48 - Estatstica 1 Ano 1 Semestre

24
23-02-2017

Amostra Aleatria Simples


Etapas:
Numerar os elementos da populao de 1 a N;
Escolher n elementos usando um processo aleatrio (lotaria) ou
recorrendo a uma tabela de nmeros aleatrios;
Os elementos que constituem a amostra so os que correspondem aos
nmeros escolhidos.

Mtodo
aleatrio

- 49 - Estatstica 1 Ano 1 Semestre

Amostra Aleatria Simples

Caratersticas:
Processo moroso e caro, se a amostra for grande;
Muitas vezes impraticvel por exigir a enumerao de todos os
elementos da populao;
No caso de uma populao pequena pode ser til e fcil de aplicar se
a base de sondagem for credvel;
A seleo dos elementos pode fazer-se atravs de tabelas de nmeros
aleatrios, mtodo da lotaria, etc.

- 50 - Estatstica 1 Ano 1 Semestre

25
23-02-2017

Amostra Aleatria Simples


7 0 0 3 0 0 1 2 9 6 3 9 0 3 5 5 4 0 7 2 2 7 5 9 8 7
4 1 7 9 8 1 3 7 4 1 0 2 7 7 3 0 2 7 3 0 4 6 9 5 3 6
8 4 0 0 6 7 3 7 8 1 0 8 3 0 4 2 4 3 7 1 9 5 6 6 5 6
2 0 1 0 8 3 2 0 2 5 7 4 4 1 5 7 8 4 3 9 9 8 6 2 4 8
9 7 1 5 7 5 5 9 5 6 1 5 4 8 6 6 2 7 3 2 7 8 2 3 6 9
0 0 9 6 7 7 7 7 3 0 0 8 7 3 0 3 0 2 7 3 5 6 3 9 5 4
2 6 2 7 5 7 8 0 1 0 2 6 6 0 6 3 3 5 5 2 5 8 9 5 1 4
5 3 0 2 4 5 6 6 4 5 5 9 7 9 8 8 1 4 3 9 2 3 7 5 3 1
8 5 2 3 9 4 2 2 5 5 9 7 8 3 6 1 2 8 5 9 6 4 6 9 5 8
4 0 6 2 4 7 2 1 9 2 5 0 3 2 9 0 1 7 4 8 0 9 9 6 3 1
0 7 1 6 0 9 0 7 5 7 2 1 8 5 2 1 6 7 8 6 5 6 1 6 7 6
4 2 7 0 1 7 0 9 3 4 3 4 9 1 2 3 3 0 7 4 3 4 3 2 1 5
1 9 5 0 7 6 3 3 8 1 6 7 9 2 2 1 5 1 7 7 2 7 3 5 5 1
2 1 6 6 3 8 8 5 9 0 4 0 3 2 6 8 4 1 3 7 5 1 5 0 2 0
0 4 0 8 0 9 7 0 6 3 3 2 7 5 5 7 9 2 9 6 1 8 4 5 9 3

- 51 - Estatstica 1 Ano 1 Semestre

Amostra Aleatria Simples


Em vez de se recorrer a tabelas de nmeros aleatrios tambm se pode
usar a funo ALEATRIOENTRE( ; ) do Excel para gerar nmeros
aleatrios.

- 52 - Estatstica 1 Ano 1 Semestre

26
23-02-2017

Amostra Aleatria Sistemtica


Populao

Amostra

N n
elementos elementos
De forma
sequencial

- 53 - Estatstica 1 Ano 1 Semestre

Amostra Aleatria Sistemtica

Etapas:
N
1. Calcular o intervalo da amostra: K = int
n

2. Escolher aleatoriamente um nmero J entre 1 e K;


3. Partindo desse nmero, adicionar sucessivamente o valor K, ficando,
assim, selecionados os elementos J, J+K, J+2K, J+3K, ..., J+(n-1)K,
perfazendo n elementos.

Caratersticas:
Processo semelhante ao da amostragem aleatria simples.

- 54 - Estatstica 1 Ano 1 Semestre

27
23-02-2017

Amostra Aleatria Sistemtica

Exemplo:

N = 200 ; n = 50 => K = 4
Escolher um nmero aleatrio x : 1 < x < 4. Por exemplo, 3
Os indivduos selecionados sero:
3, 7, 11, 15, ..., 195, 199

A seleo de um elemento depende do que foi anteriormente selecionado.

- 55 - Estatstica 1 Ano 1 Semestre

Amostra Aleatria Sistemtica

Problema:
Vendas mensais de determinada empresa;
Calcular o valor de K;
Quando os elementos tm comportamentos cclicos tem que se
ter ateno ao valor de K. Por exemplo, ao selecionar
aleatoriamente o nmero correspondente a um determinado
ms, escolher-se-ia sempre o mesmo ms todos os anos =>
Enviesamento dos resultados obtidos.

- 56 - Estatstica 1 Ano 1 Semestre

28
23-02-2017

Amostra: Rotas Aleatrias

Caso Particular da Amostragem Aleatria Sistemtica;


Mtodo til em sondagens realizadas em localidades. um meio de
orientao para o entrevistador;
Base de referncia cartogrfica.

Etapas:
1. Selecionar aleatoriamente um ponto de partida Ponto de
amostragem;
2. Definir critrios de escolha dos elementos Definir as regras de
orientao para o entrevistador;
3. Reunir os elementos selecionados para constiturem a amostra.

- 57 - Estatstica 1 Ano 1 Semestre

Amostra: Rotas Aleatrias

Exemplo:
A partir de uma determinada rua, virar na 1 direita e depois na 2 rua
esquerda.
Quando se vira direita entrevistam -se os moradores das casas mpares;
quando se vira esquerda entrevistam -se os moradores das casas pares.

- 58 - Estatstica 1 Ano 1 Semestre

29
23-02-2017

Amostra: Rotas Aleatrias

Exemplo:
Seleo de edifcios

- 59 - Estatstica 1 Ano 1 Semestre

Amostra: Rotas Aleatrias

Exemplo:
Seleo de edifcios (cont.)

- 60 - Estatstica 1 Ano 1 Semestre

30
23-02-2017

Amostragem Aleatria Estratificada


Populao N elementos

N1 elementos
Amostra n elementos
N2 elementos
n2 n1
. elementos elementos

n = n1 + n2 +

N = N1 + N2 + .

- 61 - Estatstica 1 Ano 1 Semestre

Amostragem Aleatria Estratificada

Numa populao com N elementos, identificam -se L sub-grupos (estratos)


com Ni elementos cada. Selecionam-se ni elementos em cada estrato em vez
de recorrer populao como um todo.

Etapas:
1. Definir os estratos;
2. Escolher aleatoriamente os elementos de cada estrato;
3. Reunir os elementos selecionados em cada estrato para constiturem
a amostra

Exemplo:
Estudo sobre caratersticas mais importantes num carro.

- 62 - Estatstica 1 Ano 1 Semestre

31
23-02-2017

Amostragem Aleatria Estratificada


Seleo
Definio
aleatria
dos estratos
dentro dos
estratos

Amostragem Estratificada

- 63 - Estatstica 1 Ano 1 Semestre

Amostragem Aleatria Estratificada

Caratersticas:
Os estratos devem ser exaustivos (cobrir toda a populao) e
mutuamente exclusivos (no haver elementos que pertenam a mais do
que um estrato);
A diviso da populao deve ser feita de acordo com as caratersticas
da populao em estudo;
O ideal que a variabilidade dentro dos estratos seja pequena e grande
entre os estratos;
A amostragem estratificada pode ser proporcional ou no proporcional.

- 64 - Estatstica 1 Ano 1 Semestre

32
23-02-2017

Amostragem Aleatria por Clusters


Populao com K grupos
Selecionam-se alguns grupos
para a amostra

- 65 - Estatstica 1 Ano 1 Semestre

Amostragem Aleatria por Clusters

Cluster um grupo de unidades elementares da populao.


Selecionam -se os grupos de elementos e no elementos individuais.

Etapas:
1. Especificar os Clusters (Conglomerados);
2. Escolher aleatoriamente um conjunto de clusters;
3. Construir a amostra com todos os elementos de cada cluster
selecionado.

- 66 - Estatstica 1 Ano 1 Semestre

33
23-02-2017

Amostragem Aleatria por Clusters


Definio
dos clusters
Seleo
aleatria
de clusters

- 67 - Estatstica 1 Ano 1 Semestre

Amostragem Aleatria por Clusters

Exemplos:

Cluster ou Unidade Unidade


Aplicao (Exemplo)
Amostral Primria Elementar
Conhecer hbitos de consumo de
alcol dos estudantes duma escola Turma Aluno
secundria
Estimar o tempo mdio de espera
Centro de Sade Utentes
para atendimento numa consulta
Estimar o montante de vendas para o Zona Geogrfica de
Vendedor
prximo ano Vendas

- 68 - Estatstica 1 Ano 1 Semestre

34
23-02-2017

Amostragem Aleatria por Clusters

Caratersticas:

Os clusters devem ser exaustivos (cobrir toda a populao) e


mutuamente exclusivos (no haver elementos que pertenam a
mais do que um cluster);
Cada cluster deve refletir a variabilidade da populao;
Custo geralmente mais baixo do que nos casos anteriores.

- 69 - Estatstica 1 Ano 1 Semestre

Amostragem Aleatria Multi-etapas

Extenso do conceito de amostragem por clusters.


Selecionam -se aleatoriamente vrios clusters e, dependendo dos casos,
selecionam -se sub-clusters at se obterem os elementos individuais.

Etapas:
1. Definir os Clusters;
2. Escolher aleatoriamente um conjunto de clusters. De acordo com o
nmero de etapas que se considerarem, vo-se definindo e
selecionando os novos clusters at se obterem as unidades
elementares;
3. Construir a amostra com todos os elementos de cada cluster
selecionado.

- 70 - Estatstica 1 Ano 1 Semestre

35
23-02-2017

Amostragem Aleatria Multi-etapas

Exemplo:
Numa sondagem sobre estudantes de ensino secundrio a nvel nacional:
1. Selecionar localidades;
2. Selecionar escolas secundrias;
3. Selecionar turmas dentro das escolas secundrias;
4. Entrevistar todos os alunos das turmas selecionadas.

Caratersticas:
Mtodo geralmente econmico.

- 71 - Estatstica 1 Ano 1 Semestre

Amostragem No Aleatria

Amostragem No Aleatria
Intencional
Snowball
Por Convenincia
Por Quotas

- 72 - Estatstica 1 Ano 1 Semestre

36
23-02-2017

Amostragem Intencional

Os elementos so intencionalmente selecionados geralmente por se pensar


que tm caratersticas representativas da populao.

Exemplo:
Num estudo sobre o futuro da Televiso pblica, escolher uma amostra de
especialistas no sector audiovisual.

Caratersticas:
Mtodo geralmente usado em estudos exploratrios;
Obteno de amostras de dimenso reduzida;
Impossibilidade de se conseguir uma amostra aleatria;
Conseguir deliberadamente uma amostra enviesada.

- 73 - Estatstica 1 Ano 1 Semestre

Amostragem Snowball

Usada quando a populao alvo muito pequena.


Caso particular da amostragem intencional:
Consiste em ir pedindo aos inquiridos para indicarem novos elementos
para a amostra.

Exemplo:
Populaes com caratersticas especficas:
Deficientes, emigrantes, imigrantes, etc.

- 74 - Estatstica 1 Ano 1 Semestre

37
23-02-2017

Amostragem por Convenincia

Os elementos da amostra so escolhidos porque esto disponveis na


altura ou no local do estudo.

Apesar de ser uma tcnica suscetvel de provocar enviesamento nos


resultados, til se o interesse do estudo for captar ideias ou se se
pretender fazer uma explorao prvia sobre algum assunto.

Exemplos:
Pessoas que passam no local onde o entrevistador faz inquritos.

Inquritos telefnicos feitas por estaes de TV ou Rdio em que se


convidam as pessoas a dar a sua opinio sobre determinado assunto.

- 75 - Estatstica 1 Ano 1 Semestre

Amostragem por Quotas

Amostragem estratificada no aleatria;


Usa os mesmos critrios da estratificao;
O objetivo da diviso por quotas garantir a representatividade das
caratersticas da populao;
A proporo de elementos com determinada caraterstica na amostra
deve ser aproximadamente igual proporo de elementos com a mesma
caraterstica na populao;
A populao dividida em subgrupos segundo uma caracterstica de
interesse e selecionam -se amostras no aleatrias em cada subgrupo.

Etapas:
1. Definir as quotas;
2. Escolher os elementos respeitando as quotas;
3. Reunir os elementos selecionados para constiturem a amostra.

- 76 - Estatstica 1 Ano 1 Semestre

38
23-02-2017

Amostragem por Quotas

Quotas independentes

Idade

15-24 18
Gnero
25-34 25
Masculino 48
35-44 30
Feminino 52
Mais de 44 27
Total 100
Total 100

- 77 - Estatstica 1 Ano 1 Semestre

Amostragem por Quotas

Quotas interrelacionadas

Idade
15-24 25-34 35-44 Mais de 44 Total
Gnero

Masculino 10 11 12 15 48

Feminino 8 14 18 12 52

Total 18 25 30 27 100

- 78 - Estatstica 1 Ano 1 Semestre

39
23-02-2017

Processos de Amostragem Mistos

Processos em vrias fases

Combinao entre processos aleatrios e no aleatrios

- 79 - Estatstica 1 Ano 1 Semestre

Dimenso da amostra

- 80 - Estatstica 1 Ano 1 Semestre

40
23-02-2017

Dimenso da Amostra

Amostras no aleatrias:

Oramento disponvel

Dimenso utilizada em estudos anteriores com as mesmas


caratersticas

Dimenso de amostras aleatrias (indicativo)

- 81 - Estatstica 1 Ano 1 Semestre

Dimenso da Amostra

Amostras aleatrias:

Dimenso da populao

Variabilidade da caraterstica de interesse na populao

Preciso do estudo e nvel de confiana

Custo

- 82 - Estatstica 1 Ano 1 Semestre

41
23-02-2017

Dimenso da Amostra

Amostra aleatria Simples:


Erro mximo na estimao de caratersticas qualitativas

P (1 - P )
e = 1 , 9 6 x
n

- 83 - Estatstica 1 Ano 1 Semestre

Dimenso da Amostra

Amostra aleatria Simples:


Estimao de caratersticas qualitativas

P(1- P) P(1- P)
n= n=
e
2

2
Erro mximo
e
que se
pretende + P(1-P )
1.96
1,96
z
N

Para um nvel de confiana de 95% N infinito

- 84 - Estatstica 1 Ano 1 Semestre

42
23-02-2017

Dimenso da Amostra - Exerccio

Para um nvel de confiana de 95% e erro de estimao de

2% 3% 5%
Partido Proporo Amostra Amostra Amostra
PSD (38,63%) 0,3863 2277 1012 365
PS (28,05%) 0,2805 1939 861 311
CDS-PP (11,71%) 0,1174 996 442 160
PCP-PEV (7,90%) 0,0790 703 311 112
BE (5,17%) 0,0517 473 210 76

0,5 2401 1068 385

- 85 - Estatstica 1 Ano 1 Semestre

Introduo ao software
SPSS

Estatstica 1 Ano 1 Semestre

43
23-02-2017

Introduo ao Software SPSS

Para iniciar o SPSS clique em

Start
IBM SPSS Statistics
IBM SPSS Statistics 21

- 87 - Estatstica 1 Ano 1 Semestre

Introduo ao Software SPSS


Ambiente de trabalho
Janela de edio de dados: cada coluna representa uma varivel

cada linha est


associada a um
indivduo:

- 88 - Estatstica 1 Ano 1 Semestre

44
23-02-2017

Introduo ao Software SPSS


Ambiente de trabalho
Janela de especificao das variveis:

- 89 - Estatstica 1 Ano 1 Semestre

Introduo ao Software SPSS


Ambiente de trabalho
Janela de visualizao de resultados:

- 90 - Estatstica 1 Ano 1 Semestre

45
23-02-2017

Introduo ao Software SPSS


Ambiente de trabalho
Barra de Menus:

Barra de Ferramentas:

- 91 - Estatstica 1 Ano 1 Semestre

Ficheiro de Dados - Escalas de Medida

Antes de comear a definir um ficheiro de dados, deve ter em conta a


escala de medida associada a cada varivel.

So diferenciadas pelo tipo de relao que


existe entre os objetos

- 92 - Estatstica 1 Ano 1 Semestre

46
23-02-2017

Ficheiro de Dados - Escalas de Medida

Os dados que caraterizam as escalas de medida podem ser do tipo:

Qualitativo
Representam qualidades associadas aos indivduos.
Podem ser representadas por nmeros, mas estes no tm qualquer
significado matemtico.

Quantitativo
Representam quantidades associadas aos indivduos.
So representadas por nmeros, e esses nmeros tm significado
matemtico (por exemplo, 4 o dobro de 2).

- 93 - Estatstica 1 Ano 1 Semestre

Ficheiro de Dados - Escalas de Medida

Nominais

Qualitativos

Ordinais

Dados

Quantitativos

- 94 - Estatstica 1 Ano 1 Semestre

47
23-02-2017

Ficheiro de Dados - Escalas de Medida


Os dados Qualitativos podem ser definidos numa escala

Nominal
Os dados so identificados pela atribuio de um nome que se
designa por categoria (classe ou modalidade).
As categorias so exaustivas e mutuamente exclusivas.
Apenas permite caraterizar algum aspeto qualitativo da caraterstica
que est a ser estudada.
No existe qualquer relao de ordem entre as categorias (apenas
permite dizer se uma modalidade igual ou diferente de outra).
Podem ser representadas por nmeros, mas estes no tm qualquer
significado matemtico.

- 95 - Estatstica 1 Ano 1 Semestre

Ficheiro de Dados - Escalas de Medida


Escala Nominal Exemplos:

Num inqurito opinio sobre a utilizao de genricos:

a favor da introduo de genricos? varivel nominal


Sim No dicotmica

Num inqurito sobre as diferentes redes de telemvel usadas:


Qual a rede de telemvel que utiliza com mais frequncia?
NOS MEO Vodafone Outra

varivel nominal
policotmica

- 96 - Estatstica 1 Ano 1 Semestre

48
23-02-2017

Ficheiro de Dados - Escalas de Medida


Ordinal
Apresentam as mesmas caratersticas que os dados definidos numa
escala nominal, mas agora possvel estabelecer uma relao de
ordem entre as categorias. (melhor/pior, maior/menor, )

Escala Ordinal Exemplos:


a favor da introduo de genricos?
Totalmente Contra Nem Contra A favor Totalmente
contra nem a favor a favor

Est satisfeito/a com os servios prestados pela sua operadora de


telemvel? (1 Nada satisfeito, , 5 Completamente satisfeito)

1 2 3 4 5

- 97 - Estatstica 1 Ano 1 Semestre

Ficheiro de Dados - Escalas de Medida


Os dados podem ser definidos numa escala Quantitativa quando

Os valores numricos associados a esta escala so verdadeiramente


quantitativos.
Permitem quantificar e comparar as diferenas existentes entre as
diferentes modalidades, bem como a realizao de operaes
matemticas. (somas, produtos, diferenas, )
As diferenas entre dois valores consecutivos so iguais.

- 98 - Estatstica 1 Ano 1 Semestre

49
23-02-2017

Escala de medida - Exerccio


Para cada uma das bases de dados a seguir apresentadas, identifique a escala de
medida associada a cada varivel:
Grau Compe- Rendi- Grau Compe- Rendi-
N N mdio N N mdio
Aluno Gnero Escolaridade tncia mento Aluno Gnero Escolaridade tncia mento
irmos horas sono irmos horas sono
Enc. Educ. Leitora Escolar Enc. Educ. Leitora Escolar
1 Feminino E. Bsico 0 5 103 <7 horas 16 Masculino E. Secundrio 2 15 109 7 a 9 horas
2 Feminino E. Bsico 1 8 109 7 a 9 horas 17 Masculino E. Secundrio 1 10 108 >9 horas
3 Feminino E. Bsico 2 10 102 <7 horas 18 Masculino E. Secundrio 0 9 109 >9 horas
4 Feminino E. Bsico 1 8 109 7 a 9 horas 19 Masculino E. Secundrio 0 8 108 7 a 9 horas
5 Feminino E. Bsico 1 9 110 >9 horas 20 Masculino E. Secundrio 0 11 107 7 a 9 horas
6 Masculino E. Bsico 0 15 115 >9 horas 21 Feminino E. Superior 1 12 109 >9 horas
7 Masculino E. Bsico 1 4 106 7 a 9 horas 22 Feminino E. Superior 1 19 115 >9 horas
8 Masculino E. Bsico 2 5 105 <7 horas 23 Feminino E. Superior 0 14 111 >9 horas
9 Feminino E. Secundrio 3 19 114 >9 horas 24 Feminino E. Superior 1 17 115 >9 horas
10 Feminino E. Secundrio 1 15 115 >9 horas 25 Feminino E. Superior 2 18 110 >9 horas
11 Feminino E. Secundrio 0 14 110 >9 horas 26 Feminino E. Superior 2 12 109 7 a 9 horas
12 Feminino E. Secundrio 1 6 108 7 a 9 horas 27 Masculino E. Superior 1 14 108 7 a 9 horas
13 Feminino E. Secundrio 3 18 112 >9 horas 28 Masculino E. Superior 1 9 104 <7 horas
14 Feminino E. Secundrio 0 4 102 <7 horas 29 Masculino E. Superior 2 5 107 <7 horas
15 Masculino E. Secundrio 3 7 106 <7 horas 30 Masculino E. Superior 3 15 102 <7 horas

Competncia leitora: definida numa escala de 0-20


Rendimento escolar: Definida numa escala de 0-120

- 99 - Estatstica 1 Ano 1 Semestre

Escala de medida - Exerccio

Considere o seguinte conjunto de


dados referente avaliao
contnua de 27 estudantes:

LEGENDA:
Genero: Masculino, Feminino
Ano Curso: 1 ano, 2 ano
Presenas: N de presenas s aulas (0-12)
TPC: N de TPC realizados (0-8)
Teste_1: Classificao no 1 teste (0-20)
Teste_2: Classificao no 2 teste (0-20)

- 100 - Estatstica 1 Ano 1 Semestre

50
23-02-2017

Escala de medida - Exerccio


Ind Gnero Idade N_Filhos C_Trab A_Emp D_Casa Ind Gnero Idade N_Filhos C_Trab A_Emp D_Casa
1 Feminino 21 0 Pess <3 33 16 Masculino 27 1 Boas <3 68
2 Feminino 53 2 Exc 3a5 23 17 Masculino 54 0 Pess >8 9
3 Feminino 54 2 Med 6a8 76 18 Masculino 38 1 Pess 6a8 30
4 Feminino 44 3 Exc 3a5 21 19 Masculino 59 1 Boas 3a5 68
5 Feminino 54 1 Med 6a8 23 20 Masculino 32 0 Boas 6a8 14
6 Feminino 53 2 Ms >8 66 21 Masculino 48 0 Med >8 27
7 Feminino 67 1 Med >8 41 22 Masculino 42 1 Med <3 26
8 Feminino 28 0 Pess 6a8 61 23 Masculino 53 1 Ms 3a5 15
9 Feminino 39 0 Med <3 55 24 Masculino 55 2 Med 3a5 58
10 Feminino 60 1 Boas 3a5 75 25 Masculino 55 1 Med 6a8 22
11 Feminino 50 0 Boas 3a5 5 26 Masculino 37 0 Ms <3 58
12 Feminino 28 2 Med 3a5 35 27 Masculino 51 2 Ms >8 19
13 Feminino 52 2 Med 6a8 70 28 Masculino 36 0 Boas 3a5 23
14 Feminino 66 0 Ms 6a8 1 29 Masculino 66 1 Pess 3a5 63
15 Feminino 31 1 Ms <3 12 30 Masculino 54 3 Pess 6a8 19

LEGENDA:
Gnero:Gnero do funcionrio (Fem, Masc)
Idade: Idade do funcionrio (em anos)
N_Filh: Nmero de Filhos do funcionrio
C_Trab: Condies de trabalho (Pess, Ms, Mdias, Boas, Exc)
A_Emp: Antiguidade na empresa (< 3, 3 a 5, 6 a 8, > 8)
D_Casa: Distncia do emprego a casa (em Km)

- 101 - Estatstica 1 Ano 1 Semestre

Conceo de um Ficheiro de Dados


Considere novamente o conjunto de dados associado ao desempenho escolar
de 30 alunos.
Para inserir estes dados num ficheiro de dados SPSS deve comear por definir
as diferentes variveis na folha de especificao de variveis:

- 102 - Estatstica 1 Ano 1 Semestre

51
23-02-2017

Conceo de um Ficheiro de Dados


Varivel Aluno:

- 103 - Estatstica 1 Ano 1 Semestre

Conceo de um Ficheiro de Dados


Varivel Gnero:

- 104 - Estatstica 1 Ano 1 Semestre

52
23-02-2017

Conceo de um Ficheiro de Dados


Varivel Grau de Escolaridade do Encarregado de Educao:

- 105 - Estatstica 1 Ano 1 Semestre

Conceo de um Ficheiro de Dados


Varivel Nmero de Irmos:

Varivel Compreenso Leitora:

Varivel Rendimento Escolar:

- 106 - Estatstica 1 Ano 1 Semestre

53
23-02-2017

Conceo de um Ficheiro de Dados


Varivel Nmero mdio de horas de sono por noite:

- 107 - Estatstica 1 Ano 1 Semestre

Conceo de um Ficheiro de Dados


Guardar o Ficheiro de Dados:

- 108 - Estatstica 1 Ano 1 Semestre

54
23-02-2017

Conceo de um Ficheiro de Dados

- 109 - Estatstica 1 Ano 1 Semestre

Conceo de um Ficheiro de Dados


Cada coluna corresponde a uma varivel:

Insira os valores observados,


considerando que cada linha
corresponde aos valores de cada
aluno:

- 110 - Estatstica 1 Ano 1 Semestre

55
23-02-2017

Conceo de um Ficheiro de Dados


Para visualizar as codificaes feitas:

Ou usar a barra de atalho:

- 111 - Estatstica 1 Ano 1 Semestre

Conceo de um Ficheiro de Dados


No final, guarde novamente o ficheiro de dados:

- 112 - Estatstica 1 Ano 1 Semestre

56
23-02-2017

Operaes bsicas com Ficheiros de Dados


Considere novamente o conjunto de dados referente avaliao contnua
de 27 estudantes.

Suponha agora que se pretendia determinar a mdia das notas obtidas


nos dois testes escritos:

Mdia = (Teste_1 + Teste_2)/2

Como proceder?

Nota: Estes dados encontram-se no ficheiro SPSS com o nome 2_avaliao_continua.sav

- 113 - Estatstica 1 Ano 1 Semestre

Operaes bsicas com Ficheiros de Dados


Seleccione os comandos:

Transforme
Compute Variable

- 114 - Estatstica 1 Ano 1 Semestre

57
23-02-2017

Operaes bsicas com Ficheiros de Dados


Expresso
matemtica
para
determinar a
nova varivel

Nome
da nova
varivel

- 115 - Estatstica 1 Ano 1 Semestre

Operaes bsicas com Ficheiros de Dados

- 116 - Estatstica 1 Ano 1 Semestre

58
23-02-2017

Operaes bsicas com Ficheiros de Dados


Suponha agora que a classificao associada participao
determinada por:

Participao = Presenas + T.P.C.

Como proceder?

Seleccione os comandos:

Transforme
Compute Variable

- 117 - Estatstica 1 Ano 1 Semestre

Operaes bsicas com Ficheiros de Dados


Expresso
matemtica
para
determinar a
Nome nova varivel
da nova
varivel

- 118 - Estatstica 1 Ano 1 Semestre

59
23-02-2017

Operaes bsicas com Ficheiros de Dados

- 119 - Estatstica 1 Ano 1 Semestre

Operaes bsicas com Ficheiros de Dados


Suponha agora que a classificao final de cada aluno dada por:

Nota Final = 80% Mdia dos teste + 20% Participao

Como proceder?

Seleccione os comandos:

Transforme
Compute Variable

- 120 - Estatstica 1 Ano 1 Semestre

60
23-02-2017

Operaes bsicas com Ficheiros de Dados


Expresso
matemtica
para
determinar a
Nome nova varivel
da nova
varivel

- 121 - Estatstica 1 Ano 1 Semestre

Operaes bsicas com Ficheiros de Dados

A varivel nota final de cada aluno, tambm pode ser codificada da


seguinte forma:

Situao Final:
Reprovado se nota final < 9.5
Aprovado se nota final 9.5

Como proceder?

- 122 - Estatstica 1 Ano 1 Semestre

61
23-02-2017

Operaes bsicas com Ficheiros de Dados


Seleccione os comandos:
Transforme
Recode into Different Variables

- 123 - Estatstica 1 Ano 1 Semestre

Operaes bsicas com Ficheiros de Dados


Nome da varivel usada
para determinar nova
varivel

Nome
da nova
varivel

- 124 - Estatstica 1 Ano 1 Semestre

62
23-02-2017

Operaes bsicas com Ficheiros de Dados

- 125 - Estatstica 1 Ano 1 Semestre

Operaes bsicas com Ficheiros de Dados

- 126 - Estatstica 1 Ano 1 Semestre

63
23-02-2017

Operaes bsicas com Ficheiros de Dados


Para facilitar consultas futuras deste ficheiro, deve proceder codificao da
nova varivel:

- 127 - Estatstica 1 Ano 1 Semestre

Operaes bsicas com Ficheiros de Dados

- 128 - Estatstica 1 Ano 1 Semestre

64
23-02-2017

Operaes bsicas com Ficheiros de Dados


No fim, no se esquea de gravar o ficheiro construdo:

- 129 - Estatstica 1 Ano 1 Semestre

Estatstica Descritiva Univariada

Estatstica 1 Ano 1 Semestre

65
23-02-2017

A estatstica no mundo atual

A Estatstica usada no nosso dia a dia, por exemplo em


Estudos de mercados
Sondagens

O que a estatstica?
Para que serve a estatstica?

A Estatstica muitas vezes definida como


Mtodo matemtico de anlise de dados
Cincia que trata os dados

- 131 - Estatstica 1 Ano 1 Semestre

A estatstica no mundo atual

Analise o seguinte conjunto de dados, por breves momentos:

Grupo 1 Grupo 2
6 4 1 12 7 5 6 9 2 12 8 4
3 6 5 8 11 5 3 11 1 10 9 3
2 9 7 9 4 10 4 5 4 7 3 9
8 6 6 7 5 7 5 8 10 2 9 3

Quais as principais concluses?

- 132 - Estatstica 1 Ano 1 Semestre

66
23-02-2017

A estatstica no mundo atual

Utilizando algumas tcnicas de organizao dos dados, podem-se obter


as seguintes tabelas:

Grupo 1 Grupo 2
x x x x x
x x x x x x
x x x x x x x x x x x x x
x x x x x x x x x x x x x x x x x x x x x x x x
1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12

As diferenas entre os dois conjuntos de dados so facilmente


identificadas

- 133 - Estatstica 1 Ano 1 Semestre

Tratamento dados univariados - Introduo

A forma de organizar, sumarizar e descrever os dados depende basicamente


da escala em que os dados esto medidos

A Inferncia Estatstica
do nmero de variveis a analisar

Uma Anlise Estatstica pode ser:


Univariada - se envolve apenas uma varivel
Bivariada - se envolve apenas duas variveis
Multivariada - se envolve a anlise simultnea de mais de 2 variveis

- 134 - Estatstica 1 Ano 1 Semestre

67
23-02-2017

Dados Qualitativos Nominais: Tabelas de


Frequncia
A organizao dos dados definidos numa escala nominal, baseia-se em
contagens de elementos pertencentes mesma caraterstica ou modalidade.

Uma forma possvel de organizar dados nominais conseguida atravs do uso


de tabelas de frequncia.

Como proceder?
1 - listar todas as categorias da varivel em estudo
2 - contar os elementos pertencentes a cada modalidade (ou classe).

- 135 - Estatstica 1 Ano 1 Semestre

Dados Qualitativos Nominais: Tabelas de


Frequncia
Tabela de Frequncias para dados Qualitativos Nominais
Frequncia absoluta (n i) Frequncia relativa (fi)
nmero de observaes quociente entre a frequncia
em cada modalidade ou absoluta dessa modalidade
classe (ou classe) e o nmero total
de observaes
X ni fi

x1 n1 f1 = n 1/N

Modalidade x2 n2 f2 = n 2/N
ou classe

xk nk fk = n k/N

A soma de todas as Total N 1 A soma de todas as


frequncias absolutas frequncias relativas
igual a N igual a 1.

- 136 - Estatstica 1 Ano 1 Semestre

68
23-02-2017

Dados Qualitativos Nominais: Tabelas de


Frequncia - Exemplo
Considere o seguinte conjunto de dados associados competncia leitora dos
alunos:
Grau Compe- Rendi- Grau Compe- Rendi-
N N mdio N N mdio
Aluno Gnero Escolaridade tncia mento Aluno Gnero Escolaridade tncia mento
irmos horas sono irmos horas sono
Enc. Educ. Leitora Escolar Enc. Educ. Leitora Escolar
1 Feminino E. Bsico 0 5 103 <7 horas 16 Masculino E. Secundrio 2 15 109 7 a 9 horas
2 Feminino E. Bsico 1 8 109 7 a 9 horas 17 Masculino E. Secundrio 1 10 108 >9 horas
3 Feminino E. Bsico 2 10 102 <7 horas 18 Masculino E. Secundrio 0 9 109 >9 horas
4 Feminino E. Bsico 1 8 109 7 a 9 horas 19 Masculino E. Secundrio 0 8 108 7 a 9 horas
5 Feminino E. Bsico 1 9 110 >9 horas 20 Masculino E. Secundrio 0 11 107 7 a 9 horas
6 Masculino E. Bsico 0 15 115 >9 horas 21 Feminino E. Superior 1 12 109 >9 horas
7 Masculino E. Bsico 1 4 106 7 a 9 horas 22 Feminino E. Superior 1 19 115 >9 horas
8 Masculino E. Bsico 2 5 105 <7 horas 23 Feminino E. Superior 0 14 111 >9 horas
9 Feminino E. Secundrio 3 19 114 >9 horas 24 Feminino E. Superior 1 17 115 >9 horas
10 Feminino E. Secundrio 1 15 115 >9 horas 25 Feminino E. Superior 2 18 110 >9 horas
11 Feminino E. Secundrio 0 14 110 >9 horas 26 Feminino E. Superior 2 12 109 7 a 9 horas
12 Feminino E. Secundrio 1 6 108 7 a 9 horas 27 Masculino E. Superior 1 14 108 7 a 9 horas
13 Feminino E. Secundrio 3 18 112 >9 horas 28 Masculino E. Superior 1 9 104 <7 horas
14 Feminino E. Secundrio 0 4 102 <7 horas 29 Masculino E. Superior 2 5 107 <7 horas
15 Masculino E. Secundrio 3 7 106 <7 horas 30 Masculino E. Superior 3 15 102 <7 horas

Nota: Estes dados encontram-se no ficheiro SPSS com o nome 1_educacao.sav

- 137 - Estatstica 1 Ano 1 Semestre

Dados Qualitativos Nominais: Tabelas de


Frequncia - Exemplo
A tabela de frequncias para a varivel gnero obtida da seguinte forma:

Gnero ni fi
Masculino 13 13/30 = 0.43
Feminino 17 17/30 = 0.57

Modalidade Frequncia Frequncia


(classe) absoluta relativa

- 138 - Estatstica 1 Ano 1 Semestre

69
23-02-2017

Dados Qualitativos Nominais: Tabelas de


Frequncia - Exemplo
No SPSS:

- 139 - Estatstica 1 Ano 1 Semestre

Dados Qualitativos Nominais: Tabelas de


Frequncia - Exemplo

Modalidade Frequncia Percentagem


(classe) absoluta =Frequncia relativa x 100

- 140 - Estatstica 1 Ano 1 Semestre

70
23-02-2017

Dados Qualitativos Nominais:


Representaes Grficas - Exemplo
As representaes grficas mais adequadas para dados expressos numa escala
nominal so:

Pictograma Grfico de barras Grfico circular

Cada ou corresponde
a 5 indivduos

- 141 - Estatstica 1 Ano 1 Semestre

Dados Qualitativos Nominais:


Representaes Grficas
No SPSS:

- 142 - Estatstica 1 Ano 1 Semestre

71
23-02-2017

Dados Qualitativos Nominais:


Representaes Grficas

- 143 - Estatstica 1 Ano 1 Semestre

Dados Qualitativos Nominais:


Representaes Grficas

Para alterar as especificaes do


grfico clicar duas vezes em cima
do grfico abrindo-se outra janela.
Escolher, por exemplo, a opo

- 144 - Estatstica 1 Ano 1 Semestre

72
23-02-2017

Dados Qualitativos Nominais:


Representaes Grficas
Esco lhendo a o po

- 145 - Estatstica 1 Ano 1 Semestre

Dados Qualitativos Nominais:


Representaes Grficas
Grfico Barras no SPSS:
Graphs > Legacy Dialogs > Bar

- 146 - Estatstica 1 Ano 1 Semestre

73
23-02-2017

Dados Qualitativos Nominais:


Representaes Grficas

Clicando duas vezes em


cima do grfico pode-se
alterar as definies

- 147 - Estatstica 1 Ano 1 Semestre

Dados Qualitativos Ordinais: Tabelas de


Frequncia
Dados Qualitativos Ordinais
A organizao de dados qualitativos ordinais baseia-se na contagem dos
elementos pertencentes s diferentes categorias.

Como possvel estabelecer uma relao de ordem entre as categorias, j


possvel determinar as frequncias acumuladas (absolutas e relativas)

Como proceder?
1 - listar todas as categorias da varivel em estudo e orden-las
2 - contar os elementos pertencentes a cada modalidade (ou classe).

- 148 - Estatstica 1 Ano 1 Semestre

74
23-02-2017

Dados Qualitativos Ordinais: Tabelas de


Frequncia
Tabela de Frequncias para dados Qualitativos Ordinais

X ni fi Ni Fi

x1 n1 f1 = n 1/N n1 f1

x2 n2 f2 = n 2/N n 1+n 2 f1+f2

xk nk fk = n k/N N 1k

Total N 1

Frequncia Frequncia Frequncia


Frequncia
relativa (fi ) absoluta relativa
absoluta (ni )
acumulada (N i ) acumulada (Fi )

- 149 - Estatstica 1 Ano 1 Semestre

Dados Qualitativos Ordinais: Tabelas de


Frequncia - Exemplo
A tabela de frequncias para a varivel grau de escolaridade do encarregado
de educao obtida da seguinte forma:

Grau Esc. Enc.


ni fi Ni Fi
Educ.
Ensino Bsico 8 8/30 = 0.27 8 0.27
Ensino Secundrio 12 12/30 = 0.40 20 0.67
Ensino Superior 10 10/30 = 0.33 30 1.00

Modalidade Frequncia Frequncia Frequncia Frequncia


(classe) absoluta relativa absoluta relativa
acumulada acumulada

- 150 - Estatstica 1 Ano 1 Semestre

75
23-02-2017

Dados Qualitativos Ordinais: Tabelas de


Frequncia - Exemplo
No SPSS:
Analyze > Descriptive Statistics > Frequencies

Modalidade Frequncia Percentagem Percentagem


(classe) absoluta acumulada

- 151 - Estatstica 1 Ano 1 Semestre

Dados Qualitativos Ordinais:


Representaes Grficas
As representaes grficas mais adequadas para dados expressos numa escala
ordinal so:
Grficos circulares
Grficos barras
Grficos de traos
Diagramas de extremos e quartis /Caixas de bigodes (boxplot)
(a ver mais tarde)

- 152 - Estatstica 1 Ano 1 Semestre

76
23-02-2017

Dados Qualitativos Ordinais:


Representaes Grficas - Exemplo

Grfico Circular Grfico de barras

- 153 - Estatstica 1 Ano 1 Semestre

Dados Quantitativos Discretos: Tabelas de


Frequncia - Exemplo
Dados Quantitativos Discretos
A organizao de dados quantitativos discretos feita de forma
semelhante considerada para dados qualitativos ordinais
A tabela de frequncias para a varivel n de irmos obtida da seguinte
forma:

N de Irmos ni fi Ni Fi
0 8 8/30 = 0.27 8 0.27
1 12 12/30 = 0.40 20 0.67
2 6 6/30 = 0.20 26 0.87
3 4 4/30 = 0.13 30 1.00

Valores observados Frequncia Frequncia Frequncia Frequncia


para a varivel absoluta relativa absoluta relativa
acumulada acumulada

- 154 - Estatstica 1 Ano 1 Semestre

77
23-02-2017

Dados Quantitativos Discretos: Tabelas de


Frequncia - Exemplo
No SPSS:

- 155 - Estatstica 1 Ano 1 Semestre

Dados Quantitativos Discretos:


Representaes Grficas - Exemplo
As representaes grficas mais adequadas para dados expressos numa escala
quantitativa discreta so:
Grficos circulares
Grficos barras
Grficos de traos
Diagramas de extremos e quartis /Caixas de bigodes (a ver mais tarde)

- 156 - Estatstica 1 Ano 1 Semestre

78
23-02-2017

Dados Quantitativos Discretos:


Representaes Grficas - Exemplo

Grfico de barras Diagrama de extremos e


(freq. relativas) (freq. acumuladas) quartis

- 157 - Estatstica 1 Ano 1 Semestre

Dados Quantitativos (agrup. em classes):


Tabelas de Frequncia
Dados Quantitativos agrupados em classes
A organizao deste tipo de dados requer que os dados sejam agrupados
em classes ou intervalos.

O nmero de classes a considerar (c) dado pela regra de Sturges:


c = 1 + 3.322 log10 (N)
Nota: O nmero de classes a considerar deve ser arredondado para o valor
inteiro superior.

No caso de se considerar que as classes tm igual amplitude, ela dada


por
h = (Xmax Xmin) /c

- 158 - Estatstica 1 Ano 1 Semestre

79
23-02-2017

Dados Quantitativos (agrup. em classes):


Tabelas de Frequncia
Tabela de Frequncias para dados Quantitativos (agrup. em classes)

Ponto mdio da X ni fi Ni Fi
classe
x'1=(l1+l2)/2 [l1, l2[ n1 f1 = n 1/N n1 f1

x2=(l2+l3)/2 [l2, l3[ N2 f2 = n 2/N n 1+n 2 f1+f2

x'k =(lk +lk+1)/2 [lk, lk+1[ nk fk = n k/N N 1

Total N 1

Frequncia Frequncia
Frequncia Frequncia absoluta relativa
absoluta (ni ) relativa (fi ) acumulada (N i ) acumulada (F i )

- 159 - Estatstica 1 Ano 1 Semestre

Dados Quantitativos (agrup. em classes):


Tabelas de Frequncia - Exemplo
A tabela de frequncias para a varivel competncia leitora obtida da
seguinte forma:

O nmero de classes dados por:


c = 1 + 3.322 log10 (30) = 5.906 considerar 6 classes

A amplitude de cada classe dada por:


h = (19 4) /6 = 2.5 considerar, por exemplo, h = 2.6
Considerando h = 2.5, as classes seriam: Assim, as classes a
[4.0, 6.5[ considerar so:
[6.5, 9.0[ [4.0, 6.6[
[9.0, 11.5[ [6.6, 9.2[
[11.5, 14.0[ [9.2, 11.8[
[14.0, 16.5[ O valor 19 no pertence [11.8, 14.4[
[16.5, 19.0[ a nenhuma classe [14.4, 17.0[
[17.0, 19.6[

- 160 - Estatstica 1 Ano 1 Semestre

80
23-02-2017

Dados Quantitativos (agrup. em classes):


Tabelas de Frequncia - Exemplo
Ponto mdio Classe ni fi Ni Fi
da classe
5.3 [4.0,6.6[ 6 6/30 =0.20 6 0.20
7.9 [6.6,9.2[ 7 7/30 =0.23 13 0.43
10.5 [9.2, 11.8[ 3 3/30=0.10 16 0.53
13.1 [11.8, 14.4[ 5 5/30=0.17 21 0.70
15.7 [14.4, 17.0[ 4 4/30=0.13 25 0.83
18.3 [17.0, 19.6[ 5 5/30=0.17 30 1.00

Classes Frequncia Frequncia Frequncia Frequncia


absoluta relativa absoluta relativa
acumulada acumulada

- 161 - Estatstica 1 Ano 1 Semestre

Dados Quantitativos (agrup. em classes):


Representaes Grficas - Exemplo
Para representar graficamente estes dados usando o SPSS pode-se construir
um histograma:
Graph > Legacy Dialogs > Histogram

- 162 - Estatstica 1 Ano 1 Semestre

81
23-02-2017

Dados Quantitativos (agrup. em classes):


Representaes Grficas - Exemplo
Para definir o nmero de classes e a amplitude das classes, deve clicar com o
rato duas vezes em cima das barras do histograma que aparece no editor de
grficos para obter a seguinte janela:

- 163 - Estatstica 1 Ano 1 Semestre

Dados Quantitativos (agrup. em classes):


Representaes Grficas - Exemplo
Para representar graficamente estes dados usando o SPSS pode-se construir
um diagrama de extremos e quartis:
Graph > Legacy Dialogs > Boxplot

- 164 - Estatstica 1 Ano 1 Semestre

82
23-02-2017

Distribuies de Frequncia e
Representaes Grficas - Exerccios
Considere o novamente o conjunto de
dados referente avaliao contnua de
27 estudantes.
Descreva cada uma das variveis atravs
de distribuies de frequncia e de
representaes grficas. LEGENDA:
Gnero:Gnero do
funcionrio (Fem, Masc)
Idade: Idade do funcionrio
LEGENDA: (m anos)
N_Filh: Nmero de Filhos
Genero: Masculino, Feminino do funcionrio
Ano Curso: 1 ano, 2 ano, 3 ano C_Trab: Condies de
Presenas: N de presenas s aulas (0-12) trabalho (Pess, Ms,
Mdias, Boas, Exc)
TPC: N de TPC realizados (0-8) A_Emp: Antiguidade na
Teste_1: Classificao no 1 teste (0-20) empresa (< 3, 3 a 5, 6 a
Teste_2: Classificao no 2 teste (0-20) 8, > 8)
D_Casa: Distncia do
emprego a casa (em Km)

Nota: Estes dados encontram-se no ficheiro SPSS com o


nome 2_avaliao_continua_Exercicio.sav

- 165 - Estatstica 1 Ano 1 Semestre

Estatsticas Descritivas
Os dados tambm podem ser caraterizados pela obteno de medidas
estatsticas designadas por Estatsticas Descritivas.

O clculo das estatsticas descritivas depende da escala em que os dados esto


expressos.

As estatsticas descritivas mais frequentes so:


a) Medidas de localizao:
Permitem caraterizar a ordem de grandeza dos dados.

b) Medidas de disperso:
Permitem quantificar a variabilidade dos dados.

- 166 - Estatstica 1 Ano 1 Semestre

83
23-02-2017

Medidas de Localizao
As medidas de localizao podem ser classificadas em

a) Medidas de Tendncia Central


As medidas de tendncias central indicam o valor central em torno do qual
se distribuem os restantes dados em estudo. Na maior parte dos casos esse
valor (central) aquele em torno do qual se agrupam os dados da
distribuio.

b) Medidas de Posio (ou de Tendncia no Central)


As medidas de posio indicam a posio de uma determinada observao
relativamente s restantes.

- 167 - Estatstica 1 Ano 1 Semestre

Medidas de Tendncia Central: Moda

A moda (Mo) consiste na observao mais frequente da amostra.

No caso em que os dados esto agrupados em classes fala-se em classe modal e


representa a classe com frequncia absoluta mais elevada.

A moda a medida de localizao menos usada, embora possa ser determinada


para qualquer tipo de dados estatsticos.

Propriedades da Moda:
A moda bastante simples de calcular, no entanto tem o inconveniente de
poder no ser nica ou mesmo no existir.
A moda depende da frequncia das observaes.
A moda no afetada por valores extremos.

- 168 - Estatstica 1 Ano 1 Semestre

84
23-02-2017

Medidas de Tendncia Central: Moda -


Exemplos
Considere as tabelas de frequncias obtidas para os dados associados competncia
leitora dos alunos:

A Moda da varivel
Gnero corresponde ao
gnero Feminino.

A Moda da varivel Grau de


Escolaridade do Encarregado de
Educao corresponde ao
Ensino Secundrio.

- 169 - Estatstica 1 Ano 1 Semestre

Medidas de Tendncia Central: Moda -


Exemplos
A Moda da varivel N de
irmos corresponde a 1 irmo .

Pto mdio Classe ni Fi Ni Fi


da classe
5.3 [4.0,6.6[ 6 6/30 =0.20 6 0.20 A classe modal da
varivel Compe-
7.9 [6.6,9.2[ 7 7/30 =0.23 13 0.43 tncia Leitora
10.5 [9.2, 11.8[ 3 3/30=0.10 16 0.53 corresponde classe
[6.6, 9.2[.
13.1 [11.8, 14.4[ 5 5/30=0.17 21 0.70
15.7 [14.4, 17.0[ 4 4/30=0.13 25 0.83
18.3 [17.0, 19.6[ 5 5/30=0.17 30 1.00

- 170 - Estatstica 1 Ano 1 Semestre

85
23-02-2017

Medidas de Tendncia Central: Mediana

A mediana (Me) um valor que divide o conjunto ordenado de observaes em


duas partes iguais.

A mediana s pode ser determinada para dados expressos numa escala pelo
menos ordinal.

Propriedades da Mediana:
A mediana nica.
A mediana depende das posies ocupadas pelas observaes.
A mediana depende unicamente das observaes centrais.

A forma de determinar a mediana, depende da escala em que os dados esto


expressos:

- 171 - Estatstica 1 Ano 1 Semestre

Medidas de Tendncia Central: Mediana


Se os dados esto expressos numa escala ordinal

Isto , se a amostra tem dimenso par, a mediana corresponde ao


elemento que est na posio n/2 da amostra ordenada

Se a dimenso da amostra mpar, a mediana corresponde ao


valor central das observaes ordenadas;

- 172 - Estatstica 1 Ano 1 Semestre

86
23-02-2017

Medidas de Tendncia Central: Mediana


Se os dados esto expressos numa escala quantitativa (discreta)

Isto , se a amostra tem dimenso par, a mediana corresponde


mdia aritmtica dos dois valores centrais.

Se a dimenso da amostra mpar, a mediana corresponde ao


valor central das observaes ordenadas;

- 173 - Estatstica 1 Ano 1 Semestre

Medidas de Tendncia Central: Mediana -


Exemplos
Considere novamente a tabela de frequncias obtidas anteriormente para a
varivel Grau de Escolaridade do Encarregado de Educao:

Como se trata de uma varivel expressa numa escala ordinal e a dimenso


da amostra par (n=30), a mediana corresponde ao 15 elemento da
amostra ordenada.
Logo, Me = Ens. Secundrio

- 174 - Estatstica 1 Ano 1 Semestre

87
23-02-2017

Medidas de Tendncia Central: Mediana -


Exemplos
Para a varivel Nmero de irmos:

Como se trata de uma varivel expressa numa escala quantitativa (discreta) e


a dimenso da amostra par (n=30), a mediana corresponde media
aritmtica dos dois valores centrais da amostra ordenada. Logo,

Assim, Me = 1 irmo

- 175 - Estatstica 1 Ano 1 Semestre

Medidas de Tendncia Central: Mdia

A Mdia s pode ser determinada para dados do tipo quantitativo

Propriedades da Mdia:
A mdia nica.
A mdia depende do valor de cada observao.
A mdia afetada por valores extremos.

A mdia (aritmtica) de uma amostra obtida dividindo a soma de todos os


valores da amostra pelo nmero de elementos que constitui essa amostra (n),
isto ,

- 176 - Estatstica 1 Ano 1 Semestre

88
23-02-2017

Medidas de Tendncia Central: Mdia -


Exemplos
Considere as tabelas de frequncias obtidas para os dados apresentados na
pgina 140 associados competncia leitora dos alunos:

A mdia dada por,

- 177 - Estatstica 1 Ano 1 Semestre

Medidas de Posio
De uma forma geral as medidas de posio so designadas por quantis, isto ,
so medidas que permitem dividir (uma amostra ordenada) em vrias partes
iguais.

Os quantis mais frequentemente utilizados so:


Quartis (Q1, Q2, Q3)
Dividem a mostra em quatro partes iguais

Decis (D 1, D 2, , D 9)
Dividem a amostra em 10 partes iguais

Percentis (P1, P2, , P99)


Dividem a amostra em cem partes iguais

- 178 - Estatstica 1 Ano 1 Semestre

89
23-02-2017

Medidas de Posio

Dizemos que o percentil de ordem p toma o valor a (Pp = a), quando p% das
observaes que so inferiores ou iguais a a e (100-p )% das observaes so
superiores ou iguais a a.

50% das observaes 50% das observaes

Me = Q2 = P50

- 179 - Estatstica 1 Ano 1 Semestre

Medidas de Posio - Exemplos

Com base na informao fornecida atravs da tabela de frequncias para a


varivel Grau de escolaridade do encarregado de educao, podem-se
determinar os quartis.

O primeiro quartil (Q1) corresponde ao percentil 25


O segundo quartil (Q2) corresponde ao percentil 50 ou mediana
O terceiro quartil (Q3) corresponde ao percentil 75

- 180 - Estatstica 1 Ano 1 Semestre

90
23-02-2017

Medidas de Posio - Exemplos


Como interpretar estes valores?
Q1 = Ensino Bsico
Para 25% dos inquiridos, o nvel de escolaridade do Encarregado de
Educao inferior ou igual ao ensino bsico
Para 75% dos inquiridos, o nvel de escolaridade do Encarregado de
Educao superior ou igual ao ensino bsico
Q2 = Ensino Secundrio
Para 50% dos inquiridos, o nvel de escolaridade do Encarregado de
Educao inferior ou igual ao ensino secundrio
Para 50% dos inquiridos, o nvel de escolaridade do Encarregado de
Educao superior ou igual ao ensino secundrio
Q3 = Ensino Superior
Para 75% dos inquiridos, o nvel de escolaridade do Encarregado de
Educao inferior ou igual ao ensino superior
Para 25% dos inquiridos, o nvel de escolaridade do Encarregado de
Educao superior ou igual ao ensino superior

- 181 - Estatstica 1 Ano 1 Semestre

Medidas de Posio - Exemplos

1 quartil:
O 1 Quartil corresponde a Zero irmos
2 quartil:
O 2 Quartil ou mediana corresponde a 1 irmo
3 quartil:
O 3 Quartil corresponde a 2 irmos

- 182 - Estatstica 1 Ano 1 Semestre

91
23-02-2017

Medidas Localizao Resumo

As medidas de localizao permitem caraterizar a ordem de grandeza dos


dados.

Escala
Medida de localizao Nominal Ordinal Quantitativa

Moda
Central Mediana
Tendncia
Mdia
No central Quantis

- 183 - Estatstica 1 Ano 1 Semestre

Medidas de Disperso
As medidas de disperso quantificam a disperso, isto , a variabilidade dos
dados amostrais. Estas medidas, juntamente com as medidas de localizao,
permitem uma melhor descrio das amostras.

Considerem-se os seguintes conjuntos de dados que representam idades de 5


indivduos (em anos):

Amostra 1 14 15 18 18 25 Mo = 18 Me = 18
Amostra 2 10 18 18 18 26 Mo = 18 Me = 18
Amostra 3 18 18 18 18 18 Mo = 18 Me = 18

Estes dados apresentam a mesma moda, mediana e mdia, no entanto, os


valores que constituem as amostras so diferentes. As medidas de disperso vo
realar estas diferenas.

- 184 - Estatstica 1 Ano 1 Semestre

92
23-02-2017

Medidas de Disperso:
Amplitude de variao total
A amplitude de variao total pode ser calculada para dados expressos numa
escala quantitativa.

Esta medida de disperso indica a diferena entre o valor mximo e mnimo da


amostra, isto , R = Max(X i) Min(X i).

Propriedades da amplitude de variao total:


A amplitude de variao muito fcil de calcular.
A amplitude de variao total tem em conta apenas os valores extremos
A amplitude de variao total nica.

AVT
Amostra 1 14 15 18 18 25 11.0
Amostra 2 10 18 18 18 26 16.0
Amostra 3 18 18 18 18 18 0.00

- 185 - Estatstica 1 Ano 1 Semestre

Medidas de Disperso:
Amplitude de Variao Quartlica
As amplitudes de variao interquartlica e semi-interquartlica podem ser
calculadas para dados expressos numa escala quantitativa.

A amplitude de variao interquartlica dada pela diferena entre o terceiro


e o primeiro quartil, isto ,
AIQ = Q3 Q1,

A amplitude de variao semi-interquartlica representa a semi-distncia


entre o 1 e o 3 quartil, isto ,
ASIQ = (Q3 Q1)/2

Nota: No caso de dados ordinais, os valores que estas diferenas apresentam no


tm qualquer significado matemtico. Logo no tem qualquer sentido calcular
estas medidas de disperso!

- 186 - Estatstica 1 Ano 1 Semestre

93
23-02-2017

Medidas de Disperso:
Amplitude de Variao Quartlica - exemplo
AVT AIQ ASIQ
Amostra 1 14 15 18 18 25 11.0 3.00 1.50
Amostra 2 10 18 18 18 26 16.0 0.00 0.00
Amostra 3 18 18 18 18 18 0.00 0.00 0.00

Propriedades da amplitude de variao quartlica:


A amplitude de variao interquartlica e semi-interquartlica so nicas.
A amplitude de variao interquartlica e semi-interquartlica no
dependem dos valores extremos.
A amplitude de variao interquartlica e semi-interquartlica dependem
das posies dos quartis.

- 187 - Estatstica 1 Ano 1 Semestre

Medidas de Disperso:
Varincia e desvio-padro
A varincia mede a disperso das observaes em torno da mdia, isto ,
uma medida de disperso relativamente mdia.

O desvio-padro a raiz quadrada da varincia.

Este tipo de medidas de disperso s pode ser calculado para dados do tipo
quantitativo.

Propriedades da varincia:
A varincia mede a disperso dos valores em relao mdia.
A varincia depende do valor de cada observao.
A varincia nica.
A varincia sempre um valor no negativo.

- 188 - Estatstica 1 Ano 1 Semestre

94
23-02-2017

Medidas de Disperso:
Varincia e desvio-padro

A varincia de uma amostra pode ser determinada atravs de:

O desvio-padro a raiz quadrada da varincia.

AVT AIQ ASIQ S S2


Amostra 1 14 15 18 18 25 11.0 3.00 1.50 2.07 4.30
Amostra 2 10 18 18 18 26 16.0 0.00 0.00 2.38 5.66
Amostra 3 18 18 18 18 18 0.00 0.00 0.00 0.00 0.00

- 189 - Estatstica 1 Ano 1 Semestre

Medidas de Disperso:
Coeficiente de Variao - Exemplo
O Coeficiente de Variao uma outra medida de disperso que pode ser
determinada pelo quociente entre o desvio-padro e a mdia, isto ,

AVT AIQ ASIQ S S2 CV


Amostra 1 14 15 18 18 25 11.0 3.00 1.50 2.07 4.30 0.115
Amostra 2 10 18 18 18 26 16.0 0.00 0.00 2.38 5.66 0.132
Amostra 3 18 18 18 18 18 0.00 0.00 0.00 0.00 0.00 0.000

- 190 - Estatstica 1 Ano 1 Semestre

95
23-02-2017

Medidas de Disperso

Considerando novamente os dados que representam as idades de 5 indivduos:


Embora as medidas de localizao no evidenciassem diferenas,
Amostra 1 14 15 18 18 25 Mo = 18 Me = 18
Amostra 2 10 18 18 18 26 Mo = 18 Me = 18
Amostra 3 18 18 18 18 18 Mo = 18 Me = 18

as medidas de disperso j vo permitir detetar diferenas entre as amostras:


AVT AIQ ASIQ S S2 CV
Amostra 1 14 15 18 18 25 11.0 3.00 1.50 2.07 4.30 0.115
Amostra 2 10 18 18 18 26 16.0 0.00 0.00 2.38 5.66 0.132
Amostra 3 18 18 18 18 18 0.00 0.00 0.00 0.00 0.00 0.000

- 191 - Estatstica 1 Ano 1 Semestre

Medidas de Disperso - Resumo

As medidas de Disperso permitem quantificar a variabilidade dos dados.

Escala
Medida de disperso Nominal Ordinal Quantitativa

Amplitude de variao

total (Max-Min)
Amplitude de variao

semi-interquartlica
Varincia
Desvio-padro
Coeficiente de variao

- 192 - Estatstica 1 Ano 1 Semestre

96
23-02-2017

Medidas de Disperso - outliers

Alm destas medidas tambm usual fazer referncia existncia de


observaes que se afastam bastante das restantes. Estas observaes so
designadas por outliers (moderados ou severos) e podem ser detetados da
seguinte forma:

Moderado inferior:

Moderado superior:

Severo inferior:

Severo superior:

- 193 - Estatstica 1 Ano 1 Semestre

Medidas de Disperso - outliers

Outliers Outliers
Outliers
severos Outliers severos
moderados
inferiores moderados superiores
superiores
inferiores

- 194 - Estatstica 1 Ano 1 Semestre

97
23-02-2017

Estatstica descritiva univariada


No SPSS as estatsticas descritivas univariadas para as variveis quantitativas
apresentadas no ficheiro 1_educacao.sav podem ser obtidas atravs dos
comandos:

- 195 - Estatstica 1 Ano 1 Semestre

Estatstica descritiva univariada

- 196 - Estatstica 1 Ano 1 Semestre

98
23-02-2017

Estatstica descritiva univariada

- 197 - Estatstica 1 Ano 1 Semestre

Estatstica descritiva univariada

Ou alternativamente, atravs de

- 198 - Estatstica 1 Ano 1 Semestre

99
23-02-2017

Estatstica descritiva univariada

- 199 - Estatstica 1 Ano 1 Semestre

Estatstica descritiva univariada - Exerccio


Considere o novamente o conjunto de
dados referente avaliao contnua de
27 estudantes.
Obtenha as medidas de localizao, de
disperso, de assimetria e de
achatamento mais adequadas para os
diferentes tipos de dados.

LEGENDA:
Genero: Masculino, Feminino
Ano Curso: 1 ano, 2 ano
Presenas: N de presenas s aulas (0-12)
TPC: N de TPC realizados (0-8)
Teste_1: Classificao no 1 teste (0-20)
Teste_2: Classificao no 2 teste (0-20)

Nota: Estes dados encontram-se no ficheiro SPSS com o


nome 2_avaliao_continua.sav

- 200 - Estatstica 1 Ano 1 Semestre

100
23-02-2017

Diagrama de extremos e quartis


Para representar graficamente dados expressos numa escala pelo menos
ordinal, por vezes utilizado o diagrama de extremos e quartis, tambm
designado por caixa de bigodes ou boxplot.

minimo Q1 Q2 Q3 mximo

Este tipo de representao grfica permite obter informao sobre:


Medidas de tendncia central: Mediana
Medidas de tendncia no central: 1 e 3 quartil
Medidas de disperso: amplitude e distncia interquartilica

- 201 - Estatstica 1 Ano 1 Semestre

Diagrama de extremos e quartis

Este diagrama tambm d indicao sobre a possvel existncia de outliers:

outliers mnimo Q1 Q2 Q3 Mximo outliers


s/outliers s/outliers

- 202 - Estatstica 1 Ano 1 Semestre

101
23-02-2017

Diagrama de extremos e quartis

E sobre a assimetria da distribuio, tendo em conta a posio relativa da


mediana e o comprimento dos bigodes

assimtrica assimtrica
simtrica
negativa positiva

- 203 - Estatstica 1 Ano 1 Semestre

Diagrama de extremos e quartis


No SPSS

- 204 - Estatstica 1 Ano 1 Semestre

102
23-02-2017

Diagrama de extremos e quartis

- 205 - Estatstica 1 Ano 1 Semestre

Diagrama de extremos e quartis

assimetria
negativa

- 206 - Estatstica 1 Ano 1 Semestre

103
23-02-2017

Diagrama de extremos e quartis- Exerccio

Considere o novamente o conjunto de


dados referente avaliao contnua de
27 estudantes.
Obtenha obtenha o diagrama de
extremos e quartis para as variveis
teste_1 e teste_2.

LEGENDA:
Genero: Masculino, Feminino
Ano Curso: 1 ano, 2 ano, 3 ano
Presenas: N de presenas s aulas (0-12)
TPC: N de TPC realizados (0-8)
Teste_1: Classificao no 1 teste (0-20)
Teste_2: Classificao no 2 teste (0-20)

Nota: Estes dados encontram-se no ficheiro SPSS com o


nome 2_avaliao_continua_exercicio.sav

- 207 - Estatstica 1 Ano 1 Semestre

Diagrama de extremos e quartis- Exerccio

- 208 - Estatstica 1 Ano 1 Semestre

104
23-02-2017

Diagrama de extremos e quartis- Exerccio

- 209 - Estatstica 1 Ano 1 Semestre

Diagrama de extremos e quartis- Exerccio

- 210 - Estatstica 1 Ano 1 Semestre

105
23-02-2017

Estatsticas Descritivas: Exerccios

Exerccio:

Realizou-se um inqurito a 34 funcionrios seleccionados aleatoriamente de


uma dada empresa, tendo-se analisado as seguintes variveis:
Antig: Antiguidade do funcionrio na empresa (menos de 5 anos, 5 a 10
anos, mais de 10 anos)
Conf_Emp: Nvel de Confiana dos funcionrios relativamente empresa
(medido numa escala de 1 a 10)
Cred_Emp: Nvel de credibilidade da empresa transmitido ao pblico pelos
seus funcionrios (medido numa escala de 1 a 10)

Os valores obtidos encontram -se na tabela seguinte:

Nota: Estes dados encontram-se no ficheiro SPSS com o nome 3_funcionarios.sav

- 211 - Estatstica 1 Ano 1 Semestre

Estatsticas Descritivas: Exerccios


Ind Antig Com_Emp Cred_Emp Ind Antig Com_Emp Cred_Emp
1 Mais de 10 anos 2 4 18 Mais de 10 anos 7 10
2 5 a 10 anos 6 9 19 5 a 10 anos 5 1
3 5 a 10 anos 1 5 20 Mais de 10 anos 3 2
4 Mais de 10 anos 9 10 21 Menos de 5 anos 9 5
5 5 a 10 anos 2 4 22 Menos de 5 anos 10 7
6 Mais de 10 anos 9 4 23 Mais de 10 anos 4 8
7 Mais de 10 anos 9 7 24 Menos de 5 anos 4 2
8 5 a 10 anos 9 6 25 5 a 10 anos 10 8
9 5 a 10 anos 8 7 26 Mais de 10 anos 7 9
10 Menos de 5 anos 5 5 27 5 a 10 anos 6 10
11 5 a 10 anos 4 10 28 5 a 10 anos 6 10
12 Mais de 10 anos 4 2 29 5 a 10 anos 4 2
13 Mais de 10 anos 1 2 30 Menos de 5 anos 2 3
14 5 a 10 anos 5 10 31 Mais de 10 anos 3 2
15 Mais de 10 anos 3 7 32 Menos de 5 anos 5 8
16 Mais de 10 anos 6 4 33 Menos de 5 anos 4 2
17 Mais de 10 anos 6 6 34 Mais de 10 anos 4 6

- 212 - Estatstica 1 Ano 1 Semestre

106
23-02-2017

Estatsticas Descritivas: Exerccios

a) Para cada uma das variveis, indique a sua escala de medida e as medidas
de localizao e de disperso mais adequadas para as caraterizar.
b) Construa uma tabela de frequncias para a varivel Antig.
c) Represente graficamente os valores associados varivel Antig.
d) Determine os percentis de ordem 10 e 50 para as variveis Antig e
Conf_Emp e interprete esses valores.
e) Estude a existncia de possveis outliers para a varivel Cred_Emp e
construa o diagrama de extremos e quartis.
f) Comente a seguinte afirmao O nvel de confiana dos funcionrios
relativamente empresa apresenta uma maior variabilidade de valores
do que o nvel de credibilidade da empresa transmitido ao pblico por
parte dos seus funcionrios.
g) O que pode concluir sobre a assimetria e achatamento das variveis
Cred_Emp e Conf_Emp?

- 213 - Estatstica 1 Ano 1 Semestre

Estatstica Descritiva
Bivariada

Estatstica 1 Ano 1 Semestre

107
23-02-2017

Estatstica Descritiva Bivariada


A Estatstica Bivariada considera o estudo simultneo de duas variveis
estatsticas.

Cada indivduo (objeto) avaliado segundo duas modalidades, uma


pertencendo primeira varivel e a outra segunda varivel, isto ,

Indivduo Varivel X Varivel Y


1 X1 Y1
2 X2 Y2
... ... ...
n Xn Yn

- 215 - Estatstica 1 Ano 1 Semestre

Cruzamento de variveis
Tabelas de Contingncia
O resumo de dados bivariados depende do nvel de mensurao das variveis.
Os dados bivariados podem ser representados atravs de tabelas de dupla
entrada designadas por tabelas de contingncia.

X\Y Y 1 Y2 ... Yj total


X1 O11 O12 ... O1j L1
X2 O21 O22 ... O2j L2 Distribuio
marginal de X
... ... ... ... ... ...
Xi Oi1 Oi2 ... Oij Li
total C1 C2 ... Cj n
Distribuio
marginal de Y

- 216 - Estatstica 1 Ano 1 Semestre

108
23-02-2017

Tabelas de Contingncia

Na construo de tabelas de contingncia para os dados do tipo quantitativo


pode-se considerar os dados agrupados ou no agrupados.

No caso de os dados no estarem agrupados em classes, considera-se cada


uma das variveis em separado e recorre-se s diferentes tcnicas de
agrupamento de dados j estudados.

O nmero de classes a considerar para cada uma das variveis pode no ser o
mesmo e a amplitude das classes de uma varivel no necessariamente igual
amplitude das classes considerada para a outra varivel.

- 217 - Estatstica 1 Ano 1 Semestre

Tabelas de Contingncia - Exemplo


Considere o seguinte conjunto de dados j apresentado anteriormente:
Grau Compe- Rendi- Grau Compe- Rendi-
N N mdio N N mdio
Aluno Gnero Escolaridade tncia mento Aluno Gnero Escolaridade tncia mento
irmos horas sono irmos horas sono
Enc. Educ. Leitora Escolar Enc. Educ. Leitora Escolar
EE EE
1 Feminino E. Bsico 0 5 103 <7 horas 16 Masculino E. Secundrio 2 15 109 7 a 9 horas
2 Feminino E. Bsico 1 8 109 7 a 9 horas 17 Masculino E. Secundrio 1 10 108 >9 horas
3 Feminino E. Bsico 2 10 102 <7 horas 18 Masculino E. Secundrio 0 9 109 >9 horas
4 Feminino E. Bsico 1 8 109 7 a 9 horas 19 Masculino E. Secundrio 0 8 108 7 a 9 horas
5 Feminino E. Bsico 1 9 110 >9 horas 20 Masculino E. Secundrio 0 11 107 7 a 9 horas
6 Masculino E. Bsico 0 15 115 >9 horas 21 Feminino E. Superior 1 12 109 >9 horas
7 Masculino E. Bsico 1 4 106 7 a 9 horas 22 Feminino E. Superior 1 19 115 >9 horas
8 Masculino E. Bsico 2 5 105 <7 horas 23 Feminino E. Superior 0 14 111 >9 horas
9 Feminino E. Secundrio 3 19 114 >9 horas 24 Feminino E. Superior 1 17 115 >9 horas
10 Feminino E. Secundrio 1 15 115 >9 horas 25 Feminino E. Superior 2 18 110 >9 horas
11 Feminino E. Secundrio 0 14 110 >9 horas 26 Feminino E. Superior 2 12 109 7 a 9 horas
12 Feminino E. Secundrio 1 6 108 7 a 9 horas 27 Masculino E. Superior 1 14 108 7 a 9 horas
13 Feminino E. Secundrio 3 18 112 >9 horas 28 Masculino E. Superior 1 9 104 <7 horas
14 Feminino E. Secundrio 0 4 102 <7 horas 29 Masculino E. Superior 2 5 107 <7 horas
15 Masculino E. Secundrio 3 7 106 <7 horas 30 Masculino E. Superior 3 15 102 <7 horas

NOTA: Estes dados encontram-se no ficheiro de dados do SPSS com o nome 1_educacao.sav

- 218 - Estatstica 1 Ano 1 Semestre

109
23-02-2017

Tabelas de Contingncia - Exemplo

Comp Ensino Ensino Ensino Ensino total


leitora Bsico Secundrio Superior
[4.0;6.6[ 3 2 1 6

[6.6;9.2[ 3 3 1 7

[9.2;11.8[ 1 2 0 3

[11.8;14.4[ 0 1 4 5
[14.4;17.0[ 1 2 1 4

[17.0;19.6[ 0 2 3 5

total 8 12 10 30

- 219 - Estatstica 1 Ano 1 Semestre

Tabelas de Contingncia - Exemplo

No SPSS as tabelas de contingncia podem ser obtidas atravs dos comandos:

- 220 - Estatstica 1 Ano 1 Semestre

110
23-02-2017

Tabelas de Contingncia - Exemplo

do EE

do EE

- 221 - Estatstica 1 Ano 1 Semestre

Associao Estatstica

A associao estatstica entre duas variveis pode ser estudada


considerando:

a forma de ligao de duas variveis


linear/no linear,

a sua intensidade
forte, mdia ou fraca

o seu sentido
positivo ou negativo

- 222 - Estatstica 1 Ano 1 Semestre

111
23-02-2017

Associao Estatstica

A associao estatstica diz-se


positiva
se as variveis variam no mesmo sentido, isto , se para valores
elevados de uma varivel se observam valores elevados da outra e,
simultaneamente, para valores reduzidos das duas variveis
verificada a mesma associao.

negativa
se as variveis variarem em sentidos opostos, isto , a valores elevados
de uma varivel esto associados valores baixos da outra varivel e
vice-versa.

- 223 - Estatstica 1 Ano 1 Semestre

Associao Estatstica
Diagramas de Disperso
A existncia (ou no) de associao estatstica entre duas variveis pode
ser analisada graficamente atravs de diagramas de disperso:
58
58
57
57
56
56
55
55
54
54
53 53
52 52
51 51
50 50

7 9 11 13 15 17 19 21 7 9 11 13 15 17 19 21

Associao linear positiva forte Associao linear positiva fraca

60

58
58
57
56
56
55
54
54
53

52 52
51
50 50
7 9 11 13 15 17 19 21 7 9 11 13 15 17 19 21

Associao linear negativa forte Associao linear negativa fraca


- 224 - Estatstica 1 Ano 1 Semestre

112
23-02-2017

Associao Estatstica
Diagramas de Disperso
58 60
57
58
56

55 56

54
54
53

52 52

51
50
7 9 11 13 15 17
7 9 11 13 15 17 19 21

No existe qualquer tipo de Existe associao entre as


associao entre as variveis variveis mas no do tipo linear

61 58

59
56
57
54
55

53 52

51
50
49
48
47
0 5 10 15 20 25
7 9 11 13 15 17 19 21 23

Existe associao entre as Existe associao entre as


variveis mas no do tipo linear variveis mas no do tipo linear

- 225 - Estatstica 1 Ano 1 Semestre

Diagramas de Disperso - Exemplo

No SPSS, os diagramas de disperso podem ser obtidos atravs dos comandos:

- 226 - Estatstica 1 Ano 1 Semestre

113
23-02-2017

Diagramas de Disperso - Exemplo

- 227 - Estatstica 1 Ano 1 Semestre

Exerccios
Considere o seguinte ficheiro de dados SPSS 2_avaliao_continua_exerccio,
referente avaliao contnua de 27 estudantes a uma cadeira de estatstica:

- 228 - Estatstica 1 Ano 1 Semestre

114
23-02-2017

Exerccios

a) Estude a associao estatstica existente entre a mdia nos testes escritos


e a classificao obtida na participao.

b) Estude a associao estatstica existente entre a classificao no 1 teste


escrito e a nota final cadeira. Comente os resultados obtidos.

c) Estude a associao estatstica existente entre o ano do curso e a


classificao final cadeira. Comente os resultados obtidos.

- 229 - Estatstica 1 Ano 1 Semestre

Inferncia Estatstica

Estatstica 1 Ano 1 Semestre

115
23-02-2017

Introduo Inferncia Estatstica

Populao Seleco da
Amostra
Amostra

Estatsticas
descritivas

Inferir para
a populao

Probabilidade
de erro

- 231 - Estatstica 1 Ano 1 Semestre

Introduo Inferncia Estatstica

A inferncia estatstica tem por objetivo estimar parmetros populacionais a


partir do estudo de uma amostra.

Os parmetros (representados por letras gregas) so caratersticas


populacionais que tm um valor exato, embora sejam normalmente
desconhecidos. Os parmetros so estimados por estatsticas.

As estatsticas (representadas por legras latinas) so caratersticas amostrais


que podem ser calculadas, embora possam ser diferentes de amostra para
amostra.

- 232 - Estatstica 1 Ano 1 Semestre

116
23-02-2017

Introduo Inferncia Estatstica

Parmetro Estatstica
Caraterstica
(Populacional) (amostral)
Dimenso N n
Valor mdio
Desvio padro s
Proporo p
Coeficiente de
r
Correlao

- 233 - Estatstica 1 Ano 1 Semestre

Mtodos de Estimao

Os mecanismos mais usuais para estimar esses parmetros so:

Estimao Pontual:
Obter um valor numrico nico (a partir da amostra) para estimar o correspondente
parmetro populacional.

Estimao Intervalar:
Obter um intervalo de valores que contenha o(s) parmetro(s) desejado(s) com uma
probabilidade especificada.

Testes de hipteses:
Avaliar, atravs de tcnicas estatsticas apropriadas, se uma determinada hiptese
ou conjetura que se faz sobre os valores possveis do(s) parmetro(s) tem ou no
razo de existir.

- 234 - Estatstica 1 Ano 1 Semestre

117
23-02-2017

Estimao Pontual

A estimao pontual consiste em determinar um valor (nico) para estimar o


verdadeiro valor do parmetro populacional desconhecido.

Este mtodo tem bastantes desvantagens, uma vez que no existe nenhum
grau de certeza relativamente qualidade da estimativa obtida.

- 235 - Estatstica 1 Ano 1 Semestre

Introduo Inferncia Estatstica


Exemplo:
Suponha uma populao consistindo nas idades de 5 crianas:

6, 8, 10, 12, 14.

2,
A estimao pontual de e vai depender da amostra que se extrai:

Estimativa Estimativa Estimativa Estimativa


Amostra Amostra
pontual de pontual de 2 pontual de pontual de 2

(6, 10, 14) 10.00 16.00 (10, 8, 14) 10.67 9.33


(14,12,14) 13.33 1.33 (10, 8, 10) 9.33 1.33
(8, 6, 14) 9.33 17.33 (14, 6, 12) 10.67 17.33
(6, 8, 10) 8.00 4.00 (10, 14, 12) 12.00 4.00

Amostras diferentes produzem estatsticas diferentes!

- 236 - Estatstica 1 Ano 1 Semestre

118
23-02-2017

Estimao Intervalar

A estimao intervalar, permite obter um determinado intervalo de valores


que contm o verdadeiro valor do parmetro populacional, com um certo
grau de certeza.

Exemplo:
A classificao mdia num teste de matemtica situa-se entre os 8 e 11
valores, com uma probabilidade de 95%.

Em cada 100 intervalos obtidos, 95 desses intervalos contero o


verdadeiro valor do parmetro (apenas 5 desses intervalos no contm
o valor do parmetro).

- 237 - Estatstica 1 Ano 1 Semestre

Estimao Intervalar

- 238 - Estatstica 1 Ano 1 Semestre

119
23-02-2017

Estimao Intervalar

Intervalo de Confiana a 95% = ]49,0 ; 54,0[

Temos 95% de confiana de que a percentagem de votos no


candidato Cavaco Silva esteja entre 49% e 54%.

- 239 - Estatstica 1 Ano 1 Semestre

Estimao Intervalar
Margem de Erro:
metade da amplitude do intervalo de confiana
a medida da preciso

Quanto menor a margem de erro maior a preciso da estimativa.

Num intervalo de confiana,


a margem de erro indica a preciso da estimativa
o nvel de confiana indica-nos a confiana que temos em que o
intervalo contenha o valor do parmetro

Quanto maior for o intervalo, maior o grau de confiana, mas menor a


preciso da estimativa.

- 240 - Estatstica 1 Ano 1 Semestre

120
23-02-2017

Intervalo de Confiana para a Proporo


Intervalo de confiana a 95% para a proporo

quando se conhece a dimenso da populao


p (1 p ) n p (1 p ) n
IC 95 %
: p 1 , 96 1 ; p 1 , 96 1
n N n N

onde p a estimativa da proporo


proporo = percentagem / 100

assumindo que a dimenso da populao (N) grande.

p (1 p ) p (1 p )
IC 95 %
p 1 , 96 ; p 1 , 96
n n

- 241 - Estatstica 1 Ano 1 Semestre

Intervalo de Confiana para a Proporo

Exerccio 1: Estudo sobre sites de notcias em Portugal

Populao: indivduos registados nos vrios sites analisados.


Estime os resultados para a populao, sabendo que obtivemos com uma
amostra de 300 indivduos o seguinte resultado:
a) 45% dizem que recomendariam o site a amigos.
b) 20% dizem que consideram o site mal estruturado.
c) 20% dizem que consideram o site mal estruturado, neste caso a populao
considerada foi de 5000 indivduos.

- 242 - Estatstica 1 Ano 1 Semestre

121
23-02-2017

Intervalo de Confiana para a Proporo


Exerccio 2: (Frequncia de Estatstica Janeiro 2015)

Calcula e interpreta o intervalo de confiana a 95% para a proporo de


alunos de Jornalismo que escolheram o curso pela vocao.

- 243 - Estatstica 1 Ano 1 Semestre

Testes de Hipteses

Estatstica 1 Ano 1 Semestre

122
23-02-2017

Testes de hipteses: Introduo

Teste de Hiptese
Objetivo:
Avaliar se uma determinada hiptese ou conjetura que se faz sobre um
parmetro ou populao tem ou no razo de existir.

Nota:
Os testes de hipteses s devem ser aplicados a amostras aleatrias.

Existem diferenas entre os resultados de uma amostra e os


resultados da populao de onde a amostra foi retirada, ou seja,
existem diferenas entre as estimativas amostrais e os valores
previamente fixados correspondentes a parmetros populacionais ?

- 245 - Estatstica 1 Ano 1 Semestre

Testes de hipteses: Generalidades

Para realizar um teste de hipteses devem-se considerar os seguintes passos:


1 Identificao do Teste
2 - Definio das hipteses estatsticas
3 Determinao da significncia do teste (obtida atravs do software)
4 - Deciso
Se sig. Rejeita-se H0
Se sig. > No se rejeita H0
5 Concluso

- 246 - Estatstica 1 Ano 1 Semestre

123
23-02-2017

Testes de hipteses: Generalidades

1) Identificao do Teste:

Este primeiro passo consiste na identificao do teste a utilizar.


Ao identificar o teste mais adequado para analisar a questo em estudo
deve-se ter em conta os seguintes aspectos:
quais as variveis envolvidas no estudo,
as escalas em que essas variveis esto definidas,
qual o parmetro a avaliar (mdia, desvio-padro, coeficiente de
correlao, .)
os pressupostos (condies de aplicao) subjacentes ao teste que se
pretende utilizar.

- 247 - Estatstica 1 Ano 1 Semestre

Testes de hipteses: Generalidades

2) Definio das hipteses estatsticas:

Num teste de hipteses h sempre duas hipteses estatsticas em confronto:


Hiptese nula (H0) vs Hiptese alternativa (H1)

provisoriamente aceite como


verdadeira e que submetida a hiptese complementar H0.
uma comprovao experimental

contm sempre condio de no


contm sempre uma condio de
igualdade ( ) ou uma
igualdade (=, ou ).
desigualdade (< ou >).

- 248 - Estatstica 1 Ano 1 Semestre

124
23-02-2017

Testes de hipteses: Generalidades

Exemplo:
Pretende-se analisar se a mdia das notas de acesso dos alunos de
PM no difere da mdia das notas de acesso dos alunos de RPCE.

H0 :
vs
H1 :

- 249 - Estatstica 1 Ano 1 Semestre

Testes de hipteses: Generalidades

3) Determinao da significncia do teste:


A significncia do teste ser obtida por recurso ao software estatstico SPSS.

4) Deciso:
Quando se realiza um teste de hipteses, pode-se tomar uma de duas
decises:

rejeita-se a hiptese nula


Deciso do teste ou
no se rejeita a hiptese nula

Em ambos os casos corre-se o risco de errar.

Uma das caratersticas dos testes de hipteses minimizar esse risco.

- 250 - Estatstica 1 Ano 1 Semestre

125
23-02-2017

Testes de hipteses: Generalidades

Ao tomar a deciso de rejeitar ou no rejeitar a hiptese nula, podem-se


cometer os seguintes erros:

Situao real
H0 Verdadeira H0 Falsa
Rejeitar H0 Erro tipo I Deciso correta
Deciso
No rejeitar H0 Deciso correta Erro tipo II

- 251 - Estatstica 1 Ano 1 Semestre

Testes de hipteses: Generalidades


Estes erros podem ser quantificados em termos de probabilidades:

= P(cometer erro tipo I) = P(rejeitar H0 quando H0 verdadeira)

Nvel de significncia

1- = P(no cometer erro tipo I) =


= P(no rejeitar H0 quando H0 verdadeira)

Grau de Confiana

= P(cometer erro tipo II) = P(no rejeitar H0 quando H0 falsa)

1- = P(no cometer erro tipo II) = P(rejeitar H 0 quando H 0 falsa)

Potncia do teste

- 252 - Estatstica 1 Ano 1 Semestre

126
23-02-2017

Testes de hipteses: Generalidades


Escolher a margem de erro associada a um teste de hiptese

Escolher o erro tipo I ou nvel de significncia

Os nveis de significncia usuais so = 0.01; = 0.05 ou = 0.10

Situao real
H0 Verdadeira H0 Falsa
Rejeitar H0 Erro tipo I Deciso correta
( ) (1- )
Deciso
No rejeitar H0 Deciso correta Erro tipo II
(1- ) ( )

- 253 - Estatstica 1 Ano 1 Semestre

Testes de hipteses: Generalidades

A Estatstica de teste uma frmula matemtica que compara os dados


amostrais com a suposio feita sobre a populao (sob a validade de H0).
Nota: A Estatstica de Teste obtida atravs do software SPSS.

A deciso do Teste consiste em comparar a significncia do teste obtida


atravs do software SPSS com o nvel de significncia pr-definido.
Assim, se sig. do teste > no rejeito H0
sig. do teste rejeito H0

5) Concluso:
se a hiptese nula no rejeitada, diz-se que os dados sobre os quais o
teste foi realizado no apresentam evidncias suficientes para levar
rejeio desta hiptese;
se a hiptese nula rejeitada, diz-se que os dados em estudo no so
compatveis com a hiptese nula.

- 254 - Estatstica 1 Ano 1 Semestre

127
23-02-2017

Testes de Hipteses
Testes de independncia

Teste de independncia do Qui-Quadrado

Testes ao coeficiente de Correlao

Teste ao coeficiente de Correlao de Pearson


Teste ao Coeficiente de Correlao de Spearman

Teste de Comparao de Mdias

Teste para comparao de mdias a partir de 2 amostras independentes


Teste para comparao de mdias a partir de mais de 2 amostras
independentes.
- 255 - Estatstica 1 Ano 1 Semestre

Testes de Independncia do
Qui-Quadrado

Estatstica 1 Ano 1 Semestre

128
23-02-2017

Teste de Independncia do Qui-Quadrado

Condies de aplicabilidade:
As variveis podem estar expressas em qualquer escala, desde que
categorizadas;
A dimenso da amostra deve ser superior a 30 elementos;
no pode haver mais de 20% das clulas com frequncia esperada
inferior a 5;
cada clula tem de ter frequncia esperada igual ou superior a 1.

Hipteses:

H0: As variveis X e Y so independentes


vs
H1: As variveis X e Y no so independentes

- 257 - Estatstica 1 Ano 1 Semestre

Teste de Independncia do Qui-Quadrado


Exemplo:
Consideremos as variveis
Acreditar na astrologia
Gnero

Gnero * Acredita na astrologia? Crosstabulation

Count

Acredita na astrologia?

Nada Pouco Algo Muito Total


Gnero Feminino 15 48 79 9 151
Masculino 25 21 9 1 56
Total 40 69 88 10 207

- 258 - Estatstica 1 Ano 1 Semestre

129
23-02-2017

Teste de Independncia do Qui-Quadrado


1) Identificao do teste a utilizar
Pretende-se verificar se existe independncia entre duas variveis
gnero e acreditar na astrologia, definidas numa escala qualitativa.
O teste a utilizar (caso se verifiquem os pressupostos de aplicao) ser
o teste de independncia do Qui-Quadrado.

2) Definio das hipteses


H0: As variveis Gnero e Acreditar na astrologia so independentes
vs
H1: As variveis Gnero e Acreditar na astrologia no so
independentes

3) Determinao da significncia do teste


Analyze
Descriptive Statistics
Crosstabs

- 259 - Estatstica 1 Ano 1 Semestre

Teste de Independncia do Qui-Quadrado

- 260 - Estatstica 1 Ano 1 Semestre

130
23-02-2017

Teste de Independncia do Qui-Quadrado

- 261 - Estatstica 1 Ano 1 Semestre

Teste de Independncia do Qui-Quadrado

Chi-Square Tests

Asymp. Sig.
Value df (2-sided)
a
Pearson Chi-Square 39,966 3 ,000
Likelihood Ratio 39,371 3 ,000
Linear-by-Linear
36,334 1 ,000
Association

N of Valid Cases 207

a. 1 cells (12,5%) have expected count less than 5. The

minimum expected count is 2,71.

- 262 - Estatstica 1 Ano 1 Semestre

131
23-02-2017

Teste de Independncia do Qui-Quadrado

4) Deciso do teste
Como Sig < 0.001 < 0,05 Rejeita-se H0

As variveis Gnero e Acreditar na astrologia no so


independentes.

Nota: o fato de se ter rejeitado a hiptese nula no significa que as


variveis gnero e acreditar na astrologia sejam dependentes.
Apenas se sabe que existe qualquer tipo de associao entre elas.
Podemos tentar explicar essa associao atravs da anlise:
grfica
de resduos

- 263 - Estatstica 1 Ano 1 Semestre

Teste de Independncia do Qui-Quadrado


Anlise grfica

- 264 - Estatstica 1 Ano 1 Semestre

132
23-02-2017

Teste de Independncia do Qui-Quadrado

Anlise de resduos:
Se H0 for verdadeira, ou seja, se houver independncia, os resduos
estariam entre -2 e 2.
A existncia de no independncia explicada pelos resduos que
se afastam muito de -2 e 2.

- 265 - Estatstica 1 Ano 1 Semestre

Teste de Independncia do Qui-Quadrado


Anlise de resduos

- 266 - Estatstica 1 Ano 1 Semestre

133
23-02-2017

Teste de Independncia do Qui-Quadrado

4) Deciso

Anlise de resduos

Gnero * Acredita na astrologia? Crosstabulation

Acredita na astrologia?

Nada Pouco Algo Muito Total


Gnero Feminino Count 15 48 79 9 151
Expected Count 29,2 50,3 64,2 7,3 151,0
Adjusted Residual -5,6 -,8 4,7 1,2
Masculino Count 25 21 9 1 56
Expected Count 10,8 18,7 23,8 2,7 56,0
Adjusted Residual 5,6 ,8 -4,7 -1,2
Total Count 40 69 88 10 207
Expected Count 40,0 69,0 88,0 10,0 207,0

- 267 - Estatstica 1 Ano 1 Semestre

Teste de Independncia do Qui-Quadrado

5) Concluso
H uma maior tendncia para os indivduos do gnero feminino
serem mais crentes na astrologia. O inverso verificado
relativamente aos indivduos do gnero masculino que se mostram
menos crentes.

- 268 - Estatstica 1 Ano 1 Semestre

134
23-02-2017

Teste de Independncia do Qui-Quadrado

Exemplos:
Considere a base de dados 4_Consumo.sav

a) Verifique se o fato de os alunos considerarem ser importante estar na


moda independente do gnero.

b) O fato de o aluno considerar que divertido fazer compras


independente do gnero?

c) Ser que existe independncia entre as variveis Moda e


Trabalhador?

d) As variveis Oramento mensal e Fazer compras divertido so


independentes?

- 269 - Estatstica 1 Ano 1 Semestre

Testes aos coeficientes de


correlao

Estatstica 1 Ano 1 Semestre

135
23-02-2017

Associao Estatstica

A associao estatstica entre duas variveis pode ser estudada


considerando:

a forma de ligao de duas variveis


linear/no linear,

a sua intensidade
forte, mdia ou fraca

o seu sentido
positivo ou negativo

- 271 - Estatstica 1 Ano 1 Semestre

Associao Estatstica

A associao estatstica diz-se


positiva
se as variveis variam no mesmo sentido, isto , se para valores
elevados de uma varivel se observam valores elevados da outra e,
simultaneamente, para valores reduzidos das duas variveis
verificada a mesma associao.

negativa
se as variveis variarem em sentidos opostos, isto , a valores elevados
de uma varivel esto associados valores baixos da outra varivel e
vice-versa.

- 272 - Estatstica 1 Ano 1 Semestre

136
23-02-2017

Associao Estatstica

58 58

57 57
56
56
55
55
54
54
53
53
52
52
51
51
50
50
7 9 11 13 15 17 19 21
7 9 11 13 15 17 19 21

Associao linear positiva forte Associao linear positiva fraca

60 58
57
58
56
55
56
54

54
53
52

52 51
50
50 7 9 11 13 15 17 19 21
7 9 11 13 15 17 19 21

Associao linear negativa forte Associao linear negativa


fraca
- 273 - Estatstica 1 Ano 1 Semestre

Associao Estatstica

58 60
57
58
56

55 56

54
54
53

52 52

51
50
7 9 11 13 15 17
7 9 11 13 15 17 19 21

No existe qualquer tipo de Existe associao entre as


associao entre as variveis variveis mas no do tipo linear

61 58

59
56
57
54
55

53 52

51
50
49
48
47
0 5 10 15 20 25
7 9 11 13 15 17 19 21 23

Existe associao entre as Existe associao entre as


variveis mas no do tipo linear variveis mas no do tipo linear
- 274 - Estatstica 1 Ano 1 Semestre

137
23-02-2017

Associao Estatstica

O grau de associao linear entre duas variveis pode ser estudado


atravs dos coeficientes de associao/correlao de
Pearson ()
Caso de variveis quantitativas

Spearman (S)
Caso de variveis pelo menos ordinais

- 275 - Estatstica 1 Ano 1 Semestre

Coeficiente de associao de Pearson


O coeficiente de correlao de Pearson
mede o grau de associao linear entre duas variveis expressas
numa escala quantitativa
no depende das unidades de medida das variveis
os seus valores variam sempre entre 1 e 1

O sinal do coeficiente de correlao de Pearson indica a direco da


associao linear:
se o sinal for positivo, existe uma tendncia para as duas variveis
variarem no mesmo sentido;
se o sinal for negativo, existe uma tendncia para as duas variveis
variarem em sentido contrrio

- 276 - Estatstica 1 Ano 1 Semestre

138
23-02-2017

Coeficiente de associao de Pearson

De uma forma geral, pode-se considerar que:

Se rXY = 1 ou r XY = -1 existe correlao linear perfeita

Se rXY = 0, no existe qualquer tipo de correlao linear entre as duas


variveis em estudo.
(embora possa existir correlao de outro tipo que no o linear)

Se 0 < | rXY | < 0.3, existe correlao linear baixa

Se 0.3 | rXY | < 0.7, existe correlao linear mdia

Se 0.7 | rXY | < 1, existe correlao linear forte

- 277 - Estatstica 1 Ano 1 Semestre

Teste de Pearson
1) Identificao do teste
Pretende-se avaliar se existe associao estatstica entre duas
variveis definidas numa escala quantitativa. O teste a realizar o
teste ao coeficiente de correlao de Pearson.

2) Definio das hipteses


H0: No existe correlao do tipo linear entre as variveis X e Y
vs
H1: Existe correlao do tipo linear entre as variveis X e Y

ou ento,

H0: =0
vs
H1: 0

- 278 - Estatstica 1 Ano 1 Semestre

139
23-02-2017

Teste de Pearson

Exemplo:
Existir alguma associao entre a cilindrada e as rotaes de um
automvel?

1) Identificao do teste
Pretende-se avaliar se existe associao estatstica entre duas
variveis definidas numa escala quantitativa. O teste a realizar o
teste ao coeficiente de correlao de Pearson.

2) Definio das hipteses


H0:
vs
H1:

- 279 - Estatstica 1 Ano 1 Semestre

Teste de Pearson
3) Determinao da significncia do teste

- 280 - Estatstica 1 Ano 1 Semestre

140
23-02-2017

Teste de Pearson

- 281 - Estatstica 1 Ano 1 Semestre

Teste de Pearson
Correlatio ns

Cilindrada Rotaes
(cm cbicos) por minuto
Cilindrada (cm cbicos) Pearson Correlation 1 -,442**
Sig. (2-tailed) ,000
N 125 125
Rotaes por minuto Pearson Correlation -,442** 1
Sig. (2-tailed) ,000
N 125 125

**. Correlation is significant at the 0.01 level (2-tailed).

4) Deciso do teste
Como sig < 0.001 (inferior a 0.05) rejeita-se a hiptese nula,
5) Concluso:
Existe associao (do tipo linear) entre a cilindrada e as rotaes de um
automvel.
O valor do coeficiente de correlao de Pearson -0,442, logo a
associao negativa mdia. Ou seja, os automveis com mais rotaes
tm menos cilindrada
- 282 - Estatstica 1 Ano 1 Semestre

141
23-02-2017

Teste de Pearson - Exerccios


Exerccios:

Considere os dados fornecidos no ficheiro 5_forest_fire.sav re ferentes ao


ndice Meteorolgico de Perigo de Incndio (FWI - Fire Weather Index)
registados no parque de Montesinho.

a) Ser que se pode admitir que quando o ndice de humidade dos


combustveis compactos (DMC) aumenta h tendncia para o valor do
ndice de seca do sistema (DC) aumentar?

b) Verifique se existe alguma relao estatstica do tipo linear entre a


humidade relativa e a rea de floresta ardida?

c) Nos dias de maior humidade relativa h tendncia para uma diminuio


da temperatura?

- 283 - Estatstica 1 Ano 1 Semestre

Coeficiente de associao de Spearman


O coeficiente de correlao de Spearman um caso particular do
coeficiente de correlao de Pearson, aplicado a variveis expressas
numa escala pelo menos ordinal.
As propriedades do coeficiente de correlao de Spearman so idnticas
s do coeficiente de correlao de Pearson.
O valor absoluto do coeficiente de correlao de Spearman mede o
grau de associao linear de duas variveis expressas numa escala
pelo menos ordinal.
O coeficiente de correlao de Spearman est sempre entre 1 e 1.
Se o coeficiente de correlao de Spearman tomar o valor zero, no
existe qualquer tipo de associao linear entre as variveis em
estudo.
O sinal do coeficiente de correlao de Spearman d a direco da
associao linear entre as variveis e estudo,
o Se for positivo, as variveis evoluem no mesmo sentido;
o se for negativo, as variveis evoluem em sentidos opostos

- 284 - Estatstica 1 Ano 1 Semestre

142
23-02-2017

Teste de Spearman
O grau de associao entre duas variveis definidas numa escala pelo
menos ordinal pode ser estudado atravs do teste de associao de
Spearman:

Definio das hipteses

H0: As variveis X e Y no esto correlacionadas


vs
H1: As variveis X e Y esto correlacionadas

ou ento,

H0: S =0
vs
H1: S 0

- 285 - Estatstica 1 Ano 1 Semestre

Teste de Spearman

Exemplo:
Ser que as pessoas mais comunicadoras tm tendncia para ser mais
eloquentes?

1) Identificao do teste
Pretende-se avaliar se existe associao estatstica entre duas
variveis definidas numa escala qualitativa ordinal. O teste a
realizar o teste ao coeficiente de correlao de Spearman.

2) Definio das hipteses


H0:
vs
H1:

- 286 - Estatstica 1 Ano 1 Semestre

143
23-02-2017

Teste de Spearman
3) Determinao da significncia do teste

- 287 - Estatstica 1 Ano 1 Semestre

Teste de Spearman
Correlatio ns

Comunicador Eloquente
Spearman's rho Comunicador Correlation Coefficient 1,000 ,418**
Sig. (2-tailed) . ,000
N 209 206
Eloquente Correlation Coefficient ,418** 1,000
Sig. (2-tailed) ,000 .
N 206 206

**. Correlation is significant at the 0.01 level (2-tailed).

4) Deciso do teste
Como sig < 0.001 (inferior a 0.05) rejeita-se a hiptese nula,
5) Concluso:
Rejeita-se a hiptese nula, logo existe associao do tipo linear entre
as variveis Comunicador e Eloquente.
O valor do coeficiente ordinal de Spearman 0,418, logo a associao
positiva mdia. Ou seja, as pessoas mais comunicadoras so mais
eloquentes.
- 288 - Estatstica 1 Ano 1 Semestre

144
23-02-2017

Teste de Spearman - Exerccios


Exerccios:

Considere a base de dados 4_consumo.sav

a) Verifique se as pessoas que consideram importante estar na moda e ser


chique tm tendncia a considerarem que fazer compras lhes d imenso
prazer?

b) Ser que se pode admitir que quanto mais velhas so os inquiridos menos
satisfeitos esto com a sua situao financeira actual?

- 289 - Estatstica 1 Ano 1 Semestre

Testes para comparao de


valores mdios

Estatstica 1 Ano 1 Semestre

145
23-02-2017

Testes para comparao de valores mdios

Quando se pretende comparar o valor mdio de uma mesma varivel


(quantitativa) em dois ou mais grupos independentes, podemos recorrer ao
teste:
Teste t-Student para amostras independentes
comparar o valor mdio de uma mesma varivel (quantitativa) em dois grupos independentes

ANOVA one-way Anlise de Varincia


comparar o valor mdio de uma mesma varivel (quantitativa) em mais de 2 grupos
independentes

- 291 - Estatstica 1 Ano 1 Semestre

Teste de tStudent para


amostras independentes

Estatstica 1 Ano 1 Semestre

146
23-02-2017

Teste t-Student

Para que serve?


Comparar o valor mdio de uma mesma varivel em dois grupos independentes,
como por exemplo: Homens vs Mulheres; Curso diurno vs Curso ps-laboral;
Grupo controlo vs Grupo experimental

Quando se aplica (Pressupostos)?


i. varivel dependente quantitativa;
ii. amostras independentes;
iii. varivel dependente com distribuio normal em ambos os grupos em
estudo;

- 293 - Estatstica 1 Ano 1 Semestre

Teste t-Student - normalidade


Validao do pressuposto da normalidade
O teste para comparao de valores mdios para duas amostras
independentes (teste t-student) um teste paramtrico, e como todos os
testes paramtricos exigem que a distribuio amostral seja conhecida. Neste
caso em particular, exige-se a distribuio Normal ou Gaussiana.

- 294 - Estatstica 1 Ano 1 Semestre

147
23-02-2017

Teste t-Student - normalidade

Para verificar se uma varivel provm de uma populao com distribuio


Normal usa-se um destes testes:

Kolmogorov-Smirnov ou Shapiro-Wilk

Hipteses:

H0: A varivel em estudo provm de uma populao com distribuio Normal


vs
H1: A varivel em estudo no provm de uma populao com distribuio
Normal

- 295 - Estatstica 1 Ano 1 Semestre

Teste t-Student - normalidade

Para realizar o teste t-Student necessrio verificar sempre se a varivel


(quantitativa) provm de uma populao com distribuio Normal em cada
um dos grupos? No!

NOTA: Nos testes t-Student para duas amostras se a dimenso da amostra


for:
Superior ou igual a 30, assume-se que a distribuio assinttica
Normal e aplica-se o teste sem a verificao formal do pressuposto da
normalidade.
Inferior a 30 necessrio verificar se a varivel segue uma distribuio
Normal atravs do teste de Shapiro-Wilk.

- 296 - Estatstica 1 Ano 1 Semestre

148
23-02-2017

Teste t-Student

Hipteses

H0: No h diferenas significativas entre os valores mdios nos dois grupos


vs
H1: H diferenas significativas entre os valores mdios nos dois grupos

ou H0: 1= 2 vs H1: 1 2

- 297 - Estatstica 1 Ano 1 Semestre

Testes t-Student
Exemplo 1:
Teste a seguinte hiptese:
A Valorizao do estudo difere entre as raparigas e os rapazes que
frequentam a ESCS.

Os dados encontram -se no ficheiro 6_novos_alunos_13_15.sav

Hipteses:
Ho: O valor mdio da valorizao do estudo no difere entre as raparigas e
os rapazes.
vs
H1: O valor mdio da valorizao do estudo difere entre as raparigas e os
rapazes.

- 298 - Estatstica 1 Ano 1 Semestre

149
23-02-2017

Testes t-Student

No SPSS

- 299 - Estatstica 1 Ano 1 Semestre

Teste t-Student
Outputs da anlise:

- 300 - Estatstica 1 Ano 1 Semestre

150
23-02-2017

Teste t-Student
Resoluo:
Validao de Pressupostos:
v. dependente Valorizao do Estudo Quantitativa
v. independente Gnero Qualitativa nominal com 2 grupos: feminino e
masculino
Amostras independentes
n Fem =182; n Mas= 71 (ver output Teste t-Student) assume-se que a
distribuio assinttica Normal

Como se verificam os pressupostos de aplicabilidade do teste t-Student,


vamos analis-lo.

- 301 - Estatstica 1 Ano 1 Semestre

Teste t-Student teste de Levene


Para se analisar o teste t necessrio saber se a varivel dependente
(valorizao do estudo) apresenta varincias homogneas nos grupos (feminino
e masculino). Para isso utiliza-se o teste de Levene.

Hipteses:

Ho: As varincias populacionais so homogneas em ambos os grupos em


estudo.
vs
H1: As varincias populacionais no so homogneas em ambos os grupos em
estudo.

Nota: No SPSS o teste de Levene feito conjuntamente com o teste t-Student.

- 302 - Estatstica 1 Ano 1 Semestre

151
23-02-2017

Teste t-Student teste de Levene


Teste de Levene

Hipteses:

Ho: As varincias populacionais da valorizao do estudo so homogneas entre


o gnero masculino e feminino.
vs
H1: As varincias populacionais da valorizao do estudo no so homogneas
entre o gnero masculino e feminino.

- 303 - Estatstica 1 Ano 1 Semestre

Testes t-Student teste de Levene


Anlise do teste de Levene:

Deciso:
Como a sig.= 0.304 >0.05, no se rejeitar H0.
Concluso:
As varincias populacionais da valorizao do estudo so homogneas em
ambos os gneros.

Nota: Como existe homogeneidade de varincias iremos analisar a 1 linha do


teste t-Student.

- 304 - Estatstica 1 Ano 1 Semestre

152
23-02-2017

Testes t-Student
Anlise do teste t-Student:

Deciso:
Como a sig.< 0.001< 0.05, rejeitar-se H0.
Concluso:
A valorizao mdia do estudo difere consoante o gnero.

- 305 - Estatstica 1 Ano 1 Semestre

Testes t-Student

Concluiu-se que:
A mdia da valorizao do estudo difere significativamente entre rapazes e
raparigas que frequentam a ESCS.

Como encontrar essas diferenas?

As raparigas valorizam mais o estudo (Mdia feminina=8.62, DP= 1.243) do que


os rapazes (Mdia masculina= 7.91, DP=1.412).

- 306 - Estatstica 1 Ano 1 Semestre

153
23-02-2017

Testes t-Student

Exerccio:
Com base nos outputs apresentados, teste a seguinte hiptese:
O n mdio de anos de escolaridade difere consoante o gnero.

- 307 - Estatstica 1 Ano 1 Semestre

ANOVA one-way

- 308 - Estatstica 1 Ano 1 Semestre

154
23-02-2017

ANOVA one-way

Para que serve?


A anlise de varincia ANOVA - uma tcnica paramtrica que permite
verificar se existem diferenas significativas entre as mdias de 3 ou mais
populaes.

Objetivo:
A ANOVA usada quando se quer perceber se as diferenas amostrais
observadas so causadas por diferenas significativas entre as populaes
ou se so consequncia da variabilidade amostral, partindo do pressuposto
que a variabilidade decorrente da anlise de amostras s pode ser
responsvel por pequenos desvios.

Nota:
Esta tcnica estatstica, a ANOVA, usada para averiguar se os valores
mdios so estatisticamente diferentes e no para ver se as varincias so
diferentes!

- 309 - Estatstica 1 Ano 1 Semestre

ANOVA one-way
mas se precisamos comparar k grupos porque no usamos o teste t-
Student vrias vezes?

Por exemplo, se necessrio comparar 3 grupos, porque no usamos 3 testes


t-Student (grupo 1 vs grupo 2, grupo 1 vs grupo 3 e grupo 2 vs grupo 3)?

Para manter a probabilidade de erro de tipo I no seu nvel nominal a (ou


inferior) necessrio usar um mtodo que considere todas as comparaes
em simultneo - ANOVA

- 310 - Estatstica 1 Ano 1 Semestre

155
23-02-2017

ANOVA one-way
Quando se aplica? (Pressupostos)
i) varivel dependente quantitativa;
ii) amostras independentes;
iii) varivel dependente com distribuio normal em todos os grupos
em estudo (Teste de Kolmogorov-Smirnov ou Shapiro-Wilk);
iv) varivel dependente com varincias homogneas nos grupos em
estudo (teste de Levene)

Hipteses
H0: No existem diferenas significativas entre as mdias das k
populaes
vs
H1: Existe pelo menos um par de mdias significativamente diferentes

ou
H0: 1= 2== k vs H1: i,j: i j (i j; i.j=1.....k)

- 311 - Estatstica 1 Ano 1 Semestre

ANOVA one-way

Quando no se rejeita H0 Quando se rejeita H0

No existem diferenas significativas Existem diferenas significativas entre


entre os valores mdios dos grupos os valores mdios de pelo menos dois
em comparao dos grupos em comparao

descobrir entre que grupos ocorrem


estas diferenas

Para identificar quais as mdias que diferem entre si preciso fazer testes
Post-Hoc: O teste de Scheff dos mais utilizados, pois dos mais potentes!

- 312 - Estatstica 1 Ano 1 Semestre

156
23-02-2017

Comparao Mltipla de Mdias : Teste de Scheff

Teste de Scheff

Pressupostos:
Os mesmos da ANOVA one-way

Hipteses:
H0: i= j vs. H1: i j para todos os pares i,j de mdias possveis

necessrio analisar a significncia associada a cada par de mdias


correspondente aos grupos i e j .

Deciso :
Rejeita-se H0 se sig. 0,05 concluindo assim que existem diferenas
significativas entre os grupos i e j.

- 313 - Estatstica 1 Ano 1 Semestre

ANOVA one-way
Exemplo 1:
Considere o ficheiro de dados 1_educao.sav.
Utilize a metodologia mais adequada para averiguar se a Competncia Leitora
difere consoante o grau de escolaridade do encarregado de educao.

Resoluo:
1)Validao de Pressupostos:
v. dependente Competncia Leitora Quantitativa
v. independente Grau de Escolaridade do encarregado de educao
Qualitativa ordinal (define 3 grupos independentes)
Amostras independentes
Normalidade (verificar usando o Teste de Kolmogorv-Smirnov ou o Teste de
Shapiro-Wilks)
Homogeneidade de varincias (verificar usando o Teste Levene)
- 314 - Estatstica 1 Ano 1 Semestre

157
23-02-2017

ANOVA one-way

Validao de Pressupostos- continuao


1. Normalidade:
Hipteses:
H0: A varivel Competncia Leitora provm de uma populao com
distribuio Normal nos diferentes grupos de escolaridade em estudo.

vs

H1: Existe pelo menos um grupo de escolaridade para o qual a varivel


Competncia Leitora no provm de uma populao com distribuio
normal.

- 315 - Estatstica 1 Ano 1 Semestre

ANOVA one-way
No SPSS:

- 316 - Estatstica 1 Ano 1 Semestre

158
23-02-2017

ANOVA one-way

Outputs parciais:

Deciso:
Em todos os graus de escolaridade, a significncia do teste de Shapiro-Wilk para
a varivel Competncia leitora sempre superior a 0,05 No Rejeitar H0.

Concluso:
A Competncia Leitora segue distribuio normal em todos os grupos graus de
escolaridade em estudo (grau de escolaridade dos EE).

- 317 - Estatstica 1 Ano 1 Semestre

ANOVA one-way

2. Homogeneidade de varincias:

Para verificar se a varivel dependente apresenta varincias homogneas nos


grupos em estudo utiliza-se o teste de Levene.

Hipteses:
Ho: As varincias populacionais da varivel Competncia Leitora so
homogneas/no diferem nos diferentes Graus de escolaridade .
vs
H1: Existe pelo menos um Grau de Escolaridade para o qual a varivel
Competncia Leitora apresenta varincia populacional diferente dos
restantes.

Nota: No SPSS o teste de Levene pode ser feito no mesmo conjunto de


comandos da ANOVA

- 318 - Estatstica 1 Ano 1 Semestre

159
23-02-2017

ANOVA one-way
No SPSS:

- 319 - Estatstica 1 Ano 1 Semestre

ANOVA one-way

Outputs parciais:

Deciso:
Como a sig.=0.372 >0.05 No Rejeitar H0.

Concluso:
A varivel Competncia Leitora apresenta varincias homogneas nos
diferentes Graus de Escolaridade.

- 320 - Estatstica 1 Ano 1 Semestre

160
23-02-2017

ANOVA one-way

Teste ANOVA - Hipteses:


Ho: A mdia da Competncia Leitora no difere entre os Graus de
Escolaridade dos EE.
vs
H1: Existe pelo menos um par de Graus de Escolaridade em que a
mdia da Competncia Leitora difere significativamente.

Outputs parciais:

- 321 - Estatstica 1 Ano 1 Semestre

ANOVA one-way

Deciso:
sig.= 0.041<0.05 Rejeitar H0.

Concluso:
A mdia da Competncia Leitora difere significativamente entre pelo
menos dois dos graus de escolaridade dos pais.

Entre que grupos (graus de escolaridade dos EE) ocorrem as diferenas?

Teste de Scheff

- 322 - Estatstica 1 Ano 1 Semestre

161
23-02-2017

ANOVA one-way
Teste de Scheff 3 hipteses a testar:
Ho: A mdia da Competncia Leitora no difere em crianas com EE com
instruo bsica e secundria.
vs
H1: A mdia da Competncia Leitora diferente em crianas com EE com
instruo bsica e secundria.
e
Ho: A mdia da Competncia Leitora no difere em crianas com EE com
instruo bsica e superior.
vs
H1: A mdia da Competncia Leitora diferente em crianas com EE com
instruo bsica e superior.
e
Ho: A mdia da Competncia Leitora no difere em crianas com EE com
instruo secundria e superior.
vs
H1: A mdia da Competncia Leitora diferente em crianas com EE com
instruo secundria e superior.
- 323 - Estatstica 1 Ano 1 Semestre

ANOVA one-way
No SPSS: Teste de Scheff

- 324 - Estatstica 1 Ano 1 Semestre

162
23-02-2017

ANOVA one-way
Outputs parciais:

Deciso:
Apenas na comparao entre o grupo com o ensino primrio e com o ensino
superior se observa uma sig. inferior a 0.05 (0.042). Pelo que apenas neste
caso se rejeita a H0

Concluso:
A Competncia Leitora mdia difere significativamente entre crianas com
EE com o ensino primrio das que tm EE com o ensino superior. A compreenso
mdia das crianas com EE com o ensino superior significativamente superior
(Mdia Ens_Sup=13.5; DPEns_Sup =4.249) mdia das crianas com EE com o ensino
bsico ( MdiaEns_Bas=8.0; DPEns_Bas=3.546)
- 325 - Estatstica 1 Ano 1 Semestre

ANOVA one-way
Exemplo 2:
Considere o ficheiro de dados 6_novos_alunos_13_15.sav.
Utilize a uma metodologia mais adequada para averiguar se: O Prazer de
estudar idntico entre os alunos que frequentam as diferentes
licenciaturas da ESCS

Resoluo:
1) Validao de Pressupostos:
v. dependente Prazer de estudar Quantitativa
v. independente Curso Qualitativa nominal (define 4 grupos
independentes)
Amostras independentes
Normalidade (Teste de Kolmogorv-Smirnov ou Teste de Shapiro-Wilk)
Homogeneidade de varincias (Teste Levene)

- 326 - Estatstica 1 Ano 1 Semestre

163
23-02-2017

ANOVA one-way

1. Normalidade:
Para verificar se uma varivel provm de uma populao com
distribuio Normal usa-se o teste de:
Kolmogorov-Smirnov ou Shapiro-Wilk

Hipteses:

H0: A varivel Prazer de estudar provm de uma populao com


distribuio Normal nos diferentes cursos em estudo.
vs
H1: Existe pelo menos um curso para o qual a varivel Prazer de
Estudar no provm de uma populao com distribuio normal.

- 327 - Estatstica 1 Ano 1 Semestre

ANOVA one-way
No SPSS:

- 328 - Estatstica 1 Ano 1 Semestre

164
23-02-2017

ANOVA one-way
Outputs parciais:

Deciso:
O Prazer de estudar segue distribuio normal em todos os cursos
(sig>0.05) excepto no curso de jornalismo (sig.= 0.017<0.05).

Concluso:
A varivel prazer de estudar no segue distribuio normal em
todos os cursos pelo que se dever recorrer a uma alternativa no
paramtrica (teste de Kruskal-Wallis).

- 329 - Estatstica 1 Ano 1 Semestre

Testes de Hipteses no
Paramtricos
Teste de Kruskal-Wallis

Estatstica 1 Ano 1 Semestre

165
23-02-2017

Teste Kruskal-Wallis
Para que serve?
Comparar as distribuies populacionais de uma mesma varivel dependente
em dois ou mais grupos independentes.
Alternativa no paramtrica ao teste t-Student para duas amostras
independentes e ANOVA one-way (a utilizar quando falham os pressupostos
de aplicao)

Quando se aplica (Pressupostos)?


i) varivel dependente pelo menos ordinal;
ii) amostras independentes.

Hipteses:
H0: No existem diferenas significativas entre as distribuies populacionais
nos diferentes grupos em estudo
vs
H1: Existe pelo menos um grupo cuja distribuio populacional difere dos
restantes.
- 331 - Estatstica 1 Ano 1 Semestre

Comparaes Mltiplas de Mdias de ordens


Ao analisar o teste de Kruskal-Wallis, quando se rejeita H0 necessrio
identificar qual ou quais populaes que diferem significativamente entre si,
para isso recorre-se ao Teste de Dunn.

Pressupostos
Os mesmos do teste de Kruskal-Wallis;
Este procedimento s se deve realizar quando se rejeita H0 do teste de K-W .

Hipteses
O teste de Dunn realiza todas as comparaes duas a duas para identificar
entre que grupos existem as diferenas detetadas pelo teste de KrusKal-
Wallis . Assim, vamos ter tantos conjuntos de hipteses quantos os necessrios
para comparar os grupos 2 a 2:

H0:No existem diferenas significativas na distribuio da varivel


dependente no grupo i e j.
vs
H1: Existem diferenas significativas na distribuio da varivel dependente
no grupo i e j. (i j; i,j=1,,k, sendo k o nmero de grupos existentes)
- 332 - Estatstica 1 Ano 1 Semestre

166
23-02-2017

Teste Kruskal-Wallis
Exemplo 1:
Considere o ficheiro de dados 6_novos_alunos_13_15.sav.
Utilize a metodologia mais adequada para averiguar se: O Prazer de
estudar idntico entre os alunos que frequentam as diferentes
licenciaturas da ESCS.

Resoluo:
Validao de Pressupostos:
v. dependente Prazer de estudar Quantitativa
v. independente Curso Qualitativa nominal (define 4 grupos
independentes)
As amostras so independentes
Normalidade - verificar usando o Teste de Shapiro-Wilk ou o Teste de
Kolmogorv-Smirnov, se a dimenso do grupo for menos ou igual a 30 ou
superior a 30 respetivamante
Homogeneidade de varincias - verificar usando o Teste de Levene

- 333 - Estatstica 1 Ano 1 Semestre

Teste Kruskal-Wallis

Validao do pressuposto da Normalidade:

Hipteses:
H0: A varivel Prazer de estudar provm de uma populao com
distribuio Normal no curso Y.
vs
H1: A varivel Prazer de estudar no provm de uma populao com
distribuio Normal no curso Y.
Y={PM, RPCE, AM, JOR}

- 334 - Estatstica 1 Ano 1 Semestre

167
23-02-2017

Teste Kruskal-Wallis
No SPSS

- 335 - Estatstica 1 Ano 1 Semestre

Teste Kruskal-Wallis

Deciso:
O Prazer de estudar segue distribuio normal em todos os cursos
(sig>0.05) exceto no curso de jornalismo (sig.= 0.017<0.05).

Concluso:
A varivel prazer de estudar no segue distribuio normal em todos
os cursos pelo que se dever recorrer a uma alternativa no
paramtrica (teste de Kruskal-Wallis).

- 336 - Estatstica 1 Ano 1 Semestre

168
23-02-2017

Teste Kruskal-Wallis

Teste de Kruskal-Wallis:

Hipteses:
H0: No existem diferenas significativas entre as distribuies
populacionais do Prazer de estudar nos diferentes cursos
ministrados na ESCS.
vs
H1: Existe pelo menos um curso cuja distribuio populacional do
Prazer de estudar difere dos restantes.

- 337 - Estatstica 1 Ano 1 Semestre

Teste Kruskal-Wallis
No SPSS:

- 338 - Estatstica 1 Ano 1 Semestre

169
23-02-2017

Teste Kruskal-Wallis
Output:

Deciso:
Como a significncia do teste 0.064 que superior a 0.05, ento no se
rejeita H0.

Concluso:
No existem diferenas estatisticamente significativas na distribuio dos
valores do Prazer de Estudar nos diferentes cursos.

- 339 - Estatstica 1 Ano 1 Semestre

Teste Kruskal-Wallis
Exerccio:
Considere o ficheiro de dados 7_valores_humanos_2016.sav.
Averige se os indivduos das diferentes regies identificam-se de igual
forma com a afirmao Importante sentir-se bem

Resoluo:
Validao de Pressupostos:
v. dependente Importante sentir-se bem Qualitativa ordinal
v. independente Regio Qualitativa (define 5 grupos independentes)
Amostras independentes

Hipteses:
H0: No existem diferenas significativas entre as distribuies populacionais
de Importante sentir-se bem nas diferentes Regies.
vs
H1: Existe pelo menos uma Regio cuja distribuio populacional de
Importante sentir-se bem difere dos restantes.

- 340 - Estatstica 1 Ano 1 Semestre

170
23-02-2017

Teste Kruskal-Wallis
Resoluo:
No SPSS:

- 341 - Estatstica 1 Ano 1 Semestre

Teste Kruskal-Wallis
Output:

Deciso:
sig.< 0.001<0.05 Rejeitar H0.

Concluso:
Existem diferenas estatisticamente significativas na distribuio dos
valores da Importante sair-se bem em pelo menos um par de regies.

Para identificar onde esto essas diferenas Teste de Dunn


(basta dar um duplo clique na tabela anterior no SPSS e escolher a opo
Pairwise Comparisons).

- 342 - Estatstica 1 Ano 1 Semestre

171
23-02-2017

Teste Kruskal-Wallis
Teste de Dunn

Deciso:
Apenas h diferenas entre as regies:
Algarve e Centro sig. =0.023 < 0.05
Algarve e Norte sig. =0.005 < 0.05
Lisboa e Centro sig. =0.004 < 0.05
Lisboa e Norte sig. <0.001 < 0.05

Concluso:
As regies Norte e Centro registam diferenas estatisticamente significativas
das regies de Lisboa e Algarve quanto distribuio dos valores de ser
Importante sair-se bem.

- 343 - Estatstica 1 Ano 1 Semestre

172

Você também pode gostar