Você está na página 1de 45

UNIVERSIDADE FEDERAL DO PARÁ

INSTITUTO DE CIÊNCIAS SOCIAIS APLICADAS


FACULDADE DE ECONOMIA

Estatística II

Prof. Dr. Ricardo Bruno Nascimento dos Santos


TESTES DE
HIPÓTESES
COM DUAS
AMOSTRAS
TESTES DE HIPÓTESES para DUAS amostras
A questão agora se baseia em verificarmos se duas amostras distintas
possuem ou não as mesmas características. Ou seja, podemos inferir para
comparar duas populações distintas. Vamos partir do exemplo sobre dois grupos
que fazem exercícios físicos e outro que não realiza temos as seguintes
informações:
Praticantes de Atividades Físicas (n=1.593)
Característica Frequência Proporção
40 a 49 anos 367 0,2304
Renda de R$ 5,000 a 239 0,1500
10,000
Não fumam 1.322 0,8299

Não Praticantes de Atividades Físicas (n=29.948)


Característica Frequência Proporção
40 a 49 anos 6.290 0,2104
Renda de R$ 5,000 a 5.990 0,2000
10,000
Não fumam 23.360 0,7800
TESTES DE HIPÓTESES para DUAS amostras
A pergunta que fica é: Podemos concluir que existe uma proporção
significativamente maior de pessoas que praticam ou não atividades
físicas entre 40 e 49 anos, com renda entre 5 a 10 mil e que não fumam?
Deve-se, diante desses elementos fazer alguns questionamentos com
relação a amostra que será observado a seguir.
TESTES
amostrasDE HIPÓTESES para DUAS
Diferença entre médias (amostras grandes e
independentes)
Antes devemos verificar se as amostras são ou não independentes.
Duas amostras serão consideradas independentes se a amostra
selecionada de uma das populações não é relacionada à amostra da
segunda população.
Elas podem ser consideradas dependentes se cada informação de uma
amostra corresponde a um membro da outra amostra. Amostras
dependentes também são chamadas de amostras emparelhadas ou
amostras relacionadas.
amostrasDiferença entre médias (amostras grandes e
independentes)
Já foi frisado que trabalhar com a população é algo trabalhoso,
cansativo e demorado, por esse motivo inferimos sobre amostras. Teste
de médias visa identificar se amostras diferentes possuem
comportamentos ou características semelhantes.
Para visualizar essa diferença podemos assumir que não há diferenças
na médias das duas populações, ou seja 𝜇1 − 𝜇2 = 0, evidentemente que
expressando isso para amostras teríamos 𝑥1 − 𝑥2 . Imagine que
tenhamos os seguintes resultados:
amostrasDiferença entre médias (amostras grandes e
independentes)
A situação anterior pode ser representada no gráfico da normal a
seguir. A situação a que se segue tem a característica de mostrar 𝜇1 −
𝜇2 = 0. Pelo gráfico verifica-se que seja bem improvável obter médias
amostrais que se difiram por 4 minutos se a diferença real é zero. A
diferença amostral entre médias seria de mais de 2,5 desvios padrões da
diferença hipotética de 0! Então podemos concluir que existe uma
diferença significativa na quantidade de tempo que estudantes
universitários do sexo masculino e do sexo feminino passam conectados
no dia.
amostrasDiferença entre médias (amostras grandes e
independentes)
TESTES DE HIPÓTESES para DUAS
amostrasDiferença entre médias (amostras grandes e
independentes)
Já sabemos como são formadas as hipóteses nulas e alternativas.
Lembrando sempre que as alternativas de hipóteses abrangem:

TESTE Z DE DUAS AMOSTRAS PARA A DIFERENÇA ENTRE


MÉDIAS
O que devemos verificar então seria:
1. As amostras devem ser selecionadas aleatoriamente
2. As amostras devem ser INDEPENDENTES
3. Cada tamanho de amostra deve ser pelo menos 30 ou, se não, cada
população deve ter uma distribuição normal com o  conhecido.
TESTES
amostrasDE HIPÓTESES para DUAS
Diferença entre médias (amostras grandes e
independentes)
TESTES DE HIPÓTESES para DUAS
amostrasDiferença entre médias (amostras grandes e
independentes)
Então podemos proceder com o teste da seguinte forma:
𝐷𝑖𝑓𝑒𝑟𝑒𝑛ç𝑎 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑎 − 𝑑𝑖𝑓𝑒𝑟𝑒𝑛ç𝑎 ℎ𝑖𝑝𝑜𝑡é𝑡𝑖𝑐𝑎
𝑧=
𝐸𝑟𝑟𝑜 𝑝𝑎𝑑𝑟ã𝑜

Assim formalmente o teste z para duas amostras para grandes


amostras (n>30), e considerando que as amostras são independentes será
dado por:
𝑥1 − 𝑥 2 − 𝜇1 − 𝜇2
𝑧=
𝜎𝑥 1−𝑥 2
Com
𝜎1 + 𝜎2
𝜎𝑥 1−𝑥 2
𝑛1 𝑛2
=
TESTES
amostrasDE HIPÓTESES para DUAS
Diferença entre médias (amostras grandes e
independentes)
amostrasDiferença entre médias (amostras grandes e
independentes)
Exemplo: Teste z de duas amostras para diferenças de médias.
Um grupo de cartão de crédito quer testar se a diferença entre a média
de cartões de débito das famílias do Rio de Janeiro e de São Paulo. O
resultado da amostra aleatória de 250 famílias para cada estado são
mostradas na tabela abaixo:

As duas amostras são independentes. Assuma que 𝜎1 = 𝑅$ 1.045


para Rio de Janeiro e 𝜎2 = 𝑅$ 1.350 para São Paulo. Os resultados
suportam a afirmação do grupo? Teste a 𝛼 = 0,05
Diferença entre médias (amostras grandes e
amostras
independentes)
As hipóteses nula e alternativa são:

Pelo fato de o teste de bicaudal e o nível de significância ser de 5%,


os valores críticos serão −𝑧0 = −1,96 𝑒 𝑧0 = 1,96 . A região de
rejeição será 𝑧 < −1,96 𝑒 𝑧 > 1,96. A estatística de teste
padronizada será:

Intepretação: Não há evidência a 5% de significância sobre


a afirmação do grupo que exista diferença entre o uso do
cartão de débito das famílias do Rio e São Paulo.
TESTES DE HIPÓTESES para DUAS
Diferença entre médias (amostras pequenas
amostras
e independentes)
Se o pressuposto de que as duas distribuições sã normais, então
podemos usar o teste de diferença de médias para populações menores
que 30 observações. Porém o que será retratado agora é de que ambas
devem ser independentes. Dessa forma:
1. Os desvios padrões populacionais são desconhecidos;
2. As amostras devem ser selecionadas aleatoriamente;
3. As amostras são independentes.
4. As populações são normalmente distribuídas ou cada tamanho da
amostra é de pelo menos 30.
Um teste t de duas amostras é usado para testar a diferen9a de médias entre
duas popula5ées ¥1 e 92 quando (l)'>1e°^_sño desconhecidos. (2) as amostras
sfio aleatñfias. (3) as amostras sao independentes, e (4) as popula9ées sfio
nomalmente distfibuidas on ambos •l * ?tJ e ›‹; ° ?() . A estatistica do
teste é 7, — 72 , e a estatistica de teste padronizada serñ

( *› -**2) f I J2)

Variñncias iguais: Se as v@âncias da popula9ho sfio iguais, entdo a


informagfio das duas amostras é conibinada para e&eular uma estinsatis•a
coligada do desvio padrño ñ.

_ (/›, —l )sj +[ ii› —l )s2


/i]+ri, —2
O erro padrdo da distribui9ño de amosYapem de 7; — .T› ser3:
1 1
TESTE T DE DUAS AAIOSTRAS PARA DIFERENQA
ENTRE MkDIAS(CONTINUA$ AO)
Variâncias néo iguais: Se as variâncias nao sao iguais entao o erro padrao é:
s2! (’Y”ariâncias nfio ieitais)
j. L_!
' nj
n2
p.l. = menor que n i ou n 2 1.
—o
TESTES DE HIPÓTESES para DUAS
amostrasDiferença entre médias (amostras pequenas
e independentes)
Assim os requisitos para o teste t serão:
TESTES DE
aUmsaondsotoratesste t em duas amostras para as diferen$as entre as
médias (Amostras pequenas e independentes)

1. Verifique se e sño desconhecidos,


se as amosnas sao aleatérias e
independentes e ambas popula$ées sño
normalmente distribuidas ou », » ?0
e › z 0.
2. Expresse a afirma$ño e a5
Aflrme H!; e H„.
identifiqtie hipéteses nula e
alternativa

3. Especifique o nivel de
Identifique n.
significância
gj „ 1 -j- „, — ¿ ou
4. Determine os graus de liberdade
p 1.= menor que », — l ou n 2 — l

Usar a Tabela
S. Determine os valores criticos
£. Determine a regiño de rejei$ño
7. Enconne a estatistica de teste (r,— .r2)
padronizada *
• Tome a decisño de rejeitar ou falhar Se t estiver na regiao de rejei9ao.
em rejeitar a hipotese nula rejeite H;) caso connârio. falhe em
rejcitar Hit
Q. Interprete a decisao no contexto da
afinnapño original
TESTES DE HIPÓTESES para DUAS
Diferença entre médias (amostras pequenas
amostras
e independentes)
Exemplo: Teste t de duas amostras para diferença entre médias
O resultado de um teste matemático para amostras aleatórias simples
de estudantes para dois professores diferentes na mesma escola é
mostrado abaixo:

Podemos concluir que existe uma diferença na média das notas de


matemática dos estudantes para os dois professores? Use 𝛼 = 10%.
Assuma que as populações são normalmente distribuídas para os dois
professores.
TESTES DE HIPÓTESES
Diferença para
entre DUAS(amostras pequenas
médias
amostras
e independentes)

No nível de significância de 10% não existe evidências que de suporte para a


afirmação de que a média das notas de matemática dos estudantes sejam
diferentes para os dois professores
TESTES DE HIPÓTESES para DUAS
Diferença entre médias (amostras pequenas
amostras
e independentes)
Exemplo: teste t para duas amostras para a diferença entre médias
A Renaut supõe o custo médio operacional por Km de um sedã é
menor que o custo de seu principal concorrente. Você é contratado para
conduzir um estudo usando uma amostra aleatória de 30 sedãs da
empresa Renaut e 32 amostras (aleatórias) do concorrente. Os resultados
podem ser observados na tabela abaixo:

A 𝛼 = 0,05, podemos afirmar a hipótese da Renaut? Assuma que as


variâncias das populações são iguais.
Diferença entre médias (amostras pequenas
amostras
e independentes)
amostrasDiferença entre médias (amostras pequenas
e independentes)
A 5% de significância, podemos afirmar estatisticamente que existe
evidência de que a afirmação da Renaut está correta que o custo
operacional do sedã deles é menor que o concorrente.
TESTES DE HIPÓTESES para entre
Diferença DUAS médias (amostras
amostras
dependentes)
Quando as amostras são dependentes
Nessa situação devemos utilizar um procedimento diferente e
encontrar uma diferença entre médias para dados emparelhados dado por
𝑑 𝑥 −𝑥2
= 1
A estatística do teste é a média 𝑑 dessas diferenças:
𝑑
𝑑=
𝑛
As seguinte condições devem ser satisfeitas:
1. As amostras devem ser selecionadas aleatoriamente
2. As amostras devem ser dependentes
3. Ambas populações devem ser normalmente distribuídas.
Graficamente o teste se baseará na condição que:
TESTES DE HIPÓTESES para DUAS
amostras Diferença entre médias (amostras
dependentes)
TESTES DE HIPÓTESES para entre
Diferença DUAS médias (amostras
amostras
dependentes)
TESTES DE HIPÓTESES para entre
Diferença DUAS médias (amostras
amostras
dependentes)
O teste t para diferença de médias então será dado por:
TESTES DE HIPÓTESES para DUAS
amostras Diferença entre médias (amostras
dependentes)
amostras Diferença entre médias (amostras
dependentes)
Exemplo:
A fabricante de calçados afirma que os atletas podem aumentar suas
alturas de salto vertical usando sapatos de treinamento do fabricante. As
alturas de salto vertical de oito atletas selecionados aleatoriamente foram
medidos. Depois que os atletas usaram os sapatos por 8 meses, suas
alturas de salto vertical foram medidas novamente. As alturas de
impulsão vertical (em polegadas) para cada atleta são mostrados na
tabela abaixo.
TESTES
amostrasDE HIPÓTESES para DUAS
Diferença entre médias (amostras
dependentes)
A um α = 0,10, há evidência suficiente para apoiar a afirmação do
fabricante? Assuma as alturas de salto vertical são normalmente
distribuídas.
TESTES DE HIPÓTESES para entre
Diferença DUAS médias (amostras
amostras
dependentes)

Podemos afirmar que a nível


10% de significância, que existe
evidências que dão suporte a
afirmação do fabricante.
TESTES DE HIPÓTESES para DUAS
amostras Diferença entre proporções
Lembrando que as hipóteses serão:

Considerando que:
1. As amostras são aleatoriamente
selecionadas
2. As amostras são independentes
3. As amostras são grandes ou
normalmente distribuídas,
lembrando
que a regra 𝑛𝑝 ≥ 5 e 𝑛𝑞 ≥ 5 ainda
deve ser observada.
TESTES DE HIPÓTESES para DUAS
Caso a
hipótese
indique 𝒑𝟏
= 𝒑 𝟐 , 𝒑𝟏
≤ 𝒑𝟐
≥ 𝒑𝟐,
então 𝒑𝟏 =
𝒑𝟐 é
assumida a
expressão
𝒑𝟏 − 𝒑𝟐 =
𝟎
TESTES DE HIPÓTESES para DUAS amostras
Diferença entre proporções
Então as possibilidades serão:

A hipótese pautando-se em 𝜇𝑝 1−𝑝 2 = 𝑝1 − 𝑝2


O desvio padrão para proporção de duas amostras será:
TESTES DE HIPÓTESES para DUAS amostras
Diferença entre proporções
Repare que precisamos conhecer a variância da proporção da
população calculada. Podemos calcular o peso da estimativa de 𝑝1 𝑒 𝑝2
usando:

Onde 𝑥1 = 𝑛1𝑝 1 e 𝑥2 = 𝑛2𝑝 2. Com o peso da 𝑝,o


estimativa desvio
padrão amostral da distribuição para 𝑝 1 − 𝑝 2 será

Assim o teste z será dado por


𝑝 1 − 𝑝 2−𝑝1 − 𝑝2
𝑧=
1+1
𝑝𝑞
𝑛1 𝑛2
Diferença entre proporções
Diferença entre proporções
Diferença entre proporções
Exemplo: Um estudo de 150 ocupantes selecionados aleatoriamente
em carros de passageiros e 200 ocupantes selecionados aleatoriamente
em picapes mostra que 86% dos ocupantes de veículos de passageiros e
74% dos ocupantes em picapes usam cintos de segurança. A um nível de
significância de 10%, podemos rejeitar a alegação de que a proporção de
ocupantes que usam cintos de segurança é o mesmo para carros de
passeio e picapes? Ver dados na tabela abaixo:
TESTES DE HIPÓTESES para DUAS amostras
Diferença entre proporções
TESTES DE HIPÓTESES para DUAS amostras
Diferença entre proporções

Há evidência suficiente a nível de 10% de significância para rejeitar a alegação de que


a proporção de ocupantes que usam cintos de segurança é a mesma para carros de
passeio e caminhonetes.
APLICAÇÃO NO R
(Clique na Figura para ir ao vídeo Prático do R)
PRÓXIMA AULA
REGRESSÃO LINEAR
SIMPLES

Você também pode gostar