Você está na página 1de 79

Inferência Estatística

Julienne Borges
Introdução aos testes de hipóteses
Um teste de hipóteses é um procedimento em que
utilizamos resultados experimentais provenientes de
uma amostra para verificar se, uma afirmação sobre
uma população, mais especificamente sobre um
parâmetro dessa população, é contrariada ou não.
Vamos entender alguns conceitos básicos sobre os
testes de hipóteses que serão utilizados em todos os
testes ao longo dessa unidade.
Hipóteses Estatísticas
Hipótese nula (denotada por H0) é uma hipótese estatística que contém uma afirmativa
de igualdade e deve escrever como =, < ou >.
Para uma média, temos as três formas possíveis para a hipótese nula:
Onde, 0 é algum valor que você deseja testar.
H0:  = 0
H0:  > 0
H0:  < 0
Para uma proporção, temos as três formas possíveis para a hipótese nula:
Onde, p0 é algum valor que você deseja testar.
H 0: p = p 0
H 0: p > p 0
H 0: p < p 0
Hipóteses Estatísticas
Hipótese alternativa (denotada por Ha) é o complemento da hipótese nula. É uma
afirmativa que deve ser verdadeira se H0 for falsa e contém uma afirmativa de
desigualdade, tal como <,  ou >.
Para uma média, a hipótese alternativa comporta apenas uma das três formas:
Ha:   0
Ha:  < 0
Ha:  > 0
Para uma proporção, a hipótese alternativa comporta apenas uma das três formas:
Ha: p  p0
Ha: p < p0
Ha: p > p0
Tipos de Hipóteses Estatísticas

Para uma média:


H0:  = 0 vs Ha:   0 → Hipótese bilateral ou bicaudal
H0:  > 0 vs Ha:  < 0 → Hipótese unilateral à esquerda
H0:  < 0 vs Ha:  > 0 → Hipótese unilateral à direita

Para uma proporção:


H0: p = p0 vs Ha: p  p0 → Hipótese bilateral ou bicaudal
H0: p > p0 vs Ha: p < p0 → Hipótese unilateral à esquerda
H0: p < p0 vs Ha: p > p0 → Hipótese unilateral à direita
Exemplos
Estabeleça as hipóteses nula e alternativa para cada situação proposta.
a) Uma universidade alega que a proporção de seus alunos formados em quatro anos é
de 82%.
H0: vs Ha :
b) Um fabricante de torneiras alega que a taxa de fluxo médio de um determinado tipo de
torneira é inferior a 2,5 galões por minuto.
H0: vs Ha :
c) Uma companhia que fabrica cereais alega que o peso médio do conteúdo de suas caixas
de cereais é de, no máximo, 200 gramas.
H0: vs Ha :
d) Uma estação de rádio alega que sua proporção de audiência local é superior a 39%.
H0: vs Ha :
Tipos de erros

A verdade real de H0
Decisão do
H0 é
teste H0 é falsa
verdadeira
Não rejeitar Decisão
Erro do tipo II
H0 correta

(1 - )
Rejeitar H0 Decisão
Erro do tipo I
correta

(1 - )
Tipos de erros

Seria ótimo se pudéssemos ter sempre =0 e =0, mas, na realidade, isto não é possível,
então devemos tentar administrar as probabilidades de erro  e .

Matematicamente, pode-se mostrar que ,  e n estão todos relacionados, de modo que


quando escolhemos ou determinamos quaisquer dois deles, o terceiro fica
automaticamente determinado.

A prática usual é selecionar os valores de  e n de modo que o valor de  fica


determinado.
Tipos de erros

Considerações práticas sobre os tipos de erros em um teste de hipóteses:

- Para qualquer  fixo, um aumento no tamanho amostral n causará um decréscimo em


. Isto é, um tamanho amostral maior diminuirá a chance de que você cometa o erro
de não rejeitar a hipótese nula quando ela é, na verdade, falsa.
- Para qualquer tamanho amostral n fixo, um decréscimo em  causará um aumento em
. Reciprocamente, um aumento em  causará um decréscimo em .
- Para diminuir tanto  quanto , aumente o tamanho da amostra.
Nível de significância ()
Determina o erro máximo tolerado no teste de hipóteses!

O nível de significância () de um teste é a probabilidade de uma


hipótese nula ser rejeitada, quando verdadeira.

Nível de confiança x Nível de significância


(1- ) ()
95% 5%
98% 2%
Estatística de teste

A estatística de teste é uma estatística amostral, ou um


valor baseado nos dados amostrais. Utiliza-se uma
estatística de teste para tomar uma decisão sobre a
rejeição ou não da hipótese nula.
Valor p

O valor p quantifica o erro cometido ao rejeitar a hipótese nula. Um valor p


muito pequeno sugere que os resultados amostrais são muito improváveis sob a
hipótese nula, ou seja, constitui evidência contra a hipótese nula.

O critério de decisão baseado no valor p é feito da seguinte maneira:


• Rejeitar a hipótese nula (H0) se o valor p é no máximo igual ao nível de
significância ().
• Não rejeitar a hipótese nula (H0) se o valor p é maior do que o nível de
significância ().
Como conduzir um teste de hipóteses?

1. Identificar o parâmetro que está sendo testado (média, proporção, variância,...).


2. Identificar os dados amostrais disponíveis.
3. Especificar o nível de significância que será utilizado.
4. Identificar o teste que deverá ser realizado (teste Z, teste t, teste qui-quadrado, teste
não paramétrico,...).
5. Identificar as hipóteses estatísticas (H0 e Ha).
6. Calcular a estatística de teste.
7. Escolher o método de conclusão do teste (região de rejeição, valor p ou intervalo de
confiança, quando possível).
8. Concluir o teste de hipóteses sempre dentro do contexto!
Teste de hipóteses para uma média

• Hipóteses estatísticas:
H0:  = 0
Ha:   0 → Denominada hipótese bilateral.

H0:  > 0
Ha:  < 0 → Denominada hipótese unilateral à esquerda.

H0:  < 0
Ha:  > 0 → Denominada hipótese unilateral à direita.
Teste de hipóteses para uma média

• Estatísticas de teste:

x − 0 x − 0
z teste = t teste =
 s
n n

Utilizada quando  (desvio padrão Utilizada quando 


da população) é conhecido! NÃO é conhecido!
Teste de hipóteses para uma média
Tipo de teste Valor p
• Valor p: Área à direita da estatística
Unilateral direito
de teste

Por exemplo, para um teste unilateral à direita


em que a estatística de teste seja igual a +2, o
valor p seria:
Teste de hipóteses para uma média
Tipo de teste Valor p
• Valor p: Área à direita da estatística
Unilateral direito
de teste

Por exemplo, para um teste unilateral à direita


em que a estatística de teste seja igual a -2, o
valor p seria:
Teste de hipóteses para uma média

Tipo de teste Valor p


• Valor p:
2 x a área à direita do
Bilateral módulo da estatística de
teste.

Por exemplo, para um teste bilateral em


que a estatística de teste seja igual a -1,5,
o valor p seria:
Teste de hipóteses para uma média

Tipo de teste Valor p


• Valor p:
Área à esquerda da
Unilateral esquerdo
estatística de teste

Por exemplo, para um teste unilateral à


esquerda em que a estatística de teste seja
igual a -1, o valor p seria:
Teste de hipóteses para uma média

Tipo de teste Valor p


• Valor p:
Área à esquerda da
Unilateral esquerdo
estatística de teste

Por exemplo, para um teste unilateral à


esquerda em que a estatística de teste seja
igual a +1, o valor p seria:
Exemplo 1

(Adaptado de Levine et al.) Uma das principais medidas de qualidade dos serviços
oferecidos por qualquer organização corresponde à velocidade através da qual ela
responde a uma reclamação feita pelos clientes. Uma grande loja de departamentos,
de controle familiar passou por uma grande expansão nos últimos anos. Foi
selecionada uma amostra de 50 reclamações com relação à instalação de pisos deste
ano, ou seja, correspondem ao tempo de espera (em dias) entre o recebimento da
reclamação e a solução do problema relacionado com a reclamação. Nesta amostra o
tempo médio de espera foi de 29 dias. Sabe-se que o desvio padrão da população é de
21 dias. O gerente afirma que o tempo médio de espera é de no máximo 20 dias. Com
um nível de 5% de significância há evidências que comprovem a alegação do gerente?
Parâmetro: Tempo médio de espera (em dias) entre o recebimento da reclamação e a
solução do problema relacionado com a reclamação.

Dados disponíveis:
Tamanho da amostra (n) = 50
Média da amostra (𝑥)ҧ = 29
Desvio padrão da população (σ) = 21 → Distribuição Normal
Nível de significância () = 5% = 0,05 → Erro máximo tolerado no teste.

Questão do problema: “O gerente afirma que o tempo médio de espera é de no


máximo 20 dias. Há evidências que comprovem a alegação do gerente?”

Hipóteses estatísticas: H0:  < 20 vs Ha:  > 20 → Hipótese unilateral à direita.


Qual teste estatístico devo
utilizar?
Como estamos testando uma
afirmação sobre uma média e o
desvio padrão populacional é
conhecido, devemos utilizar o
teste Z para uma média!
Valor p = 0,00122 → Ao rejeitar a
hipótese nula, comete-se um erro
de 0,122%.
Como valor p <  → Rejeita-se H0.

Conclusão teste:
Conclui-se com 5% de significância
que NÃO há evidências que
comprovem a alegação do gerente,
ou seja, o tempo médio de espera
(em dias) entre o recebimento da
reclamação e a solução do
problema relacionado com a
reclamação NÃO é de no máximo
20 dias.
Exercício 1
(Adaptado de Stevenson, 2001) Suponha que queiramos avaliar a afirmação de um
fabricante, de que seus pneus radiais suportam uma quilometragem de 40000 milhas,
no mínimo. Para uma amostra aleatória de 49 pneus observou-se uma média de duração
de 38000 milhas. Sabe-se que o desvio padrão populacional da duração dos pneus é de
3500 milhas. Utilize um nível de significância de 0,03. O que você pode concluir?
Valor p = 0,00003 → Se
rejeitarmos a H0, cometemos
um erro de 0,00003.

Valor p <  → Rejeitamos a H0

Conclusão do teste:
Conclui-se com 3% de
significância que o tempo
médio de duração dos pneus
NÃO é de 40000 milhas no
mínimo, ou seja, não há
evidências para comprovar a
alegação do fabricante.
Exercício 2 – Agora é a sua vez!
Um estudante de direito quer conferir a alegação de sua professora de que fraudadores
condenados passam, em média 12,3 meses na cadeia. Uma amostra aleatória de 35 casos
do arquivo judiciário indicou uma média de 11,5 meses. Suponha que o desvio padrão seja 
= 3,8 meses. Adote um nível de 4% de significância. O que o estudante pode concluir a partir
dos dados da amostra? Utilize o valor p e o intervalo de confiança.
Valor p =0,21295 →
Representa um erro de
21,295% ao rejeitar H0.

Valor p > 0,04 → NÃO


rejeitamos H0.

Conclusão do teste:
Podemos concluir com 4% de
significância que o tempo
médio que os fraudadores
condenados passam na cadeia
é igual a 12,3 meses, ou seja, a
afirmação da professora é
válida.
Interpretação do intervalo de
confiança:
Podemos afirmar com 96% de
confiança que o tempo médio
que os fraudadores
condenados passam na cadeia
pode variar de 10,18 a 12,82
meses.

H0:  =12,3
Ha:  ≠12,3 → Bilateral

Como o 12,3 pertence ao


intervalo de confiança, devemos
aceitar a H0.
Exemplo 2

(Adaptado de Morettin & Bussab, 2007) A associação dos proprietários de indústrias


metalúrgicas está muito preocupada com o tempo perdido com acidentes de trabalho, cuja
média, nos últimos tempos tem sido da ordem de 60 horas/homem por ano. Tentou-se um
programa de prevenção de acidentes, após o qual foi tomada uma amostra de nove
indústrias e medido o número de horas/homens perdidas por acidente obtendo-se uma
média de 50 horas e um desvio padrão de 20 horas. Você diria, considerando-se um nível
de significância de 5%, que houve alguma alteração no tempo perdido com acidentes de
trabalho? Suponha que a população segue aproximadamente a distribuição normal.

AMOSTRA → S → Desvio padrão da amostra → Distribuição t-Student


Parâmetro: Tempo médio perdido com acidentes de trabalho.

Dados disponíveis:
Tamanho da amostra (n) = 9
Média da amostra (𝑥)ҧ = 50
Desvio padrão da amostra (s) = 20
Nível de significância () = 5% = 0,05

Questão do problema: “Houve alguma alteração no tempo perdido com acidentes de


trabalho?... o tempo perdido com acidentes de trabalho, cuja média, nos últimos
tempos tem sido da ordem de 60 horas/homem por ano.”

Hipóteses estatísticas: H0:  = 60 vs Ha:  ≠ 60 → Hipótese bilateral ou bicaudal.


Qual teste estatístico devo
utilizar?
Como estamos testando uma
afirmação sobre uma média e o
desvio padrão populacional NÃO
é conhecido, devemos utilizar o
teste t para uma média!
Valor p = 0,172 → Ao rejeitar a
hipótese nula, comete-se um erro
de 17,2%.
Como valor p >  → NÃO rejeita-se
H0.

Conclusão teste:
Conclui-se com 5% de significância
que NÃO houve alteração no
tempo médio perdido com
acidentes de trabalho, ou seja, o
tempo médio é igual a 60
horas/homem indicando que o
programa de prevenção de
acidentes implementado não foi
eficaz!
Exercício 3 – Tente fazer!
(Adaptado de Morettin & Bussab) Um escritório de investimentos acredita que o
rendimento médio das diversas ações que movimenta é de 20%. Uma nova estratégia foi
definida com o objetivo de aumentar o rendimento médio das diversas ações que
movimenta. Para verificar esta hipótese, tomaram-se 18 empresas ao acaso obtendo-se
um rendimento médio de 24,56% e um desvio padrão de 5%. Suponha que a população
tenha distribuição aproximadamente normal. Faça o teste estatístico para comprovar que a
nova estratégia é realmente eficiente para aumentar o rendimento médio das diversas
ações. Use um nível de significância de 1%.
Valor p = 0,00062 → Se
rejeitarmos H0, cometemos
um erro de 0,00062.

Valor p < 0,01 → Rejeito H0

Conclusão do teste:
Conclui-se com 1% de
significância que o
rendimento médio das ações
é superior a 20%, ou seja, a
estratégia implementada foi
eficaz!
Teste de hipóteses para uma amostra utilizando o R

Teste t para uma média utilizando o R

x<-c(x1,x2,...,xn)
t.test(x, alternative = c("two.sided", "less", "greater"), mu = m0, conf.level = 0.95)

Onde:
x → representa o vetor de valores observados na amostra.
alternative = c("two.sided", "less", "greater") → representa o tipo de hipótese que será testado:
"two.sided“ → bilateral
“less” → Unilateral à esquerda
“greater” → Unilateral à direita
m0 → você deve indica a média que está sendo testada por meio das hipóteses
conf.level → você deve especificar o nível de confiança para o teste de hipóteses
Exercício 4

Uma amostra aleatória de oito pedidos dos arquivos de uma companhia mostra que os
pedidos de certa peça de uma máquina forma despachados em: 12 10 17 14 13 18
11 9 dias. Ao nível de 5% de significância , podemos concluir que, em média, tais
pedidos são despachados em menos de 10 dias?

H0:  >10
Ha:  <10 → Unilateral à esquerda
Parâmetro: Tempo médio para despachar os pedidos.

Dados disponíveis:
Tamanho da amostra (n) = 8
Média da amostra (𝑥)ҧ = 13 ➔ Obtida utilizando a função =media do Excel.
Desvio padrão da amostra (s) = 3,2071 ➔ Obtido por meio da função =desvpad.a do
Excel.
Nível de significância () = 5% = 0,05

Questão do problema: “...em média, tais pedidos são despachados em menos de 10


dias?”

Hipóteses estatísticas: H0:  > 10 vs Ha:  < 10 → Hipótese unilateral à esquerda.

Como não conhecemos o σ, vamos utilizar o teste t para uma média!


Valor p = 0,98343 → Ao rejeitar a
hipótese nula, comete-se um erro
de 98,343%.
Como valor p >  → NÃO rejeita-se
H0.

Conclusão teste:
Conclui-se com 5% de significância
que o tempo médio para despachar
os pedidos é superior ou igual a 10
dias.
Utilizando o R:

> x<-c(12,10,17,14,13,18,11,9)
> t.test(x,alternative=c("less"),mu=10,conf.level=0.95)

One Sample t-test

data: x
t = 2.6458, df = 7, p-value = 0.9834
alternative hypothesis: true mean is less than 10
95 percent confidence interval:
-Inf 15.14825
sample estimates:
mean of x
13
Curiosidade
Para o exemplo anterior em que a média é o parâmetro a ser estimado, não conhecemos
o desvio padrão populacional (σ) e temos a amostra de valores observados no estudo,
podemos utilizar o mesmo comandos t.test para encontrar um intervalo de confiança.
Observe: One Sample t-test
> t.test(x,conf.level=0.95)
data: x
t = 11.465, df = 7, p-value = 8.631e-06
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
10.31877 15.68123
sample estimates:
mean of x
13
Teste de hipóteses para uma proporção

• Hipóteses estatísticas:
H0: p = p0
Ha: p  p0 → Denominada hipótese bilateral.

H0: p > p0
Ha: p < p0 → Denominada hipótese unilateral à esquerda.

H0: p < p0
Ha: p > p0 → Denominada hipótese unilateral à direita.
Teste de hipóteses para uma proporção

• Estatística de teste:

n  p0  5
pˆ − p0
z teste =
p0 (1 − p0 )
e
n  (1 − p0 )  5
n
Teste de hipóteses para uma proporção

• Valor p:

Tipo de teste Valor p


Área à direita da estatística
Unilateral direito
de teste
2 x a área à direita do
Bilateral módulo da estatística de
teste.
Área à esquerda da
Unilateral esquerdo
estatística de teste
Exemplo 3

Em um estudo da eficácia do airbag em automóveis, constatou-se que, em 821 colisões


de carros de tamanho médio equipados com airbag, 46 colisões resultaram em
hospitalização do motorista. Ao nível de significância de 0,01, teste a afirmação de que
a taxa de hospitalização dos motoristas, nos casos de carros equipados com airbag, é
inferior à taxa de 7,8% para colisões de carros de tamanho médio equipados somente
com cintos automáticos de segurança.
Parâmetro: Taxa (proporção) de hospitalização dos motoristas, nos casos de carros
equipados com airbag.

Dados disponíveis:
Tamanho da amostra (n) = 821
Número de motoristas hospitalizados (x) = 46 ➔ 𝑝Ƹ = 46/821=0,056 (proporção amostral)
Nível de significância () = 1% = 0,01

Questão do problema: “Teste a afirmação de que a taxa de hospitalização dos motoristas,


nos casos de carros equipados com airbag, é inferior à taxa de 7,8% para colisões de carros
de tamanho médio equipados somente com cintos automáticos de segurança.”

Hipóteses estatísticas: H0: p > 0,078 vs Ha: p < 0,078 → Hipótese unilateral à esquerda.
Qual teste estatístico devo utilizar?
✓ n.p0 =821.0,078=64,038>5
✓ n.(1-p0) =821.0,922=756,962>5

Como estamos testando uma


afirmação sobre uma proporção e
as condições de uso da distribuição
normal foram satisfeitas, devemos
utilizar o teste Z para uma
proporção!
Valor p = 0,00937 → Ao rejeitar a
hipótese nula, comete-se um erro de
0,937%.
Como valor p < 0,01 → Rejeita-se H0.

Conclusão teste:
Conclui-se com 1% de significância que
a taxa de hospitalização dos motoristas,
nos casos de carros equipados com
airbag, é inferior à taxa de 7,8% para
colisões de carros de tamanho médio
equipados somente com cintos
automáticos de segurança, ou seja, o
airbag parece ser um item eficaz na
segurança dos motoristas.
Teste de hipóteses para uma proporção utilizando o R

Teste para uma proporção utilizando o R


O R utiliza a distribuição qui-quadrado e não distribuição normal para esse teste
prop.test(x, n, p = NULL, alternative = c("two.sided", "less", "greater"), conf.level =
0.95, correct = FALSE)
Onde:
x → número de itens que apresentam a característica de interesse.
n → tamanho da amostra
NULL → você deve indica a proporção que está sendo testada por meio das hipóteses
alternative = c("two.sided", "less", "greater") → representa o tipo de hipótese que será testado:
"two.sided“ → bilateral
“less” → Unilateral à esquerda
“greater” → Unilateral à direita
conf.level → você deve especificar o nível de confiança para o teste de hipóteses

IMPORTANTE: O R utiliza a distribuição qui-quadrado e não a distribuição Normal para a realização do teste!
Utilizando o R:

> prop.test(46, 821, p = 0.078, alternative = c("less"), conf.level = 0.99, correct = FALSE)

1-sample proportions test without continuity correction

data: 46 out of 821, null probability 0.078


X-squared = 5.5107, df = 1, p-value = 0.00945
alternative hypothesis: true p is less than 0.078
99 percent confidence interval:
0.00000000 0.07777309
sample estimates:
p
0.05602923
Exercício 5 – Vamos fazer esse?

Um sistema de reservas da companhia Y acusa uma taxa de 7% de não-comparecimento.


Adotou-se então um novo processo, pelo qual as reservas são confirmadas no dia anterior
ao do vôo, fazendo-se um estudo de 5218 reservas pelo novo sistema, selecionadas
aleatoriamente. Se se registraram 333 não-comparecimentos, teste a afirmação de que a
taxa de não-comparecimento é menor no novo sistema. O novo sistema se afigura
eficiente na redução do não-comparecimento? Utilize um nível de 2% de significância.
Exercício 6 – Para finalizar!
Em um estudo de 71 fumantes que estavam procurando deixar de fumar utilizando uma
terapia especial, 32 não estavam fumando um ano após o tratamento. Ao nível de 0,10 de
significância, teste a afirmação de que, dos fumantes que procuram deixar de fumar com
aquela terapia, no máximo 25% voltam a fumar um ano após o tratamento. Esses
resultados sugerem que a terapia não é eficaz?
Valor p = 0 → Cometemos
um erro de 0% ao rejeitar
H0.

Valor p < 0,10 → Rejeitar


H0.

Conclusão do teste:
Podemos concluir com 10%
de significância que o
tratamento NÃO é eficaz
visto que mais de 25% dos
indivíduos voltam a fumar
um ano após o tratamento.
> prop.test(39,71,p=0.25,alternative=c("greater"),conf.level=0.9,correct=FALSE)

1-sample proportions test without continuity correction

data: 39 out of 71, null probability 0.25


X-squared = 33.92, df = 1, p-value = 2.871e-09
alternative hypothesis: true p is greater than 0.25
90 percent confidence interval:
0.4733577 1.0000000
sample estimates:
p
0.5492958
Testes de hipóteses no Python

Testes para uma e duas médias, variâncias e normalidade:


https://tmfilho.github.io/pyestbook/math/03_scip.html?highlight=test#testes-de-
hipotese

Teste para uma proporção:


https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.binomtest.html#scipy
.stats.binomtest
Além do básico!
Teste para duas médias

Testes paramétricos são


aplicáveis quando as duas
populações seguem a
distribuição normal. Faça
o teste de normalidade!
Normalidade ok? Escolha
o teste de acordo com o
esquema ao lado. Não
normal? Veja opções de
testes não paramétricos!
Além do básico!
Teste para duas médias com variâncias iguais

No Python:
https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.ttest_ind.html

Como vou saber se as variâncias são iguais? Testando! Faça o teste para igualdade de
variâncias. Algumas opções: Teste F, teste de Levene, teste de Bartlett (3 ou mais
grupos), teste de Cochram, etc.
Além do básico!
Teste para duas médias com variâncias iguais

Exemplo 4
Foram avaliadas duas amostras de computadores selecionadas de duas empresas (A e
B) concorrentes, especializadas em serviços computacionais a terceiros. A empresa A
apresentou, em uma amostra de 26 computadores, média de MIPS (milhões de
instruções executadas por segundo) de 5000, com desvio padrão de 2500, e a empresa
B, em uma amostra de 16 computadores, apresentou média de MIPS de 4000, com
desvio padrão de 2400. Supondo que as variâncias são iguais, teste a hipótese de que a
média de desempenho dos computadores das empresas A e B seja diferente. Utilize um
nível de significância de 3%.
Além do básico!
Teste para duas médias com variâncias iguais
Dados do enunciado:
Empresa Tamanho Média da Desvio padrão
amostral amostra da amostra
A 26 5000 2500
B 16 4000 2400

Hipóteses estatísticas:
H0: µA=µB
HA: µA≠µB
Além do básico!
Teste para duas médias com variâncias iguais

Hipóteses estatísticas:
H0: µA=µB
HA: µA≠µB

Valor-T GL Valor-p O que você pode concluir?


1,28 40 0,209 As médias são iguais ou diferentes?
Além do básico!
Teste para duas proporções

Exemplo 5
Um analista de sistemas deseja comparar o desempenho de duas amostras de
programas na solução de um problema. Na amostra 1, os programas foram feitos na
linguagem de programação A, em 40 diferentes algoritmos. Na amostra 2, os programas
foram feitos na linguagem de programação B, em 60 diferentes algoritmos. Na amostra
1, a proporção de acerto da resposta do problema foi de 65% e na B, 90%.
Considerando um nível de 1% de significância, há evidência suficiente para dizer que
existe diferença na proporção de acerto da resposta entre as duas linguagens de
programação?
Além do básico!
Teste para duas proporções

Dados do enunciado:
Programação Tamanho Proporção de
amostral acerto
A 40 0,65
B 60 0,90

Hipóteses estatísticas:
H0: pA=pB
HA: pA≠pB
Além do básico!
Teste para duas proporções

Hipóteses estatísticas:
H0: pA=pB
HA: pA≠pB
Método Valor-Z Valor-p
O que você pode concluir? Aproximação normal -3,06 0,002
Considerando um nível de 1% de
significância, há evidência O teste baseado na aproximação normal usa a
suficiente para dizer que existe estimativa combinada da taxa (0,8).
diferença na proporção de acerto
da resposta entre as duas
linguagens de programação?
Além do básico!
Teste para duas proporções

Hipóteses estatísticas: Estimativa da diferença


H0: pA=pB Diferença IC de 99% para a Diferença
HA: pA≠pB -0,25 (-0,468377; -0,031623)
IC com base na aproximação normal
Observe que as hipóteses podem ser
reescritas da seguinte forma:
Verificamos que há diferença na proporção de
H₀: pA - pB =0 acerto entre as duas linguagens de
HA: pA - pB ≠ 0 programação. A partir do intervalo de
confiança para a diferença entre as estimativas,
como podemos identificar qual linguagem
apresentou maior proporção de acerto?
Além do básico!
Teste de normalidade para uma variável quantitativa

Use um teste de normalidade para determinar se os dados não seguem uma


distribuição normal.

Para um teste de normalidade, as hipóteses são as seguintes:


•H0: os dados seguem uma distribuição normal.
•HA: os dados não seguem uma distribuição normal.

Alguns testes de normalidade que podem ser utilizados: Teste de Shapiro-Wilk, Teste
de Kolmogorov-Smirnov, Teste de Anderson-Darling, etc.
Além do básico!
Teste de normalidade para uma variável quantitativa

No Python:
https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.shapiro.html

https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.kstest.html
Além do básico!
Teste de normalidade para uma variável quantitativa

Percentual de
Exemplo 6 Gordura
O engenheiro de alimentos em uma empresa 15,2 18,5
fabricante de alimentos processados deseja avaliar o 12,4 16,3
15,4 20
percentual de gordura nos molhos engarrafados da 16,5 19,2
empresa. O percentual anunciado é 15%. O 15,9 12,3
engenheiro mede o percentual de gordura em 20 17,1 12,8
amostras aleatórias. 16,9 17,9
14,3 16,3
Deseja-se verificar a suposição de normalidade antes 19,1 18,7
de realizar o teste de hipótese. 18,2 16,2
Além do básico!
Teste de normalidade para uma variável quantitativa

Lembrando que, nesse teste, as


hipóteses estatísticas são:
•H0: os dados seguem uma
distribuição normal.
•HA: os dados não seguem uma
distribuição normal.

O que você pode concluir


utilizando um nível de 5% de
significância?
Além do básico!
Teste para igualdade de variâncias

Use Teste para 2 variâncias para determinar se as variâncias ou os desvios padrão de


dois grupos são diferentes.

Para um teste para 2 variâncias, as hipóteses são como a seguir:


Ho: 12 = 22 → Amostras homocedásticas (variâncias iguais)
HA: 12 ≠ 22 → Amostras heterocedásticas (variâncias diferentes)

Algumas opções de teste de igualdade de variâncias que podem ser utilizados: Teste F,
teste de Levene, teste de Bartlett (3 ou mais grupos), teste de Cochram, etc.
Além do básico!
Teste para igualdade de variâncias

No Python:
https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.bartlett.html#scipy.s
tats.bartlett
Além do básico!
Teste para igualdade de variâncias

Máquina A Máquina B
145 138 133 135
142 131 123 139
Exemplo 7
136 139 133 151
Queremos verificar se 2 máquinas produzem peças com a
133 140 130 136
131 123 129 141
mesma homogeneidade quanto ao diâmetro (em mm). Para
131 137 129 147 isso, sorteamos vinte amostras de peças de cada máquina e
132 128 133 145 obtivemos as seguintes medidas do diâmetro (em mm):
127 137 137 139
138 133 142 151
139 132 151 139
Além do básico!
Teste para igualdade de variâncias

Hipóteses estatísticas:
Ho: A2 = B2 → Amostras homocedásticas
(variâncias iguais)
HA: A2 ≠ B2 → Amostras heterocedásticas
(variâncias diferentes)

Considerando um nível de 5% de significância, o que


podemos concluir?
MUITO OBRIGADA!!

prof.julienne@gmail.com

Você também pode gostar