2 - Testes de Hipóteses PDF

ANA CAROLINA
Cientista de Dados na TakeBlip
TESTES DE HIPÓTESES
Referências
@descomplicaestatistica
NOSSO ENCONTRO DE HOJE
_
AGENDA
● Bloco 1: Recapitulando
● Bloco 2: Intervalo de Confiança
● Bloco 3: Teste de Hipóteses
● Bloco 4: Anova
● Bloco 5: Teste Qui-quadrado

Recapitulando …
Generalização (Inferência Estatística)
(Resultados e conclusões)
Amostragem
Amostra
Subconjunto da população,
na qual conseguimos
População coletar e analisar os dados.
Conjunto de todos os
elementos de interesse.
Estatística
Uma estatística é uma característica da amostra, ou seja, uma estatística é uma
função (um valor) calculado através dos valores obtidos da amostra.
As estatísticas mais comuns são:
Média amostral
Variância amostral
Menor valor da amostra
Maior valor da amostra
Amplitude amostral
Parâmetro
Um parâmetro é uma medida usada para descrever uma característica da
população.
Ex.: média, variância, proporção etc., Muitas vezes é representado por letras gregas
Denominação Parâmetro
Média 𝜇
Variância 𝜎²
Desvio padrão 𝜎
Proporção 𝑝
Tamanho Ｎ
Estimador
Função/combinação dos elementos da amostra usado para estimar o parâmetro
populacional desconhecido.
Parâmetro Estatística
Denominação
(População) (Amostra)
Média
Variância
Desvio padrão
Proporção
Tamanho
Variância
A variância é uma medida de dispersão que mostra o quão distante cada valor observado está do valor
central (média).
Quanto menor é a variância, mais próximos os valores estão da média; mas quanto maior ela é, mais
distantes os valores estão da média.
Variância populacional Variância amostral

INFERÊNCIA ESTATÍSTICA
O objetivo é produzir afirmações sobre dada característica de uma população, na qual

estamos interessados, a partir de informações colhidas de uma parte dessa população
(amostra).
● Estimar o parâmetro populacional - Intervalo de Confiança
● Testar hipóteses sobre o parâmetro. - Teste de Hipótese

Erro amostral
Por mais que o processo de coleta dos dados seja bem planejado e executado,
SEMPRE vai existir um erro amostral nos resultados, ou seja na inferência sobre
o valor que queremos estimar da população.
Erro amostral é a diferença entre o resultado amostral e o verdadeiro resultado

da população, esses erros resultam das flutuações amostrais devido a aleatoriedade
das seleções.
Estimação
Exemplo: de posse de uma amostra de 1000 eleitores de um Estado, deseja-se
estimar a proporção p de eleitores desse Estado que votarão no candidato x.
Parâmetro populacional: p (Proporção de intenção de votos)
Estimação pontual: Somente um valor é dado como estimativa para p.

Ex.: proporção amostral de eleitores do candidato x , é
Estimação intervalar: Um intervalo de valores é dado como estimativa para p.

Ex.: proporção amostral de eleitores do candidato x, é:
Intervalo de
Confiança (IC)
Intervalo de Confiança
Um intervalo de confiança (ou estimativa intervalar) é uma faixa (ou um intervalo) de
valores, usada para estimar o verdadeiro valor de um parâmetro populacional
considerando o erro amostral.
Estimação intervalar
Exemplo: Suponha que queremos estimar a renda familiar média dos alunos da
Tera.
Em uma amostra de 40 alunos da Tera, encontrou-se uma renda familiar média de

3500 reais (estimativa pontual)
Suponha que: A margem de erro calculada foi igual a 300 reais.
Assim, a estimativa intervalar para a renda familiar média dos alunos da Tera é de
[3500 ± 300] = [3200 ; 3800] reais.
Para obtermos a “margem de erro”, é preciso identificar a distribuição amostral.

Distribuição amostral
É a distribuição de uma estatística obtida a partir de um número maior de amostras de mesmo tamanho
extraídas de uma população específica.
A distribuição amostral nos fornece a informação dos possíveis resultados de uma estatística, como a média
amostral.
Amostra 2 A distribuição de probabilidade de uma

Amostra 1
Estatística (como a média amostral) é chamada
de distribuição amostral.
Distribuição amostral da média
Se a variável (por exemplo, altura) que estamos interessados em estudar tem distribuição normal com média
μ e variância σ² então a média amostral dessa variável (altura média) terá distribuição normal com média μ e
variância σ²/n. Em que n é o tamanho da amostra.
Suponha que a altura uma variável aleatória com média 1.7 e variância 0.01, então, a altura média de uma
amostra de tamanho 100 terá distribuição normal com média 1.7 e variância 0.01/100.
Gerei uma amostra de

tamanho 100 de uma
população com
distribuição normal com
média 1.7 e desvio 0.1.
Média amostral é Calculei a média e variância dos dados gerados.

igual ou bem
próxima a Média
populacional
Variância Calculei a variância populacional dividida

populacional/n é por n (tamanho da amostra).
aproximadamente
igual a variância
amostral.
Distribuição Normal
A distribuição normal é uma das distribuições de probabilidade mais utilizadas
para modelar fenômenos naturais.
Isso se deve ao fato de que um grande número de fenômenos naturais

apresenta comportamento semelhante a distribuição normal.
Teorema do limite central
Uma razão para a distribuição Normal ser considerada tão importante é porque qualquer que seja a
distribuição da variável de interesse quando se tem grandes amostras, a distribuição das médias
amostrais serão aproximadamente normalmente distribuídas, e tendem a uma distribuição
normal à medida que o tamanho da amostra cresce.
Então podemos ter uma variável original com uma distribuição muito diferente da Normal (pode
até mesmo ser discreta), mas a distribuição amostral da média se parecerá como uma
distribuição normal.
Teorema do limite central
Quando o tamanho da amostra aumenta, independentemente da forma da distribuição da população, a distribuição amostral
aproxima-se cada vez mais de uma distribuição normal.
Esse resultado, fundamental na teoria da Inferência Estatística, é conhecido como Teorema Limite Central (TLC).
Para construir um IC precisamos:
● Determinar qual o parâmetro populacional estamos interessados (média,
variância, proporção.
● Identificar a distribuição amostral.
● Determinar o nível de confiança.
● Procurar o valor tabelado referente a distribuição amostral usando o nível

de confiança.
Nível de confiança
Refere-se à taxa de sucesso do método usado para construir o IC, ou seja, com que
frequência esse tipo de intervalo vai capturar o parâmetro de interesse.
Área
O nível de confiança nos fornece a taxa de
Probabilidade
sucesso do procedimento usado para a
construção do intervalo de confiança.
O nível de confiança é a probabilidade 1 - 𝛼 (em geral, expressa em porcentagem) que é a proporção
de vezes que o intervalo de confiança realmente contém o parâmetro populacional que estamos
estimando, supondo que o processo de estimação seja repetido um grande número de vezes.
𝛼 é o complemento do nível de confiança (chamado de nível de significância).
Se 𝛼= 0.05, nível de confiança = (1 - 𝛼 ) = 0,95 ou 95%.

Se 𝛼= 0.01, nível de confiança = (1 - 𝛼 ) = 0,99 ou 99%.
Se 𝛼= 0.10, nível de confiança =(1 - 𝛼 ) = 0,90 ou 90%.
Amostra 1 Intervalo de
Tamanho (n) confiança
População Amostra 1
Intervalo de
Amostra 2
confiança
Tamanho (n)
Amostra 2 LI LS
Sim
Intervalo de
Amostra 3 confiança
Tamanho (n)
Amostra 3 Sim
⋮ Não
Intervalo de
Amostra k confiança
Tamanho (n)
Amostra 4
Sim
Suponha que estamos interessados na proporção de intenção de voto de um candidato x.
Parâmetro populacional = p :a proporção de intenção de votos do candidato x
Para estimar essa proporção, pegamos uma amostra aleatória (n = 100) e calculamos a
proporção de intenção de votos através da amostra:
Suponha que para entender a margem de erro da estimativa calculamos o intervalo
para o parâmetro com 95% de confiança e encontramos os valores:
45% como limite inferior e 53% como limite superior, ou seja (45% < p < 53%) com um nível
de 95% de confiança.
Como interpretar o Intervalo de Confiança
Se coletássemos 20 amostras do mesmo tamanho (n=100) de forma aleatória, e calculássemos o intervalo
de confiança para a intenção de voto para cada uma dessas amostras, dos 20 intervalos calculados, 19
(95%) deles conteriam a verdadeira intenção de votos da população (que conhecemos nesse caso
hipotético e é de 45%).
Valor verdadeiro da
proporção de intenção de
votos (que em casos reais
não sabemos qual é).
Esse intervalo não contém p = 45% (o
valor verdadeiro da intenção de votos).
Como interpretar o Intervalo de Confiança
Estamos 95% confiantes de que o intervalo de confiança encontrado 35% a 52%

realmente contém o verdadeiro valor de p (a intenção de votos do candidato x).
Errado!!! A probabilidade de p estar entre LI e LS é de 95%.
Lembre-se que o nível de 95% se refere a taxa da quantidade de vezes que o intervalo vai
conter o valor do parâmetro.
Cálculo do IC
Intervalo de confiança para média populacional -
● Intervalo que considera o desvio padrão populacional conhecido - Tabela Z
● Intervalo que considera o desvio padrão populacional desconhecida - Tabela t

Intervalo de confiança
para média - μ
Variância populacional Conhecida (Tabela Z)
Intervalo de confiança para média - Variância populacional Conhecida (Z)
Erro padrão de
Nível de confiança (Variabilidade)
(Conhecido)
Parâmetro Média amostral

populacional
Valor da tabela na
Normal padrão N(0,1)
Se 𝛼= 0.05, 100(1 - 𝛼 ) = 95%

Se 𝛼= 0.01, 100(1 - 𝛼 ) = 99%
Se 𝛼= 0.10, 100(1 - 𝛼 ) = 90%
Exemplo
Uma máquina enche pacotes de café com uma variância igual a 100 g². Ela
estava regulada para encher os pacotes com 500 g, em média. Agora, ela se
desregulou, e queremos saber qual a nova média µ.
[501.58, 505.3, 497.62, 511.23, 502.13, 498.45, 496.38, 498.44, 498.45, 488.0, 508.1, 493.79, 505.24,
492.62, 518.15, 488.77, 495.19, 510.56, 477.39, 508.69, 488.84, 503.39, 499.12, 511.97, 484.84]
Uma amostra de 25 pacotes apresentou uma média igual a 499 g. Vamos

construir um intervalo de confiança com 95% de confiança para µ.
Exemplo
Como reduzir a margem de erro (amplitude
do intervalo)?
Aumentar o tamanho da amostra

Cálculo do Tamanho da Amostra
Qual deve ser o tamanho mínimo da amostra para que a margem de erro na
estimação de µ seja menor ou igual a um valor específico em um intervalo de
100(1-α)% de confiança ?
Exemplo
● Considerando que uma população seja normalmente distribuída com σ = 10,
qual seria o tamanho de amostra necessário para construir um intervalo de
95% de confiança para a média (µ) de modo que o comprimento do intervalo
não seja maior do que 1.0?
Intervalo de confiança
para média - μ
Variância populacional desconhecida (Tabela t)
Distribuição de t-Student
É muito semelhante à distribuição normal também em forma de sino e simétrica em relação à média.
Utilizamos essa distribuição quando temos amostras pequenas e a variância da população é desconhecida.
Como consequência, temos curvas com caudas mais pesadas, ou seja, os extremos têm probabilidades maiores.
IC para média - Variância populacional Desconhecida (t)
Calculado pelos dados da

amostra.
É o valor tabelado da distribuição

t-Student com (n-1) g.l.
Exercício
Suponha que estamos interessados em estudar qual é a idade média das
crianças que começam a falar. Para isso, obtém-se uma amostra de 20 crianças.
[1.71, 1.06, 1.68, 2.12, 2.17, 2.71, 1.02, 2.62, 2.15, 2.22, 2.1, 1.97, 1.44, 2.48, 1.45, 2.3, 1.73,
1.0, 2.36, 0.8]
Encontre o intervalo de confiança da idade média ao falar com 90% e 95% de

confiança.
Exemplo:
Para estudar
● Intervalo de confiança para Variância de uma população normal
● Intervalo de confiança para proporção

TESTES DE
HIPÓTESE
Teste de Hipótese
Teste de Hipóteses é o processo de decisão entre duas hipóteses sobre um parâmetro da
população.
Rejeitamos a Hipótese Nula.

Não rejeitamos a Hipótese Nula.
● Hipótese nula: é a afirmação que estamos tentando rejeitar.

● Hipótese alternativa: é a afirmação verdadeira para o caso de a hipótese nula ser falsa.
A hipótese nula é o estado atual das coisas (ponto de partida), enquanto a alternativa é a mudança ou
inovação (hipótese do pesquisador).
As hipóteses são mutuamente exclusivas (complementares) elas somam 100% das opções possíveis.
A ProCare Industries LTDA lançou, certa vez, um produto chamado “Gender
Choice”.
De acordo com a propaganda, o Gender Choice permitiria aos casais aumentar a

chance de ter um bebe do sexo feminino (ou masculino).
Teste de Hipótese
Será que esse produto funciona mesmo?
Rejeitamos ou Não rejeitamos a Hipótese Nula?

Em um experimento para verificar a eficácia do “Gender Choice”, suponha que
100 casais que querem uma menina façam uso da embalagem rosa.
● p = probabilidade de uma menina em um nascimento
● Probabilidade “natural” de ter uma menina: 0.5 ou 50%
● Se o produto não funciona, ou seja, os casais não usassem o produto

(p=0.50), o número esperado de meninas em 100 nascimentos seria
100(0.50)=50.
Testes de Hipótese
p = proporção de nascimentos de meninas com uso do Gender Choice
Hipótese é uma afirmação sobre um parâmetro da população.

Utilizando somente o bom senso, o que você pensaria se, das 100 crianças nascidas.
● Víssemos o resultado de 52 meninas em 100 nascimentos?
O número de 52 meninas é muito próximo daquele que esperamos sem o uso de

nenhum método (50) e poderia ter ocorrido por mero acaso.
Neste caso, não há evidências

suficientes para concluir que o
“Gender Choice” tenha eficácia.
Não rejeitamos a hipótese Nula.
● Víssemos o resultado de 98 meninas em 100 nascimentos?
Ou ocorreu um evento extremamente raro (probabilidade< 0.0001), ou o “Gender

Choice” é realmente eficaz (p>0.50).
● 98 meninas são prováveis quando p >

0.50.
● Diante da probabilidade extremamente

baixa de ocorrer 98 meninas em 100
nascimentos de maneira “natural”, a
explicação mais sensata é a de que o
produto é eficaz.
Como os métodos funcionam?
Concluímos que o produto é eficaz apenas se observarmos significativamente mais
meninas do que em geral esperávamos (significando que o produto conseguiu
aumentar a probabilidade natural de se ter uma menina).
É exatamente assim que os métodos estatísticos funcionam:

Eles rejeitam explicações baseadas em probabilidade muito pequenas.
Regra do evento Raro
Se, sob determinada suposição, a probabilidade de um evento observado particular
é excepcionalmente pequena, concluímos que suposição provavelmente não é
correta.
Guiados por essa regra, testamos uma afirmativa analisando os dados na tentativa de
distinguir entre resultados que facilmente podem ocorrer por acaso e resultados que
são altamente improváveis de ocorrer por acaso.
Testes de Hipótese
Valor-p
Probabilidade de obtermos
um resultado igual (ou mais
extremo) que o obtido, dados
Suponha que a probabilidade do
que a Hipótese nula é
experimento resultar em 75 meninas
verdadeira.
considerando que o gender Choice
não funciona = 40%
α (Alpha) = nível de significância

experimento resultar em 90 meninas Limite estabelecido para a rejeição
considerando que o gender Choice ou não da hipótese nula.
não funciona = 2%
Erros associados a um Teste de Hipóteses
Situação real (desconhecida)

Decisão baseada no teste
(Amostra)
H0 é verdadeira H0 é falsa
Decisão incorreta
Decisão correta
Rejeitar H0 (Erro tipo I)
Verdadeiro negativo
Falso positivo
Decisão incorreta
Decisão correta
Não rejeitar H0 (Erro tipo II)
Verdadeiro positivo
Falso negativo
Erro tipo I: Rejeitar H0 quando H0 é verdadeira.

Erro tipo II: Não Rejeitar H0 quando H0 é falsa.
Testes de Hipótese
p = proporção de nascimentos de meninas com uso do Gender Choice
O método não funciona
O método funciona
Erro tipo I: Dizer que o Gender Choice funciona, quando ele não funciona.
(Rejeitar H0 quando H0 é verdadeira)
Erro tipo II: Dizer que o Gender Choice não funciona, quando ele funciona.
(Não Rejeitar H0 quando H0 é falsa.)
O Erro Tipo I geralmente é o mais grave. Assim pretende-se “controlá-lo”, pré-fixando sua
probabilidade de ocorrência em um valor pequeno:
P(Erro tipo I): P(Rejeitar H0 quando H0 é verdadeira) = 𝛼

nível de significância
do teste
Usualmente tem-se 𝛼= 0.05, 𝛼= 0.01, 𝛼= 0.10

Exemplo: Uma pessoa está sendo julgada
Como pela lei uma pessoa é inocente até que se prove o contrário, as hipóteses
são:
Erro tipo I: A pessoa é condenada apesar de ser inocente.
Erro tipo II: A pessoa é absolvida apesar de ser culpada.
Naturalmente, a Justiça procura reduzir a possibilidade de ocorrer o Erro I, pois entende-se que é mais
grave condenar inocentes do que absolver criminosos.
P(Erro tipo II): P(Não Rejeitar H0 quando H0 é falsa) = β
β é reduzido aumentando o tamanho da amostra.
Pode do Teste: P(Rejeitar H0 quando H0 é falsa) = 1- β
Um teste de hipótese com um poder de 90%, por exemplo, rejeitará H0, quando ela for falsa, com
90% de probabilidade.
Regra de decisão entre as hipóteses
A conclusão é sempre tomada com base na hipótese nula.
● Estatística de teste: é um valor calculado a partir da amostra, que será usada

na tomada de decisão. Ela mede a distância entre o que foi observado na
amostra e o que seria esperado se a hipótese nula fosse verdadeira.
● Região de Rejeição / região crítica: conjunto de valores da estatística de teste

que levam à rejeição de H0.
H0 é rejeitada H0 é rejeitada
H0 é não
rejeitada
Regra de decisão entre as hipóteses
Região crítica
● Teste unilateral direito
● Teste unilateral esquerdo α (Alpha) = nível de

significância
Limite estabelecido para a

rejeição ou não da hipótese
nula.
● Hipótese bilateral
Testes de Hipótese Paramétricos
● Uma das premissas é o pressuposto que os dados seguem uma distribuição e
na maioria das vezes uma distribuição normal .
Precisamos fazer testes de normalidade dos dados.

● Kolmogorov-Smirnov
● Shapiro-Wilk
● Anderson-Darling
● Jarque-Bera
● D'Agostino-Pearson Omnibus test
Distribuição Normal Padrão
● A distribuição normal padrão é uma distribuição de probabilidade normal com
média 𝜇 = 0 e desvio padrão 𝜎 = 1, e a área total sob a curva é 1.
TESTES DE
HIPÓTESE PARA
UMA AMOSTRA
Teste de Hipóteses para a Média Populacional -
● Teste Z que considera a variância populacional conhecida - Tabela Z
● Teste t que considera a variância populacional desconhecida (usa a variância amostral) -

Tabela t
Aplicação Teste Z:
● Amostras grandes de qualquer distribuição ou

● Amostra grande ou pequena de distribuição Normal com σ conhecido.
Aplicação Teste t:
● Amostras pequenas de distribuição Normal com σ desconhecido.

● Amostras grandes de qualquer distribuição com σ desconhecido.
Teste de Hipóteses para a Média Populacional
● Teste Z - Tabela Normal padrão
Estatística de
Teste:
● Teste T - tabela t-student
Estatística de
Teste:
Região crítica: conjunto de valores da estatística de teste que levam à rejeição de H0 .
A região de rejeição é construída a partir da distribuição de referência.
● Teste Z
Se o Valor da Est. de teste Z for menor que , Rej. H0.
Se o Valor da Est. de teste Z for maior que , Rej. H0.
Se o Valor da Est. de teste Z for menor que

ou for maior que , Rej. H0.
● Teste T
Bilateral
Rej. H0 se
Rej. H0, se
Rej. H0, se ou se
Exemplo:
Uma máquina é programada para encher pacotes de café, com média µ e variância igual a 400g².
Sabemos que a máquina está regulada se a quantidade média de gramas nos pacotes de café é
de µ = 500g. Para verificar se a máquina está regulada, colhemos uma amostra de 25 pacotes e
verificamos se a produção está sob controle, isto é, se µ = 500g ou não.
Determine se a máquina está regulada, considerando um 𝛼 = 0.01.

Exemplo: ● Nível de significância
○ 𝛼 = 0.01
● Tamanho da amostra
○ Amostra pequena n = 25
● Variância populacional conhecida?
○ Sim. 400g²
● Amostra tem distribuição normal?
○ Precisamos verificar. Se sim, usar o teste Z.
Se o p-valor for maior do que o nível de

significância estabelecido (alfa), não
rejeitamos H꧐, os dados possuem dist.
normal.
Seguiremos com o teste Z

Estatística de Teste:
Considerando nível de significância 𝛼 = 0.01,

temos que a região crítica é:
Como Estatística de Teste = –0.158 está fora da Região crítica = -2,576,

não rejeitamos H0 ao nível de 1% de significância, ou seja, não há
evidências estatísticas suficientes nesta amostra para refutar a
hipótese de que a quantidade média de café nos pacotes é igual a
500g, a máquina está regulada.
-0.158
Exemplo:
Um fabricante afirma que seus cigarros não contêm mais que 30 mg de nicotina.
Uma amostra de 35 cigarros fornece média de 32.1 mg e desvio padrão de 2.2 mg.
[33.81, 31.9, 30.15, 27.55, 32.87, 36.74, 31.75, 30.06, 34.3, 33.09, 32.87, 32.25, 32.1, 31.91, 31.13, 30.18, 33.0,
37.04, 34.62, 37.12, 33.3, 33.31, 30.91, 28.94, 33.51, 30.68, 31.99, 32.12, 31.64, 28.13, 29.21, 31.8, 32.52,
30.24, 30.57]
No nível de 5%, os dados refutam ou não a afirmação do fabricante?

Exemplo: ● Nível de significância
○ 𝛼 = 0.05
● Tamanho da amostra
○ Amostra pequena n = 35
● Variância populacional conhecida?
○ Não. Vamos usar variância amostral
● Amostra tem distribuição normal?
○ Precisamos verificar. Se sim, usar o teste t.
Se o p-valor for maior do que o nível de

significância estabelecido (alfa), não
rejeitamos H꧐, os dados possuem dist.
normal.
Seguiremos com o teste t
Considerando nível de significância 𝛼 = 0.05, temos

que a região crítica é:
Como Estatística de Teste = 5.16 > que Região crítica = 1.69,

rejeitamos H0 ao nível de 5% de significância, ou seja, há
evidências de que os cigarros contenham mais de 30 mg
de nicotina.
5.615
Método para testar hipóteses estatísticas
● Método tradicional (visto até agora)
Conclusão: a amostra não contém evidências

NÃO suficientes para a rejeição da afirmação da hipótese
nula. Não rejeitamos H0.
O valor observado da
estatística pertence à
região de rejeição ?
Conclusão: a amostra contém evidências suficientes

SIM para a rejeição da hipótese nula.
Testes de Hipótese
Valor-p
Probabilidade de obtermos
um resultado igual (ou mais
extremo) que o obtido, dados
que a Hipótese nula é
verdadeira.
não funciona = 40%

não funciona = 2%
Valor-p
● O método de construção de um teste de hipóteses, descrito nas seções
anteriores, parte da fixação do nível de significância α.
● Pode-se argumentar que esse procedimento pode levar à rejeição da

hipótese nula para um valor de α e à não rejeição para um valor menor
porque é um valor arbitrário e definido pelo pesquisador.
O Valor-p consiste em calcular a probabilidade de ocorrer valores da estatística mais extremos

do que o observado, sob a hipótese de que H0 é verdadeira.
● De posse dos dados amostrais, podemos perguntar:
Qual é a probabilidade de errarmos ao rejeitar a hipótese nula com base nesses dados
amostrais?
Essa probabilidade é o valor-P do teste.

Valor-p
Raciocínio no qual se baseia o método do valor-p
● Se o valor p é “pequeno”, a probabilidade de cometermos um erro ao rejeitarmos H0 é

pequena. Então, devemos rejeitar H0 .
● Se o valor p é “grande”, a probabilidade de cometermos um erro ao rejeitarmos H0 é grande.

Então, não devemos rejeitar H0 .
Exemplo:
Um fabricante afirma que seus cigarros não contêm mais que 30 mg de nicotina.
Uma amostra de 35 cigarros fornece média de 32.1 mg e desvio padrão de 2.2 mg.
[33.81, 31.9, 30.15, 27.55, 32.87, 36.74, 31.75, 30.06, 34.3, 33.09, 32.87, 32.25, 32.1, 31.91, 31.13, 30.18, 33.0,
37.04, 34.62, 37.12, 33.3, 33.31, 30.91, 28.94, 33.51, 30.68, 31.99, 32.12, 31.64, 28.13, 29.21, 31.8, 32.52,
30.24, 30.57]
No nível de 5%, os dados refutam ou não a afirmação do fabricante?

Regra de decisão P-valor
Se o p-valor for menor do que o nível de significância estabelecido (alfa), rejeitamos H0, os cigarros contém
mais do que 30 mg de nicotina.
Métodos para testar hipóteses estatísticas
● Valor-p
Conclusão: a amostra não contém evidências

NÃO suficientes para a rejeição da afirmação da hipótese
nula. Não rejeitamos H0.
O valor-P é menor do que

o nível de significância α?
Conclusão: a amostra contém evidências suficientes

SIM para a rejeição da hipótese nula.
Teste de Hipóteses
Passos para fazer um teste de hipótese:
1. Formular as hipóteses. Definir a Hipótese nula e alternativa.
2. Identificar o teste apropriado de acordo com o parâmetro populacional e a

distribuição amostral.
3. Escolher o nível de significância α (Alpha).
4. Estabelecer a regra de decisão.
5. Calcular o valor da estatística de teste ou o valor-p.
6. Tomar a decisão com base no resultado.

Para estudar
● Teste de hipótese para proporção
● Teste de hipótese para variância de uma normal
Para ir além
● Testes Estatísticos não paramétricos
● Intervalos de confiança não paramétricos

ALGUMA DÚVIDA
ATÉ AQUI?
TESTES DE
HIPÓTESE PARA
DUAS AMOSTRAS
Teste-t para duas amostras
Comparação de drogas, dietas, terapias, métodos cirúrgicos, fertilizantes, condições
experimentais, características físicas .
● Dois Novos Tratamentos ou

● Tratamento Novo com um Tratamento Padrão ou
● Tratamento com a Ausência de Tratamento.
Tipos de Planejamento
Amostras Independentes:
Temos duas amostras separadas, uma de cada população:

● Tratamento 1 é aos n1 indivíduos da primeira amostra;
● Tratamento 2 é aos n2 indivíduos da segunda amostra.
Exemplo
● Um clínico suspeita que o fato de a mãe ter menos de 20 anos de idade está associado com o
nascimento de bebês com baixo peso ao nascer (< 2500 gramas).
Ele selecionou aleatoriamente alguns registros de uma grande maternidade maternidade e os

dividiu dividiu em dois grupos:
○ Grupo 1: bebês de mães com menos de 20 anos

○ Grupo 2: bebês de mães com mais de 20 anos.
Para cada bebê em cada grupo, observou a variável: X: peso ao nascer (em gramas).
Tipos de Planejamento
Amostras Dependentes (ou Emparelhadas ou Pareadas):
A amostra é constituída de n pares de indivíduos:
● Tratamento 1 é aplicado a um elemento do par

● Tratamento 2 é aplicado ao outro elemento do par.
Exemplo
● Para comparar dois tipos de colírio (A e B) quanto à variável “tempo para dilatar a pupila para o
exame oftalmológico”, 20 pacientes receberam um colírio em cada olho.
n = 20 pares cada paciente é um par: (Olho D ; Olho E).

TESTES DE
HIPÓTESE PARA
DUAS AMOSTRAS
independentes
TESTES DE HIPÓTESE PARA DUAS AMOSTRAS
independentes
Passo 1: Fazer o teste de Levene para verificar se as amostras dos grupos 1 e 2 vêm de
populações com distribuição Normal com desvios-padrão iguais ou diferentes.
Passo 2: Usar o teste adequado com base no teste anterior.

Comparação das Variâncias de Duas Populações Normais
(Levene)
Suponha que temos duas amostras independentes, de tamanhos n1 e n2 , retiradas de duas

populações normais independentes. Seja:
A variância populacional da amostra 1 é igual a variância da amostra 2.
A variância populacional da amostra 1 é diferente da variância da amostra 2.
Rejeita H0 se p-valor < nível de significância.
● Se não rejeitamos H0, usamos o teste para amostras independentes com variâncias iguais.
● Se rejeitamos H0, usamos o teste para amostras independentes com variâncias diferentes .
Inferências para duas médias: amostras independentes
variâncias iguais

variâncias diferentes
Quando a hipótese de igualdade de variâncias for rejeitada, devemos usar a estatística:

Suponha que queremos verificar se existe diferença na nota média de Biologia para alunos
que sentam na frente ou no fundo, ao nível de 5% de significância.
● Nível de significância
○ 𝛼 = 0.05
● Amostras têm distribuição normal ? (Testar as duas)
○ Precisamos verificar. Se sim continuar com o teste.
● Os dados possuem variâncias iguais ou diferentes?
○ Se forem iguais usar o teste que combina a variância das duas amostras.
○ Se forem diferentes, use o teste que utiliza as variâncias individuais.
Passo 1: Testar normalidade dos dados
Duas amostras possuem

distribuição normal.
Passo 2: Testar homogeneidade das variâncias
Não rejeitamos H0 , p-valor > nível de significância.

As amostras possuem variâncias iguais.
Passo 3: Testar as médias - Variâncias iguais
Rejeitamos H0 , p-valor <= nível de significância.
Com um nível de confiança de 95% rejeitamos H0 , isto é, concluímos que a média

das notas dos alunos do Fundo é diferente das notas médias dos alunos da Frente.
E se o teste de Levenne desse o resultado de variâncias diferentes?
Testar as médias - Variâncias diferentes
Mudar esse parâmetro.

Inferência para duas médias: amostras dependentes
(Emparelhadas )
Amostra com n pares de indivíduos:
● Tratamento 1 é aplicado a um elemento do par (medida x )

● Tratamento 2 é aplicado ao outro elemento do par (medida y)

Inferências para duas médias: amostras dependentes
Dataset contém informações de 275 indivíduos tratados com anticonvulsivante. A variável Convulsões indica o número de
convulsões por dia de cada paciente:
Convulsões PT: Antes do início do tratamento.

Convulsões S1: Na primeira semana do tratamento.
Vamos verificar se houve diminuição das convulsões comparando antes do início do tratamento com a primeira semana do
tratamento.
Passo 1: Testar normalidade da diferença
Os dados não possuem distribuição normal.

Nesse caso, não podemos seguir com o teste.
Utilizar alternativas como teste não paramétrico
Wilcoxon.
A título de aprendizado, vou seguir com o teste mesmo assim para entendermos o procedimento.
Passo 2: Testar as médias
Rejeitamos H0 , p-valor <= nível de significância.
Com um nível de confiança de 95% rejeitamos H0 , isto é, concluímos que a diferença

média de convulsões da semana antes do tratamento e da primeira semana é maior que 0
(as convulsões diminuíram).
ANOVA
Análise de Variância
Comparação de Várias Médias – ANOVA One Way
Comparação de Várias Médias
● Técnica estatística que testa as hipóteses:
Requisitos para a realização da ANOVA:
● A variável tem distribuição Normal em todas as populações; A variância é igual
para todas as populações:
● As amostras são aleatórias simples (amostras de mesmo tamanho tem a mesma

probabilidade de serem selecionadas).
● As amostras são independentes.

Se testamos médias, por que o nome Análise de Variância ?
● Porque a ideia dessa técnica é decidir se as médias dessas populações são iguais
ou não olhando para a variância (σ²) dessas populações.
Comparamos a variabilidade das medidas dentro dos grupos com a variabilidade das
medidas entre os grupos.
Entenda mais sobre a anova: Aqui

Anova
Dataset contém informações de 31 indivíduos tratados com placebo, um anti-hipertensivo já em uso no mercado e um
anti-hipertensivo novo. Vamos verificar se existe diferença na pressão sistólica dos indivíduos referente ao tratamento utilizado.
Passo 1: Testar normalidade dos dados
Todas as amostras possuem distribuição

normal.
Anova
Passo 2: Testar homogeneidade das variâncias
Não rejeitamos H0 , p-valor > nível de significância.

As amostras possuem variâncias iguais.
Anova
Passo 3: Testar as médias
Teste Post hoc - detectando quais grupos são

diferentes
Rejeitamos H0 , p-valor < nível de significância. ●
●
Duncan - Mais liberal
Bonferroni - Mais conservador
Pelo menos uma das médias é diferente. ● Tukey - hsd - Moderado
Outra forma de visualizar o mesmo teste.

Saída parecida com o que temos no R.
TESTES
Chi-quadrado
Teste Chi-quadrado de independência
● Testes qui-quadrado são desenhados a partir de tabelas de contingência.Os n indivíduos de uma
amostra são classificados segundo duas variáveis qualitativas (variáveis A e variável B):
Independência: Testa a hipótese nula de que não há associação entre a variável linha e a
variável coluna em uma tabela de contingência.
Pergunta: Existe associação grupo sanguíneo e presença de uma

característica de interesse?
Suposições
● Os dados são selecionados aleatoriamente
● Os dados amostrais consistem em contagens de frequências em uma tabela de dupla

entrada.
● Para cada categoria a frequência esperada é no mínimo = 5
Os valores críticos são encontrados na tabela qui-quadrado com (l-1)(c-1) g.l, onde l é o número
de linhas e c de colunas.
No teste de hipótese de independência com uma tabela de contingência, a região crítica é

apenas na cauda da direita.
Teste Chi-quadrado de independência
Vamos utilizar um conjunto de dados de RH da IBM do Kaggle e testar se existe relação entre um funcionário sair da empresa
(variável Attrition) e sua satisfação com o trabalho (JobSatisfaction).
● Para nosso teste Qui-quadrado de independência, vamos testar a hipótese nula de que não existe relação
significativa entre Saída e Satisfação com trabalho.
● A hipótese alternativa é que existe uma relação significativa entre Saída e Satisfação com trabalho.
Temos na saída:
● Estatística do teste X²
● Valor-p
● Grau de liberdade
● Frequências esperadas, respectivamente.
Rejeitamos H0 , p-valor < nível de significância.
Como o p-valor = 0.0005 < 5%, podemos concluir que
existe uma relação significativa entre Saída e Satisfação
com o trabalho.
Teste Post hoc - detectando em qual combinação temos diferença significativa. Para estudar: Teste post hoc qui-quadrado.
Para estudar
● Teste Chi-quadrado de aderência
● Teste Chi-quadrado de homogeneidade
Um teste de aderência é usado para testar a hipótese de que uma distribuição de frequência
observada se ajusta a alguma distribuição especificada.
Um teste de homogeneidade testa se uma determinada variável se distribui da mesma forma em

várias populações de interesse.
DÚVIDAS FINAIS
COMO FOI?
Referências
Referências
@descomplicaestatistica
Boa noite
E ATÉ A PRÓXIMA!

2 - Testes de Hipóteses PDF

Enviado por

Dados do documento

Descrição original:

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

2 - Testes de Hipóteses PDF

Enviado por

Direitos autorais:

Formatos disponíveis

ANA CAROLINA

Cientista de Dados na TakeBlip

● Bloco 2: Intervalo de Conﬁança

● Bloco 3: Teste de Hipóteses

● Bloco 5: Teste Qui-quadrado

Menor valor da amostra

Maior valor da amostra

Variância populacional Variância amostral

O objetivo é produzir aﬁrmações sobre dada característica de uma população, na qual

● Estimar o parâmetro populacional - Intervalo de Conﬁança

● Testar hipóteses sobre o parâmetro. - Teste de Hipótese

Erro amostral é a diferença entre o resultado amostral e o verdadeiro resultado

Parâmetro populacional: p (Proporção de intenção de votos)

Estimação pontual: Somente um valor é dado como estimativa para p.

Estimação intervalar: Um intervalo de valores é dado como estimativa para p.

Em uma amostra de 40 alunos da Tera, encontrou-se uma renda familiar média de

Suponha que: A margem de erro calculada foi igual a 300 reais.

Para obtermos a “margem de erro”, é preciso identiﬁcar a distribuição amostral.

Amostra 2 A distribuição de probabilidade de uma

Gerei uma amostra de

Média amostral é Calculei a média e variância dos dados gerados.

Variância Calculei a variância populacional dividida

Isso se deve ao fato de que um grande número de fenômenos naturais

● Identiﬁcar a distribuição amostral.

● Determinar o nível de conﬁança.

● Procurar o valor tabelado referente a distribuição amostral usando o nível

𝛼 é o complemento do nível de confiança (chamado de nível de significância).

Se 𝛼= 0.05, nível de confiança = (1 - 𝛼 ) = 0,95 ou 95%.

Parâmetro populacional = p :a proporção de intenção de votos do candidato x

Estamos 95% conﬁantes de que o intervalo de conﬁança encontrado 35% a 52%

Errado!!! A probabilidade de p estar entre LI e LS é de 95%.

● Intervalo que considera o desvio padrão populacional conhecido - Tabela Z

● Intervalo que considera o desvio padrão populacional desconhecida - Tabela t

Parâmetro Média amostral

Se 𝛼= 0.05, 100(1 - 𝛼 ) = 95%

Uma amostra de 25 pacotes apresentou uma média igual a 499 g. Vamos

Aumentar o tamanho da amostra

Calculado pelos dados da

É o valor tabelado da distribuição

Encontre o intervalo de conﬁança da idade média ao falar com 90% e 95% de

● Intervalo de conﬁança para proporção

Rejeitamos a Hipótese Nula.

● Hipótese nula: é a aﬁrmação que estamos tentando rejeitar.

De acordo com a propaganda, o Gender Choice permitiria aos casais aumentar a

Será que esse produto funciona mesmo?

Rejeitamos ou Não rejeitamos a Hipótese Nula?

● p = probabilidade de uma menina em um nascimento

● Probabilidade “natural” de ter uma menina: 0.5 ou 50%

● Se o produto não funciona, ou seja, os casais não usassem o produto

Hipótese é uma aﬁrmação sobre um parâmetro da população.

● Víssemos o resultado de 52 meninas em 100 nascimentos?

O número de 52 meninas é muito próximo daquele que esperamos sem o uso de

Neste caso, não há evidências

Ou ocorreu um evento extremamente raro (probabilidade< 0.0001), ou o “Gender

● 98 meninas são prováveis quando p >

● Diante da probabilidade extremamente

É exatamente assim que os métodos estatísticos funcionam:

α (Alpha) = nível de significância

Situação real (desconhecida)

Erro tipo I: Rejeitar H0 quando H0 é verdadeira.

O método não funciona

P(Erro tipo I): P(Rejeitar H0 quando H0 é verdadeira) = 𝛼