Você está na página 1de 124

ANA CAROLINA

Cientista de Dados na TakeBlip

TESTES DE HIPÓTESES
Referências

@descomplicaestatistica
NOSSO ENCONTRO DE HOJE
_
AGENDA
● Bloco 1: Recapitulando

● Bloco 2: Intervalo de Confiança

● Bloco 3: Teste de Hipóteses

● Bloco 4: Anova

● Bloco 5: Teste Qui-quadrado


Recapitulando …
Generalização (Inferência Estatística)

(Resultados e conclusões)

Amostragem

Amostra
Subconjunto da população,
na qual conseguimos
População coletar e analisar os dados.

Conjunto de todos os
elementos de interesse.
Estatística
Uma estatística é uma característica da amostra, ou seja, uma estatística é uma
função (um valor) calculado através dos valores obtidos da amostra.
As estatísticas mais comuns são:

Média amostral

Variância amostral

Menor valor da amostra

Maior valor da amostra

Amplitude amostral
Parâmetro
Um parâmetro é uma medida usada para descrever uma característica da
população.
Ex.: média, variância, proporção etc., Muitas vezes é representado por letras gregas

Denominação Parâmetro

Média 𝜇
Variância 𝜎²
Desvio padrão 𝜎
Proporção 𝑝
Tamanho N
Estimador
Função/combinação dos elementos da amostra usado para estimar o parâmetro
populacional desconhecido.

Parâmetro Estatística
Denominação
(População) (Amostra)
Média

Variância
Desvio padrão
Proporção

Tamanho
Variância
A variância é uma medida de dispersão que mostra o quão distante cada valor observado está do valor
central (média).

Quanto menor é a variância, mais próximos os valores estão da média; mas quanto maior ela é, mais
distantes os valores estão da média.

Variância populacional Variância amostral


INFERÊNCIA ESTATÍSTICA

O objetivo é produzir afirmações sobre dada característica de uma população, na qual


estamos interessados, a partir de informações colhidas de uma parte dessa população
(amostra).

● Estimar o parâmetro populacional - Intervalo de Confiança

● Testar hipóteses sobre o parâmetro. - Teste de Hipótese


Erro amostral
Por mais que o processo de coleta dos dados seja bem planejado e executado,
SEMPRE vai existir um erro amostral nos resultados, ou seja na inferência sobre
o valor que queremos estimar da população.

Erro amostral é a diferença entre o resultado amostral e o verdadeiro resultado


da população, esses erros resultam das flutuações amostrais devido a aleatoriedade
das seleções.
Estimação
Exemplo: de posse de uma amostra de 1000 eleitores de um Estado, deseja-se
estimar a proporção p de eleitores desse Estado que votarão no candidato x.

Parâmetro populacional: p (Proporção de intenção de votos)

Estimação pontual: Somente um valor é dado como estimativa para p.


Ex.: proporção amostral de eleitores do candidato x , é

Estimação intervalar: Um intervalo de valores é dado como estimativa para p.


Ex.: proporção amostral de eleitores do candidato x, é:
Intervalo de
Confiança (IC)
Intervalo de Confiança
Um intervalo de confiança (ou estimativa intervalar) é uma faixa (ou um intervalo) de
valores, usada para estimar o verdadeiro valor de um parâmetro populacional
considerando o erro amostral.
Estimação intervalar
Exemplo: Suponha que queremos estimar a renda familiar média dos alunos da
Tera.

Em uma amostra de 40 alunos da Tera, encontrou-se uma renda familiar média de


3500 reais (estimativa pontual)

Suponha que: A margem de erro calculada foi igual a 300 reais.

Assim, a estimativa intervalar para a renda familiar média dos alunos da Tera é de
[3500 ± 300] = [3200 ; 3800] reais.

Para obtermos a “margem de erro”, é preciso identificar a distribuição amostral.


Distribuição amostral
É a distribuição de uma estatística obtida a partir de um número maior de amostras de mesmo tamanho
extraídas de uma população específica.

A distribuição amostral nos fornece a informação dos possíveis resultados de uma estatística, como a média
amostral.

Amostra 2 A distribuição de probabilidade de uma


Amostra 1
Estatística (como a média amostral) é chamada
de distribuição amostral.
Distribuição amostral da média
Se a variável (por exemplo, altura) que estamos interessados em estudar tem distribuição normal com média
μ e variância σ² então a média amostral dessa variável (altura média) terá distribuição normal com média μ e
variância σ²/n. Em que n é o tamanho da amostra.

Suponha que a altura uma variável aleatória com média 1.7 e variância 0.01, então, a altura média de uma
amostra de tamanho 100 terá distribuição normal com média 1.7 e variância 0.01/100.
Distribuição amostral da média

Gerei uma amostra de


tamanho 100 de uma
população com
distribuição normal com
média 1.7 e desvio 0.1.
Distribuição amostral da média

Média amostral é Calculei a média e variância dos dados gerados.


igual ou bem
próxima a Média
populacional

Variância Calculei a variância populacional dividida


populacional/n é por n (tamanho da amostra).
aproximadamente
igual a variância
amostral.
Distribuição Normal
A distribuição normal é uma das distribuições de probabilidade mais utilizadas
para modelar fenômenos naturais.

Isso se deve ao fato de que um grande número de fenômenos naturais


apresenta comportamento semelhante a distribuição normal.
Teorema do limite central
Uma razão para a distribuição Normal ser considerada tão importante é porque qualquer que seja a
distribuição da variável de interesse quando se tem grandes amostras, a distribuição das médias
amostrais serão aproximadamente normalmente distribuídas, e tendem a uma distribuição
normal à medida que o tamanho da amostra cresce.

Então podemos ter uma variável original com uma distribuição muito diferente da Normal (pode
até mesmo ser discreta), mas a distribuição amostral da média se parecerá como uma
distribuição normal.
Teorema do limite central
Quando o tamanho da amostra aumenta, independentemente da forma da distribuição da população, a distribuição amostral
aproxima-se cada vez mais de uma distribuição normal.

Esse resultado, fundamental na teoria da Inferência Estatística, é conhecido como Teorema Limite Central (TLC).
Para construir um IC precisamos:
● Determinar qual o parâmetro populacional estamos interessados (média,
variância, proporção.

● Identificar a distribuição amostral.

● Determinar o nível de confiança.

● Procurar o valor tabelado referente a distribuição amostral usando o nível


de confiança.
Nível de confiança
Nível de confiança
Refere-se à taxa de sucesso do método usado para construir o IC, ou seja, com que
frequência esse tipo de intervalo vai capturar o parâmetro de interesse.

Área
O nível de confiança nos fornece a taxa de
Probabilidade
sucesso do procedimento usado para a
construção do intervalo de confiança.
Nível de confiança
O nível de confiança é a probabilidade 1 - 𝛼 (em geral, expressa em porcentagem) que é a proporção
de vezes que o intervalo de confiança realmente contém o parâmetro populacional que estamos
estimando, supondo que o processo de estimação seja repetido um grande número de vezes.

𝛼 é o complemento do nível de confiança (chamado de nível de significância).

Se 𝛼= 0.05, nível de confiança = (1 - 𝛼 ) = 0,95 ou 95%.


Se 𝛼= 0.01, nível de confiança = (1 - 𝛼 ) = 0,99 ou 99%.
Se 𝛼= 0.10, nível de confiança =(1 - 𝛼 ) = 0,90 ou 90%.
Amostra 1 Intervalo de
Tamanho (n) confiança
População Amostra 1

Intervalo de
Amostra 2
confiança
Tamanho (n)
Amostra 2 LI LS
Sim

Intervalo de
Amostra 3 confiança
Tamanho (n)
Amostra 3 Sim

⋮ Não

Intervalo de
Amostra k confiança
Tamanho (n)
Amostra 4
Sim
Suponha que estamos interessados na proporção de intenção de voto de um candidato x.

Parâmetro populacional = p :a proporção de intenção de votos do candidato x

Para estimar essa proporção, pegamos uma amostra aleatória (n = 100) e calculamos a
proporção de intenção de votos através da amostra:
Suponha que para entender a margem de erro da estimativa calculamos o intervalo
para o parâmetro com 95% de confiança e encontramos os valores:

45% como limite inferior e 53% como limite superior, ou seja (45% < p < 53%) com um nível
de 95% de confiança.
Como interpretar o Intervalo de Confiança
Se coletássemos 20 amostras do mesmo tamanho (n=100) de forma aleatória, e calculássemos o intervalo
de confiança para a intenção de voto para cada uma dessas amostras, dos 20 intervalos calculados, 19
(95%) deles conteriam a verdadeira intenção de votos da população (que conhecemos nesse caso
hipotético e é de 45%).

Valor verdadeiro da
proporção de intenção de
votos (que em casos reais
não sabemos qual é).
Esse intervalo não contém p = 45% (o
valor verdadeiro da intenção de votos).
Como interpretar o Intervalo de Confiança

Estamos 95% confiantes de que o intervalo de confiança encontrado 35% a 52%


realmente contém o verdadeiro valor de p (a intenção de votos do candidato x).

Errado!!! A probabilidade de p estar entre LI e LS é de 95%.

Lembre-se que o nível de 95% se refere a taxa da quantidade de vezes que o intervalo vai
conter o valor do parâmetro.
Cálculo do IC
Intervalo de confiança para média populacional -

● Intervalo que considera o desvio padrão populacional conhecido - Tabela Z

● Intervalo que considera o desvio padrão populacional desconhecida - Tabela t


Intervalo de confiança
para média - μ
Variância populacional Conhecida (Tabela Z)
Intervalo de confiança para média - Variância populacional Conhecida (Z)
Erro padrão de
Nível de confiança (Variabilidade)

(Conhecido)

Parâmetro Média amostral


populacional

Valor da tabela na
Normal padrão N(0,1)

Se 𝛼= 0.05, 100(1 - 𝛼 ) = 95%


Se 𝛼= 0.01, 100(1 - 𝛼 ) = 99%
Se 𝛼= 0.10, 100(1 - 𝛼 ) = 90%
Exemplo
Uma máquina enche pacotes de café com uma variância igual a 100 g². Ela
estava regulada para encher os pacotes com 500 g, em média. Agora, ela se
desregulou, e queremos saber qual a nova média µ.

[501.58, 505.3, 497.62, 511.23, 502.13, 498.45, 496.38, 498.44, 498.45, 488.0, 508.1, 493.79, 505.24,
492.62, 518.15, 488.77, 495.19, 510.56, 477.39, 508.69, 488.84, 503.39, 499.12, 511.97, 484.84]

Uma amostra de 25 pacotes apresentou uma média igual a 499 g. Vamos


construir um intervalo de confiança com 95% de confiança para µ.
Exemplo
Como reduzir a margem de erro (amplitude
do intervalo)?

Aumentar o tamanho da amostra


Cálculo do Tamanho da Amostra
Qual deve ser o tamanho mínimo da amostra para que a margem de erro na
estimação de µ seja menor ou igual a um valor específico em um intervalo de
100(1-α)% de confiança ?
Exemplo
● Considerando que uma população seja normalmente distribuída com σ = 10,
qual seria o tamanho de amostra necessário para construir um intervalo de
95% de confiança para a média (µ) de modo que o comprimento do intervalo
não seja maior do que 1.0?
Intervalo de confiança
para média - μ
Variância populacional desconhecida (Tabela t)
Distribuição de t-Student
É muito semelhante à distribuição normal também em forma de sino e simétrica em relação à média.
Utilizamos essa distribuição quando temos amostras pequenas e a variância da população é desconhecida.

Como consequência, temos curvas com caudas mais pesadas, ou seja, os extremos têm probabilidades maiores.
IC para média - Variância populacional Desconhecida (t)

Calculado pelos dados da


amostra.

É o valor tabelado da distribuição


t-Student com (n-1) g.l.
Exercício
Suponha que estamos interessados em estudar qual é a idade média das
crianças que começam a falar. Para isso, obtém-se uma amostra de 20 crianças.

[1.71, 1.06, 1.68, 2.12, 2.17, 2.71, 1.02, 2.62, 2.15, 2.22, 2.1, 1.97, 1.44, 2.48, 1.45, 2.3, 1.73,
1.0, 2.36, 0.8]

Encontre o intervalo de confiança da idade média ao falar com 90% e 95% de


confiança.
Exemplo:
Para estudar
● Intervalo de confiança para Variância de uma população normal

● Intervalo de confiança para proporção


TESTES DE
HIPÓTESE
Teste de Hipótese
Teste de Hipóteses é o processo de decisão entre duas hipóteses sobre um parâmetro da
população.

Rejeitamos a Hipótese Nula.


Não rejeitamos a Hipótese Nula.

● Hipótese nula: é a afirmação que estamos tentando rejeitar.


● Hipótese alternativa: é a afirmação verdadeira para o caso de a hipótese nula ser falsa.

A hipótese nula é o estado atual das coisas (ponto de partida), enquanto a alternativa é a mudança ou
inovação (hipótese do pesquisador).

As hipóteses são mutuamente exclusivas (complementares) elas somam 100% das opções possíveis.
A ProCare Industries LTDA lançou, certa vez, um produto chamado “Gender
Choice”.

De acordo com a propaganda, o Gender Choice permitiria aos casais aumentar a


chance de ter um bebe do sexo feminino (ou masculino).
Teste de Hipótese

Será que esse produto funciona mesmo?

Rejeitamos ou Não rejeitamos a Hipótese Nula?


Em um experimento para verificar a eficácia do “Gender Choice”, suponha que
100 casais que querem uma menina façam uso da embalagem rosa.

● p = probabilidade de uma menina em um nascimento

● Probabilidade “natural” de ter uma menina: 0.5 ou 50%

● Se o produto não funciona, ou seja, os casais não usassem o produto


(p=0.50), o número esperado de meninas em 100 nascimentos seria
100(0.50)=50.
Testes de Hipótese
p = proporção de nascimentos de meninas com uso do Gender Choice

Hipótese é uma afirmação sobre um parâmetro da população.


Utilizando somente o bom senso, o que você pensaria se, das 100 crianças nascidas.

● Víssemos o resultado de 52 meninas em 100 nascimentos?

O número de 52 meninas é muito próximo daquele que esperamos sem o uso de


nenhum método (50) e poderia ter ocorrido por mero acaso.

Neste caso, não há evidências


suficientes para concluir que o
“Gender Choice” tenha eficácia.
Não rejeitamos a hipótese Nula.
● Víssemos o resultado de 98 meninas em 100 nascimentos?

Ou ocorreu um evento extremamente raro (probabilidade< 0.0001), ou o “Gender


Choice” é realmente eficaz (p>0.50).

● 98 meninas são prováveis quando p >


0.50.

● Diante da probabilidade extremamente


baixa de ocorrer 98 meninas em 100
nascimentos de maneira “natural”, a
explicação mais sensata é a de que o
produto é eficaz.
Como os métodos funcionam?
Concluímos que o produto é eficaz apenas se observarmos significativamente mais
meninas do que em geral esperávamos (significando que o produto conseguiu
aumentar a probabilidade natural de se ter uma menina).

É exatamente assim que os métodos estatísticos funcionam:


Eles rejeitam explicações baseadas em probabilidade muito pequenas.
Regra do evento Raro
Se, sob determinada suposição, a probabilidade de um evento observado particular
é excepcionalmente pequena, concluímos que suposição provavelmente não é
correta.

Guiados por essa regra, testamos uma afirmativa analisando os dados na tentativa de
distinguir entre resultados que facilmente podem ocorrer por acaso e resultados que
são altamente improváveis de ocorrer por acaso.
Testes de Hipótese
Valor-p
Probabilidade de obtermos
um resultado igual (ou mais
extremo) que o obtido, dados
Suponha que a probabilidade do
que a Hipótese nula é
experimento resultar em 75 meninas
verdadeira.
considerando que o gender Choice
não funciona = 40%

α (Alpha) = nível de significância


Suponha que a probabilidade do
experimento resultar em 90 meninas Limite estabelecido para a rejeição
considerando que o gender Choice ou não da hipótese nula.
não funciona = 2%
Erros associados a um Teste de Hipóteses

Situação real (desconhecida)


Decisão baseada no teste
(Amostra)
H0 é verdadeira H0 é falsa

Decisão incorreta
Decisão correta
Rejeitar H0 (Erro tipo I)
Verdadeiro negativo
Falso positivo

Decisão incorreta
Decisão correta
Não rejeitar H0 (Erro tipo II)
Verdadeiro positivo
Falso negativo

Erro tipo I: Rejeitar H0 quando H0 é verdadeira.


Erro tipo II: Não Rejeitar H0 quando H0 é falsa.
Testes de Hipótese
p = proporção de nascimentos de meninas com uso do Gender Choice

O método não funciona

O método funciona

Erro tipo I: Dizer que o Gender Choice funciona, quando ele não funciona.
(Rejeitar H0 quando H0 é verdadeira)

Erro tipo II: Dizer que o Gender Choice não funciona, quando ele funciona.
(Não Rejeitar H0 quando H0 é falsa.)
O Erro Tipo I geralmente é o mais grave. Assim pretende-se “controlá-lo”, pré-fixando sua
probabilidade de ocorrência em um valor pequeno:

P(Erro tipo I): P(Rejeitar H0 quando H0 é verdadeira) = 𝛼


nível de significância
do teste

Usualmente tem-se 𝛼= 0.05, 𝛼= 0.01, 𝛼= 0.10


Exemplo: Uma pessoa está sendo julgada
Como pela lei uma pessoa é inocente até que se prove o contrário, as hipóteses
são:

Erro tipo I: A pessoa é condenada apesar de ser inocente.

Erro tipo II: A pessoa é absolvida apesar de ser culpada.

Naturalmente, a Justiça procura reduzir a possibilidade de ocorrer o Erro I, pois entende-se que é mais
grave condenar inocentes do que absolver criminosos.
P(Erro tipo II): P(Não Rejeitar H0 quando H0 é falsa) = β

β é reduzido aumentando o tamanho da amostra.

Pode do Teste: P(Rejeitar H0 quando H0 é falsa) = 1- β

Um teste de hipótese com um poder de 90%, por exemplo, rejeitará H0, quando ela for falsa, com
90% de probabilidade.
Regra de decisão entre as hipóteses
A conclusão é sempre tomada com base na hipótese nula.

● Estatística de teste: é um valor calculado a partir da amostra, que será usada


na tomada de decisão. Ela mede a distância entre o que foi observado na
amostra e o que seria esperado se a hipótese nula fosse verdadeira.

● Região de Rejeição / região crítica: conjunto de valores da estatística de teste


que levam à rejeição de H0.

H0 é rejeitada H0 é rejeitada

H0 é não
rejeitada
Regra de decisão entre as hipóteses
Região crítica

● Teste unilateral direito

● Teste unilateral esquerdo α (Alpha) = nível de


significância

Limite estabelecido para a


rejeição ou não da hipótese
nula.

● Hipótese bilateral
Testes de Hipótese Paramétricos
● Uma das premissas é o pressuposto que os dados seguem uma distribuição e
na maioria das vezes uma distribuição normal .

Precisamos fazer testes de normalidade dos dados.


● Kolmogorov-Smirnov
● Shapiro-Wilk
● Anderson-Darling
● Jarque-Bera
● D'Agostino-Pearson Omnibus test
Distribuição Normal Padrão
● A distribuição normal padrão é uma distribuição de probabilidade normal com
média 𝜇 = 0 e desvio padrão 𝜎 = 1, e a área total sob a curva é 1.
TESTES DE
HIPÓTESE PARA
UMA AMOSTRA
Teste de Hipóteses para a Média Populacional -

● Teste Z que considera a variância populacional conhecida - Tabela Z

● Teste t que considera a variância populacional desconhecida (usa a variância amostral) -


Tabela t

Aplicação Teste Z:

● Amostras grandes de qualquer distribuição ou


● Amostra grande ou pequena de distribuição Normal com σ conhecido.

Aplicação Teste t:

● Amostras pequenas de distribuição Normal com σ desconhecido.


● Amostras grandes de qualquer distribuição com σ desconhecido.
Teste de Hipóteses para a Média Populacional

● Teste Z - Tabela Normal padrão

Estatística de
Teste:

● Teste T - tabela t-student

Estatística de
Teste:
Região crítica: conjunto de valores da estatística de teste que levam à rejeição de H0 .
A região de rejeição é construída a partir da distribuição de referência.

● Teste Z

Se o Valor da Est. de teste Z for menor que , Rej. H0.

Se o Valor da Est. de teste Z for maior que , Rej. H0.

Se o Valor da Est. de teste Z for menor que


ou for maior que , Rej. H0.
● Teste T
Bilateral

Rej. H0 se

Rej. H0, se

Rej. H0, se ou se
Exemplo:
Uma máquina é programada para encher pacotes de café, com média µ e variância igual a 400g².

Sabemos que a máquina está regulada se a quantidade média de gramas nos pacotes de café é
de µ = 500g. Para verificar se a máquina está regulada, colhemos uma amostra de 25 pacotes e
verificamos se a produção está sob controle, isto é, se µ = 500g ou não.

Determine se a máquina está regulada, considerando um 𝛼 = 0.01.


Exemplo: ● Nível de significância
○ 𝛼 = 0.01
● Tamanho da amostra
○ Amostra pequena n = 25
● Variância populacional conhecida?
○ Sim. 400g²
● Amostra tem distribuição normal?
○ Precisamos verificar. Se sim, usar o teste Z.

Se o p-valor for maior do que o nível de


significância estabelecido (alfa), não
rejeitamos H꧐, os dados possuem dist.
normal.

Seguiremos com o teste Z


Estatística de Teste:

Considerando nível de significância 𝛼 = 0.01,


temos que a região crítica é:

Como Estatística de Teste = –0.158 está fora da Região crítica = -2,576,


não rejeitamos H0 ao nível de 1% de significância, ou seja, não há
evidências estatísticas suficientes nesta amostra para refutar a
hipótese de que a quantidade média de café nos pacotes é igual a
500g, a máquina está regulada.
-0.158
Exemplo:
Um fabricante afirma que seus cigarros não contêm mais que 30 mg de nicotina.
Uma amostra de 35 cigarros fornece média de 32.1 mg e desvio padrão de 2.2 mg.

[33.81, 31.9, 30.15, 27.55, 32.87, 36.74, 31.75, 30.06, 34.3, 33.09, 32.87, 32.25, 32.1, 31.91, 31.13, 30.18, 33.0,
37.04, 34.62, 37.12, 33.3, 33.31, 30.91, 28.94, 33.51, 30.68, 31.99, 32.12, 31.64, 28.13, 29.21, 31.8, 32.52,
30.24, 30.57]

No nível de 5%, os dados refutam ou não a afirmação do fabricante?


Exemplo: ● Nível de significância
○ 𝛼 = 0.05
● Tamanho da amostra
○ Amostra pequena n = 35
● Variância populacional conhecida?
○ Não. Vamos usar variância amostral
● Amostra tem distribuição normal?
○ Precisamos verificar. Se sim, usar o teste t.

Se o p-valor for maior do que o nível de


significância estabelecido (alfa), não
rejeitamos H꧐, os dados possuem dist.
normal.
Seguiremos com o teste t
Estatística de Teste:

Considerando nível de significância 𝛼 = 0.05, temos


que a região crítica é:

Como Estatística de Teste = 5.16 > que Região crítica = 1.69,


rejeitamos H0 ao nível de 5% de significância, ou seja, há
evidências de que os cigarros contenham mais de 30 mg
de nicotina.

5.615
Método para testar hipóteses estatísticas

● Método tradicional (visto até agora)

Conclusão: a amostra não contém evidências


NÃO suficientes para a rejeição da afirmação da hipótese
nula. Não rejeitamos H0.

O valor observado da
estatística pertence à
região de rejeição ?

Conclusão: a amostra contém evidências suficientes


SIM para a rejeição da hipótese nula.
Testes de Hipótese
Valor-p
Probabilidade de obtermos
um resultado igual (ou mais
extremo) que o obtido, dados
Suponha que a probabilidade do
que a Hipótese nula é
experimento resultar em 75 meninas
verdadeira.
considerando que o gender Choice
não funciona = 40%

Suponha que a probabilidade do


experimento resultar em 90 meninas
considerando que o gender Choice
não funciona = 2%
Valor-p
● O método de construção de um teste de hipóteses, descrito nas seções
anteriores, parte da fixação do nível de significância α.

● Pode-se argumentar que esse procedimento pode levar à rejeição da


hipótese nula para um valor de α e à não rejeição para um valor menor
porque é um valor arbitrário e definido pelo pesquisador.

O Valor-p consiste em calcular a probabilidade de ocorrer valores da estatística mais extremos


do que o observado, sob a hipótese de que H0 é verdadeira.

● De posse dos dados amostrais, podemos perguntar:

Qual é a probabilidade de errarmos ao rejeitar a hipótese nula com base nesses dados
amostrais?

Essa probabilidade é o valor-P do teste.


Valor-p
Raciocínio no qual se baseia o método do valor-p

● Se o valor p é “pequeno”, a probabilidade de cometermos um erro ao rejeitarmos H0 é


pequena. Então, devemos rejeitar H0 .

● Se o valor p é “grande”, a probabilidade de cometermos um erro ao rejeitarmos H0 é grande.


Então, não devemos rejeitar H0 .
Exemplo:
Um fabricante afirma que seus cigarros não contêm mais que 30 mg de nicotina.
Uma amostra de 35 cigarros fornece média de 32.1 mg e desvio padrão de 2.2 mg.

[33.81, 31.9, 30.15, 27.55, 32.87, 36.74, 31.75, 30.06, 34.3, 33.09, 32.87, 32.25, 32.1, 31.91, 31.13, 30.18, 33.0,
37.04, 34.62, 37.12, 33.3, 33.31, 30.91, 28.94, 33.51, 30.68, 31.99, 32.12, 31.64, 28.13, 29.21, 31.8, 32.52,
30.24, 30.57]

No nível de 5%, os dados refutam ou não a afirmação do fabricante?


Regra de decisão P-valor

Se o p-valor for menor do que o nível de significância estabelecido (alfa), rejeitamos H0, os cigarros contém
mais do que 30 mg de nicotina.
Métodos para testar hipóteses estatísticas

● Valor-p

Conclusão: a amostra não contém evidências


NÃO suficientes para a rejeição da afirmação da hipótese
nula. Não rejeitamos H0.

O valor-P é menor do que


o nível de significância α?

Conclusão: a amostra contém evidências suficientes


SIM para a rejeição da hipótese nula.
Teste de Hipóteses
Passos para fazer um teste de hipótese:

1. Formular as hipóteses. Definir a Hipótese nula e alternativa.

2. Identificar o teste apropriado de acordo com o parâmetro populacional e a


distribuição amostral.

3. Escolher o nível de significância α (Alpha).

4. Estabelecer a regra de decisão.

5. Calcular o valor da estatística de teste ou o valor-p.

6. Tomar a decisão com base no resultado.


Para estudar

● Teste de hipótese para proporção

● Teste de hipótese para variância de uma normal

Para ir além
● Testes Estatísticos não paramétricos

● Intervalos de confiança não paramétricos


ALGUMA DÚVIDA
ATÉ AQUI?
TESTES DE
HIPÓTESE PARA
DUAS AMOSTRAS
Teste-t para duas amostras
Comparação de drogas, dietas, terapias, métodos cirúrgicos, fertilizantes, condições
experimentais, características físicas .

● Dois Novos Tratamentos ou


● Tratamento Novo com um Tratamento Padrão ou
● Tratamento com a Ausência de Tratamento.
Tipos de Planejamento
Amostras Independentes:

Temos duas amostras separadas, uma de cada população:


● Tratamento 1 é aos n1 indivíduos da primeira amostra;
● Tratamento 2 é aos n2 indivíduos da segunda amostra.

Exemplo

● Um clínico suspeita que o fato de a mãe ter menos de 20 anos de idade está associado com o
nascimento de bebês com baixo peso ao nascer (< 2500 gramas).

Ele selecionou aleatoriamente alguns registros de uma grande maternidade maternidade e os


dividiu dividiu em dois grupos:

○ Grupo 1: bebês de mães com menos de 20 anos


○ Grupo 2: bebês de mães com mais de 20 anos.

Para cada bebê em cada grupo, observou a variável: X: peso ao nascer (em gramas).
Tipos de Planejamento
Amostras Dependentes (ou Emparelhadas ou Pareadas):

A amostra é constituída de n pares de indivíduos:

● Tratamento 1 é aplicado a um elemento do par


● Tratamento 2 é aplicado ao outro elemento do par.

Exemplo

● Para comparar dois tipos de colírio (A e B) quanto à variável “tempo para dilatar a pupila para o
exame oftalmológico”, 20 pacientes receberam um colírio em cada olho.

n = 20 pares cada paciente é um par: (Olho D ; Olho E).


TESTES DE
HIPÓTESE PARA
DUAS AMOSTRAS
independentes
TESTES DE HIPÓTESE PARA DUAS AMOSTRAS
independentes

Passo 1: Fazer o teste de Levene para verificar se as amostras dos grupos 1 e 2 vêm de
populações com distribuição Normal com desvios-padrão iguais ou diferentes.

Passo 2: Usar o teste adequado com base no teste anterior.


Comparação das Variâncias de Duas Populações Normais
(Levene)

Suponha que temos duas amostras independentes, de tamanhos n1 e n2 , retiradas de duas


populações normais independentes. Seja:

A variância populacional da amostra 1 é igual a variância da amostra 2.

A variância populacional da amostra 1 é diferente da variância da amostra 2.

Rejeita H0 se p-valor < nível de significância.

● Se não rejeitamos H0, usamos o teste para amostras independentes com variâncias iguais.
● Se rejeitamos H0, usamos o teste para amostras independentes com variâncias diferentes .
Inferências para duas médias: amostras independentes
variâncias iguais

Estatística de Teste:

Rejeita H0 se p-valor < nível de significância.


Inferências para duas médias: amostras independentes
variâncias diferentes

Quando a hipótese de igualdade de variâncias for rejeitada, devemos usar a estatística:

Estatística de Teste:

Rejeita H0 se p-valor < nível de significância.


Inferências para duas médias: amostras independentes

Suponha que queremos verificar se existe diferença na nota média de Biologia para alunos
que sentam na frente ou no fundo, ao nível de 5% de significância.

● Nível de significância
○ 𝛼 = 0.05
● Amostras têm distribuição normal ? (Testar as duas)
○ Precisamos verificar. Se sim continuar com o teste.
● Os dados possuem variâncias iguais ou diferentes?
○ Se forem iguais usar o teste que combina a variância das duas amostras.
○ Se forem diferentes, use o teste que utiliza as variâncias individuais.
Inferências para duas médias: amostras independentes

Passo 1: Testar normalidade dos dados

Duas amostras possuem


distribuição normal.
Inferências para duas médias: amostras independentes

Passo 2: Testar homogeneidade das variâncias

Não rejeitamos H0 , p-valor > nível de significância.


As amostras possuem variâncias iguais.
Inferências para duas médias: amostras independentes

Passo 3: Testar as médias - Variâncias iguais

Rejeitamos H0 , p-valor <= nível de significância.

Com um nível de confiança de 95% rejeitamos H0 , isto é, concluímos que a média


das notas dos alunos do Fundo é diferente das notas médias dos alunos da Frente.
E se o teste de Levenne desse o resultado de variâncias diferentes?
Testar as médias - Variâncias diferentes

Mudar esse parâmetro.


Inferência para duas médias: amostras dependentes
(Emparelhadas )

Amostra com n pares de indivíduos:

● Tratamento 1 é aplicado a um elemento do par (medida x )


● Tratamento 2 é aplicado ao outro elemento do par (medida y)

Estatística de Teste:

Rejeita H0 se p-valor < nível de significância.


Inferências para duas médias: amostras dependentes

Dataset contém informações de 275 indivíduos tratados com anticonvulsivante. A variável Convulsões indica o número de
convulsões por dia de cada paciente:

Convulsões PT: Antes do início do tratamento.


Convulsões S1: Na primeira semana do tratamento.

Vamos verificar se houve diminuição das convulsões comparando antes do início do tratamento com a primeira semana do
tratamento.
Inferências para duas médias: amostras independentes

Passo 1: Testar normalidade da diferença

Os dados não possuem distribuição normal.


Nesse caso, não podemos seguir com o teste.
Utilizar alternativas como teste não paramétrico
Wilcoxon.

A título de aprendizado, vou seguir com o teste mesmo assim para entendermos o procedimento.
Inferências para duas médias: amostras independentes

Passo 2: Testar as médias

Rejeitamos H0 , p-valor <= nível de significância.

Com um nível de confiança de 95% rejeitamos H0 , isto é, concluímos que a diferença


média de convulsões da semana antes do tratamento e da primeira semana é maior que 0
(as convulsões diminuíram).
ANOVA
Análise de Variância
Comparação de Várias Médias – ANOVA One Way
Comparação de Várias Médias
● Técnica estatística que testa as hipóteses:
Requisitos para a realização da ANOVA:
● A variável tem distribuição Normal em todas as populações; A variância é igual
para todas as populações:

● As amostras são aleatórias simples (amostras de mesmo tamanho tem a mesma


probabilidade de serem selecionadas).

● As amostras são independentes.


Se testamos médias, por que o nome Análise de Variância ?

● Porque a ideia dessa técnica é decidir se as médias dessas populações são iguais
ou não olhando para a variância (σ²) dessas populações.

Comparamos a variabilidade das medidas dentro dos grupos com a variabilidade das
medidas entre os grupos.

Entenda mais sobre a anova: Aqui


Anova

Dataset contém informações de 31 indivíduos tratados com placebo, um anti-hipertensivo já em uso no mercado e um
anti-hipertensivo novo. Vamos verificar se existe diferença na pressão sistólica dos indivíduos referente ao tratamento utilizado.

Passo 1: Testar normalidade dos dados

Todas as amostras possuem distribuição


normal.
Anova
Passo 2: Testar homogeneidade das variâncias

Não rejeitamos H0 , p-valor > nível de significância.


As amostras possuem variâncias iguais.
Anova
Passo 3: Testar as médias

Teste Post hoc - detectando quais grupos são


diferentes
Rejeitamos H0 , p-valor < nível de significância. ●

Duncan - Mais liberal
Bonferroni - Mais conservador
Pelo menos uma das médias é diferente. ● Tukey - hsd - Moderado

Outra forma de visualizar o mesmo teste.


Saída parecida com o que temos no R.
TESTES
Chi-quadrado
Teste Chi-quadrado de independência
● Testes qui-quadrado são desenhados a partir de tabelas de contingência.Os n indivíduos de uma
amostra são classificados segundo duas variáveis qualitativas (variáveis A e variável B):

Independência: Testa a hipótese nula de que não há associação entre a variável linha e a
variável coluna em uma tabela de contingência.

Pergunta: Existe associação grupo sanguíneo e presença de uma


característica de interesse?
Suposições
● Os dados são selecionados aleatoriamente

● Os dados amostrais consistem em contagens de frequências em uma tabela de dupla


entrada.

● Para cada categoria a frequência esperada é no mínimo = 5

Os valores críticos são encontrados na tabela qui-quadrado com (l-1)(c-1) g.l, onde l é o número
de linhas e c de colunas.

No teste de hipótese de independência com uma tabela de contingência, a região crítica é


apenas na cauda da direita.
Teste Chi-quadrado de independência
Vamos utilizar um conjunto de dados de RH da IBM do Kaggle e testar se existe relação entre um funcionário sair da empresa
(variável Attrition) e sua satisfação com o trabalho (JobSatisfaction).

● Para nosso teste Qui-quadrado de independência, vamos testar a hipótese nula de que não existe relação
significativa entre Saída e Satisfação com trabalho.

● A hipótese alternativa é que existe uma relação significativa entre Saída e Satisfação com trabalho.

Temos na saída:
● Estatística do teste X²
● Valor-p
● Grau de liberdade
● Frequências esperadas, respectivamente.
Rejeitamos H0 , p-valor < nível de significância.
Como o p-valor = 0.0005 < 5%, podemos concluir que
existe uma relação significativa entre Saída e Satisfação
com o trabalho.

Teste Post hoc - detectando em qual combinação temos diferença significativa. Para estudar: Teste post hoc qui-quadrado.
Para estudar
● Teste Chi-quadrado de aderência

● Teste Chi-quadrado de homogeneidade

Um teste de aderência é usado para testar a hipótese de que uma distribuição de frequência
observada se ajusta a alguma distribuição especificada.

Um teste de homogeneidade testa se uma determinada variável se distribui da mesma forma em


várias populações de interesse.
DÚVIDAS FINAIS
COMO FOI?
Referências
Referências

@descomplicaestatistica
Boa noite
E ATÉ A PRÓXIMA!

Você também pode gostar