Escolar Documentos
Profissional Documentos
Cultura Documentos
TESTES DE HIPÓTESES
Referências
@descomplicaestatistica
NOSSO ENCONTRO DE HOJE
_
AGENDA
● Bloco 1: Recapitulando
● Bloco 4: Anova
(Resultados e conclusões)
Amostragem
Amostra
Subconjunto da população,
na qual conseguimos
População coletar e analisar os dados.
Conjunto de todos os
elementos de interesse.
Estatística
Uma estatística é uma característica da amostra, ou seja, uma estatística é uma
função (um valor) calculado através dos valores obtidos da amostra.
As estatísticas mais comuns são:
Média amostral
Variância amostral
Amplitude amostral
Parâmetro
Um parâmetro é uma medida usada para descrever uma característica da
população.
Ex.: média, variância, proporção etc., Muitas vezes é representado por letras gregas
Denominação Parâmetro
Média 𝜇
Variância 𝜎²
Desvio padrão 𝜎
Proporção 𝑝
Tamanho N
Estimador
Função/combinação dos elementos da amostra usado para estimar o parâmetro
populacional desconhecido.
Parâmetro Estatística
Denominação
(População) (Amostra)
Média
Variância
Desvio padrão
Proporção
Tamanho
Variância
A variância é uma medida de dispersão que mostra o quão distante cada valor observado está do valor
central (média).
Quanto menor é a variância, mais próximos os valores estão da média; mas quanto maior ela é, mais
distantes os valores estão da média.
Assim, a estimativa intervalar para a renda familiar média dos alunos da Tera é de
[3500 ± 300] = [3200 ; 3800] reais.
A distribuição amostral nos fornece a informação dos possíveis resultados de uma estatística, como a média
amostral.
Suponha que a altura uma variável aleatória com média 1.7 e variância 0.01, então, a altura média de uma
amostra de tamanho 100 terá distribuição normal com média 1.7 e variância 0.01/100.
Distribuição amostral da média
Então podemos ter uma variável original com uma distribuição muito diferente da Normal (pode
até mesmo ser discreta), mas a distribuição amostral da média se parecerá como uma
distribuição normal.
Teorema do limite central
Quando o tamanho da amostra aumenta, independentemente da forma da distribuição da população, a distribuição amostral
aproxima-se cada vez mais de uma distribuição normal.
Esse resultado, fundamental na teoria da Inferência Estatística, é conhecido como Teorema Limite Central (TLC).
Para construir um IC precisamos:
● Determinar qual o parâmetro populacional estamos interessados (média,
variância, proporção.
Área
O nível de confiança nos fornece a taxa de
Probabilidade
sucesso do procedimento usado para a
construção do intervalo de confiança.
Nível de confiança
O nível de confiança é a probabilidade 1 - 𝛼 (em geral, expressa em porcentagem) que é a proporção
de vezes que o intervalo de confiança realmente contém o parâmetro populacional que estamos
estimando, supondo que o processo de estimação seja repetido um grande número de vezes.
Intervalo de
Amostra 2
confiança
Tamanho (n)
Amostra 2 LI LS
Sim
Intervalo de
Amostra 3 confiança
Tamanho (n)
Amostra 3 Sim
⋮ Não
Intervalo de
Amostra k confiança
Tamanho (n)
Amostra 4
Sim
Suponha que estamos interessados na proporção de intenção de voto de um candidato x.
Para estimar essa proporção, pegamos uma amostra aleatória (n = 100) e calculamos a
proporção de intenção de votos através da amostra:
Suponha que para entender a margem de erro da estimativa calculamos o intervalo
para o parâmetro com 95% de confiança e encontramos os valores:
45% como limite inferior e 53% como limite superior, ou seja (45% < p < 53%) com um nível
de 95% de confiança.
Como interpretar o Intervalo de Confiança
Se coletássemos 20 amostras do mesmo tamanho (n=100) de forma aleatória, e calculássemos o intervalo
de confiança para a intenção de voto para cada uma dessas amostras, dos 20 intervalos calculados, 19
(95%) deles conteriam a verdadeira intenção de votos da população (que conhecemos nesse caso
hipotético e é de 45%).
Valor verdadeiro da
proporção de intenção de
votos (que em casos reais
não sabemos qual é).
Esse intervalo não contém p = 45% (o
valor verdadeiro da intenção de votos).
Como interpretar o Intervalo de Confiança
Lembre-se que o nível de 95% se refere a taxa da quantidade de vezes que o intervalo vai
conter o valor do parâmetro.
Cálculo do IC
Intervalo de confiança para média populacional -
(Conhecido)
Valor da tabela na
Normal padrão N(0,1)
[501.58, 505.3, 497.62, 511.23, 502.13, 498.45, 496.38, 498.44, 498.45, 488.0, 508.1, 493.79, 505.24,
492.62, 518.15, 488.77, 495.19, 510.56, 477.39, 508.69, 488.84, 503.39, 499.12, 511.97, 484.84]
Como consequência, temos curvas com caudas mais pesadas, ou seja, os extremos têm probabilidades maiores.
IC para média - Variância populacional Desconhecida (t)
[1.71, 1.06, 1.68, 2.12, 2.17, 2.71, 1.02, 2.62, 2.15, 2.22, 2.1, 1.97, 1.44, 2.48, 1.45, 2.3, 1.73,
1.0, 2.36, 0.8]
A hipótese nula é o estado atual das coisas (ponto de partida), enquanto a alternativa é a mudança ou
inovação (hipótese do pesquisador).
As hipóteses são mutuamente exclusivas (complementares) elas somam 100% das opções possíveis.
A ProCare Industries LTDA lançou, certa vez, um produto chamado “Gender
Choice”.
Guiados por essa regra, testamos uma afirmativa analisando os dados na tentativa de
distinguir entre resultados que facilmente podem ocorrer por acaso e resultados que
são altamente improváveis de ocorrer por acaso.
Testes de Hipótese
Valor-p
Probabilidade de obtermos
um resultado igual (ou mais
extremo) que o obtido, dados
Suponha que a probabilidade do
que a Hipótese nula é
experimento resultar em 75 meninas
verdadeira.
considerando que o gender Choice
não funciona = 40%
Decisão incorreta
Decisão correta
Rejeitar H0 (Erro tipo I)
Verdadeiro negativo
Falso positivo
Decisão incorreta
Decisão correta
Não rejeitar H0 (Erro tipo II)
Verdadeiro positivo
Falso negativo
O método funciona
Erro tipo I: Dizer que o Gender Choice funciona, quando ele não funciona.
(Rejeitar H0 quando H0 é verdadeira)
Erro tipo II: Dizer que o Gender Choice não funciona, quando ele funciona.
(Não Rejeitar H0 quando H0 é falsa.)
O Erro Tipo I geralmente é o mais grave. Assim pretende-se “controlá-lo”, pré-fixando sua
probabilidade de ocorrência em um valor pequeno:
Naturalmente, a Justiça procura reduzir a possibilidade de ocorrer o Erro I, pois entende-se que é mais
grave condenar inocentes do que absolver criminosos.
P(Erro tipo II): P(Não Rejeitar H0 quando H0 é falsa) = β
Um teste de hipótese com um poder de 90%, por exemplo, rejeitará H0, quando ela for falsa, com
90% de probabilidade.
Regra de decisão entre as hipóteses
A conclusão é sempre tomada com base na hipótese nula.
H0 é rejeitada H0 é rejeitada
H0 é não
rejeitada
Regra de decisão entre as hipóteses
Região crítica
● Hipótese bilateral
Testes de Hipótese Paramétricos
● Uma das premissas é o pressuposto que os dados seguem uma distribuição e
na maioria das vezes uma distribuição normal .
Aplicação Teste Z:
Aplicação Teste t:
Estatística de
Teste:
Estatística de
Teste:
Região crítica: conjunto de valores da estatística de teste que levam à rejeição de H0 .
A região de rejeição é construída a partir da distribuição de referência.
● Teste Z
Rej. H0 se
Rej. H0, se
Rej. H0, se ou se
Exemplo:
Uma máquina é programada para encher pacotes de café, com média µ e variância igual a 400g².
Sabemos que a máquina está regulada se a quantidade média de gramas nos pacotes de café é
de µ = 500g. Para verificar se a máquina está regulada, colhemos uma amostra de 25 pacotes e
verificamos se a produção está sob controle, isto é, se µ = 500g ou não.
[33.81, 31.9, 30.15, 27.55, 32.87, 36.74, 31.75, 30.06, 34.3, 33.09, 32.87, 32.25, 32.1, 31.91, 31.13, 30.18, 33.0,
37.04, 34.62, 37.12, 33.3, 33.31, 30.91, 28.94, 33.51, 30.68, 31.99, 32.12, 31.64, 28.13, 29.21, 31.8, 32.52,
30.24, 30.57]
5.615
Método para testar hipóteses estatísticas
O valor observado da
estatística pertence à
região de rejeição ?
Qual é a probabilidade de errarmos ao rejeitar a hipótese nula com base nesses dados
amostrais?
[33.81, 31.9, 30.15, 27.55, 32.87, 36.74, 31.75, 30.06, 34.3, 33.09, 32.87, 32.25, 32.1, 31.91, 31.13, 30.18, 33.0,
37.04, 34.62, 37.12, 33.3, 33.31, 30.91, 28.94, 33.51, 30.68, 31.99, 32.12, 31.64, 28.13, 29.21, 31.8, 32.52,
30.24, 30.57]
Se o p-valor for menor do que o nível de significância estabelecido (alfa), rejeitamos H0, os cigarros contém
mais do que 30 mg de nicotina.
Métodos para testar hipóteses estatísticas
● Valor-p
Para ir além
● Testes Estatísticos não paramétricos
Exemplo
● Um clínico suspeita que o fato de a mãe ter menos de 20 anos de idade está associado com o
nascimento de bebês com baixo peso ao nascer (< 2500 gramas).
Para cada bebê em cada grupo, observou a variável: X: peso ao nascer (em gramas).
Tipos de Planejamento
Amostras Dependentes (ou Emparelhadas ou Pareadas):
Exemplo
● Para comparar dois tipos de colírio (A e B) quanto à variável “tempo para dilatar a pupila para o
exame oftalmológico”, 20 pacientes receberam um colírio em cada olho.
Passo 1: Fazer o teste de Levene para verificar se as amostras dos grupos 1 e 2 vêm de
populações com distribuição Normal com desvios-padrão iguais ou diferentes.
● Se não rejeitamos H0, usamos o teste para amostras independentes com variâncias iguais.
● Se rejeitamos H0, usamos o teste para amostras independentes com variâncias diferentes .
Inferências para duas médias: amostras independentes
variâncias iguais
Estatística de Teste:
Estatística de Teste:
Suponha que queremos verificar se existe diferença na nota média de Biologia para alunos
que sentam na frente ou no fundo, ao nível de 5% de significância.
● Nível de significância
○ 𝛼 = 0.05
● Amostras têm distribuição normal ? (Testar as duas)
○ Precisamos verificar. Se sim continuar com o teste.
● Os dados possuem variâncias iguais ou diferentes?
○ Se forem iguais usar o teste que combina a variância das duas amostras.
○ Se forem diferentes, use o teste que utiliza as variâncias individuais.
Inferências para duas médias: amostras independentes
Estatística de Teste:
Dataset contém informações de 275 indivíduos tratados com anticonvulsivante. A variável Convulsões indica o número de
convulsões por dia de cada paciente:
Vamos verificar se houve diminuição das convulsões comparando antes do início do tratamento com a primeira semana do
tratamento.
Inferências para duas médias: amostras independentes
A título de aprendizado, vou seguir com o teste mesmo assim para entendermos o procedimento.
Inferências para duas médias: amostras independentes
● Porque a ideia dessa técnica é decidir se as médias dessas populações são iguais
ou não olhando para a variância (σ²) dessas populações.
Comparamos a variabilidade das medidas dentro dos grupos com a variabilidade das
medidas entre os grupos.
Dataset contém informações de 31 indivíduos tratados com placebo, um anti-hipertensivo já em uso no mercado e um
anti-hipertensivo novo. Vamos verificar se existe diferença na pressão sistólica dos indivíduos referente ao tratamento utilizado.
Independência: Testa a hipótese nula de que não há associação entre a variável linha e a
variável coluna em uma tabela de contingência.
Os valores críticos são encontrados na tabela qui-quadrado com (l-1)(c-1) g.l, onde l é o número
de linhas e c de colunas.
● Para nosso teste Qui-quadrado de independência, vamos testar a hipótese nula de que não existe relação
significativa entre Saída e Satisfação com trabalho.
● A hipótese alternativa é que existe uma relação significativa entre Saída e Satisfação com trabalho.
Temos na saída:
● Estatística do teste X²
● Valor-p
● Grau de liberdade
● Frequências esperadas, respectivamente.
Rejeitamos H0 , p-valor < nível de significância.
Como o p-valor = 0.0005 < 5%, podemos concluir que
existe uma relação significativa entre Saída e Satisfação
com o trabalho.
Teste Post hoc - detectando em qual combinação temos diferença significativa. Para estudar: Teste post hoc qui-quadrado.
Para estudar
● Teste Chi-quadrado de aderência
Um teste de aderência é usado para testar a hipótese de que uma distribuição de frequência
observada se ajusta a alguma distribuição especificada.
@descomplicaestatistica
Boa noite
E ATÉ A PRÓXIMA!