Você está na página 1de 53

TESTES DE HIPÓTESES

PROFA. DRA. GIANNINI PASIZNICK APATI


TESTE DE HIPÓTESES

Como tomar decisões baseadas em significância


estatística e não em percepções?

Por meio dos TESTES DE HIPÓTESES podemos quantificar o nível de incerteza e


minimizar o risco de tomar a decisão errada!
TESTE DE HIPÓTESES
Nos testes de hipóteses teremos várias informações, tais como:
• ESTIMATIVAS PONTUAIS: representadas pela média e desvio-padrão de uma
amostra da população.
• INTERVALO DE CONFIANÇA: é a faixa de valores na qual se encontra a média e
desvio-padrão da população como um todo.
• NÍVEL DE CONFIANÇA: representa o nível de certeza que nós temos de que o
intervalo de confiança contém o valor real do parâmetro da população.
O mais utilizado é 95%.
TESTE DE HIPÓTESES
TESTE DE HIPÓTESES
Teste de hipótese é um procedimento estatístico no qual testamos alternativas,
utilizando da teoria de probabilidades, para tirar conclusões a respeito de uma
amostragem e determinar sua veracidade.
Na estatística, temos duas hipóteses a serem testadas:
• HIPÓTESE NULA (H0): é a hipótese que assumimos como verdade para a
construção do teste. É o que estamos interessados em testar.
• HIPÓTESE ALTERNATIVA (H1): é o que consideramos caso a hipótese nula seja
rejeitada.
TESTE DE HIPÓTESES
TESTE DE HIPÓTESES
Nós podemos ter duas possíveis conclusões:
a. REJEITAR H0: nós concluímos que o resultado é estatisticamente significativo,
confirmando a hipótese alternativa como verdadeira.
b. FALHAR AO REJEITAR H0: nós concluímos que não temos evidência suficiente
para assumir que a hipótese nula é verdadeira.
COMO COMPREENDER OS TESTES DE HIPÓTESES: NÍVEIS DE
SIGNIFICÂNCIA (ALFA) E VALORES-P NA ESTATÍSTICA

• O que os níveis de significância e valores-p significam nos


testes de hipóteses?
• O que é mesmo a significância estatística?
É mais fácil entender quando você consegue vir a significância
estatística que que tem significado real! Vejamos o exemplo:
Queremos determinar se a média da nossa amostra (330,6)
indica que o custo médio de energia deste ano é
significativamente diferente do custo médio de energia do ano
passado, que foi US$ 260,00.
Onde traçamos a linha de significância estatística no gráfico?
Agora vamos adicionar o nível de significância e o valor-p, que são as ferramentas de tomada de
decisão de que precisaremos.

Usaremos essas ferramentas para testar as seguintes hipóteses:

• Hipótese nula: A média da população é igual à média hipotética (260).


• Hipótese alternativa: A média da população é diferente da média hipotética (260).
QUAL É O NÍVEL DE SIGNIFICÂNCIA (ALFA)?

• O nível de significância, também denotado como alfa ou α, é a probabilidade de rejeição da


hipótese nula quando ela é verdadeira. Por exemplo, um nível de significância de 0,05 indica um
risco de 5% de concluir que existe uma diferença quando não há diferença real.

• A natureza técnica de tais tipos de definições pode dificultar a sua compreensão. A utilização de
imagens facilita muito a compreensão dos conceitos!

• O nível de significância determina a que distância do valor da hipótese nula traçaremos essa linha
no gráfico. Para representar graficamente um nível de significância de 0,05, precisamos sombrear
os 5% da distribuição que estão mais distantes da hipótese nula.
• No gráfico, as duas áreas sombreadas são equidistantes do
valor da hipótese nula e cada área tem uma probabilidade de
0,025, para um total de 0,05. Em estatística, chamamos essas
áreas sombreadas de região crítica quando se trata de um teste
bilateral. Se a média da população for 260, esperamos obter
uma média amostral que fique na região crítica por 5% do
tempo. A região crítica define a que distância a estatística de
nossas amostras deve estar do valor da hipótese nula antes que
seja possível afirmar que ela é atípica o suficiente para que a
hipótese nula seja rejeitada.

• Nossa média amostral (330,6) fica dentro da região crítica, o


que indica que é estatisticamente significativa no nível de 0,05.
• Também podemos ver se ela é estatisticamente significativa
quando usado outro nível de significância comum no nível
de 0,01.

• As duas áreas sombreadas têm uma probabilidade de 0,005,


cuja soma resulta em uma probabilidade total de 0,01.
Desta vez, nossa média amostral não fica dentro da região
crítica e não podemos rejeitar a hipótese nula.
• Essa comparação mostra por que você precisa escolher seu
nível de significância antes de começar seu estudo. Ela o
impede de escolher um nível de significância inadequado
porque convenientemente lhe dá resultados significativos!
TESTE DE HIPÓTESES
Exemplo:
Pesquisadores de uma empresa de cosméticos querem testar se o produto deles
é melhor que os concorrentes. Eles resolvem testar um determinado parâmetro
(efeito sobre a pele) na qual a média dos concorrentes é 3,10.
TESTE DE HIPÓTESES
Para tomarmos uma decisão, avaliamos o valor de p (p-value):
• Se o valor de p≤0,05 então rejeitamos H0 (o cosmético testado é diferente da
média dos concorrentes, ou seja, tem um efeito significativo).
• Se o valor de p>0,05 então falhamos ao rejeitar H0 (não existe evidências que
comprovem que o produto é igual aos concorrentes).
TESTE T PARA 1 AMOSTRA
TESTE T PARA 1 AMOSTRA (1-sample t-test): nós
usamos este teste para determinar se a média de uma
população é igual a um valor determinado.
Exemplo: uma empresa de botijões de gás quer avaliar
se os botijões estão sendo carregados corretamente.
A carga de gás deve ser de 20 kg.

TankWeight.MTW
TESTE T PARA 1 AMOSTRA
Premissas para a realização deste teste de
hipótese:
1) Os dados são numéricos e aleatórios
(sem conveniências na amostragem);
2) Os dados seguem uma distribuição
normal.
TESTE T PARA 1 AMOSTRA
No Minitab ...
TESTE T PARA 1 AMOSTRA
No Minitab ...

Valor a ser avaliado


TESTE T PARA 1 AMOSTRA

Conforme valor-p e IC
de 95%, é improvável
que a nossa amostra
provenha de uma
população com uma
média que seja igual
ao valor alvo (20 kg)
TESTE T PARA 1 AMOSTRA - EXERCÍCIO
Dados de vedação do pacote de salgadinho
Um engenheiro de embalagem quer testar um novo método para vedar pacotes de
salgadinhos. A força necessária para abrir os pacotes deve estar dentro de 10% do
valor de meta de 4,2 N (Newtons). O engenheiro seleciona, aleatoriamente, 28
pacotes de amostra que estão vedados usando o novo método e registra a força
necessária para abrir o pacote.
Use esses dados para demonstrar Teste de equivalência para uma amostra.
Coluna da Worksheet Descrição
Força A força necessária para abrir o pacote de salgadinhos, em
Newtons

VedaçãoDePacoteDeSalgadinho.mtw
TESTE T PARA 2 AMOSTRAS
TESTE T PARA 2 AMOSTRAS (2-sample t-test): nós usamos este teste para
comparar a média de 02 populações independentes e aleatórias.
Exemplo: um médico está querendo entender se existe diferença no tempo
médio de recuperação para 02 tratamentos diferentes (em casa ou no hospital).
RecoveryTime.MTW
TESTE T PARA 2 AMOSTRAS
Premissas para a realização deste teste de
hipótese:
1) Os dados são numéricos, independentes
(refletem realmente a realidade) e
Aleatórios (sem conveniências na amostragem);
2) Os dados seguem uma distribuição normal.
TESTE T PARA 2 AMOSTRAS
No Minitab...
TESTE T PARA 2 AMOSTRAS
No Minitab...
TESTE T PARA 2 AMOSTRAS

No Minitab...
TESTE T PARA 2 AMOSTRAS - EXERCÍCIO
No Minitab...
TESTE T PAREADO
TESTE T PAREADO (Paired t-test): nós usamos este
teste para comparar a média de duas populações
dependentes.
Exemplo: uma empresa de cosméticos quer comparar
o efeito de 02 cremes anti-rugas em diferentes
pessoas.
FacialCream.MTW
TESTE T PAREADO
Premissas para a realização deste
teste de hipótese:
1) Os dados são numéricos,
pareados (mesma condição para as
diferentes amostras) e aleatórios
(sem conveniências na
amostragem);
2) A diferença dos dados pareados
seguem uma distribuição normal.
TESTE T PAREADO
No Minitab...
TESTE T PAREADO
No Minitab...
TESTE T PAREADO
EXERCÍCIO - TESTE T PAREADO
Dados de frequência cardíaca em repouso
• Um fisiologista quer verificar se um determinado programa de corrida tem algum
efeito na frequência cardíaca em repouso. Foram medidas as frequências de 15
pessoas selecionadas aleatoriamente. As pessoas foram, então, colocadas no
programa de corrida e medidas novamente um ano mais tarde. Assim, as
medições antes e depois de cada pessoa são um par de observações.
• Use os dados para demonstrar um test t pareado:
Coluna da worksheet descrição
Antes A frequência cardíaca da pessoa em repouso antes do programa de corrida.
Depois A frequência cardíaca da pessoa em repouso depois do programa de corrida.
Diferença A diferença da frequência cardíaca da pessoa em repouso antes e depois do
programa de corrida

• FrequenciaCardiacaEmRepouso.mtw
TESTE T PARA UMA PROPORÇÃO
TESTE PARA 1 PROPORÇÃO (1-proportion test): nós usamos este teste para
determinar se a proporção de uma população é igual a um valor determinado.
A realização deste teste requer dados binários (sim ou não, macho ou fêmea,
bom ou ruim, etc.).
TESTE T PARA UMA PROPORÇÃO
Premissas para a realização deste teste de hipótese:
1) Os dados são binários (duas opções de escolha), independentes (sem
influências) e aleatórios (sem conveniências na amostragem).
TESTE T PARA UMA PROPORÇÃO

Exemplo: um banco está interessado em


saber se mais de 5% dos clientes atuais tem
interesse em uma nova linha de crédito. Para
isso, o banco entrevistou 3.518 clientes, dos
quais 194 disseram ter interesse nesta nova
linha de crédito.
TESTE T PARA UMA PROPORÇÃO
No Minitab
TESTE T PARA UMA PROPORÇÃO
TESTE T PARA UMA PROPORÇÃO
EXERCÍCIO - TESTE T PARA UMA PROPORÇÃO

Vamos supor que você trabalha em uma empresa


de sabão em pó, e está interessado em avaliar
uma nova fórmula. Você quer saber se pelo
menos 50% das amostras são tão brancas ou
mais brancas que a amostra padrão (referência).
• Número de amostras avaliadas = 12
• Número de amostras que ficaram tão brancas
ou mais brancas que o padrão = 7
TESTE T PARA 2 PROPORÇÕES

TESTE PARA 2 PROPORÇÕES (2-proportions test): nós usamos este teste para
determinar se a proporção de uma população é igual a proporção de outra
população.
A realização deste teste requer dados binários (sim ou não, macho ou fêmea,
bom ou ruim, etc.).
TESTE T PARA 2 PROPORÇÕES
Premissas para a realização deste teste de hipótese:
1) Os dados são binários (duas opções de escolha), independentes (sem
influências) e aleatórios (sem conveniências na amostragem).
TESTE T PARA 2 PROPORÇÕES
Exemplo: um banco está interessado em comparar a
eficiência de 02 times (interno e externo) quanto ao
número de endereços de clientes localizados
corretamente.

• Time Interno: 82 endereços localizados de 212


procurados;
• Time Externo: 102 endereços localizados de 211
procurados.
TESTE T PARA 2 PROPORÇÕES
No Minitab
TESTE T PARA 2 PROPORÇÕES No Minitab
TESTE T PARA 2 PROPORÇÕES No Minitab
EXERCÍCIO - TESTE T PARA 2 PROPORÇÕES
Vamos supor que você trabalha em uma empresa de
baterias automotivas. Para reduzir o número de falhas,
o time de engenharia propõe 02 novos conceitos de
bateria. O time quer determinar se a taxa de falha é
igual ou diferente entre os modelos, de forma a
implementar o melhor conceito.
• Conceito A = 17 falhas de 250 baterias testadas
• Conceito B = 09 falhas de 223 baterias testadas
Determine se a proporção de falhas são iguais ou diferentes entre os conceitos;
Avalie a diferença e recomende qual o melhor conceito para implementar.
TESTE PARA 2 VARIÂNCIAS
TESTE PARA 2 VARIÂNCIAS (2-variance): nós usamos este teste para determinar
se duas populações possuem variações iguais.

Exemplo: um médico está querendo entender se existe diferença na variação do


tempo de recuperação para 02 tratamentos diferentes (em casa ou no hospital).
RecoveryTime.MTW
TESTE PARA 2 VARIÂNCIAS
Premissas para a realização deste teste de hipótese:
1) Os dados são numéricos, independentes (refletem realmente a realidade) e
Aleatórios (sem conveniências na amostragem).
TESTE PARA 2 VARIÂNCIAS
No Minitab...
TESTE PARA 2 VARIÂNCIAS No Minitab...
TESTE PARA 2 VARIÂNCIAS No Minitab...
EXERCÍCIO - TESTE PARE 2 VARIÂNCIAS
Dados de comparação de hospitais
• Um consultor de saúde deseja comparar os índices de satisfação de pacientes de
dois hospitais. O consultor coleta as classificações de 20 pacientes para cada um
dos hospitais.

• Use estes dados para demonstrar teste para duas variâncias


Coluna da worksheet Descrição
Classificação A classificação do hospital: 1 a 100, sendo 100 a melhor pontuação
Hospital O hospital que foi classificado: A ou B

• ComparaçãoDeHospital.mtw
Qual é o seu objetivo???
RESUMO

Comparar uma amostra Comparar duas


a um valor alvo amostras entre si

Teste t para uma amostra Teste t para duas amostras

Teste para 1 proporção Teste t pareado

Teste para 2 proporções

Teste para 2 variâncias

Você também pode gostar