Você está na página 1de 19

28/09/2022

Módulo Testes de hipóteses: a hipótese nula e


alternativa, erros de tipo I e II.
2.6
Arlindo Gomes
Ano Letivo 2022/23

Testes de Hipóteses

Muitas vezes é necessário tomar decisões sobre características das


populações com base em informação sobre obtidas através de amostras.
(Exemplos: análise de conformidade, sondagens de opinião, etc……).

No percurso para uma decisão fundamentada é conveniente partir de


suposições sobre as populações envolvidas. Estas suposições designam-
se por hipóteses estatísticas e podem ser verdadeiras ou falsas.
Em geral, trata-se de afirmações sobre as distribuições de probabilidade
das populações (testes não paramétricos) ou sobre parâmetros
específicos, tais como a média, desvio padrão ou a proporção (testes
paramétricos).

1
28/09/2022

Testes de Hipóteses

H0, hipótese nula que afirma que não há diferença, ou alteração, nos
parâmetros da população

H1, hipótese alternativa que reflecte a existência de uma diferença ou


alteração

A soma da probabilidade associada à Hipótese nula com a Hipótese


alternativa é 1 (ou 100%).
Os procedimentos que nos permitem decidir sobre a validade ou
rejeição de uma hipótese são designados por testes de hipóteses.

Testes de Hipóteses

Testes de hipóteses
Frequentemente é necessário tomar decisões fundamentadas sobre
populações com base na análise estatística de amostras (i.e., partes das
populações com maior ou menor representatividade).

São utilizados para avaliar estatisticamente duas hipóteses considerando


um nível de certeza 1-α, onde α designa o nível de significância (os mais
comuns são 1 e 5%).

Frequentemente, o formalismo é simplificado sem indicação das etapas


dos testes de hipótese, considerando-se simplesmente a conclusão
relativamente à aceitação ou rejeição da hipótese nula. (o que foi
realizado anteriormente)

2
28/09/2022

Testes de Hipóteses

TESTES DE HIPÓTESES (Etapas)

1. Formulação das hipóteses;

2. Escolha da estatística de Teste apropriada

3. Definição da zona de aceitação/rejeição

4. Calcular o valor do parâmetro;

5. Conclusão/Decisão

Testes de Hipóteses

Exemplo #1:
Embalagem de cereais pequeno almoço de peso líquido 500 g.
No contexto de um consumidor a respectiva preocupação é pagar 500 g e
receber uma quantidade inferior.

H0, hipótese nula µ = 500 g (afirmação da empresa é


verdadeira – não alteração)

H1, hipótese alternativa µ< 500 g (afirmação da empresa é


falsa – consumidores enganados)
ANO LECTIVO 2009/10 6

3
28/09/2022

Testes de Hipóteses
Exemplo #2: Uma máquina de produção de pacotes de açúcar. O peso
médio de cada pacote deverá ser 8 g (ou seja µ=8). Senão forem
controlados todos os pacotes de açúcar podemos afirmar que a máquina
está a funcionar bem?
Qualquer teste de hipóteses baseia-se sempre na formulação de duas
hipóteses:

H0, hipótese nula afirmação que não há diferença, ou alteração, nos


parâmetros da população (pacotes de açúcar produzidos)
H1, hipótese alternativa que reflecte a existência de uma diferença ou
alteração

Testes de Hipóteses
Unilateral direita:
• Ho:  = 8
• Ha:  > 8

Unilateral esquerda:
• Ho:  = 8
• Ha:  <8

Bilateral:
• Ho:  = 8
• Ha:   8

4
28/09/2022

Testes de Hipóteses

Exemplo #3: Numa localidade antes e depois de uma cimenteira iniciar o


processo de co-incineração de resíduos tóxicos (substituição de
combustível por resíduos), recolheram-se amostras de solo.
Antes de se iniciar o processo as análises realizadas para determinação
da concentração de dioxinas no solo durante um ano apresentam uma
distribuição normal de média e desvio padrão de 2,00 pg/(m2/dia) e 0,10
pg/(m2/dia), respectivamente. Uma série de quatro medições actuais
produziu como média amostral 2,13 pg/(m2/dia).
Hipótese: Será a diferença encontrada entre 2,13 e 2,00 estatisticamente
significativa? Ou seja, a co-incineração está a contribuir para aumentar a
concentração de dioxinas no solo?

Testes de Hipóteses

Será que a diferença entre a média da amostra (2,13) e o valor do


parâmetro (µ=2,00) não tem significado? sendo somente devida à
dispersão inerente ao próprio processo de amostragem aleatória: (H0)
– verdadeira,
… ou se essa diferença significa que a amostra já foi tirada de uma
população diferente (Ha) – verdadeira
Qualquer que seja a decisão tomada (aceitar ou rejeitar a hipótese nula
H0) existe sempre um risco de cometer um erro. As várias situações são
resumidas na tabela seguinte:

10

5
28/09/2022

Decisão correcta
“A coincineração não “A coincineração
Decisão através do teste de hipóteses
afecta a saúde dos afecta a saúde dos
habitantes” habitantes”
Rejeitar H0 ERRO tipo I Decisão correcta
(i.e., a coincineração altera a saúde Decisão incorrecta P=1–β
dos habitantes)
P=α
Aceitar H0 Decisão correcta ERRO tipo II
(i.e., a coincineração não altera a P=1–α Decisão incorrecta
saúde dos habitantes)
P=β

A conclusão estabelecida após um teste de hipóteses não está isenta de erro. Podendo mesmo
considerar-se duas possibilidades de obter a conclusão errada. A probabilidade de rejeitar a
H0 estando esta correcta, se assumirmos um nível de significância (i.e., α=0,05) é de 5% (i.e.,
tomamos uma decisão para um nível de certeza de 95%). A rejeição da H0 sendo esta
verdadeira é classificada como um ERRO tipo I. Porém, também é possível tomar a decisão
errada ao aceitar a H0 sendo esta errada, neste caso estamos a cometer um ERRO tipo II. A
probabilidade de cometer um ERRO tipo II é usualmente designada como β.

11

Interpretação do valor-p nos testes de hipótese estatísticos


Um valor p menor significa que há evidências mais fortes a favor da
hipótese alternativa, nomeadamente quando valor-p <<< α é uma
indicação cada vez mais forte em favor da hipótese alternativa.

Um valor p maior significa que há evidências mais fortes em favor


da hipótese nula, nomeadamente quando valor-p >>> α é uma
indicação cada vez mais forte em favor da hipótese nula.
Se α = 0,05
Hipótese Alternativa prevalece

Hipótese Nula prevalece

12

6
28/09/2022

Interpretação do valor-p nos testes de hipótese estatísticos

Valor p calculado Interpretação


p > 0,05 Não significativo
p ≤ 0,05 Significativo
p ≤ 0,01 Muito significativo
p ≤ 0,001 Extremamente significativo
Quanto menor for o valor-p maior a certeza para rejeitar H0, pois o valor-p estima o nível de
significância mínimo que pode ser considerado na rejeição da H0 (ou seja aumenta a certeza).
Por isso em muitos artigos científicos são apresentados os valor-p quando se pretende
garantir em termos de conclusões que os resultados experimentais em 2 contextos são
diferentes.

13

Interpretação do valor-p nos testes de hipótese estatísticos

14

7
28/09/2022

Referência avaliação do valor-p (distribuição Normal)

15

Testes de Hipóteses

Para que uma decisão fiável seja tomada através de um teste de


hipótese é necessário minimizar os erros de decisão (i.e., erros
tipo I ou II).
Este não é um problema simples resolução porque para uma
dada dimensão de amostra a tentativa de diminuir um
determinado tipo de erro pode incrementar outro.
Assim, a única forma de reduzir ambos os tipos de erro é
através do aumento da dimensão da amostra, o que nem
sempre é possível ou viável.

16

8
28/09/2022

Testes de Hipóteses

Nível de Significância - α
Ao testar uma dada hipótese, a probabilidade máxima de
ocorrer um erro do Tipo I (H0 rejeitada sendo verdadeira)
designa-se por nível de significância do teste.
Em geral, esta probabilidade é especificada antes da amostra
ser extraída da população, desta forma os resultados obtidos
não influenciarão a nossa decisão.
Na prática são comuns níveis de significância de 0,05 ou 0,01
(5% e 1%) os quais corresponde a certeza estatística de 95% e
99%. Não esquecer que podemos ter testes unilaterais e
bilaterais.

17

1º Passo – Formulação das hipóteses


A hipótese alternativa Ha reflecte uma suspeita que se aceitará como
verdadeira no caso de haver razões para rejeitar H0. Neste caso teremos:

H a :  8
Pacotes Açucar

Hipótese alternativa unilateral

H a :  8 (à direita - superior ou esquerda - inferior)

Hipótese alternativa bilateral


Ha :   8
(two-tailed test)
Coincineração

A média da população Notar que não faz sentido


H a :   2,00 é superior a 2,00
considerar que o valor da
concentração das dioxinas
pg/(m2/dia) foi reduzido depois da co-
incineração iniciar-se

18

9
28/09/2022

Testes de Hipóteses

2º Passo – Escolha da estatística do teste apropriada


Será necessário usar uma variável aleatória (estatística) através da qual
seja possível decidir a aceitação ou não da hipótese nula formulada.
A escolha da variável é condicionada pelos dados que se dispõe e pelo
teste que se pretende efectuar.

Exemplo Coincineração: a população X apresenta uma distribuição


normal N:

x;   2,00;  0,10

19

Testes de Hipóteses

Assim, assumindo que Ho é verdadeira, as médias amostrais


de dimensão 4 retiradas da população terão uma Distribuição
normal N:  _ 0,10 
 x;   2,00;   
 4  _
Neste contexto a estatística a usar é X (estimador do
parâmetro sobre o qual se está a inferir), ou a variável Z
relacionada que apresenta uma distribuição normal padrão

_
_
X  2,00
X Z
Z 0,10

n 4
20

10
28/09/2022

Testes de Hipóteses

3º Passo – Definição de uma zona de aceitação/rejeição


Será necessário usar um critério para aceitar ou rejeitar a hipótese
nula. Se o valor desta variável, determinado para a amostra analisada,
pertencer a uma região de aceitação (RA), não se rejeita H0.

Se, por outro lado, tal valor cair numa região de rejeição ou crítica,
considera-se que já há razão suficientemente forte para rejeitar H0.

A definição destas regiões depende do tipo de teste efectuado


(unilateral ou bilateral) e do erro máximo do tipo I que se pretende
cometer.

21

Testes de Hipóteses

Tipos de testes de hipóteses, sinais na hipótese nula e alternativa e


posicionamento na região crítica
Teste Teste unilateral Teste unilateral
Bilateral à direita à esquerda
Sinal na H0

Sinal na Ha

Região Crítica Em ambos os à direita à esquerda


lados

22

11
28/09/2022

Testes de Hipóteses

H0 é aceite

Bilateral

23

Testes de Hipóteses
Região de aceitação

0,025 0,025
0,95

z  1,96 z  1,96
Tabelado (0,975)

24

12
28/09/2022

Testes de Hipóteses
O valor pode retirar-se da tabela da distribuição normal padrão: N z;   0;   1
com base na variável relacionada Z. Considerando um nível de
significância de 0,05 o valor crítico de Z é:

z c  1,645 _
Obtido na tabela da Distribuição Normal padrão para
XF(z)=0,95
 2,00 UNILATERAL
Z
0,10
4
_ 
X  2,00 xc  2,00 
Z zc  x c  2,08
0,10 0,05
4

25

Testes de Hipóteses

Nível de significância 0,05 1  F Z 


2,13 2,60 , ,
𝑍= , =2,60

Distribuição Normal Distribuição Normal padrão

(com valor médio definido) (após “padronização” – Tabela)

RA – Região aceitação RC – Região crítica

26

13
28/09/2022

Testes de Hipóteses

Resumo da tabela Distribuição Normal (testes de hipóteses vs nível de


significância

Nível de
0,10 0,05 0,01 0,005
Significância ()

-1,282 -1,645 -2,326 -2,576


Valores críticos z
ou ou ou ou
(testes unilaterais)
1,282 1,645 2,326 2,576

-1,645 -1,960 -2,576 -2,810


Valores críticos z
e e e e
(testes bilaterais)
1,645 1,960 2,576 2,810

27

Testes de Hipóteses

4º Passo – Conclusão/Decisão 

No caso do Exemplo #2 temos: x 0  2 ,13 está . em .2 , 08 ,  


Diz-se que este valor é significativo, permitindo concluir que a decisão
de rejeitar a hipótese nula envolverá um erro de tipo I (rejeitar
hipótese nula sendo verdadeira) nunca superior a 5%.

Ou seja, o desvio de 0,13 entre o valor da média neste teste e a suposta


média da população é já significativamente elevado (a um nível de
significância de 5%) para atribuí-lo somente ao acaso.
Há razões para concluir que a taxa de dioxinas aumentou depois da
co-incineração.

28

14
28/09/2022

Testes de Hipóteses
Significado estatístico do valor-p e do nível de significância
Os valores críticos obtidos através da consulta de tabelas (ou através do
Excel) marcam o limite à esquerda para os valores calculados que
permitem manter a H0 (i.e., Valor calculado < Valor tabelado (ou
crítico)). Por oposição, à direita teremos os valores que determinam a
rejeição da H0 (i.e., Valor calculado > Valor tabelado (ou crítico)). Assim,
quando temos α=o,05 (i.e., nível de significância a 5%, o mais comum)
corresponde a ter um valor de Zcrítico que deixa 95% da área à esquerda e
5% à direita (para teste de hipótese unilateral à direita). Ou seja, a área à
esquerda de Zcrítico terá probabilidade de 95% ou o valor obtido por
consulta na tabela (p.e., Zcrítico =2,00 corresponde a 0,9772 ou seja, valor-
p = 1-0,9772 = 0,0228)

29

Valor-p no contexto dos testes de hipóteses

30

15
28/09/2022

Testes de Hipóteses
Assim, quanto menor for o valor-p significa que maior é a certeza na
rejeição H0 sendo falsa. Por exemplo, num teste de hipótese no qual
α=0,05 se o valor-p < α rejeitamos a hipótese nula, pois significa que a
probabilidade à esquerda de Zcrítico é inferior a 95%. Mas se valor-p > α
então a probabilidade à esquerda de Zcrítico é superior a 95% (i.e.,
exactamente 1-valor-p).

Reduzir a área de exclusão


corresponde a aumentar a certeza de
0,9500 para 0,9772

31

Testes de Hipóteses

Na maior parte das situações que iremos considerar, a Hnula


(H0) será uma afirmação de que um parâmetro populacional
tem um valor especificado e que Halternativa (Ha) poderá ser:
(i) O valor do parâmetro é superior ao valor estabelecido
(Teste unilateral à direita);
(ii) O valor do parâmetro é inferior ao valor estabelecido
(Teste unilateral à esquerda);
(iii) O valor do parâmetro é superior ou inferior (Teste
Bilateral).

32

16
28/09/2022

Testes de Hipóteses
P-Valor (outro exemplo)
Se população:
desvio padrão = 3;
média = 12

Se amostra:
dimensão = 36;
média amostral = 12,95

Temos que o P-Valor para o teste depende da Ha: ...

33

Testes de Hipóteses

P-Valor
Temos que o P-Valor para o teste depende da Ha: ...
Caso (i) H a :  12

O P-Valor é a probabilidade de uma amostra com dimensão 36


ter uma média amostral de 12,95 ou superior; sendo a
verdadeira média (da população)12:
Consulta da tabela
𝑷 𝒁 ≥ 𝟏, 𝟗 = 𝟏 − 𝟎, 𝟗𝟕𝟏𝟑 = 𝟎, 𝟎𝟐𝟖𝟕 dist Normal
F(Z)=1,9;
Ou seja, a probabilidade que a média da amostra seja superior
a 12,95 sendo a média da população 12 é cerca de 3% (i.e., p-
value < α).
34

17
28/09/2022

Testes de Hipóteses

P-Valor
Temos que o P-Valor para o teste depende da Ha: ...

Caso (ii) H a :  12


O P-Valor é a probabilidade de uma amostra com dimensão 36
dar uma média amostral de 12,95 ou inferior se a verdadeira
média fosse 12:

𝑷 𝒁 ≤ 𝟏, 𝟗 = 𝟎, 𝟗𝟕𝟏𝟑
Ou seja, a probabilidade que a média da amostra seja inferior
ou igual a 12,95 sendo a média da população 12 é cerca de 97%.

35

Testes de Hipóteses
P-Valor
Temos que o P-Valor para o teste depende da Ha: ...
Caso (iii) H a :   12 12,95-12=0,95

O P-Valor é a probabilidade de uma amostra com dimensão 36


obter uma média amostra com 0,95 unidades de diferença da
verdadeira média fosse 12, ou seja superior a 12,95 ou inferior
a 11,05:
P Z  1,9   P Z  1,9   2  1  0,9713   0,057
_
x  12  0,95 sendo a média da população 12, os valores da
média da amostra fora é cerca de 6%

36

18
28/09/2022

Testes de Hipóteses

P-Valor – Resumo para α=0,05

Caso (i) P-Valor de 0,0287 é um indicador forte que a média


populacional é superior a 12 (rejeita H0);
Caso (ii) P-Valor de 0,9713 sugere fortemente que H0=12 não
deve ser rejeitada em favor da Ha :12;
Caso (iii) P-Valor de 0,0574 determina que rejeitar H0 em
favor de Ha:12 apresenta uma probabilidade inferior à do
caso (ii) (i.e., 0,9426)

37

19

Você também pode gostar