Você está na página 1de 40

6.

Princípios gerais da Inferência Estatística

1
• A inferência é feita basicamente de duas
formas:
– Estimação de parâmetros
• Estimativa Pontual: por exemplo a média ou proporção;
• Estimativa Intervalar: gama de valores que dá uma ideia
sobre a precisão da estimativa pontual;

– Testes de hipóteses

2
• Estimador : função que utilizamos para calcular
a estatística.

• Exemplo:

X=
 X i
Estimador da média
n
3
• Estimativa : valor do estimador calculado para
os valores observados.

4
• Com os estimadores pontuais, surgem
questões como:
– Qual a precisão desta estimativa?
– Será que uma estimativa obtida através de uma
amostra de 20 elementos tem a mesma precisão de
uma amostra com1000 elementos?

5
• Sabendo µ e σ:

• O intervalo que contém


os 95% valores centrais
dos valores da média
amostral , para
amostras de dimensão n:

6
• Significa que:
- se retirássemos amostras repetidas da mesma
população, 95% delas resultariam num valor de que
se encontraria naquele intervalo;
- a probabilidade de retirar uma amostra de dimensão n
com valor de que se encontre no intervalo
é de 0.95.

7
• Exemplo:
A distribuição das alturas de uma população é normal de
média igual a 160cm e desvio padrão igual a 100cm.

➢ Se retirássemos amostras repetidas de dimensão 25, 95% delas


resultariam num valor da média que estaria contida no intervalo
definido por:

8
➢ Se retirássemos uma amostra de dimensão 25
desta população, a probabilidade de a sua média
amostral ter um valor entre 120.8 e 199.2 é de 95%.

9
• De uma forma geral:

Para uma população de média µ e desvio padrão σ, (1-α)%


é a probabilidade de uma amostra de dimensão n ter um
valor de média contida no intervalo:

Na prática, desconhecemos a verdadeira média da população

10
• Novamente:

resolvendo agora em termos de µ aparece

11
• O que significa que se retirássemos amostras
repetidas da mesma população e construíssemos a
partir de cada uma delas um intervalo:

95% destes intervalos conteriam o valor da média da


população µ.

12
13
• De uma forma geral:

A partir de uma amostra aleatória de dimensão n e média

retirada de uma população,

(1- α)% é o grau de confiança que temos de que o intervalo:

contenha a verdadeira média da população, µ.

14
- o valor de z para o qual a área à direita é

15
• Significa que:

➢ diferirá de µ por menos de com uma probabilidade de 1 – α

➢ – µ é o erro que cometemos quando usamos para estimar µ,


sendo este erro menor que com uma probabilidade 1 – α

16
➢ o intervalo de confiança a (1- α)% para a verdadeira média da
população, µ é:

➢ A probabilidade 1- α é chamada o grau de confiança.

17
➢ faz inferências sobre os parâmetros da população.

➢ baseia-se muitas vezes na evidência conseguida


contra uma hipótese específica da população.

18
• Hipótese nula (H0);
• Hipótese alternativa (H1);
• Verifica se os resultados obtidos na amostra são
consistentes com a hipótese nula:
– Caso afirmativo: não se rejeita H0, não se pode afirmar H1;
– Caso negativo: rejeita-se H0, afirma-se H1;

19
Provar que um indivíduo é culpado

Hipótese: O indivíduo é inocente

A acusação tem de encontrar provas suficientes para provar


que o indivíduo não é inocente e rejeitar a hipótese de
inocência.

20
• Teste de hipótese
➢ Permite quantificar a rejeição de uma hipótese particular
i) assume que determinado parâmetro da população tem
determinado valor(es)
ii) verifica se os resultados obtidos na amostra são consistentes
com essa hipótese
iii) decide se a hipótese (pressuposto) sobre o parâmetro da
população, por exemplo, a média ou proporção, deve ou não
ser rejeitada

21
• Um teste de hipóteses relativo à média, parte do
pressuposto de que a média de uma população tem
um determinado valor.

• Esta hipótese sobre a média desconhecida da


população, µ, é testada a partir de uma amostra e
do valor da sua média .

22
• Exemplo:

• Um preparado farmacêutico foi administrado a 20 mulheres durante


algumas semanas, tendo sido registada a variação de peso neste
período.
Verificou-se que a alteração média do peso corporal foi de -1.1Kg.
A droga administrada tem como objectivo reduzir dores de cabeça.
➢ Será que esta droga tem um efeito significativo no peso corporal?

23
• Resolução através de teste de hipótese:

1º Passo: Descrever a questão a estudar em


termos de hipótese estatística

24
2º Passo: Escolher o nível de significância para o
teste estatístico

25
3º Passo: Decidir qual o teste apropriado para a hipótese
admitida

• Supondo que a amostra foi retirada de uma população em que


a variação de pesos segue a distribuição normal e é conhecido
σ = 2.8Kg.

➢ O teste apropriado é baseado na distribuição N(0,1):

26
4º Passo: Cálculo do valor observado

27
5º Passo: Valor tabelado

28
6º Passo: Conclusões

-1.96 1.96

-1.76

Como -1.76 pertence à região de não rejeição, não se rejeita H0.


Não existe evidência estatística de que a droga tenha um efeito
significativo na variação do peso, para α = 0.05.

29
• Muitas vezes é também usado o valor prova (valor -
p) para concluir num teste de hipóteses;
• Este valor- p é uma probabilidade;
– Probabilidade de obter um valor tão ou mais extremo do
que o valor observado sob a hipótese nula verdadeira;
– probabilidade de os dados concordarem com H0, sendo
H0 verdadeira;

30
Decisão baseada em Situação real
evidências H0 verdadeira H0 falsa

Rejeitar H0 Erro Tipo I Decisão correcta

Não rejeitar H0 Decisão correcta Erro Tipo II

31
• ERRO TIPO I – ocorre quando se rejeita H0,
sendo H0 verdadeira;

• A probabilidade de obter esse erro é designada


por α.

P(Rejeitar H0 | H0 verdadeir a ) = 
32
• ERRO TIPO II – ocorre quando não se rejeita
H0, sendo H0 falsa;

• A probabilidade de obter esse erro é designada


por β.

P(Não rejeitar H0 | H0 falsa ) = 


33
• Normalmente controla-se o erro do tipo I (nível
de significância);

• Poder do teste – habilidade de detectar


diferença quando ela existe;

P(Rejeitar H0 | H0 falsa ) = 1 - 

34
• Um teste de hipótese bilateral com um nível de
significância α pode ser efectuado a partir de um
intervalo de confiança a (1- α)%.

• Com um grau de confiança de (1- α)% é possível


rejeitar todas as H0 associadas a valores que estão
fora do intervalo.

35
• Optar pelo cálculo de Intervalos de Confiança ou Testes
de Hipóteses no processo inferencial depende do
objectivo do estudo e do que se pretende salientar:

➢ Intervalos de Confiança – dão mais ênfase à precisão da


estimativa através da amplitude do intervalo, qualquer
que seja a hipótese formulada.

36
➢ Testes de Hipóteses – verificam se a amostra é consistente
com o valor hipotético do parâmetro. Permitem calcular a
probabilidade de retirar uma amostra com valores tão
extremos ou mais extremos que os observados (valor-p) se a
H0 for verdadeira. O valor-p é uma medida da evidência com
que H0 é rejeitada.

37
• Testar a hipótese de a concentração de albumina no sangue
ser de 4g/dl, com base na amostra de 18 medições em que

= 3.75g/dl.

Hipótese estatística

38
• O intervalo de confiança a 95% para a verdadeira média de
albumina no sangue da qual a amostra foi retirada é (3.32, 4.18).

• Como o valor 4 está contido no intervalo não se pode rejeitar a


hipótese de esta concentração ser possível, para α = 0.05.

• Conclusão: Não se pode afirmar que a concentração de


albumina no sangue de onde foi retirada a amostra é
significativamente diferente de 4g/dl.

39
40

Você também pode gostar