Você está na página 1de 65

Estatı́stica Aplicada à Engenharia I

Intervalo de Confiança

Eliardo G. Costa

Departamento de Estatı́stica - UFRN


Parte I

0
Intervalo de Confiança

ˆ Uma estimativa não fornece por si mesma qualquer


informação sobre a precisão e confiabilidade da estimativa;

ˆ Considere o uso de X n para estimar a altura média dos


estudantes de Engenharia (µ);

ˆ Devido à variabilidade da amostragem, virtualmente


nunca é o caso de x n = µ.

1
Intervalo de Confiança

ˆ A estimativa pontual não diz nada sobre o quanto pode


estar próximo de µ;

ˆ Uma alternativa à estimação pontual é obter um intervalo


de valores plausı́veis;

ˆ Uma estimativa intervalar, também chamada de intervalo


de confiança (IC).

2
Intervalo de Confiança

ˆ Um IC sempre é calculado fixando-se um nı́vel de


confiança;

ˆ Nı́vel de confiança é uma medida do grau de


confiabilidade do intervalo;

ˆ Um IC com nı́vel de confiança de 95% para µ pode ser


(1.65, 1.70);

ˆ Com nı́vel de confiança 95%, qualquer valor de µ entre


1.65 e 1.70 é plausı́vel.

3
Intervalo de Confiança

ˆ Confiança de 95% implica que 95% de todas as amostra


forneceriam um intervalo que inclui µ;

ˆ 5% de todas as amostra dariam um intervalo errôneo;

4
Intervalo de Confiança

ˆ Suponha que o parâmetro de interesse é µ, altura média


dos estudantes de Engenharia;

ˆ Seja X1 , . . . , Xn uma amostra aleatória de uma normal


com E [Xi ] = µ e Var [Xi ] = σ 2 , i = 1, . . . , n;

ˆ Nesse sentido, X n = n−1 ni=1 Xi segue uma distribuição


P
   
normal com E X n = µ e Var X n = σ 2 /n.

5
Intervalo de Confiança

ˆ Consequentemente,

Xn − µ
Z= √
σ/ n
segue uma normal com E [Z ] = 0 e Var [Z ] = 1;

ˆ Para uma normal padrão a probabilidade entre -1.96 e


1.96 é 0.95, ou seja
 
Xn − µ
P −1.96 < √ < 1.96 = 0.95
σ/ n

6
Intervalo de Confiança

ˆ Manipulando a desigualdade na probabilidade temos que


 
σ σ
P X n − 1.96 √ < µ < X n + 1.96 √ = 0.95;
n n

ˆ Assim, o IC de 95% é dado por


 
σ σ
X n − 1.96 √ , X n + 1.96 √ .
n n

7
Intervalo de Confiança

ˆ O intervalo anterior é aleatório pois suas extremidades são


variáveis aleatórias;

ˆ A amplitude do intervalo é 2 × 1.96 √σn que não é


aleatório, a posição do intervalo (centro X n ) é aleatória;

ˆ A precisão de uma estimativa intervalar é transmitida pelo


seu comprimento.

8
Intervalo de Confiança

9
Intervalo de Confiança

ˆ Podemos dizer então: “a probabilidade de que o intervalo


aleatório acima inclua o valor real de µ é 0.95”;

ˆ Antes que qualquer dado seja coletado, é bastante


provável (= 0.95) que o intervalo contenha µ;

ˆ A interpretação da confiança baseia-se na interpretação


frequentista da probabilidade.

10
Intervalo de Confiança

ˆ Dizer que P [A] = 0.95, significa dizer que, a longo prazo,


se o experimento for repetido várias vezes, em 95% das
vezes A ocorrerá;

ˆ Ver animação sobre IC neste link!

11
Intervalo de Confiança

ˆ O nı́vel de confiança 95% veio da probabilidade 0.95

ˆ Para uma confiança de 99% a probabilidade seria 0.99;

ˆ Neste caso substituirı́amos 1.96 por 2.57 no intervalo


anterior.

12
Intervalo de Confiança

ˆ De forma geral, para uma confiança 100(1 − α)% a


probabilidade deve ser 1 − α;

ˆ Devemos então determinar zα/2 tal que


 
P −zα/2 < Z < zα/2 = 1 − α,

em que Z é uma normal padrão.

13
Intervalo de Confiança

14
Intervalo de Confiança

ˆ Um IC de confiança 100(1 − α)% para a média µ de uma


população normal (σ conhecido) é dado por
 
σ σ
X n − zα/2 √ , X n + zα/2 √ .
n n

15
Intervalo de Confiança

Exemplo: O processo de produção de caixas de controle de


um tipo especı́fico de motor foi modificado recentemente.
Antes da modificação, os dados históricos sugeriam que a
distribuição dos diâmetros do orifı́cio dos mancais eram
normais, com um desvio padrão de 0.1 mm.

Acredita-se que a modificação não tenha afetado o formato da


distribuição ou o desvio padrão, mas que o valor do diâmetro
médio possa ter mudado.

16
Intervalo de Confiança

Exemplo (cont.): Uma amostra de 40 caixas é selecionada e


o diâmetro do orifı́cio é determinado para cada uma,
resultando em um diâmetro médio da amostra de 5.426 mm.

Obtenha intervalos de confiança com nı́veis de 90%, 95% e


99%.

17
Intervalo de Confiança

ˆ Neste caso, n = 40, x 40 = 5.426 e σ = 0.1;

ˆ Para 90% de confiança 1 − α = 0.90 ⇒ α = 0.10;

ˆ Logo zα/2 = z0.10/2 = 1.64;

ˆ O IC é dado então por


 
0.1 0.1
5.426 − 1.64 √ , 5.426 + 1.64 √ = (5.400, 5.452)
40 40

18
Intervalo de Confiança

ˆ Para 95% de confiança 1 − α = 0.95 ⇒ α = 0.05;

ˆ Logo zα/2 = z0.05/2 = 1.96;

ˆ O IC é dado então por


 
0.1 0.1
5.426 − 1.96 √ , 5.426 + 1.96 √ = (5.395, 5.457)
40 40

19
Intervalo de Confiança

ˆ Para 99% de confiança 1 − α = 0.99 ⇒ α = 0.01;

ˆ Logo zα/2 = z0.01/2 = 2.57;

ˆ O IC é dado então por


 
0.1 0.1
5.426 − 2.57 √ , 5.426 + 2.57 √ = (5.385, 5.467)
40 40

20
Intervalo de Confiança

Exemplo: Considere os dados dos estudantes. Obtenha


intervalos de confiança com nı́veis de 90%, 95% e 99% para a
altura média dos estudantes, considerando σ = 0.09 para as
alturas e normalidade para as respectivas observações.

21
Fim

21
Parte II

21
Intervalo de Confiança

ˆ Continuamos como na última aula obtendo IC para a


média µ associada a uma quantidade de interesse;

ˆ O modelo da última aula é X1 , . . . , Xn segue uma normal


com parâmetros µ e σ 2 ;

ˆ µ é o parâmetro de interesse, σ 2 tı́nhamos assumido ser


conhecido;

ˆ Na prática, o valor de σ 2 (ou σ) em geral não é conhecido;

22
Intervalo de Confiança

ˆ Nesse sentido, no lugar de σ 2 usamos o seu estimador


natural n
2 1 X
S = (Xi − X n )2 ,
n − 1 i=1
e para σ usamos
v
u n
u 1 X
S= t (Xi − X n )2 .
n − 1 i=1

23
Intervalo de Confiança

ˆ O objetivo é construir um IC para µ mas considerando σ


desconhecido;

ˆ Usamos a mesma padronização anterior de X n mas


substituindo σ por S, ou seja

Xn − µ
T = √
S/ n

24
Intervalo de Confiança

ˆ Quando substituı́mos σ por S a distribuição associada não


é mais a normal padrão;

ˆ Neste caso,
Xn − µ
T = √
S/ n
segue uma distribuição t-Student com parâmetro igual a
n − 1 (graus de liberdade).

25
Intervalo de Confiança

ˆ A função densidade da t-Student com parâmetro ν é


− ν+1
Γ ν+1
 
2 t2 2
f (t) = √ ν
 1+ , t ∈ R;
νπΓ 2 ν

ˆ Quando ν → ∞ a t-Student se aproxima da normal


padrão.

26
Intervalo de Confiança

27
Intervalo de Confiança

ˆ Então, para uma t-Student com ν = n − 1


 
Xn − µ
P −t 2 ,n−1 <
α √ < t 2 ,n−1 = 1 − α;
α
S/ n

ˆ Manipulando a expressão acima temos que


 
S S
P X n − t α2 ,n−1 √ < µ < X n + t α2 ,n−1 √ = 1 − α
n n

28
Intervalo de Confiança

ˆ Um IC de confiança 100(1 − α)% para a média µ de uma


população normal (σ desconhecido) é dado por
 
S S
X n − t α2 ,n−1 √ , X n + t α2 ,n−1 √ .
n n

29
Intervalo de Confiança

Exemplo: Uma amostra de n = 8 espécimes de teste de certo


tipo de fibra de vidro produziu força do rendimento de corte
com média amostral de 30.2 e desvio padrão amostral 3.1.
Assumindo normalidade para as observações obtenha um IC de
95% para a força média real.

30
Intervalo de Confiança

ˆ Para 95% de confiança 1 − α = 0.95 ⇒ α = 0.05;

ˆ Neste caso ν = n − 1 = 8 − 1 = 7 ⇒ t0.025,7 = 2.36;

ˆ O IC é dado então por


 
3.1 3.1
30.2 − 2.36 √ , 30.2 + 2.36 √ = (27.61, 32.79);
8 8

ˆ Ver Script R!

31
Intervalo de Confiança

Exemplo: Considere os dados dos estudantes. Obtenha


intervalos de confiança com nı́veis de 90%, 95% e 99% para a
altura média dos estudantes, considerando σ desconhecido e
normalidade para as respectivas observações.

32
Intervalo de Confiança

Exemplo: Em um estudo do comportamento de painéis de


revestimento, considere as observações sobre o módulo de
elasticidade (MPa) obtidas 1 minuto depois da aplicação de
carga. Assumindo normalidade para as observações obtenha
um IC de 95% para o módulo de elasticidade média.

Ver Script R!

33
Intervalo de Confiança

Exemplo: Considere um experimento com testes trativos de


adesão em 22 corpos-de-prova de liga U-700, com observações
da carga no ponto de falha (megapascal). Assumindo
normalidade para as observações obtenha um IC de 99% para
a carga média no ponto de falha.

Ver Script R!

34
Intervalo de Confiança

ˆ Os IC’s para µ abordados anteriormente assumiam a


distribuição normal para as observações;

ˆ Se relaxarmos a suposição de normalidade ainda podemos


obter um IC se n for grande;

ˆ A obtenção deste IC é baseada no Teorema do Limite


Central (TLC).

35
Intervalo de Confiança

ˆ Seja X1 , . . . , Xn uma amostra aleatória de uma população


com E [Xi ] = µ e Var [Xi ] = σ 2 ;

ˆ Basicamente o TLC diz que

Xn − µ

σ/ n
converge (em distribuição) para uma normal padrão
quando n → ∞;

ˆ Ver animação neste link!

36
Intervalo de Confiança

ˆ Substituindo σ por S na expressão anterior ainda temos a


convergência para a normal padrão;

ˆ Isso se deve a convergência (em probabilidade) de S para


σ quando n → ∞;

ˆ Nesse sentido,
Xn − µ
T = √
S/ n
também converge para normal padrão quando n → ∞.

37
Intervalo de Confiança

ˆ Assim, para n grande, um IC aproximado para a média µ


é dado por
 
S S
X n − zα/2 √ , X n + zα/2 √ ;
n n

38
Intervalo de Confiança

Exemplo: Uma amostra de 110 relâmpagos em certa região


resultou em uma duração média do eco do radar de 0.81
segundos e desvio padrão de 0.34 segundos. Obtenha um IC
de 99% para a duração média real do eco.

39
Intervalo de Confiança

ˆ Para 99% de confiança 1 − α = 0.99 ⇒ α = 0.01;

ˆ Logo zα/2 = z0.01/2 = 2.57;

ˆ O IC é dado então por


 
0.34 0.34
0.81 − 2.57 √ , 0.81 + 2.57 √ = (0.727, 0.893);
110 110

ˆ Ver Script R!

40
Intervalo de Confiança

Exemplo: Em um estudo para investigar a contaminação por


mercúrio de uma espécie de peixe, uma amostra de peixe foi
selecionada de cada um de 53 lagos e mediu-se a concentração
(em ppm) de mercúrio no tecido muscular. Obtenha um IC de
95% para a concentração média real de mercúrio.

Ver Script R!

41
Fim

41
Parte III

41
Intervalo de Confiança

ˆ Suponha que estamos interessados na proporção (em uma


população) de:
1. pessoas com uma determinada doença;
2. eleitores de uma candidato em uma eleição;
3. pessoas do sexo feminino;
4. pessoas que fumam;

ˆ Seja p a proporção de “sucessos” em uma população;

ˆ “sucesso” identifica um indivı́duo ou objeto que tenha


uma propriedade especificada.

42
Intervalo de Confiança

ˆ Dada uma amostra de tamanho n, contamos o nº de


vezes que observamos o “sucesso”;

ˆ Seja X o nº de vezes que observamos a caracterı́stica na


amostra de tamanho n;

ˆ Podemos modelar X através de uma distribuição binomial


com parâmetros n e p.

43
Intervalo de Confiança

ˆ Um estimador natural para p é a proporção amostral


X
p=
b ;
n

ˆ Para esse estimador temos que


p(1 − p)
E [b
p] = p e Var [b
p] = .
n

44
Intervalo de Confiança

ˆ Se p não estiver próximo de 0 ou 1, e n for


grande, então
p−p
b
Z=q
p(1−p)
n

segue aproximadamente uma normal padrão;

45
Intervalo de Confiança

ˆ Dessa forma temos que


 
p−p
P −zα/2 < q < zα/2  ≈ 1 − α;
b
p(1−p)
n

ˆ Manipulando a expressão anterior temos que


" r r #
p(1 − p) p(1 − p)
P bp − zα/2 <p<b p + zα/2 ≈ 1−α.
n n

46
Intervalo de Confiança

ˆ Note que nas extremidades ainda temos quantidade


desconhecida (p) que substituı́mos por b
p;

ˆ Assim temos que


" r r #
p (1 − b
p) p (1 − b
p)
p − zα/2 ≈ 1−α.
b b
P b <p<b
p + zα/2
n n

47
Intervalo de Confiança

ˆ Assim, um IC com nı́vel de confiança de 100(1 − α)% é


r r !
p (1 − b
p) p (1 − b
p)
p − zα/2
b b
b , b
p + zα/2 .
n n

48
Intervalo de Confiança

Exemplo: Em uma amostra de 85 mancais de eixos de


manivelas de motores de automóveis, 10 têm um acabamento
de superfı́cie que é mais rugoso do que o permitido. Obtenha
um IC de 95% para proporção real de mancais que estão fora
da especificação.

49
Intervalo de Confiança

ˆ Para 95% de confiança 1 − α = 0.95 ⇒ α = 0.05;

ˆ Logo zα/2 = z0.05/2 = 1.96;

ˆ n = 82 e x = 10 ⇒ b
p = 10/85 = 0.12;

ˆ O IC é dado então por


r r !
0.12 × 0.88 0.12 × 0.88
0.12 − 1.96 , 0.12 + 1.96
85 85

(0.05, 0.19)

50
Intervalo de Confiança

Exemplo: Em uma pesquisa eleitoral, 770 pessoas foram


consultadas quanto a intenção de voto, dos quais 412
votariam no candidato A. Obtenha um IC de 99% para a
proporção real de intenção de votos no candidato A.

51
Intervalo de Confiança

ˆ Para 99% de confiança 1 − α = 0.99 ⇒ α = 0.01;

ˆ Logo zα/2 = z0.01/2 = 2.57;

ˆ n = 770 e x = 412 ⇒ b
p = 412/770 = 0.53;

ˆ O IC é dado então por


r r !
0.53 × 0.47 0.53 × 0.47
0.53 − 2.57 , 0.53 + 2.57
770 770

(0.49, 0.58)

52
Intervalo de Confiança

Exemplo: Considere os dados dos estudantes. Obtenha um


IC de 95% para a proporção real de estudantes que fumam.

Ver Script R!

53
Intervalo de Confiança

ˆ Se não for possı́vel fazer suposições sobre o modelo para


as observações ou sobre o tamanho amostral n, uma
alternativa é usar o método bootstrap;

ˆ Uma maneira simples de estabelecer um IC através do


bootstrap é usar os quantis calculados das estimativas
obtidas da reamostragem;

54
Intervalo de Confiança

ˆ Suponha que o parâmetro de interesse é θ;

ˆ Suponha que observamos uma amostra aleatória

x1 , x2 , . . . , xn

ˆ Considere um estimador θb = θ(x


b 1 , . . . , xn ) do parâmetro θ.

55
Intervalo de Confiança

ˆ Usando um computador obtemos “amostras do


bootstrap”;

ˆ Seja x = (x1 , x2 , . . . , xn ) a amostra observada, então a


amostra bootstrap

x ∗ = (x1∗ , x2∗ , . . . , xn∗ )

é obtida de x através de amostra aleatória com reposição.

56
Intervalo de Confiança

ˆ Obtemos então B amostras bootstrap e para cada uma


calculamos µ
b
∗(1) ∗(1)
x1 , x2 , . . . , xn∗(1) ⇒ θb1∗
∗(2) ∗(2)
x1 , x2 , . . . , xn∗(2) ⇒ θb2∗
.. .. .. ..
. . . .
∗(B) ∗(B)
x1 ,x 2 , . . . , x ∗(B) ⇒ θb∗
n B

ˆ O IC de 100(1 − α)% de confiança para θ é dado pelos


quantis amostrais de probabilidades α/2 e 1 − α/2
obtidos de
θb1∗ , θb2∗ , . . . , θbB∗

57
Intervalo de Confiança

Exemplo: Considere os dados dos estudantes. Obtenha um


IC de 95% (pelo bootstrap) para a altura média real dos
estudantes e para a proporção real de estudantes que fumam.

Ver Script R!

58
Fim

58

Você também pode gostar