Escolar Documentos
Profissional Documentos
Cultura Documentos
APOLITECNICA
Introdução
A maioria dos trabalhos em estatística é realizada com o uso de amostras aleatórias extraídas de uma
população, na qual se deseja fazer um determinado estudo.
A parte da estatística que procura deduzir informações relativas a uma população, mediante a utilização de
amostras dela extraídas, é denominada Inferência Estatística.
Um dos problemas da estatística é a estimativa de parâmetros populacionais (média, variância, proporção, etc),
mediante o uso de uma estatística amostral (média amostral, variância amostral, proporção amostral, etc).
A estimação é o processo que consiste em utilizar dados amostrais para estimar (ou prever) os valores de
parâmetros populacionais desconhecidos.Exemplo: A duração de vida media de um laptop de marca HP, Salário
médio dos funcionarios da LAM, etc
Estimativa Pontual
É a estimativa de um parâmetro populacional dada por um único número. Na estimativa pontual, raramente os
estimadores estatísticos coincidem com os valores populacionais. Assim, é importante delimitar a faixa de valores
onde o parâmetro populacional deve ser procurado. Isso ocorre através das estimativas intervalares.
T f ( X1 , X 2 , , X n )
Temos então alguns estimadores pontuais:
1 n
X Xi a média da amostra
n i 1
1 n
S
2
n 1 i1
( X i X ) 2 a variância da amostra
Exemplo 1: Sejam, p: proporção de alunos da que foram ao teatro pelo menos uma vez no último mês, e X:
número de estudantes que respondem “sim” em uma pesquisa com n entrevistados. Suponha que foram
entrevistados n = 500 estudantes e que, desses 100 teriam afirmado que foram ao teatro pelo menos uma vez no
último mês. A estimativa pontual (proporção amostral) para p é dada por:
100
pˆ 0,20
500
ou seja, 20% dos estudantes entrevistados afirmaram que foram ao teatro pelo menos uma vez no último mês.
Note que, outra amostra de mesmo tamanho pode levar a uma outra estimativa pontual para p.
Estimativa Intervalar
Essa estimativa consiste em uma amplitude (ou um intervalo) de valores, no qual se admite esteja o parâmetro
populacional.
Intervalo de Confiança
Um intervalo de confiança dá um intervalo de valores, centrado na estatística amostral, no qual julgamos, com um
risco conhecido de erro (ou nível de confiança), estar o parâmetro da população.
Quando utilizamos dados amostrais para estimar uma média populacional , a margem de erro (e – erro máximo
da estimativa) é a diferença máxima provável (com probabilidade 1 - ) entre a média amostral observada x e a
verdadeira média populacional . Assim:
conhecido: x z xz ;
n n
s s
desconhecido e n grande (n>30): x z xz
n n
s
E= z então, x E x E
n
s s N n
Onde, ( x ) quando População Infinita e ( x ) quando a População Finita
n n N 1
A forma da distribuição t é bastante parecida com a normal. A principal diferença entre as duas distribuições é que
a distribuição t tem maior área nas caudas. Isto significa que, para um dado nível de confiança, o valor t será um
pouco maior que o correspondente valor z.
I. A distribuição t aproxima-se da distribuição normal à medida que “n” aumenta. Para n > 30 as diferenças são tão
pequenas que podemos utilizar os valores críticos z;
II. A distribuição t tem a mesma forma geral simétrica (forma de sino) que a distribuição normal, mas reflete a maior
variabilidade (com distribuições mais amplas) que é esperada em pequenas amostras.
Há casos em que se está mais interessado na variância do que na média da amostra. Por exemplo, em filas de
espera. Mesmo conhecendo-se o tempo médio de espera, a informação do grau de variabilidade deste tempo é
importante. A distribuição usada neste caso é conhecida como Distribuição Qui-Quadrado, definida como:
(n 1) s 2
2
2
A função densidade de probabilidade é apresentada na Figura 1, como função do grau de liberdade, e
calculada por:
2
1 1
f ( 2 ) ( 2 ) 2 e 2
para 0 < 2 < ∞
2 ( )
2
2
A distribuição de probabilidade da distribuição qui-quadrado é dada por:
2
1 1
P( i2 ) P( 2 i2 ) ( d ( 2 )
2 2 2
) e
2 2 ( )
2
Devido à dificuldade de se calcular esta integral, tabelas são dadas em anexo para P( 2 ). Se
P( 2 i2 ) =0.95, então P( 2 i2 ) =0.05. Para o caso de ν=6, tem-se:
0.05 P( 2 1.635)
0.95 P( 2 12.592)
Assim, tem-se que há 90% (95 - 5) de probabilidade de 2 estar entre 1,635 e 12,592.
(n 1) s 2 (n 1) s 2
Formula para intervalo de confiança para uma Variância: 2
2 2
(1 ) ( )
2 2
Intervalo de Confiança para Proporções
Seja a estatística a proporção de “sucessos” em uma amostra de tamanho n 30 extraída de uma população
binomial. Se: n 30; n p 5 e n q 5
pˆ (1 pˆ )
Como: E Z para População Infinita e
n
pˆ (1 pˆ ) N n
E para População Finita
n N 1
pˆ (1 pˆ ) pˆ (1 pˆ )
Então: pˆ E P pˆ E ou pˆ Z P pˆ Z
n n
P – proporção de sucessos na população;
p̂ – proporção de sucessos na amostra;
z – número de desvios padrões utilizando a distribuição normal;
(1- p̂ ) = q : proporção de fracassos na amostra;
n – tamanho da amostra;
N – tamanho da população.
Exemplo 2: A altura dos alunos de uma academia apresenta uma distribuição aproximadamente normal. Para
estimar a altura média dessa população, foi observada a altura de 30 alunos, obtendo-se x =175 cm e s=15 cm.
Determine:
a) Um intervalo de confiança de 99% para a média populacional.
b) Um intervalo de confiança de 99% para a variância.
c) Um intervalo de confiança de 99% para o desvio-padrão populacional.
s
a) Para encontrarmos o erro, utilizamos a fórmula: E Z , pois n ≥ 30 e s .
n
15
E 2,575 7,05 .
30
Portanto, com 99% de confiança (λ), podemos dizer que a média populacional está entre 167,95 cm e 182,05 cm.
(n 1) s 2 (n 1) s 2
2 onde n 30 e s 15
(2 1 ) (2 2 )
1 1 0,99
1 0,005 (coluna na tabela 2 )
2 2
1 1 0,99
2 0,995 (coluna na tabela 2 )
2 2
Grau de liberdade=n-1=30-1=29 (linha na tabela 2 ) Logo, o valor de (2 1 ) =52,336.
Grau de liberdade=n-1=30-1=29 (linha na tabela 2 ) Logo o valor de (2 2 ) = 13,121.
.
Para encontrarmos um intervalo de confiança para a variância, utilizamos a fórmula:
(n 1) s 2 (n 1) s 2
2 onde n 30 e s 15
(2 1 ) (2 2 )
(2 1 ) 52,336 e (2 2 ) 13,121
(30 1) 152 (30 1) 152
2
52,336 13,121
124,68 2 497,29
Portanto, com 99% de confiança, podemos dizer que a variância populacional está entre 124,68 cm 2 e 497,29 cm2.
Para encontrarmos um intervalo de confiança para o desvio-padrão populacional, utilizamos a fórmula:
(n 1) s 2 (n 1) s 2
(2 1 ) (2 2 )
124,68 497,29
11,17 22,3
Portanto, com 99% de confiança, podemos dizer que o desvio-padrão populacional está entre 11,17 cm e
22,3 cm.
Exemplo 3: Uma amostra de tamanho 36 de uma população normal produz X =32,8 e s = 4,51. Construa um intervalo de
95% de confiança para a média populacional.
Dados : n 36 x 32,8 s 4,51 95% Z ( 0,975) 1,96
s s
x Z ( 0,975)
x Z ( 0,975)
n n
4,51 4,51
32,8 1,96 32,8 1,96
36 36
32,8 1,473267 32,8 1,473267
Logo, pela tabela da distribuição Normal Padrão, temos que z é tal que ф(z)=0,975, portanto, z =1,96.
pˆ (1 pˆ ) pˆ (1 pˆ )
pˆ Z P pˆ Z
n n
Exemplo 5. Foram seleccionados aleatoriamente e pesquisados 500 universitários. Verificou-se que 150 deles têm
computadores pessoais.
a) Determine a estimativa pontual da verdadeira proporção de universitários que têm computadores pessoais.
x 150
n 500 x 150 pˆ 0,3
n 500
b) Com um grau de confiança de 95% determine o intervalo de confiança da verdadeira proporção de todos os
universitários que têm computadores pessoais e interprete o seu resultado.
pˆ (1 pˆ ) 0,3 (1 0,3)
pˆ E pˆ E onde E z 1,96
(1 ) n 500
2
1. Numa amostra aleatória de 900 adultos, 80% são a favor do controle de armas de fogo, com uma margem de
erro de ±4 pontos percentuais para um intervalo de confiança de 95%. Indique se as seguintes interpretações são
verdadeiras ou falsas:
c) O intervalo de 76 a 84 porcento refere-se a todos valores possíveis da percentagem amostral.
d) O intervalo de 76 a 84 porcento refere-se a todos valores possíveis da percentagem populacional de todos os
adultos.
e) A verdadeira percentagem populacional está entre 76 e 84 percentagem.
f) A longo termo, uma série de intervalos semelhantes a este pode falhar incluir a percentagem populacional cerca
de 5% de vezes.
g) Na prática, nunca sabemos se o intervalo de 76 a 84 porcento é verdadeiro ou falso.
2. Um comprador de tijolos acha que a qualidade dos tijolos está diminuendo, isto é, a resistência média ao
desmoronamento de tais tijolos esta diminuir. Uma amostra de 100 tijolos, escolhidos ao acaso, forneceu uma
média de 195kg e com um desvio padrão de 10kg.
a) Ao nível de confiança de 95%, construa um intervalo de confiança para a média populacional
b) Ao nível de confiança de 95%, construa uma intervalo de confiança para a variancia populacional.
c) considera-se a resistência média ao desmoronamento de tais tijolos é igual a 200kg. que conclusão o intervalo em
“a” permite chegar?
3. Relacionam-se a seguir os valores do consumo de energia eléctrica (em kWh) numa residência durante nove
anos diferentes: 13 11 10 9 9 10 11 8 7
a) Determine a estimativa pontual da média e da variancia; Resposta: ( X = 9,8 e s = 1,79 ).
b) Ao nivel de confiança de 95% construa uma intervalo de confiança para a média populacional;
Resposta: Dados : n 9 x 9,8 s 1,79 95% t (8, 0,05) 2,306
s s 1,79 1,79
x t x t 9,8 2,306 9,8 2,306
n n 9 9
9,8 1,376 9,8 1,376
8,424 11,176 Ic (95%) : [8,424 ; 11,176]
c) Ao nivel de confiança de 95% construa uma intervalo de confiança para a variança populacional.