Explorar E-books
Categorias
Explorar Audiolivros
Categorias
Explorar Revistas
Categorias
Explorar Documentos
Categorias
APOSTILA DA DISCIPLINA
CRP 192 – INICIAÇÃO À ESTATÍSTICA
Rio Paranaíba, MG
2011/I
UNIVERSIDADE FEDERAL DE VIÇOSA
Campus de Rio Paranaíba
CRP 192 – Iniciação à Estatística – 2011/I – Turma 4
2. AVALIAÇÕES
Avaliações Peso
Prova 1 30%
Prova 2 30%
Prova 3 30%
Avaliação (Assiduidade, participação e sabatinas espontâneas) 10%
Serão ministradas sabatinas sobre o conteúdo explicado, com valor a ser definido
pelo professor, a perda da mesma acarretará em perca da pontuação, mesmo havendo
justificativa.
Será aplicada uma quarta prova escrita com peso de 30%, que abordará todo o
assunto do semestre, para o estudante que perder pelo menos umas das três provas por
qualquer motivo ou deseje melhor a nota final. O cálculo do rendimento acadêmico será
realizado tomando-se os três maiores valores das provas realizadas mais o valor da
avaliação do aluno.
Levar tabelas dos testes de hipóteses e calculadora para as provas, pois são de uso
individual.
As listas de exercícios sugeridos deverão ser entregues, impreterivelmente, no dia
da realização da prova daquele conteúdo.
No momento das provas não será permitida qualquer comunicação entre os alunos e
utilização de meios ilícitos (cola), provocando cancelamento da prova do(s) aluno(s)
interceptado(s).
O professor marcará um único período de revisão para cada uma das provas que
deverá ser respeitado, dando que não serão abertas exceções para revisões de provas fora
do período estabelecido. O período de revisão de prova será divulgado no quadro de avisos
do Campus.
A data da prova final será marcada pelo Registro Escolar.
3. BIBLIOGRAFIA
4. PLANEJAMENTO
___________________________________________________________________________________
1
Capítulo 1 – Introdução à Estatística
_____________________________________________________________________
estamos primordialmente interessados em descrever a população da qual a amostra
foi extraída.
Como coletar os dados? Em toda a população ou em amostra? Realizar
amostragem probabilística ou não probabilística? Dados secundários ou dados
primários? Que tipo de análise? Estatística descritiva? Inferência estatística? Como
apresentar? Graficamente? Tabela? Que tipo de gráfico? Quais interpretações a partir
das análises feitas?
Para efeitos práticos e de estudo divide-se a estatística em três partes:
estatística descritiva; probabilidade; inferência estatística. Podemos adiantar que o
número de metodologias de análises que podem ser feitas é enorme e entra no que
chamamos de auxílio à tomada de decisões.
___________________________________________________________________________________
2
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
1.1– Somatório
n
Lê-se ∑X
i =1
i como: somatório de X índice i, com i variando de 1 até n, onde:
2
n
(
3) ∑ X i = X1 + X 2 + ... + X n , quadrado da soma
2
)
i =1
n
4) ∑X Y = X Y + X
i=1
i i 1 1 2 Y2 + ... + X n Yn , soma de produtos (SP)
n m
5) ∑ Xi ∑ Yj = (X1 + X2 + ... + Xn )x(Y1 + Y2 + ... + Ym ) , produto das somas.
i=1 j=1
Exemplo:
Y = {60,70,80,60,90,75}
Calcule:
2
6 6
6
a) ∑X i = 540 b) ∑ X = 49738
2
i c) ∑ Xi = 291600
i=1 i=1 i=1
___________________________________________________________________________________
3
Capítulo 1 – Introdução à Estatística
_____________________________________________________________________
6
6 6
d) ∑ X i Yi = 39190 e) ∑ X i ∑ Yi = 234900
i=1 i=1 i=1
1.1.1 Número de termos (parcelas) do somatório (NT)
8 15
a) ∑ Xi ,NT = (8 − 3) + 1 = 6
i=3
b)
k =1
∑ Y ,NT = (15 − 1) + 1− 2 = 13
k
k ≠ 9,11
9 8
c) ∑∑ Z kl , NT = [(9 − 1) + 1]x[(8 − 5 ) + 1] = 36
k =1 l=5
Obs:
+ ... +
27 28
9x4 = 36 termos
k =1 l=5
+ Z 95 + Z 96 + Z 97 + Z 98
∑ k = k + k + ... + k = nk
i=1
___________________________________________________________________________________
4
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
Exemplos:
10 12
a) ∑ 5 = [(10 − 1) + 1](5 ) = 10(5 ) = 50 b) ∑ Yj = [(12 − 3 ) + 1]Yj = 10Yj
i=1 i=3
n n
Exemplos:
n
Xi 1 n 1
a)∑ = ∑ X i , k =
i=1 2 2 i=1 2
n m n m
3 2 3 2
Verifique para X = {2,4,6} e Y = {3,5} , que ∑ ∑ X iYj = ∑ Xi ∑ Yj = 96
i=1 j=1 i=1 j=1
∑ (X
i =1
i + Yi − Wi ) =∑ X i + ∑ Yi − ∑ Wi
i =1 i =1 i =1
___________________________________________________________________________________
5
Capítulo 1 – Introdução à Estatística
_____________________________________________________________________
1.1.3 – Somatório duplo
1 2 ... j ... s
s
1 X 11 X 12 ... X 1j ... X 1s ∑X
j=1
1j
s
2 X 21 X 22 ... X 2j ... X 2s ∑X
j=1
2j
r r r r
∑X
i =1
i1 ∑X
i =1
i2 ... ∑X
i =1
ij ... ∑X
i =1
is G
G = total geral
r r r r
G = ∑ Xi1 + ∑ X i2 + ... + ∑ X ij + ... + ∑ X is
i=1 i=1 i=1 i=1
= ∑ (X i1 + X i2 + ... + X ij + ... + X is )
r
i=1
r s r,s s r s,r
s
Total da i-ésima linha: ∑X
j=1
ij = Xi .
r
Total da j-ésima coluna: ∑X
i=1
ij = X.j
X1 = 2 X2 = 6 X3 = 7 X4 = 9
Y1 = 1 Y2 = 4 Y3 = 5 Y 4 = 11
Calcular:
___________________________________________________________________________________
6
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
3 4
a) ∑ (Yi − 2) b) ∑ (X i − 4Yi )
2
i=1 i=1
d) ∑∑ 3(X i − Yj )
3 4 4 3
c) ∑∑ (Xi + 2)
i=1 j=2 i= 2 j= 2
R: a) 14; b) - 60; c) 63 e d) 51
2) Efetuar
3
1 6 2
i−3
a) ∑ i2 + b) (opcional )∑∑ (i + j).
i= −1 j i=3 j=0 i
6 6 6 6
∑X
i=1
i = 42 ∑X
i=1
2
i = 364 ∑X
i=1
i = 34 ∑X
i=1
2
i = 324
i≠1,3 i≠1,3
1.2 – Produtório
n
Representação: ∏X
i =1
i = X1 . X 2 ..... X n
Fatos:
n
1) b 1 . b 2 . ... . b n = ∏b
i =1
i
n
2) b. b. b. ... b = ∏b = b
i =1
n
n fatores
n n
3) ∏ cX i = cX i . cX 2 . ... .cX n = c n . X1 . X 2 . ... . X n = c n ∏ X i
i =1 i =1
n
n n
4) ∏X Y i i = X1Y1 . X 2 Y2 . ... . X n Yn = (X1 . X 2 . ... .X n )(Y1 . Y2 . ... .Yn ) = ∏ X i ∏ Yi
i =1 i =1 i =1
n
5) ∏ i = 1.2.3. ... .n = n!
i =1
n n
6) log ∏ X i = log(X1 . X 2 . ... .X n ) = log X1 + log X 2 + ... + log X n = ∑ log X i
i =1 i =1
___________________________________________________________________________________
7
Capítulo 1 – Introdução à Estatística
_____________________________________________________________________
1.2.1 – Exemplo:
Sabendo-se que:
X1 = 2 X2 = 3 X3 = 5
Y1 = 3 Y2 = 5 Y3 = 7
Calcular:
3
a) ∏x
i =1
i = X1 . X 2 . X 3 = 2 .3.5 = 30
3
b) ∏Y
i =1
i = Y1 . Y2 . Y3 = 3.5. 7 = 105
3 3
c) ∏ 3. X i = 33 ∏ X i = 27(30) = 810
i =1 i =1
3
3 3
d) ∏ X i Yi = ∏ i ∏ Yi = (30 )(105) = 3150
X
i =1 i =1 i =1
X = {5, 2, 3, 0, 1, 2, 6, 9, 4, 8} n = 10
Calcule:
2
10
∑ Xi
X i − i=1
10
10 10
10
2 ∑
a) ∑ X i ∑X c) ∑ X i
10
b) 2
d) i=1
10 − 1
i
i =1 i =1 i=1
10 10
∑ (X i − 4) ∑X
2
10 10 i
∑ (X i − 4) ∑ (X i − 4) i =1 i =1
2
e) f) g) h)
i =1 i =1 10 − 1 10
5 5
2) Sabendo-se que ∑ X i = −6 e ∑ X i2 = 12 , calcule:
i =1 i =1
5 5 5
a) ∑ (4X i + 5) b) ∑ X i (X i − 2 ) c) ∑ (X i − 3)
2
i =1 i =1 i =1
j 1 2 3 4
i
1 8 7 5 9
2 4 0 10 2
___________________________________________________________________________________
8
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
2 4 2 4 4
a) ∑ X i1
i =1
b) ∑X j=1
1j c) (opcional) ∑∑ X
i =1 j=1
ij d) ∑ X 2 j
j=1
j≠ 3
3 4 4 4
1
e) ∑ X 2 j f) ∑ g) ∏ 6X1 j h) ∏ X 2 j
j= 2 j=1 X2j j=1 j=1
j≠ 2 j≠ 3 j≠ 2
4) Desenvolver:
3
1
a)∑ i2 +
5
b)∑∑
4
(i 2
− j2 j ) 5
c)∑ (i + 8 )
2 5
d)∏ (i + 8 )
i= −1 j j=1 i=2 i+ j i=1 i=1
j≠ 4
3 3
5) Se ∑X i=1
i = 12 ∑X i=1
2
i = 56 e Y 1 = 3, Y 2 = 5, Y 3 = 6, calcule:
( )
3 3 3 3
a)∑ 9 b)∑ 12 Xi c)∑ Xi2 − 2 d)∑ (Xi ⋅ Yi )
i=1 i=1 i=1 i=1
6) Se X1 = 2 , X 2 = 4 , X 3 = 6 e Y1 = 3 , Y2 = 5 , Y31 = 6 , calcule:
3 3
a)∑ (X i ⋅ Yi ) b)∑ (X i − 2) ⋅ (Yi − 5 )
i=1 i=1
∑ Xi = 200
i=1
∑ Xi2 = 1206
i=1
∑ Xi = 190
i=1
∑X
i=1
2
i = 1154
i≠ 9 e 21 i≠9 e 21
8) Dados:
i Yi Xi
1 3 3
2 8 4
3 2 8
4 5 7
5 6 6
Calcule:
___________________________________________________________________________________
9
Capítulo 1 – Introdução à Estatística
_____________________________________________________________________
5 5 5 4 5
a)∑ X i b)∑ 4X i c)∑ (Xi + 6 ) d)∑ (2X i − 3 ) e)∑ Xi Yi
i=1 i=1 i=3 i= 2 i=1
i≠ 2
5
f)∑ (X i + Yi )
i=1
___________________________________________________________________________________
10
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
___________________________________________________________________________________
11
Capítulo 2 – Estatística Descritiva
_____________________________________________________________________
gráficos
• Descrição dos dados.
Em estatística descritiva teremos portanto dois métodos que podem ser usados
para a apresentação dos dados: métodos gráficos (envolvendo apresentação gráfica
e/ou tabular) e métodos numéricos (envolvendo apresentações de medidas de
posição e/ou dispersão).
___________________________________________________________________________________
12
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
População Amostra
___________________________________________________________________________________
13
Capítulo 2 – Estatística Descritiva
_____________________________________________________________________
de 100 habitantes de uma cidade com 70000 habitantes (5% de 70000 = 3500
habitantes, portanto 100 < 5%), está população embora finita, é considerada como se
fosse infinita.
___________________________________________________________________________________
14
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
a b
Gráfico de setores (a) e gráfico de colunas (b) mostrando formas alternativas para
representar as classes fenotípicas da segregação F2 do cruzamento.
Existem vários tipos de gráficos que podem ser utilizados com o objetivo de
descrever um conjunto de dados resumidamente. Alguns deles serão aqui
exemplificados. Vejamos, primeiro, uma forma tabular de apresentação de dados e, a
seguir, veremos 3 tipos de apresentação gráfica.
• Distribuição de frequência
Organização tabular dos dados em classes de ocorrência, ou não, segundo
suas respectivas frequências absolutas. Em alguns casos há também o interesse de
se apresentar os dados em frequências relativas ou acumuladas. Para dados
quantitativos não é possível efetuar o mesmo tipo de tratamento que para os dados
qualitativos nominais, sendo estes representados então em classe de intervalos.
A apresentação dos dados em tabelas obedecem a certas normas e
recomendações. Essas normas são úteis para que as tabelas sejam feitas de modo
que simplicidade, clareza e veracidade perdurem. Diferentes revistas costumam usar
pequenas variações na confecção de suas tabelas. Uma observação importante é que
as tabelas devem ter significado próprio, ou seja, devem ser entendidas mesmo
quando não se lê o texto em que estão apresentadas. O mesmo é válido para as
tabelas de distribuição de frequências.
___________________________________________________________________________________
15
Capítulo 2 – Estatística Descritiva
_____________________________________________________________________
Exemplo:
Foram anotados os pontos finais dos alunos de CRP 192, referentes ao
segundo semestre de 2009. Foi feita a contagem e depois a organização dos dados na
seguinte tabela:
Conceitos (Notas) Número de alunos Porcentagem
A (90 a 100) 14 7,07
B (75 a 89) 32 16,16
C (60 a 74) 50 25,25
R (<60) 63 31,82
L (Reprovação por falta) 39 19,70
198 100,00
FONTE: Professores de CRP 192 – Iniciação à Estatística.
Exemplo:
Considere o seguinte resultado de um experimento no qual o engenheiro testa
adição de uma substância em cimento de construção para determinar seu efeito na
força da tensão de aderência (em determinada unidade/cm2):
___________________________________________________________________________________
16
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
Observe que os dados estão centrados num valor próximo de 16,8 e que os
valores da tensão de aderência caem no intervalo de cerca de 16,3 até 17,2 ud/cm2.
Este tipo de diagrama pode também ser usado para se comparar dois ou mais
conjuntos de dados. Por exemplo suponha ter sido verificado a tensão de aderência
em cimentos não modificados. Os resultados são apresentados abaixo.
___________________________________________________________________________________
17
Capítulo 2 – Estatística Descritiva
_____________________________________________________________________
Ramo Folha
• Histograma
Para alguns conjuntos de dados o número de valores distintos da variável em
estudo é muito grande para serem considerados os tipos de apresentação gráfica
apresentados acima. Em tais casos seria útil dividir os valores em grupos, ou intervalos
de classe, e então plotar o número de valores dos dados correspondentes a cada
intervalo de classe. Existem várias fórmulas para se estabelecer o número de classes,
porém qualquer número de classes poderia ser utilizado, baseando-se nas seguintes
observações:
(a) não escolher muito poucas classes, para evitar perda de informação sobre os
dados;
(b) não escolher muitas classes, o que poderia fazer com que as frequências
referentes a cada classe fossem tão pequenas a ponto de atrapalhar o discernimento
de algum padrão de distribuição para a variável em estudo.
O que se faz na prática é tentar variados números de classes e verificar, com a
ajuda de um computador, o número ideal para os dados em questão. Além disso,
comumente usamos intervalos de classe de iguais amplitudes.
___________________________________________________________________________________
18
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
Agora podemos ter uma idéia da distribuição dos salários. Apenas com essas
informações poderíamos concluir que a classe de salários predominante na empresa é
a terceira, ou seja, com salários de 11,3 a 12,8 salários mínimos.
Se quiséssemos obter maiores informações sobre os dados, poderíamos
montar uma nova tabela, incluindo outros tipos de frequência, como: frequência
acumulada (f a ), frequência relativa (f r ), e frequência acumulada relativa (f ar ).
Classes fi f ai f ri f ari
8,3 – 9,8 5 5 0,17 0,17
9,8 – 11,3 7 12 0,23 0,40
11,3 – 12,8 9 21 0,30 0,70
12,8 – 14,3 6 27 0,20 0,90
14,3 – 15,8 3 30 0,10 1,00
30 1,00
Discussão: exemplos
na terceira coluna, a frequência acumulada 21 indica que, nessa
empresa, 21 funcionários recebem salários/hora abaixo de 12,8 unidades;
podemos constatar, também, uma certa predominância de salários mais
baixos. Realmente cerca de 70% da distribuição de salários concentra-se até o
salário de 12,8 unidades;
___________________________________________________________________________________
19
Capítulo 2 – Estatística Descritiva
_____________________________________________________________________
___________________________________________________________________________________
20
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
Média Aritmética
É a medida de posição mais comum, intensa e extensivamente utilizada.
Suponha termos um conjunto de n valores numéricos x 1 , x 2 , …, x n . A média aritmética
desses valores será dada por:
n
∑x i
É a soma das observações dividida pelo número de observações.
x= i=1
n
exemplo:
y=6 = 0,6
10
Desse modo,
x = y + 280 = 286
∑fx i i k
x= i=1
, onde n = ∑ f i
n i=1
___________________________________________________________________________________
21
Capítulo 2 – Estatística Descritiva
_____________________________________________________________________
fi f f
x= x1 + i x 2 + + i x k
n n n
pode ser observado que a média amostral corresponde à média ponderada dos
valores distintos de X na amostra, onde o peso dado a cada valor x i nesse caso
corresponde à proporção dos n valores iguais a x i , com i = 1 a k.
Propriedades
i) A soma dos desvios em relação à média é igual a zero para qualquer amostra.
∑ (X − X) = 0
n
i
i=1
ii) A soma ou subtração de uma constante (k) aos dados altera a média de tal
forma que a nova média fica adicionada ou subtraída pela constante.
n
∑X i
Yi = Xi ± k e X= i=1
n
então
___________________________________________________________________________________
22
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
n n n
∑ (X i ± k ) ∑ X i ∑ k nk
Y= i=1
= i=1
± i=1
= X± = X±k
n n n n
iii) A multiplicação dos dados ou divisão por uma constante (k) aos dados altera a
média de tal forma que a nova média fica multiplicada ou dividida pela
constante.
n
∑X i
Yi = k ⋅ Xi , com k ∈ ℜ e X= i=1
,
n
então
n n n
∑ Yi ∑ (k ⋅ Xi ) ∑X i
Y= i=1
= i=1
=k i=1
=k⋅X
n n n
iv) A média é influenciada por valores extremos. A média tenderá a ser grande, se
existirem alguns poucos valores que são maiores que a maioria das
mensurações realizadas, ou a ser pequena, se existirem na amostra alguns
poucos valores menores que a maioria das mensurações.
Mediana amostral
___________________________________________________________________________________
23
Capítulo 2 – Estatística Descritiva
_____________________________________________________________________
distribuição, enquanto a mediana faz uso de apenas um ou dois valores centrais, não
sendo, portanto, afetada por valores extremos.
Propriedades
i) A soma ou subtração de uma constante (k) aos dados altera a mediana de tal
forma que a nova mediana fica adicionada ou subtraída pela constante.
Sejam Yi = Xi ± k
ii) A multiplicação dos dados ou divisão por uma constante (k) aos dados altera a
mediana de tal forma que a nova mediana fica multiplicada ou dividida pela
constante.
Sejam Yi = k ⋅ Xi , com k ∈ ℜ
iii) A mediana não é influenciada por valores extremos. Desta forma, é considerada
uma estimativa menos informativa que a média. No entanto, a mediana pode,
em algumas ocasiões, ser mais vantajosa que a média pelo fato de não ser
afetada pelos extremos. Assim, se as distribuições são assimétricas, a mediana
pode ser uma melhor medida de tendência central.
Moda amostral
Outra estatística que tem sido usada para indicar a tendência central de um
conjunto de observações é a moda amostral. Ela é definida como o valor que ocorre
com maior frequência. Podemos ter séries unimodais, bimodais ou multimodais,
dependendo do número de valores modais ocorrendo na amostra.
Exemplo: encontre a moda para o mesmo exemplo acima.
solução: a moda será o valor 19, pois esse valor ocorre com maior frequência
na distribuição. Essa é uma distribuição unimodal.
___________________________________________________________________________________
24
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
Propriedades
i) A soma ou subtração de uma constante (k) aos dados altera a moda de tal
forma que a nova moda fica adicionada ou subtraída pela constante.
Sejam Yi = Xi ± k
ii) A multiplicação dos dados ou divisão por uma constante (k) aos dados altera a
moda de tal forma que a nova moda fica multiplicada ou dividida pela constante.
Sejam Yi = k ⋅ Xi , com k ∈ ℜ
___________________________________________________________________________________
25
Capítulo 2 – Estatística Descritiva
_____________________________________________________________________
Os 3 tipos apresentam a mesma média. É fácil para o leitor perceber, com uma
inspeção mais criteriosa, que os conjuntos diferem razoavelmente um do outro.
Se os conjuntos numéricos fossem representados apenas pelas respectivas
médias, elas seriam consideradas iguais.
Variância amostral
( )
n
SQ = ∑ X − X
2
i=1
σ =
2 SQ n Xi − X
=∑
( )
2
n i=1 n
Entretanto esta fórmula apresentada anteriormente possui associada a ela um
erro que denominamos viés. A soma de quadrados será dividida por n – 1 ao invés de
usar o n. A quantidade n – 1, usada como divisor é conhecida como graus de
liberdade.
2
n
∑ Xi
∑ (X − X) Xi2 − i=1
n n
∑
2
i
SQ n
σˆ 2 = s 2 = = i=1
= i=1
n −1 n −1 n −1
___________________________________________________________________________________
26
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
2
k
∑ f i Xi
f X2 − i =1
k
∑ i i k
i =1
∑f i
σˆ = s =
2 2
k
i =1
∑f
i =1
i −1
2
n
∑ Ai
n
i =1 (30 )
2
∑ i A 2
−
n
210 −
5 = 210 − 180 = 30 = 7,5
σˆ 2A = s2A = i =1 =
n −1 5 −1 4 4
4 4
24
∑ Bi = 24 ,
i =1
∑B
i =1
2
i = 1226 e B =
4
=6
2
n
∑ Bi
n
Bi − i = 1 (24 )2
∑ 2
n
1226 −
4 = 1226 − 144 = 1082 = 360,667
σˆ B2 = sB2 = i =1 =
n −1 4 −1 3 3
___________________________________________________________________________________
27
Capítulo 2 – Estatística Descritiva
_____________________________________________________________________
solução:
5 5
60
∑ Xi = 60 ,
i =1
∑X
i =1
2
i = 840 e X0 =
5
= 12
2
n
∑ Xi
n
X i − i =1 (60 )2
∑ 2
n
840 −
5 = 840 − 720 = 120 = 30
σˆ 2X 0 = s2X 0 = i =1 =
n −1 5 −1 4 4
Multiplicando o conjunto por 2:
X1 = {12;16; 24; 28; 40}
5 5
120
∑X
i =1
i = 120 , ∑X
i =1
2
i = 3360 e X1 =
5
= 24
2
n
∑ Xi
n
i =1 (120 )2
∑ i X 2
−
n
3360 −
5 = 3360 − 2880 = 480 = 120 , ou
σˆ 2X1 = s2X1 = i =1 =
n −1 5 −1 4 4
σˆ 2X1 = s2X1 = k 2 ⋅ σˆ 2X 0 = 22 ⋅ 30 = 120
Desvio padrão
∑ 2
n
σˆ = s = i =1
n −1
___________________________________________________________________________________
28
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
∑ i i k
i =1
∑f i
σ̂ = s = k
i =1
∑f −1
i =1
i
O desvio padrão não é afetado pela soma ou subtração de uma constante (k)
aos dados. No entanto, ele se altera quando os dados são multiplicados ou divididos
por uma constante. Nesse caso, o novo desvio padrão será igual ao desvio padrão
original multiplicado ou dividido pela constante.
Quando o desvio padrão é pequeno, próximo de zero, existirá uma grande
concentração dos dados em torno da média. Por outro lado, se o desvio padrão for
grande os valores não se concentrarão com tal intensidade em torno da média.
Amplitude total
A = X k – X 1 , onde:
X k = último valor da série de dados ordenados;
X 1 = primeiro valor da série de dados ordenados.
Erro-padrão da média
s = s(x ) = σˆ
n
___________________________________________________________________________________
29
Capítulo 2 – Estatística Descritiva
_____________________________________________________________________
Coeficiente de Variação
σˆ
C.V.(%) = ⋅ 100
X
88,5 87,7 83,4 86,7 87,5 91,5 88,6 100,3 96,5 93,3 94,7
91,1 91,0 94,2 87,8 89,9 88,3 87,6 84,3 86,7 84,3 86,7
88,2 90,8 88,3 98,8 94,2 92,7 93,2 91,0 90,1 93,4 88,5
90,1 89,2 88,3 85,3 87,9 88,6 90,9 89,0 96,1 93,3 91,8
92,3 90,4 90,1 93,0 88,7 89,9 89,8 89,6 87,4 88,4 88,9
91,2 89,3 94,4 92,7 91,8 91,6 90,4 91,1 92,6 89,8 90,6
91,1 90,4 89,3 89,7 90,3 91,6 90,5 93,7 92,7 92,2 92,2
91,2 91,0 92,2 90,0 90,7
2,2 4,1 3,5 4,5 3,2 3,7 3,0 2,6 3,4 1,6 3,1
3,3 3,8 3,1 4,7 3,7 2,5 4,3 3,4 3,6 2,9 3,3
3,9 3,1 3,3 3,1 3,7 4,4 3,2 4,1 1,9 3,4 4,7
3,8 3,2 2,6 3,9 3,0 4,2 3,5
___________________________________________________________________________________
31
Capítulo 2 – Estatística Descritiva
_____________________________________________________________________
6 05589
7 244578
8 233578
9 001445
10 0278
11 0245
12 245
___________________________________________________________________________________
32
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
3.0 - AMOSTRAGEM
3.1 – Introdução
População Amostra
3.2 – Questionário
A construção de um questionário é uma etapa longa, que deve ser executada com
muita cautela e planejamento. Para tanto, alguns procedimentos devem ser levados
em consideração.
necessárias para atingir aos objetivos da pesquisa, pois quanto maior o questionário,
menor tende a ser a qualidade e a confiabilidade das respostas. Exemplo: Pesquisa
sobre a saúde do indivíduo, não necessita perguntá-lo sobre qual o sabor de sorvete
favorito.
Ao efetuar uma ou mais perguntas, terá para cada pergunta, uma e apenas uma
resposta, sendo que cada pergunta será uma variável. A característica grau de
satisfação com o trabalho pode ser avaliada com base em várias perguntas, como por
exemplo, satisfação com o salário, segurança no emprego, autonomia de trabalho, etc.
________________________________________________________________________________
35
Capítulo 3 - Amostragem
_____________________________________________________________________
________________________________________________________________________________
37
Capítulo 3 - Amostragem
_____________________________________________________________________
________________________________________________________________________________
38
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
________________________________________________________________________________
39
Capítulo 3 - Amostragem
_____________________________________________________________________
estratos terem sido identificados, uma amostra casual simples é retirada de cada
L
estrato, cujos tamanhos são n 1 , n 2 , n 3 , ..., n L , considerando n = ∑ nh .
h=1
Exemplo: Será admitida uma amostra aleatória estratificada (n = 25) sorteada de uma
população (N = 194) composta por cinco diferentes fornecedores (estratos) de aços
utilizados na fabricação de molas, sendo a variável medida, a dureza (HB) de molas de
aços produzidas por uma indústria de autopeças (tabela 1).
3.7 – Exercício
________________________________________________________________________________
42
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
________________________________________________________________________________
43
Capítulo 4 – Probabilidade
_____________________________________________________________________
4.0 – PROBABILIDADE
4.1 – Introdução
4.2 - Conceitos
Exemplos:
(i) E 1 : Ensaiar uma lâmpada quanto a duração da vida até queimar;
(ii) E 2 : Escolher, ao acaso, um ponto de um círculo de raio unitário;
(iii) E 3 : Registrar as vazões num certo rio, no mesmo mês, dia e hora em
anos sucessivos;
(iv) E 4 : Jogar um dado ao ar e observar a sua face superior; e
(v) E 5 : Seleção de três itens ao acaso de uma linha de fabricação. Cada item
é inspecionado e classificado com defeituoso ou não defeituoso.
___________________________________________________________________________________
44
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
4.2.2. Espaço amostral
4.2.3 - Eventos
n
P(A1 ∪ A 2 ∪ A 3 ∪ ∪ A n ) = P(A1 ) + P(A 2 ) + P(A 3 ) + + P(A n ) = ∑ P(A i )
i =1
Conceito 2 - Uma regra mais prática que nos fornece uma maneira mais objetiva para
a atribuição numérica da probabilidade de um evento é dado pelo chamado conceito
clássico ou probabilidade a priori. Este conceito está ligado aos jogos de azar, que
deram origem à teoria de probabilidade nos idos do século XVI.
Entretanto, o método clássico para a obtenção de probabilidades se aplica a
situações em que temos espaços amostrais finitos equiprováveis e enumeráveis.
___________________________________________________________________________________
46
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
n
P(ai ) ≥ 0, i = 1, 2,,n e ∑ P(ai ) = 1
i =1
Exemplos:
i) Seja E o experimento relativo ao lançamento de um dado honesto. Seja A
o evento ocorrência da face 6. Portanto, S = { 1, 2, 3, 4, 5, 6} e P(A) = 1/6
iii) Seja o espaço amostral referente ao número de caras obtidas em dois lances
de uma moeda. Seja A o evento ocorrência de uma cara. Então, S = {0, 1, 2} e A = {1}.
Aqui (Exemplo iii) o conceito clássico não pode ser imediatamente aplicado,
pois os pontos de S não são equiprováveis, ou seja, P(A) ≠ 1/3.
Observando o espaço amostral original: S' = {cc, ck, kc, kk}, sendo c = cara e k
= coroa, vê-se que A = {ck, kc} e, portanto, P(A) = 2/4 = 1/2.
Poderíamos empregar corretamente o espaço S da seguinte maneira: os
resultados 0 e 2 são igualmente prováveis, enquanto o resultado 1 é duas vezes mais
provável que qualquer um dos outros.
Probabilidade Geométrica
___________________________________________________________________________________
48
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
comprimento de l
P=
comprimento de L
Analogamente, suponhamos que uma figura plana g seja parte de uma outra
figura plana G e que se tenha escolhido ao acaso um ponto de G.
Solução:
P ( A) =
área do círculo de raio 2 π 2
= =
( )
1
2
área do círculo de 2 π (2 )2
2
___________________________________________________________________________________
49
Capítulo 4 – Probabilidade
_____________________________________________________________________
4.4 - Espaço Amostral Finito
Seja S um espaço amostral finito:
S = {a 1 , a 2 , ..., a n }
Fato: A recíproca deste teorema não é verdadeira, isto é, P(A) = 0 não implica que A
seja um conjunto vazio.
A A
P(S) = 1
Prova:
S = A ∪ A ⇒ 1 = P(A) + P( A ) (propriedades 2 e 3)
logo, P( A ) = 1 - P(A).
A∩ B A∩B
___________________________________________________________________________________
50
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
Prova:
A = (A ∩ B ) + (A ∩ B)
P(A) = P(A ∩ B ) + P(A ∩ B), pois (A ∩ B ) e (A ∩ B) são mutuamente exclusivos, logo:
P(A ∩ B ) = P(A) - P(A ∩ B)
IV) Se A e B forem dois eventos quaisquer, então P(A ∪ B) = P(A) + P(B) - P(A ∩ B)
(Teorema da Soma das probabilidades)
S
A B
A∩ B A∩B
Prova:
A idéia desta demonstração é decompor A∪B e B em dois eventos mutuamente
exclusivos.
Logo, podemos escrever:
A∪B = A ∪ (B ∩ A ) ......(1)
B = (A ∩ B) ∪ (B ∩ A) .....(2) consequentemente,
P(A ∪ B) = P(A) + P(B ∩ A) .....(1)
P(B) = P(A ∩ B) + P(B ∩ A) .....(2)
Prova:
B = A ∪ (B ∩ A )
P(B) = P[A ∪ (B ∩ A )]
P(B) = P(A) + P(B ∩ A )
logo P(B) é ≥ P(A) pois P(B ∩ A ) é ≥ 0 pelo axioma enunciado em 4.
___________________________________________________________________________________
51
Capítulo 4 – Probabilidade
_____________________________________________________________________
4.6 - Probabilidade Condicional
Solução:
sejam os eventos: A = {aluno faz matemática pura}
E = {aluno faz estatística}
___________________________________________________________________________________
52
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
140
c) P(M) =
200
80
P(M ∩ E) 200 = 80
d) P(M/E) = =
P(E) 90 90
200
50
P(M ∩ F) 50
e) P(M/F) = = 200 =
P(F) 60 60
200
P(A ∩ B ∩ C) P(A ∩ B ∩ C)
P[C/ (A ∩ B )] = =
P (A ∩ B ) P(A ) ⋅ P(B/A )
então:
___________________________________________________________________________________
53
Capítulo 4 – Probabilidade
_____________________________________________________________________
.
P(A∩B) = P(A) P(B)
n
P(A) = P(A/B 1 ) ⋅ P(B 1 ) + P(A/B 2 ) ⋅ P(B 2 ) + ... + P(A/B n ) ⋅ P(B n ) = ∑ P(A/Bi ) ⋅ P(Bi )
i =1
Prova:
Seja o diagrama de Venn a seguir:
A = (A ∩ B 1 ) ∪ (A ∩ B 2 ) ∪ ... ∪ P(A ∩ B n )
Logo:
P(A) = P(A ∩ B 1 ) + P(A ∩ B 2 ) + ... + P(A ∩ B n )
n
∴ P(A) = ∑ P(A/Bi ) ⋅ P(Bi )
i =1
obs: Esta relação é útil quando desejamos calcular P(A) e esta é difícil de ser
___________________________________________________________________________________
54
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
calculada diretamente, e sabemos da(s) ocorrência(s) do(s) B i . O fato é que é mais
fácil calcular os termos que compõem o somatório do que a própria P(A).
Solução:
Sejam os eventos: A = {aluno da turma A}
B = {aluno da turma B}
C = {aluno da turma C}
R = {aluno reprovado}
Método 1:
P(A) = 0,40 P(B) = 0,50 P(C) = 0,10
P(R/A) = 0,03 P(R/B) = 0,05 P(R/C) = 0,02
a) R = {(R ∩ A) ∪ (R ∩ B) ∪ (R ∩ C)}
P(R) = P(R ∩ A) + P(R ∩ B) + P(R ∩ C)
P(R) = P(A) . P(R/A) + P(B) . P(R/B) + P(C) . P(R/C)
P(R) = 0,40 . 0,03 + 0,50 . 0,05 + 0,10 . 0,02
___________________________________________________________________________________
55
Capítulo 4 – Probabilidade
_____________________________________________________________________
Método 2:
R R
A 0,012 0,388 0,40
B 0,025 0,475 0,50
C 0,002 0,098 0,10
0,039 0,961 1,00
a) P(R) = 0,039
0,025
b) P(B/R) = = 0,641
0,039
a) P(R) = P(A ∩ R) + P(B ∩ R) + P(C ∩ R) = 0,40 . 0,03 + 0,50 . 0,05 + 0,10 . 0,02 =
0,039
2. Num exame de múltipla escolha há 3 alternativas para cada questão e apenas uma
___________________________________________________________________________________
56
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
delas é correta. Portanto, para cada questão, um aluno tem probabilidade 1/3 de
escolher a resposta correta se ele esta assinalando aleatoriamente e 1 se sabe a
resposta. Um estudante sabe 30% das respostas do exame. Se ele assinalou
corretamente uma das questões, qual é a probabilidade de que ele tenha a assinalado
ao acaso? (R: 7/16)
___________________________________________________________________________________
57
Capítulo 4 – Probabilidade
_____________________________________________________________________
3) Dos 10 alunos de uma classe, 3 têm olhos azuis. Se duas delas são escolhidas
aleatoriamente, qual é a probabilidade de:
a) Ambas terem olhos azuis? (R: 1/15)
b) Nenhuma ter olhos azuis? (R: 7/15)
c) Pelo menos uma ter olhos azuis? (R: 8/15)
___________________________________________________________________________________
58
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
9) Um homem possui duas moedas, uma comum e a outra cunhada com duas caras.
Ele apanhou uma moeda aleatoriamente e a lançou, se ocorreu a face cara, qual é a
probabilidade de que a moeda lançada tenha sido a de duas caras? (R: 2/3)
10) Jogam-se dois dados. Se as duas faces mostram números diferentes, qual é a
probabilidade de que uma das faces seja o 4? (R: 1/3)
13) Numa placa de petri 20%, 40%, 25% e 15% do total das colônias bacterianas são
dos tipos A, B, C e D, respectivamente. Sabe-se que 3%, 5%. 6% e 20% de cada
colônia, respectivamente, são patogênicas.
a) Se for retirada uma amostra aleatória de uma única colônia bacteriana, qual é a
probabilidade de que esta amostra contenha somente bactérias patogênicas? (R:
0,071)
b) Se for constatado que a amostra do item a possui somente bactérias patogênicas,
qual é a probabilidade de que as bactérias sejam do tipo D? (R: ≅ 0.4225)
15) Uma caixa contém 8 peças, das quais 3 são defeituosas e uma caixa B contém 5
peças, das quais 2 são defeituosas. Uma peça é retirada aleatoriamente de cada
caixa:
a) Qual a probabilidade p de que ambas as peças não sejam defeituosas? (R: 3/8)
b) Qual a probabilidade p de que uma peça seja defeituosa e a outra não? (R: 19/40)
c) Se uma peça é defeituosa e a outra não, qual é a probabilidade p de que a peça
defeituosa venha da caixa A? (R: 9/19)
16) A e B são eventos mutuamente exclusivos. Determine quais das relações abaixo
___________________________________________________________________________________
59
Capítulo 4 – Probabilidade
_____________________________________________________________________
são verdadeiras e quais são falsas. JUSTIFIQUE.
a) P(A/B) = P(A)
b) P(A ∪ B/C) = P(A/C) + P(B/C)
c) P(A) = 0, P(B) = 0, ou ambas
P(B/A) P(A/B)
d) =
P(A) P(B)
e) P(A ∩ B) = P(A) . P(B)
___________________________________________________________________________________
60
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
Exemplo: Duas peças são retiradas sucessivamente, sem reposição, de uma caixa que
contém quatro peças boas (B) e 3 defeituosas (D). Para esse experimento teríamos o
seguinte espaço amostral
S = {BB, BD, DB, DD}.
Se considerarmos a v.a. Y = número de peças boas retiradas teríamos:
S* = {0, 1, 2}.
Fazendo uma correspondência entre S e S* teríamos:
Evento Simples Y=y
BB 2
BD 1
DB 1
DD 0
Outro exemplo:
Considere o lançamento de duas moedas e seja X = no de caras obtidas, c = cara e k =
coroa
Por outro lado, se um espaço amostral contém pontos amostrais que formam
___________________________________________________________________________________
61
Capítulo 5 – Variáveis Aleatórias e Distribuições de Probabilidade
_____________________________________________________________________
uma continuidade como todas as possíveis alturas de pessoas, pesos de animais,
tempos de vida de um componente mecânico ou eletrônico, temperaturas, etc. Então ele
é chamado espaço amostral contínuo. A variável definida sobre esse espaço é
chamada variável aleatória contínua (v.a.c.).
obs.: na maior parte dos problemas práticos as v.a.c. representam dados medidos e as
v.a.d. representam dados contados, tais como o número de defeituosos em uma
amostra de n peças ou o número de acidentes em determinada rodovia.
exemplo:
- nº de acidentes ocorridos em uma semana;
- nº de defeitos por peça produzida por um fabricante;
- nº de vitórias obtidas por um atleta;
- nº de filhos do sexo masculino por casal.
obs.: No caso das v.a.c. somente terão interesse as probabilidades de que a v.a.
assuma valores em dados intervalos. As probabilidades de interesse poderão ser
determinadas com o conhecimento da distribuição de probabilidade da v.a.
a) X é uma v.a.d.
P(X = x i ) = P(x i ) = pi
que a cada valor de X (ou seja, a cada x i ) associa sua probabilidade de ocorrência.
obs.: essa função muitas vezes está reduzida a um valor numérico e, em outros casos,
pode ser representada por uma fórmula.
i) Gráfico
ii) Tabela
xi 1 2 3 4 5 6
P(x i ) 1/21 2/21 3/21 4/21 5/21 6/21
xi
, para x i = 1, 2, 3, 4, 5, 6
P(x i ) = 21
0, para outros valores de x i
Este exemplo trata-se de uma variável aleatória X = {nº de pontos obtidos}, que
não é uniformemente distribuída.
___________________________________________________________________________________
63
Capítulo 5 – Variáveis Aleatórias e Distribuições de Probabilidade
_____________________________________________________________________
Problema proposto: Uma urna contém 4 bolas azuis e 6 brancas. Duas bolas são
retiradas sucessivamente I) com reposição e II) sem reposição. Determinar, em cada
caso, a distribuição de probabilidade e a função de probabilidade do nº de bolas brancas
retiradas.
b) X é uma v.a.c.
obs.:
d
1) Para c < d , P(c < X < d) = ∫ f(x)dx
c
x0
sendo assim, as probabilidades abaixo são todas iguais, se X for uma v.a.c.:
Problemas propostos:
a) Determinar o valor de k?
b) Traçar o gráfico da f.d.p.?
c) Calcular P(X ≤ 1).
a) Determinar o valor de k?
b) Traçar o gráfico da f.d.p.?
c) Calcular P(X ≥ 3)
obs.:
___________________________________________________________________________________
65
Capítulo 5 – Variáveis Aleatórias e Distribuições de Probabilidade
_____________________________________________________________________
a) 0 ≤ F(x) ≤ 1 para todo x.
b) Se x 1 ≤ x 2 , então F(x 1 ) ≤ F(x 2 ), isto é, F(x) é não-decrescente.
xi 0 1 2 3 4 Total
P(x i ) 1/16 4/16 6/16 4/16 1/16 1,00
F(x)
Pede-se:
X
F(x) = P(X ≤ x) = P( −∞ < X < x) = ∫ f(t)dt
−∞
d
P(c < X ≤ d) = F(d) - F(c) = ∫ f(x)dx
c
d F(x)
Vê-se também que f(x) = em todos os pontos de continuidade de f(x), isto
dx
é, a derivada da função de distribuição é a função densidade de probabilidade.
Exemplos:
1 x, para 0 ≤ x ≤ 2
f(x) = 2
0, caso contrário
___________________________________________________________________________________
66
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
Pede-se:
a) Traçar o gráfico da f.d.p.?
b) Obter F(x) e traçar seu gráfico?
c) Calcular P(X≤1)?
d) Calcular P(1 ≤ X ≤ 3/2)
e) Qual o valor de X abaixo do qual existem 50% dos dados?
ax, se 0 ≤ x < 1
a, se 1 ≤ x < 2
f(x) =
- ax + 3a, se 2 ≤ x ≤ 3
0, caso contrário
Pede-se:
a) Determine a constante a para que f(x) seja uma f.d.p.?
b) Traçar o gráfico da f.d.p.?
c) Obter F(x) e traçar seu gráfico?
3
d) P 0 < X < ?
2
e) Qual valor de X abaixo do qual existem 50% dos dados?
___________________________________________________________________________________
67
Capítulo 5 – Variáveis Aleatórias e Distribuições de Probabilidade
_____________________________________________________________________
Definição
___________________________________________________________________________________
68
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
a) P(x i , y j ) ≥ 0, para todo par (x i , y j )
b) ∑∑ P(x i, y j ) = 1
i j
∑ P(x , y )
s
para X: P(X = x i ) = P(x i ) = i j
j =1
∑ P(x , y )
r
para Y: P (Y = y j ) = P(y j ) = i j
i =1
P(X = x i, Y = y j )
P(Y = y j /X = x i ) =
P( X = x i )
Analogamente para o X:
P(X = xi, Y = y j )
P(X = xi /Y = y j ) =
P(Y = y j )
___________________________________________________________________________________
69
Capítulo 5 – Variáveis Aleatórias e Distribuições de Probabilidade
_____________________________________________________________________
b) (X, Y) é v.a.c. bidimensional
A variável (X, Y) será uma v.a.c. bidimensional se (X, Y) puder assumir todos os
valores em algum conjunto não enumerável.
Seja (X, Y) uma v.a.c. bidimensional. Dizemos que f(x, y) é uma função
densidade de probabilidade conjunta de X e Y, se satisfizer às seguintes condições:
∞ ∞
P(a ≤ X ≤ b, c ≤ Y ≤ d) = ∫ ∫ f (x, y )dx dy
−∞ −∞
∞ ∞
g(x ) = ∫ f (x, y ) dy e h(y ) = ∫ f (x, y ) dx respectivamente.
−∞ −∞
b d
P(a ≤ X ≤ b ) = ∫ g(x ) dx e P(c ≤ X ≤ d) = ∫ h(y )dy
a c
Sejam X e Y v.a.c. com f.d.p. conjunta f(x, y) e f.d.p. marginais dadas por g(x) e
h(y).
A f.d.p. condicional de X, dado que Y = y é definida por:
f (x, y )
f (x/y ) = , h(y ) > 0
h(y)
___________________________________________________________________________________
70
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
f (x, y )
f (y/x ) = , g(x ) > 0
g(x)
Basta que esta condição não se verifique para um par (x i , y j ) para que X e Y não
sejam independentes. Neste caso diremos que X e Y são dependentes.
ou equivalente se e somente se
P(Y = y j /X = x i ) = P(Y = y j ), para todo i e j.
OBS.: Todas as definições concernentes a duas v.a. podem ser generalizadas para o
caso de n v.a.
Exemplos:
1. Dada a distribuição de probabilidade conjunta de (X, Y) na Tabela abaixo:
___________________________________________________________________________________
71
Capítulo 5 – Variáveis Aleatórias e Distribuições de Probabilidade
_____________________________________________________________________
X Y 0 1 2
0 0,10 0,20 0,20
1 0,04 0,08 0,08
2 0,06 0,12 0,12
Pede-se:
a) Distribuição marginal de X e Y, distribuição de (X + Y) e de XY?
b) X e Y são independentes?
c) As distribuições condicionais de X dado que Y = 0 e Y dado que X = 1?
d) P(X ≥ 1,Y ≤ 1)?
e) P(X ≤ 1/Y = 0)?
f) Construir a distribuição conjunta a partir das distribuições marginais de X e de Y?
Problemas propostos:
1) A função de probabilidade conjunta da v.a. X e Y é dada por:
x y 10 − x − y
10! 1 25 10
p(x, y ) =
x! y! (10 − x − y ) 36 36 36
para x = 0,1,2, …, 10 e y = 0,1,2, …, 10
0 ≤ x + y ≤ 10
Calcule:
a) P(X≤ 2, Y≤ 2)?
b) P(X + Y = 4)?
___________________________________________________________________________________
72
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
5.8 - Conceitos e Propriedades de esperança matemática e variância de variáveis
aleatórias
n
E(X ) = ∑ x i ⋅ P(x i )
i =1
Exemplo: Um fabricante produz peças tais que 10% delas são defeituosas e 90% não
são defeituosas. Se uma peça defeituosa for produzida, o fabricante perde R$ 1,00;
enquanto uma peça não defeituosa lhe dá um lucro de R$ 5,00. Seja a variável aleatória
X = {lucro líquido por peça}. Calcular a média do lucro líquido por peça.
___________________________________________________________________________________
73
Capítulo 5 – Variáveis Aleatórias e Distribuições de Probabilidade
_____________________________________________________________________
∞ ∞
Prova: E(X ) = ∫ k x f (x ) dx = k ∫ x f (x ) dx = k E(X )
−∞ −∞
∞ ∞
Prova: E(XY ) = ∫ ∫ x y f (x, y ) dx dy
−∞ −∞
∞ ∞ ∞ ∞
E(XY ) = ∫ ∫ x y g(x ) h(y ) dx dy = ∫ x g(x ) dx ∫ y h(y ) dy
−∞ −∞ −∞ −∞
E(XY) = E(X).E(Y)
obs: E(XY) = E(X).E(Y) não implica que X e Y sejam variáveis aleatórias independentes.
Prova:
∞ ∞ ∞ ∞ ∞ ∞
E( X ± Y ) = ∫ ∫ (x ± y ) f (x, y ) dx dy = ∫ ∫ x f (x, y ) dx dy ± ∫ ∫ y f (x, y ) dx dy
−∞ −∞ −∞ −∞ −∞ −∞
___________________________________________________________________________________
74
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
∞ ∞
E( X ± Y ) = ∫ x g(x ) dx ± ∫ y h(y ) dy = E(X) ± E(Y )
−∞ −∞
P 6 ) A média de uma v.a. centrada é zero, ou seja, a média dos desvios dos valores da
v.a. em relação a sua média é zero.
Obs: Dizemos que a v.a. está centrada quando todos os valores são expressos como
desvios em relação à respectiva média, (X – μ x ).
b) Variância
∞
b.2.) Para X v.a.c.: V (X ) = ∫ (x − μ ) P(x )
2
x i
−∞
{
= X2 − 2XE(X ) + [E(X )]
2
}
( )
= E X2 − 2E(X )E(X ) + E(X ) [ 2
]
= E(X ) − [E(X )]
2 2
em que:
___________________________________________________________________________________
75
Capítulo 5 – Variáveis Aleatórias e Distribuições de Probabilidade
_____________________________________________________________________
( )
- para X v.a.d.: E X2 = ∑ x i2P(x i )
i
∞
( )
- para X v.a.c.: E X2 = ∫ x 2 f (x ) dx
-∞
Prova:
V (X ± k ) = E[(X ± k ) − E(X ± k )]
2
= E[(X ) − E(X ) ± (k − k )]
2
= E[X − E(X )] = V (X )
2
V (X ± k ) = V (X )
P 3 ) Multiplicando-se uma v.a. por uma constante, sua variância fica multiplicada pelo
quadrado da constante.
Prova:
V (kX ) = E[kX − E(kX )]
2
= E[kX − kE(X )]
2
= k 2E[X − E(X )]
2
V (kX ) = k 2 V (X )
P 4 ) A variância da soma de duas v.a. independentes é igual a soma das variâncias das
duas variáveis.
Prova:
V (X + Y ) = E[X + Y ] − [E(X + Y )]
2 2
( )
= E X2 + 2XY + Y 2 − [E(X ) + E(Y )]
2
___________________________________________________________________________________
76
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
Se X e Y são independentes; E(XY) = E(X).E(Y), assim
{( ) [
V ( X + Y ) = E X 2 − E( X )
2
]}+ {E(Y ) − [E(Y ) ]}
2 2
Do mesmo modo:
V(X - Y) = V(X) + V(Y)
Exercícios propostos:
Resp.: 1; 9; 5; 15; 81
2. Uma urna contém 5 bolas brancas e 7 bolas pretas. Três bolas são retiradas
simultaneamente dessa urna. Se ganharmos R$ 200,00 por bola branca retirada e
perdermos R$ 100,00 por bola preta retirada, qual seria o nosso lucro esperado? Resp.:
75
3. Uma moeda honesta é lançada sucessivamente até sair cara ou até serem feitos 3
___________________________________________________________________________________
77
Capítulo 5 – Variáveis Aleatórias e Distribuições de Probabilidade
_____________________________________________________________________
lançamentos. Obtenha a distribuição de X = número de lançamentos, e calcule sua
média e variância. Resp.: E(X)=1,75; Moda=1; V(X)=11/16
4. Uma máquina de apostar tem 2 discos independentes. Cada disco tem 10 figuras: 4
maçãs, 3 bananas, 2 pêras e 1 laranja. Paga-se 80 para acionar a máquina. Se
aparecerem 2 maçãs ganha-se 40; 2 bananas 80; 2 pêras 140 e 2 laranjas 180. Qual é
o resultado esperado após inúmeras jogadas? Resp.: E(X) = − 59
Pede-se calcular:
a) E(X), V(X) e σ x
b) E(Y), V(Y) e σ y
c) E(X + Y)
d) X e Y são independentes?
Lista de Exercícios
1. Uma v.a.c. X possui f.d.p. dada por:
( )
6 x − x 2 , 0 ≤ x ≤ 1
f (x ) =
0, para outros valores de x
Calcular :
a) P[E(X) − 2σ ≤ X ≤ E(X) + 2σ], dado E(X2) = 3/10? (R: ≅ 0,9855)
b) F(x), a Função de distribuição acumulada? (R: 0 se x < 0; x2(3 -2x) se 0 ≤ x ≤ 1; 1 se
x ≥ 1)
Calcule :
a) V(12X - 8), dado E(X2) = 127/6 (R: 2879)
___________________________________________________________________________________
79
Capítulo 5 – Variáveis Aleatórias e Distribuições de Probabilidade
_____________________________________________________________________
b) A função de distribuição acumulada (R: 0 se x < 0; x/2 se 0 ≤ x < 1; − 1/8 (x2 − 6x +
1) se 1 ≤ x < 3; 1 se x ≥ 3)
c) P(-0,5 < X < 1,5) (R:15/32)
Determinar:
a) F(x), a função de distribuição acumulada? (R: 0 se x < − 1; 1/6(−x3 + 3x + 2) se −1 ≤
x < 0; 1/6(2 + 3x) se 0 ≤ x < 4/3; 1 se x ≥ 4/3)
b) P(−0,5 ≤ x ≤ 0,5) (R: 23/48)
Pede-se:
a) Verifique se X e Y são v. a. independentes? (R: não)
X3 2Y
b) E − − 10 (R: -3723/450)
2 5
c)V(8 −15X) (R: 689/4)
7. Conceitue:
a) Variável aleatória discreta
b) Variável aleatória contínua
Determinar:
a) O valor da constante k para que f(x) seja uma f. d. p.? (R: 2/87)
8 27
b) P ≤ X ≤ (R: 149/261)
2 2
Pede-se:
1
a) E − X ? (R: -1)
3
b)V(5X− 3Y)? (R: 72,16)
c) X e Y são v. a. independentes? Mostre por que? (R: não)
10. Sabendo-se que X e Y são variáveis aleatórias independentes e que E(X) = 5, V(X)
= 2, E(Y) = 8 e V(Y) = 3, calcule:
11. Seja (X, Y) uma variável aleatória bidimensional discreta, com a seguinte função
de probabilidade:
2x i + y j
, para x i = 0, 1, 2 e y j = 0, 1, 2, 3
P(x i, y j ) = 42
0, caso contrário
Pede-se:
a) Dar a tabela da distribuição de probabilidade conjunta?
b) Dar a tabela da distribuição marginal de X e também a de Y?
c) E(X − 2Y + 4)? (R: 70/42)
___________________________________________________________________________________
81
Capítulo 5 – Variáveis Aleatórias e Distribuições de Probabilidade
_____________________________________________________________________
a) O valor de K para que f(x) seja uma f.d.p.? (R: 2/5)
b) E(X3)? (R: 81/50)
3
c) P X ≥ ? (R: 0,2)
2
d) P(X = 1)? (R: 0)
Pede-se:
a) O valor de K para que f (x, y) seja uma f. d. p.? (R: 1/210)
b) P(Y ≤ 2)? (R: 72/210)
c) P(X > 3 / 0 ≤ Y ≤ 2)? (R: 60/72)
d) X e Y são v. a. independentes? Mostre? (R: não)
___________________________________________________________________________________
82
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
6.1– Introdução
6.2.1 – Uniforme
83
Capítulo 6 – Distribuições de variáveis aleatórias discretas e contínuas
_____________________________________________________________________
i) Gráfico
ii) Tabela
xi x1 x2 x3 x4 ... xn
P(x i ) 1/n 1/n 1/n 1/n ... 1/n
Exemplos:
1) Seja E: lançamento de um dado não-viciado.
O espaço amostral é: S = {1, 2, 3, 4, 5, 6)
Cada ponto de S tem probabilidade do ocorrer igual a 1/6.
Tabela:
xi 1 2 3 4 5 6
P(x i ) 1/6 1/6 1/6 1/6 1/6 1/6
6.2.2 – Bernoulli
x = 1, se ocorrer um sucesso
X= 1
x 2 = 0, se ocorrer um fracasso
___________________________________________________________________________________
84
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
Diremos que a variável aleatória assim definida tem distribuição de Bernoulli. Se p
é a probabilidade de ocorrer sucesso, logicamente a probabilidade de ocorrer um
fracasso é 1 – p = q. Logo, a função de probabilidade de X com distribuição de Bernoulli
é dado por:
P(X = x) = p x ⋅ q1−x , se x = 0 ou 1, caso contrário = 0
A média da v.a.d. X é: Ε(x ) = p
A variância da v.a.d. X é: V (x ) = p ⋅ q
85
Capítulo 6 – Distribuições de variáveis aleatórias discretas e contínuas
_____________________________________________________________________
A distribuição de probabilidades de uma v.a. que tem distribuição binomial é dada
por:
C x ⋅ p x ⋅ qn − x x = 0, 1, 2,,n; 0 ≤ q = 1 − p ≤ 1
P(x;n,p ) = n
0, caso contrário
Se X~B(n; p) então E(X) = np, e V(X) = npq.
Exemplos:
1. Se 20% dos parafusos produzidos por uma máquina são defeituosos, determinar a
probabilidade de, entre 4 parafusos escolhidos ao acaso, no máximo 2 deles serem
defeituosos. (R: 0,9728)
2. Um fabricante de certas peças de automóveis garante que uma caixa de suas peças
conterá no máximo 2 itens defeituosos. Se a caixa contém 20 peças e a experiência tem
demonstrado que esse processo de fabricação produz 2 por cento de itens defeituosos,
qual a probabilidade de que uma caixa de suas peças não vá satisfazer a garantia? (R:
0,0071)
3. Sabe-se que os discos produzidos por certa companhia serão defeituosos com
probabilidade de 1% independentemente de outros discos. A companhia vende os
discos em pacotes de 10 unidades e oferece uma garantia (de retorno em dinheiro) de
que no máximo 1 de cada 10 discos é defeituoso.
a) Qual é a proporção de pacotes retornados? R.: ≅ 0,5%
b) Se alguém compra 3 pacotes, qual é a probabilidade de exatamente um deles
ser retornado? R.: 0,015
4. Entre 2.000 famílias com 4 crianças cada uma, quantas se esperaria que tivessem:
a) Pelo menos um menino? (R: 1875)
b) Exatamente dois meninos? (R: 750).
___________________________________________________________________________________
86
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
obs.:
a) quando o número de ensaios n for grande (n ≥ 50 e np < 5) pode-se usar a
aproximação pela distribuição de Poisson (a ser apresentada posteriormente) com
média μ = λ = np;
6.2.4 - Multinomial
n!
P(x1, x 2 ,, x n ;p1,p2 ,,pk ; n) = p1x1 ⋅ p2x 2 ⋅ ⋅ pkx k
x1! x 2! x k !
k k
onde ∑x i =1
i =n e ∑p
i =1
i =1
___________________________________________________________________________________
87
Capítulo 6 – Distribuições de variáveis aleatórias discretas e contínuas
_____________________________________________________________________
Exemplo: Uma peça é considerada “boa” (tipo 1) se uma de suas dimensões L está
entre l 1 e l 2 ; “recuperável” (tipo 2) se L > l 2 e “perdida” (tipo 3) se L < l 1 . Numa caixa
temos 5 peças do tipo 1, 4 do tipo 2 e 3 do tipo 3. Retira-se, aleatoriamente, uma peça
dessa caixa e mede-se sua dimensão com o auxílio de um aparelho de precisão, após o
que devolve-se a peça dentro da caixa. Seis operações dessa natureza são realizadas.
Qual é a probabilidade de entre as seis peças observadas obtermos o seguinte
resultado: 3 peças do tipo 1, 2 do tipo 2, e 1 do tipo 3?
solução:
p1 = 5/12; p2 = 4/12; p3 = 3/12
3 2 1
6! 5 4 3 625
P(x1, x 2 , x 3 ) = ⋅ ⋅ = = 0,1206
3!2!1! 12 12 12 5184
obs.:
a) quando k = 2 temos a distribuição binomial
b) E(X i ) = np i ; V(X i ) = np i q i
___________________________________________________________________________________
88
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
- nº de defeitos por cm2
- nº de acidentes por dia
- nº anual de suicídios
- nº de chamadas erradas por hora, num circuito telefônico, etc.
Note-se que a unidade de medida (tempo, área, etc) é contínua mas a variável
aleatória (nº de ocorrências) é discreta.
A distribuição de Poisson é utilizada quando o nº de observações de um
experimento aleatório é muito grande (ex: N ≥ 50) e a probabilidade de sucesso é muito
pequena (ex: p≤ 0,1) e o termo Np permanece constante. Daí ser conhecida,
classicamente, como a lei dos fenômenos raros.
A distribuição de Poisson fica completamente caracterizada por um único
parâmetro, a média do processo, pois na distribuição de Poisson a média é igual a
variância, ou seja, E(X) = V(X) = λ (ou algumas vezes representado por µ , ou m).
Sabendo-se que uma v.a. tem resultados distribuídos segundo Poisson e
conhecendo o nº médio de ocorrências por unidade de medida, podemos determinar a
probabilidade de qualquer dos resultados possíveis nos intervalos para os quais
desejamos.
A distribuição de Poisson é uma forma limite da distribuição binomial, quando N
tende a infinito e p tende a zero.
i) Função de probabilidade:
e − λ λx
P( X = x ) = , em que:
x!
X = v.a.d. representando o número de sucessos;
x = um particular valor de X;
e = base do logarítmo neperiano (e ≅ 2,718)
λ = média da distribuição no intervalo de tempo ou medida considerado. Média esta
sempre positiva.
E(X) = V(X) = λ = Np
___________________________________________________________________________________
89
Capítulo 6 – Distribuições de variáveis aleatórias discretas e contínuas
_____________________________________________________________________
Exemplos:
1. Num livro de 800 páginas há 800 erros de impressão.
a) Qual a probabilidade de que uma página contenha pelo menos 3 erros de impressão?
(R: ≅ 0,0803).
b) Estime o número provável de páginas por livro que não contêm erros de impressão.
(R: ≅ 294)
6.2.6 - Geométrica
E( X ) = 1 e σ 2 = q 2
p p
Exemplos:
1) Suponha-se que o custo de realização de um experimento seja R$ 1000. Se o
experimento falhar, ocorrerá um custo adicional de R$ 300 em virtude de serem
necessárias algumas alterações antes que a próxima tentativa seja executada. Se a
probabilidade de sucesso em uma tentativa qualquer for 0,2 (se as provas forem
independentes), e se os experimentos continuarem até que o primeiro resultado frutuoso
seja alcançado, qual será o custo esperado do procedimento completo? R.: R$ 6200.
___________________________________________________________________________________
90
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
3) Se a probabilidade de que um certo ensaio de reação “positiva” for igual a 0,4, qual
será a probabilidade de que menos de 5 reações “negativas” ocorram antes da primeira
positiva? R.: 0,92
obs.:
a) Suponha que exista uma longa sequência de “falhas” numa série de provas de
Bernoulli independentes com p=0,5. Contrário ao pensamento intuitivo de alguns
jogadores, isto não tem efeito algum nos resultados futuros. Essa propriedade é
chamada de falta de memória da distribuição.
b) As frequências dessa distribuição sempre diminuem numa progressão geométrica à
medida que o valor de X aumenta.
91
Capítulo 6 – Distribuições de variáveis aleatórias discretas e contínuas
_____________________________________________________________________
interessados na probabilidade de que o k-ésimo sucesso ocorra na x-ésima tentativa.
Esse tipo de experimento é chamado experimento binomial negativo. O número de
tentativas X para produzir k sucessos em um experimento binomial negativo é chamado
uma v.a.d. binomial negativa.
Sua função de probabilidade é:
k (1 − p ) k (1 − p )
E( X ) = e σ2 =
p p2
Exemplos:
1) No arremesso de uma moeda honesta, qual seria a probabilidade de ocorrer a
segunda “cara” no quarto arremesso? R.: 0,1875
obs.:
a) Essa distribuição encontra aplicação em estudos de acidentes, como uma substituta
para a distribuição de Poisson quando requerimentos de independência não são
satisfeitos.
___________________________________________________________________________________
92
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
Negativa é encontrada quando nós pré-fixamos o número de sucessos a ser obtido e
então registramos o número de provas de Bernoulli necessárias.
6.2.8 - Hipergeométrica
b) k dos N elementos podem ser classificados como sucessos e N-k são classificados
como fracasso (ou falhas).
P(X = x ) = h(x;N,n,k ) =
( )( ) , onde x = 0, 1, 2, ..., n
k N−k
n− x
()
x
N
n
N−n
E(X ) = np e σ 2 = npq em que p = k N
N − 1
Exemplos:
1) Uma firma comprou várias caixas contendo cada caixa 15 lâmpadas. A mesma
decidiu fazer uma inspeção por amostragem sem reposição analisando 5 lâmpadas de
cada caixa e aceitando a caixa caso se encontre duas ou menos defeituosas. Calcule a
probabilidade de se aceitar uma caixa sabendo que a qualidade do produto é definida
por 20% de defeituosos. R.: ≅ 0,978.
___________________________________________________________________________________
93
Capítulo 6 – Distribuições de variáveis aleatórias discretas e contínuas
_____________________________________________________________________
2) Pequenos motores elétricos são expedidos em lotes de 50 unidades. Antes que uma
remessa seja aprovada, um inspetor escolhe 5 desses motores e os inspeciona. Se
nenhum dos motores inspecionados for defeituoso, o lote é aprovado. Se um ou mais
forem verificados defeituosos, todos os motores da remessa são inspecionados.
Suponha que existam, de fato, três motores defeituosos no lote. Qual é a probabilidade
de que a inspeção de todos os motores desse lote seja necessária? R.: 0,28.
obs.:
a) uma extensão da distribuição hipergeométrica: se N elementos podem ser repartidos
em k grupos A 1 , A 2 , …, A k com a 1 , a 2 , …, ak elementos respectivamente, então a
distribuição de probabilidade das v.a.d. X 1 , X 2 , …, X k representando o número de
elementos selecionados de A 1 , A 2 , …, A k em uma amostra aleatória de tamanho n
(retirada sem reposição de elementos) é:
() N
n
k k
com ∑ xi = n
i =1
e ∑a
i =1
i =N
c) essa distribuição pode ser aproximada pela Binomial com parâmetros n e p, onde p é
calculado por k/N, se k/N ≤ 0,1;
94
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
6.3.1 - Uniforme
Exemplos:
1) Trens urbanos chegam a uma estação em intervalos de 15 minutos começando às 7
da manhã. Se o horário de chegada de um passageiro nessa estação está
uniformemente distribuída entre 7 e 7:30, encontre a probabilidade que ele espere:
a) menos que 5 minutos por um trem? R.: 1/3
b) pelo menos 12 minutos por um trem? R.: 1/5
3) Uma máquina de encher copos de de refrigerante sempre despeja nos copos uma
quantidade de bebida entre 270 e 300 ml. Assumindo que X = volume de refrigerante
seja uma v.a. uniformemente distribuida, determinar:
a) A probabilidade de que em um copo sejam despejados mais de 290 ml de
refrigerante?
b) A probabilidade de ocorrer um copo com menos de 275 ml de refrigerante?
c) O volume esperado em um copo qualquer?
d) A variância do volume esperado em um copo qualquer?
___________________________________________________________________________________
95
Capítulo 6 – Distribuições de variáveis aleatórias discretas e contínuas
_____________________________________________________________________
obs.:
a) Um valor de uma distribuição uniforme (0, 1) é chamado um “número aleatório”. Tem
inúmeras aplicações em simulações e montagem de experimentos.
6.3.2 - Normal
Notação: X∼N(μ; σ2): X tem distribuição normal com média μ e variância σ2.
i) Representação gráfica:
___________________________________________________________________________________
96
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
A função de distribuição acumulada é dada por:
x x 1 ( x − μ )2
1 −
F(x ) = P(X ≤ x ) = ∫ f (x )dx = ∫ e 2 σ2
dx
−∞ − ∞ σ 2π
ii ) Propriedades:
P 1 ) f(x) possui um ponto de máximo para x = μ.
P 2 ) f(x) tem dois pontos de inflexão cujas abscissas valem μ + σ e μ – σ.
P 3 ) f(x) é simétrica em relação a x = μ. E ainda, μ = Mo = Md.
P 4 ) f(x) tende a zero quando x tende para ± ∞ (assintótica em relação ao eixo x).
Estes problemas são resolvidos pela padronização dos valores, obtendo-se assim
a distribuição normal padronizada ou reduzida.
X −μ
Z=
σ
onde:
z = valor da variável normal padronizada Z
___________________________________________________________________________________
97
Capítulo 6 – Distribuições de variáveis aleatórias discretas e contínuas
_____________________________________________________________________
x = valor de X
μ = média de X
σ = desvio padrão de X
i) Média:
X −μ 1
= [E(X − μ)] = [E(X ) − E(μ)] = (μ − μ) = 0
1 1
E(Z ) = E
σ σ σ σ
E(Z) = 0
ii) Variância:
X −μ 1
V (Z ) = V
1
(
1 2
)
= 2 [V (X − μ)] = 2 [V (X ) + V (μ)] = 2 σ + 0 = 1
σ σ σ σ
V(Z) = 1
X −μ
Conclusão: Se X ~ N (μ, σ2), e Z = , então Z ∼N (0,1), para quaisquer valores de μ
σ
e σ2. Portanto, será possível tabelar as probabilidades, P(X ≤ x) = P(Z ≤ z), em função
dos valores de Z.
A f.d.p. da variável Z é dada por:
1
1 − 2 z2
ϕ (z ) = e , para −∞ < z < ∞
2π
___________________________________________________________________________________
98
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
z0 z 1
1 0 − 2 z2
P(0 ≤ Z ≤ z0 ) = ∫ ϕ (z )dz =
2π ∫0
e dz
0
Exemplos:
1) Calcule:
a) P(Z < 1,82)?
b) P (Z ≤ -2,03)?
c) P (-2,55 ≤ Z ≤ 1,20)?
d) P (Z ≥ 1,93)?
R: a) 0,0228 b) 0,6826 c) 98
___________________________________________________________________________________
99
Capítulo 6 – Distribuições de variáveis aleatórias discretas e contínuas
_____________________________________________________________________
também uma variável normal com média μW = aμX + bμY + c e variância
Exercícios
(R: Leves: peso < 1,43 kg; médias: 1,43 ≤ peso ≤ 1,57 kg; pesadas: peso > 1,57 kg)
3. Em uma distribuição normal 28% dos elementos são superiores a 34 e 12% dos
elementos são inferiores a 19. Encontrar a média e a variância da distribuição.
(R: μ ≅ 29,03 e σ2 ≅ 73,4)
4. X é uma v.a.c. tal que X∼N (12, 25). Qual a probabilidade de uma observação ao
acaso ser menor do que -2,5? (R: 0,0019).
___________________________________________________________________________________
100
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
Outras distribuições de variáveis aleatórias contínuas
6.3.3 - Exponencial
A v.a.c. X terá distribuição exponencial se sua f.d.p., para algum parâmetro λ > 0,
for dada por:
λe − λx para x ≥ 0
f (x ) =
0 caso contrário
Exemplos:
1) Mostre que F(x) = P(X ≤ x) = 1 – e-xλ, para x > 0
obs.:
a) Apresenta inúmeras aplicações nas áreas da teoria da confiabilidade.
b) E(X) = 1/λ e V(X) = 1/λ2.
___________________________________________________________________________________
101
Capítulo 6 – Distribuições de variáveis aleatórias discretas e contínuas
_____________________________________________________________________
6.3.4 - Lognormal
Essa distribuição ocorre na prática sempre que se encontrar uma v.a. tal que seu
logarítmo tenha uma distribuição normal. Em outras palavras, se uma v.a. X tem
distribuição Normal e se os valores de uma v.a. Y estão relacionados a X pela equação
y = ex, Y terá distribuição Lognormal.
Exemplo:
1) Encontrou-se, num certo processo de “trituração de pedras” que os diâmetros, D, das
pedras quebradas seguem aproximadamente uma lei lognormal com média 1,5 cm e
desvio padrão 0,3 cm. Qual a porcentagem das pedras:
a) que excede 2 cm? (R.: ≈ 6,2%)
b) menor do que 1 cm? (R.: ≈ 2,6 %)
obs.:
a) Exemplos de aplicação: doses críticas em aplicações de drogas; duração de
consultas médicas; distribuição de tamanhos de unidades econômicas.
6.3.5 - Gamma
A v.a. é dita ter uma distribuição Gamma com parâmetros α( , β), α > 0, β > 0, se
sua f.d.p. é dada por:
βα α -1 −βx
x e para x ≥ 0
f (x ) = Γ (α )
0
caso contrário
onde
∞
Γ (α ) = ∫ e − x x α −1dx , é chamada de função gamma.
0
___________________________________________________________________________________
102
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
Exemplo: O tempo de vida de uma bateria tem distribuição exponencial com taxaβ. Se
um aparelho eletrônico requer uma bateria para funcionar, então o tempo total de
funcionamento que podemos obter de um total de n baterias é uma v.a. gamma com
parâmetros (n, β). Como proceder para obter a probabilidade do aparelho funcionar por
um tempo maior que t?
obs.:
a) Uma relação pode ser feita entre as distribuições Gama e Poisson. Na de Poisson
estamos interessados no número de ocorrências de algum evento durante um período
de tempo fixado. A Distribuição Gama, por outro lado, surge quando indagamos a
distribuição do tempo necessário para obter um número especificado de ocorrências do
evento.
c) quando α = 1 a distribui
ção gamma se reduz à distribuição exponencial com média
1/β.
6.3.6 - Weibull
___________________________________________________________________________________
103
Capítulo 6 – Distribuições de variáveis aleatórias discretas e contínuas
_____________________________________________________________________
obs.:
a) A distribuição de Weibull representa um modelo adequado para uma lei de falhas,
sempre que o sistema for composto de vários componentes e a falha seja
essencialmente devida à “mais grave” imperfeição ou irregularidade dentre um grande
número de imperfeições do sistema;
b) Empregando uma distribuição de Weibull, poderemos obter tanto uma taxa de falhas
crescente como uma decrescente, pela simples escolha apropriada do parâmetro.
6.3.7 - Beta
obs.:
a) Essa distribuição é amplamente utilizada para ajustar distribuições teóricas cujas
amplitudes de variação são conhecidas. O ajuste é realizado após equacionar o primeiro
e segundo momentos (esperança e variância, respectivamente) das curvas teórica e
ajustada.
6.3.8 - χ2 (Qui-quadrado)
obs.:
a) Essa distribuição é usada primariamente como uma aproximação para a estatística χ2
(a ser vista oportunamente) sendo esta muito importante para vários testes de
significância.
___________________________________________________________________________________
104
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
6.3.9 - F
___________________________________________________________________________________
105
Capítulo 7 – Testes de Significância
_____________________________________________________________________
7.1– Introdução
Exemplo:
H 0 : μ = 6.000 horas (durabilidade de lâmpadas)
H a : μ > 6000; ou H a : μ < 6000; ou H a : μ ≠ 6000
106
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
Após a realização do teste concluímos por uma das hipóteses dadas acima.
RRH0 RRH0
RAH0 RAH0
RRH0 RRH0
RAH0
Teste bilateral μ ≠ X
___________________________________________________________________________________
Prof. Carlos Eduardo Magalhães dos Santos
107
Capítulo 7 – Testes de Significância
_____________________________________________________________________
O quadro abaixo facilita o entendimento.
Realidade
Decisão H 0 é verdadeira H 0 é falsa
Rejeitar H 0 α 1-β
Aceitar H 0 1-α β
então:
α = P(rej.H 0 /H 0 é verdadeira)
β = P(aceitar H 0 /H 0 é falsa)
1º - Enunciar as hipóteses H 0 e H a ;
2º - Fixar o nível de significância α e identificar a estatística do teste;
3º - Determinar a região crítica (faixa de valores que nos levam à rejeição da hipótese
H 0 ) e a região de aceitação em função do nível α pelas tabelas estatísticas apropriadas;
4º - Baseado na amostra, calcular o valor da estatística do teste;
5º - Concluir: Se estatística do teste ∈ região crítica ⇒ rej. H 0 caso contrário não rejeita
H0.
7.4.1 - Teste z
Teste z (veremos apenas o teste para uma média populacional)
Obs: assume-se que a variável em estudo tenha distribuição normal com variância
populacional conhecida.
variância σ
2
, onde n é o tamanho da amostra.
n
___________________________________________________________________________________
108
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
Testamos as hipóteses: H 0 : μ = μ 0 versus Ha: uma alternativa conveniente.
X −μ
A estatística do teste z para 1 média é: zcalc =
σ
n
Exercícios:
1) Uma máquina automática de encher pacotes de café enche-os segundo uma
distribuição normal, com média μ e variância 400 g 2. O valor de μ pode ser fixado num
mostrador situado numa posição um pouco inacessível dessa máquina. A máquina foi
regulada para μ = 500 g. Desejamos, de meia em meia hora, colher uma amostra de 16
pacotes e verificar se a produção está sob controle, isto é, se μ = 500 g ou não. Se uma
dessas amostra apresentasse uma média x = 492 g, você pararia ou não a produção
para verificar se o mostrador está na posição correta? Usar α = 1%.
2) Uma companhia de cigarros anuncia que o índice médio de nicotina dos cigarros que
fabrica apresenta-se abaixo de 23 mg por cigarro. Um laboratório realiza 6 análises
desse índice, obtendo: 27, 24, 21, 25, 26, 22. Sabe-se que o índice de nicotina se
distribui normalmente, com variância igual a 4,86 mg2. Pode-se considerar a afirmativa
do fabricante verdadeira, ao nível de 10% de probabilidade?
7.4.2 - Teste t
Obs: assume-se que a variável em estudo tenha distribuição normal com variância
populacional desconhecida.
___________________________________________________________________________________
Prof. Carlos Eduardo Magalhães dos Santos
109
Capítulo 7 – Testes de Significância
_____________________________________________________________________
7.4.2.1 - Teste t para 1 média
Testamos as hipóteses: H 0 : μ = μ 0 versus Ha: uma alternativa conveniente.
X −μ
A estatística do teste t para 1 média é: t calc = , onde:
σˆ
n
σ̂ ou s = desvio padrão amostral.
CUIDADO
Teste bilateral entrar com α
Tabela bilateral
Teste unilateral entrar com 2α
___________________________________________________________________________________
110
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
tipo de máquina, comparando a produção média de períodos em que foi usada a
máquina antiga e a nova.
Quando as variâncias das populações são substituídas pelas variâncias
amostrais, isto é, σ̂ 2 ou s2 em lugar σ 2 , o teste z passa ateste t, onde em função das
variâncias das populações serem ou não iguais entre si.
Outra pressuposição (apenas para efeito de nosso curso de CRP 192) seria a
homogeneidade das variâncias populacionais σ 2X e σ 2Y (desconhecidas).
Então: σˆ 2 =
SQD X + SQD Y (n − 1)σˆ 2X + (nY − 1)σˆ 2Y
= X
(nX − 1) + (nY − 1) nX + nY − 2
111
Capítulo 7 – Testes de Significância
_____________________________________________________________________
Decisão:
Se t calc ≥ t tab ⇒rejeita H 0
σˆ 2X = 12 min 2 σˆ 2Y = 15 min 2
n X = 18 nY = 13
___________________________________________________________________________________
112
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
permitir será apresentado também pelo menos mais um dos outros testes de qui-
quadrado.
Obs: A expressão acima nos dá um valor sempre positivo e tanto menor quanto maior
for o acordo entre as frequências observadas e as frequências esperadas, calculadas
com base em H 0 .
Obs: Para obter o χ 2tabelado precisamos conhecer o nível de significância (α) do teste e o
número de graus de liberdade v, onde v = k – 1 – r, onde k é o número de categorias em
que foi dividida a amostra; e r é o número de parâmetros estimados para o cálculo das
Ei.
___________________________________________________________________________________
Prof. Carlos Eduardo Magalhães dos Santos
113
Capítulo 7 – Testes de Significância
_____________________________________________________________________
7.4.4 - Teste F
2) Estamos desconfiados de que a média das receitas municipais per capita das cidades
pequenas (0 - 20.000 habitantes) é maior do que a das receitas do estado, que é de
1229 unidades monetárias. Para comprovar ou não esta hipótese, sorteamos dez
cidades pequenas, e obtivemos os seguintes resultados: 1230; 582; 576; 2093; 2621;
1045; 1439; 717; 1838; 1359. A que conclusão chegar a um nível de 5% de
probabilidade? (R: Não se rejeita-se H 0 )
___________________________________________________________________________________
114
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
3) Uma fábrica de embalagens para produtos químicos está estudando dois processos
para combater a corrosão de suas latas especiais. Para verificar o efeito dos
tratamentos, foram usadas amostras cujos resultados estão no quadro abaixo. Qual
seria a conclusão sobre os dois tratamentos, ao nível de 5% de significância?
Método Amostra Média Desvio padrão
A 15 48 10
B 12 52 15
(R: Não se rejeita-se H 0 )
7) Uma firma de produtos farmacêuticos afirma que o tempo médio para certo remédio
fazer efeito é de 24 minutos. Numa amostra de 19 casos, o tempo médio foi de 25
___________________________________________________________________________________
Prof. Carlos Eduardo Magalhães dos Santos
115
Capítulo 7 – Testes de Significância
_____________________________________________________________________
minutos, com desvio padrão de 2 minutos. Teste a alegação, contra a alternativa de que
o tempo médio é superior a 24 minutos, a um nível de significância de 1%. (R: Não se
rejeita-se H 0 )
Que conclusões você poderia tirar para a população de homens e mulheres desta
indústria, ao nível de 5% de significância? (R: Rejeita-se H 0 )
9) Uma das maneiras de medir o grau de satisfação dos empregados de uma mesma
categoria quanto à política salarial é através do desvio padrão de seus salários. A
fábrica A diz ser mais coerente na política salarial do que a fábrica B. Para verificar essa
afirmação, sorteou-se uma amostra de 10 funcionários não especializados de A, e 15 de
B, obtendo-se os desvios padrões s A = 1,0 SM e s B = 1,6 SM. Qual seria a sua
conclusão, ao nível de 1%? (R: Não se rejeita-se H 0 )
___________________________________________________________________________________
116
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
8.1– Introdução
mos que, por exemplo, 95% das vezes o intervalo θˆ 1 < θ < θˆ 2 contém θ. Nesse caso, o
erro seria de 5%.
Se considerarmos o intervalo l ≤ θ ≤ L , onde l é o limite inferior do intervalo, L é o
limite superior do intervalo, e θ é o parâmetro desconhecido, então o comprimento L – l
do intervalo de confiança observado é uma medida importante da qualidade da
informação obtida da amostra. A metade do intervalo, ou seja, θ – l ou L - θ, é chamado
de precisão do estimador.
Assim, quanto maior o intervalo de confiança, mais confiante nós estaremos de
que realmente o intervalo calculado contenha o verdadeiro valor de θ. Por outro lado,
quanto maior o intervalo, menos informação teremos sobre o verdadeiro valorθ.de
Numa situação ideal, obtemos um intervalo relativamente curto com alta confiança.
Nesse capítulo veremos apenas a “expressão” final para se obter um intervalo de
confiança. No entanto, pode-se demonstrar, facilmente, que intervalos de confiança são
obtidos com base na teoria discutida no capítulo sobre testes de hipóteses.
___________________________________________________________________________________
117
Capítulo 8 – Intervalos de confiança
_____________________________________________________________________
ii) Estimação por intervalo → quando a partir da amostra procuramos construir um
intervalo θˆ 1 < θ < θˆ 2 com certa probabilidade de que este intervalo contenha o
verdadeiro parâmetro populacional θ.
Sabemos que μ não é uma variável aleatória, mas sim um parâmetro, desta forma
a expressão acima deve ser interpretada do seguinte modo: “Construídos todos os
intervalos de forma especificada acima, um menos α deles conterão o parâmetro μ ”.
Assim
I.C. (95%): 41,738 < μ ≤ 42,110
___________________________________________________________________________________
118
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
Obs.1: pelo fato de μ se um par
âmetro e não uma v.a., o intervalo acima deve ser
interpretado da seguinte maneira: 95% dos intervalos assim construídos conterão a
verdadeira média.
Obs.2: A fórmula apresentada acima apresenta bons resultados para amostras oriundas
da população normal, ou para amostras com n ≥ 30 de população não normal. O nível
de confiança (1 – α) não será exato para amostras pequenas de população não normais.
Solução:
X = 7,8
2
∑ Xi
i (87 )
2
∑ iX 2
−
n
793 −
10 ≅ 4,0 ⇒ σˆ = σˆ 2 ⇒ σˆ ≅ 2,0
σˆ 2 = i =
n −1 10 − 1
___________________________________________________________________________________
119
Capítulo 8 – Intervalos de confiança
_____________________________________________________________________
2 2
∴I.C.(95%) : 8,7 − 2,262 ≤ μ ≤ 8,7 + 2,262 = 7,27 ≤ μ ≤ 10,13
10 10
Conclusão: Se repetirmos este experimento um nº muito grande de vezes em 95% dos
intervalos assim construídos conterão μ no seu interior.
Assuma que o tempo de resistência ao fogo segue uma distribuição normal. Obter o I.C.
(95%) do tempo médio de resistência ao fogo.
R.: 9,8073 ≤ μ ≤ 9,8977. Dizemos estar 95% confiantes de que a média do tempo de
resistência ao fogo está entre 9,8073 e 9,8977 segundos.
Seja X uma população normal com distribuição normal com média μ e variância
amostral. Então:
I.C.(1 − α ) :
(n − 1)σˆ 2 ≤ σ 2 ≤ (n − 1)σˆ 2
χ maior
2
χ menor
2
onde χ maior
2
e χ menor
2
são obtidos na tabela de χ 2 , com n – 1 graus de liberdade e nível de
Gráfico:
___________________________________________________________________________________
120
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
Exemplo: Considerando a mesma amostra do exemplo anterior, calcule o I.C. para σ2
ao nível de 90% de confiança (ou seja, α =10%).
Solução:
Temos: n = 10, σ̂ 2 = 4, g.l. = v = 9; α = 10%.
Gráfico:
Obs: O método apresentado abaixo é apropriado quando n for maior que 30.
f (1 − f ) f (1 − f )
I.C.(1 − α ) será : f − Z α ≤ p ≤ f + Zα
2 n 2 n
Exemplo: Entre 500 pessoas inquiridas a respeito de suas preferências eleitorais, 260
mostraram-se favoráveis ao candidato B. Calcular o intervalo de confiança ao nível de
90% para a porcentagem (ou proporção) dos eleitores favoráveis a B.
___________________________________________________________________________________
121
Capítulo 8 – Intervalos de confiança
_____________________________________________________________________
8.4.1 - Baseado no I.C. para a média, quando σ2 é conhecida
α
A precisão do I.C. é z α . Isto significa que em usar X para estimar μ , o erro
2 n
α
E = [ X - μ ] é menor ou igual a z α com confiança 100 (1 – α). Isso poderia ser
2 n
mostrado graficamente. Se o tamanho da amostra pode ser controlado, podemos
escolher n de modo que nós estaremos 100 (1 – α)% confiantes de que o erro na
estimação do μ será menor do que um erro específico E . Assim, o tamanho amostral
apropriado será aquele de n tal que
2
α zα ⋅ σ
zα = E, ou seja, n = 2
2 n E
Obs.1: Se n não for inteiro, este deve ser aproximado para cima para garantir que o
nível de confiança não fique menor que 100(1 – α)%.
Obs.2: Observe que 2E é o comprimento do I.C. de interesse.
___________________________________________________________________________________
122
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
8.4.2 - Baseado no I.C. para a média, quando não conhecemos a σ2
maneiras: 1 e tα ,n −1
.
n 2
Dessa forma, a obtenção de n ocorre por meio de tentativas e erros, usando uma
estimativa de σ baseada, talvez, em experiência passada.
Outra possibilidade seria tomar uma amostra preliminar (amostra piloto) de n
observações para estimarσ. Então, usando o desvio padrão amostral s como uma
aproximação para σ usamos a equação
2
zα ⋅ σ
n= 2
E
para calcular o valor requerido de n para fornecer a acurácia e o nível de confiança
desejados.
( )
2) Sendo X uma população tal que X ~ N μ, σ 2 em que μ e σ2 são desconhecidos. Uma
___________________________________________________________________________________
123
Capítulo 8 – Intervalos de confiança
_____________________________________________________________________
4) A força de compressão de concreto está sendo testada por um engenheiro civil. Ele
testa 12 amostras e obtém os seguintes dados:
5)Tintas para marcação em asfalto de rodovias são oferecidas em duas cores, branca e
amarela. O tempo de secagem dessas tintas é de muito interesse, e especificamente,
suspeita-se que a tinta amarela seca mais rápido do que a branca. Amostras foram
obtidas para a medição dos tempos de secagem (em minutos), em condições reais das
duas tintas:
Tinta branca 120 132 123 122 140 110 120 107
Tinta amarela 126 124 116 125 109 130 125 117 129 120
___________________________________________________________________________________
124
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
9.1– Introdução
9.2 - Correlação
___________________________________________________________________________________
125
Capítulo 9 – Correlações e Regressão Linear
_____________________________________________________________________
a) Se, quando uma das variáveis “cresce”, a outra, em média, também “cresce”,
dizemos que entre as duas variáveis existe correlação positiva, tanto mais forte quanto
mais perto de uma reta imaginária os pontos estiverem;
___________________________________________________________________________________
126
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
n n
∑ Xi ∑ Yi
SPD XY = ∑ Xi Yi − i =1 i =1
n
i =1 n
2 2
n n
∑ Xi ∑ Yi
SQD X = ∑ Xi − i =1 SQD Y = ∑ Yi − i =1
n n
2 2
i =1 n i =1 n
Exemplo:
Amostra A 4 8 3 9 7 5
Amostra B 1 5 2 14 3 11
n n
n
∑ A i ∑ Bi
i=1 = 252 − (36 )(36 ) = 36
SPD AB = ∑ A iBi − i=1
i=1 n 6
2
n
∑ Ai
SQD A = ∑ A i2 − i =1 = 244 −
n
(36 )2 = 28
i =1 n 6
2
n
∑ Bi
n
SQDB = ∑ Bi −
2 i =1 = 356 −
(36 )
2
= 140
i =1 n 6
SPD AB 36
rXY = = = 0,575
SQD A ⋅ SQDB (28 )(140 )
___________________________________________________________________________________
127
Capítulo 9 – Correlações e Regressão Linear
_____________________________________________________________________
comportam os valores da variável dependente (Y) em função da variação da variável
independente (X).
O comportamento de Y em relação a X pode se apresentar de diversas maneiras:
linear, quadrático, cúbico, exponencial, logarítmico, dentre outros. Para se estabelecer o
modelo para explicar o fenômeno, deve-se verificar qual tipo de curva e equação de um
modelo matemático que mais se aproxime dos pontos representados no diagrama de
dispersão.
Contudo, pode-se verificar que os pontos do diagrama de dispersão, não vão se
ajustar perfeitamente à curva do modelo matemático proposto. Haverá na maior parte
dos pontos, uma distância entre os pontos do diagrama e a curva do modelo
matemático. Isto acontece, devido ao fato do fenômeno que está em estudo, não ser um
fenômeno matemático e sim um fenômeno que está sujeito a influências que acontecem
ao acaso. Assim, o objetivo da regressão é obter um modelo matemático que melhor se
ajuste aos valores observados de Y em função da variação dos níveis da variável X.
No entanto o modelo escolhido deve ser coerente com o que acontece na prática.
Para isto, deve-se levar em conta as seguintes considerações no momento de se
escolher o modelo:
a) o modelo selecionado deve ser condizente tanto no grau como no aspecto da
curva, para representar em termos práticos, o fenômeno em estudo;
b) o modelo deve conter apenas as variáveis que são relevantes para explicar o
fenômeno;
Como foi dito anteriormente, os pontos do diagrama de dispersão ficam um pouco
distantes da curva do modelo matemático escolhido. Um dos métodos que se pode
utilizar para obter a relação funcional, se baseia na obtenção de uma equação estimada
de tal forma que as distâncias entre os pontos do diagrama e os pontos da curva do
modelo matemático, no todo, sejam as menores possíveis. Este método é denominado
de Método dos Mínimos Quadrados (MMQ). Em resumo por este método a soma de
quadrados das distâncias entre os pontos do diagrama e os respectivos pontos na curva
da equação estimada é minimizada, obtendo-se, desta forma, uma relação funcional
entre X e Y, para o modelo escolhido, com um mínimo de erro possível.
___________________________________________________________________________________
128
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
9.3.1 - Modelo linear de 1º grau (REGRESSÃO LINEAR SIMPLES)
Para se obter a equação estimada, vamos utilizar o MMQ (Método dos Mínimos
Quadrados), visando a minimização dos erros. Assim, tem-se que:
ei = Yi − β0 + β1Xi
aplicando o somatório,
n n
___________________________________________________________________________________
129
Capítulo 9 – Correlações e Regressão Linear
_____________________________________________________________________
n n
n
∑ X i ∑ Yi
i=1
∑ Xi Yi − i=1
n SPD XY
βˆ 1 = i=1 2
= e βˆ 0 = Y − βˆ 1X
n
SQD
∑ Xi
X
Xi2 − i=1
n
∑i=1 n
Uma vez obtidas estas estimativas, podemos escrever a equação estimada:
ˆ = βˆ + βˆ X
Yi 0 1 i
Exemplos:
1) Para verificar se existe relação linear de primeiro grau entre umidade relativa (UR) do
ar de secagem de sementes e a germinação das mesmas, um pesquisador realizou um
experimento com 4 valores diferentes para a %UR do ar, obtendo-se os seguintes dados
(dados hipotéticos)
% UR 20 30 40 50
% Germinação 94 96 95 97
2) Foi realizado uma análise de regressão para investigar a existência de relação linear
simples entre a temperatura superficial de uma estrada (X) medida em graus F e a
deformação da pavimentação (Y) medida segundo uma técnica especial. Baseado nas
seguintes informações pede-se:
n = 20; ∑ y = 12,75; ∑ y
i
2
i = 8,86; ∑ x = 1478; ∑ x
i
2
i =143215,8; e ∑ x y = 1083,67
i i
___________________________________________________________________________________
130
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
b) Use a equação para estimar qual deformação haveria na pavimentação quando a
temperatura superficial fosse de 85 ºF?
c) Qual seria a mudança esperada na deformação da pavimentação para uma mudança
de 1 ºF na temperatura superficial?
d) Suponha que a temperatura seja medida em graus C ao invés de graus F. Qual seria
a nova equação ajustada resultante? Lembre-se: C = 5(F – 32)/9.
e) Qual seria a mudança esperada na deformação da pavimentação para uma mudança
de 1 ºC na temperatura superficial?
131
Capítulo 9 – Correlações e Regressão Linear
_____________________________________________________________________
As hipóteses: H 0 : β 1 = 0 versus H a : β 1 ≠ 0; estão relacionadas com a significância
da regressão. Não rejeitar H 0 é equivalente a concluir que não há relação linear entre X
e Y. Por outro lado, se H 0 : β1 = 0 for rejeitado indicaria que X é importante para explicar
a variabilidade em Y.
De maneira alternativa poderíamos testar a significância da regressão pelo
método da Análise de Variância (ANOVA). Assim a seguinte identidade pode ser
verificada:
∑ (Y − Y ) = ∑ (Yˆ − Y ) + ∑ (Y − Yˆ )
2 2 2
i i i
SQResíduo = SQRes = variação não explicada pela regressão = SQD Y - β̂1 SPD XY .
Baseado nessa identidade o seguinte quadro pode ser montado:
F.V. GL SQ QM F
QMReg = QMReg
Regressão p SQReg
SQReg QMRes
Resíduo, ou Independente da p-n- SQRes
SQRes
Regressão 1 p − n −1
Total n-1 SQTotal
( Y)
SQTotal = ∑ Y − ∑ 2 i
2
SQReg = βˆ 0 ∑ Yi + βˆ 1 ∑ Yi Xi −
(∑ Yi )
2
i
n n
___________________________________________________________________________________
132
CRP 192 – Iniciação à Estatística – 2011/I
_____________________________________________________________________________
Exemplo: (Exemplo anterior) Para verificar se existe relação linear de primeiro grau
entre umidade relativa (UR) do ar de secagem de sementes e a germinação das
mesmas, um pesquisador realizou um experimento com 4 valores diferentes para a
%UR do ar, obtendo-se os seguintes dados (dados hipotéticos)
% UR 20 30 40 50
% Germinação 94 96 95 97
a) Obter o quadro da ANOVA para checar a significância da regressão, ou seja, se
existe efeito da UR do ar de secagem na % de germinação? Se necessário use α = 5%.
___________________________________________________________________________________
133
Capítulo 9 – Correlações e Regressão Linear
_____________________________________________________________________
Para facilitar seus cálculos considere as seguintes informações:
∑ y = 46,1; ∑ y
i
2
i = 279,41; ∑ x = 2374; ∑ x
i
2
i = 786368; e ∑ x y = 14512,6
i i
Pede-se:
a) Obter a equação de regressão ajustada para o modelo Y i = β 0 + β 1 x i + ε i ?
b) Interpretar as estimativas obtidas dos parâmetros da regressão?
c) A análise de variância (ANOVA) da regressão? [Apresente a hipótese a ser testada
pela ANOVA e realize o teste apropriado (use α = 5%) para testar essa hip ótese].
d) Calcular o coeficiente de determinação para o modelo ajustado. Faça a interpretação
apropriada para esse resultado? (R.: 79,9%)
134
CRP 192 – Iniciação à Estatística – 2011/I
____________________________________________________________________________________________________________________
Observações:
- As tabelas que aqui constam, foram adaptadas do livro: Curso de Estatística Experimental (14ª ed) de Frederico Pimentel
Gomes, 2000.
- Este material será usado em provas e, portanto não deverá conter informações adicionais.
Nome:___________________________________________________________________ Matrícula:________________
1
Anexo 1 – Formulário e Tabelas
________________________________________________________________________________________________________
Formulário
2
n
∑ Xi
X i2 − i =1
n n
(m̂ − m̂ 2 ) − (m1 − m2 ) ∑d ∑ 2
m̂ − mo m̂D − mD
()
i
n
t= t= 1 t= m̂D = i=1
sD2 = i=1 ∆ = q 1 V̂ Ĉ
s 1 1 sD2 n n −1 2
n s c2 +
n1 n 2 n
() () ai2 a2
i i
QM Re síduo QMresíduo
Di = z i 1 V̂ Ĉ V̂ Ĉ = S c2 ∑ = QM Re s∑ i ∆=q Di = z i
2 i=1 ri i=1 ri K K
2
k
∑ Xi
(I − 1)Ftab V̂ (Ĉ)
2
SQ = ∑ i − i=1k
k
CV (%) = 100
Ĉ X QM Re síduo Ti
S= t= m̂i =
V̂ Ĉ() i=1 ri
∑ r1
m̂ ri
i=1
2
CRP 192 – Iniciação à Estatística – 2011/I
____________________________________________________________________________________________________________________
G *
=
[QM Re s(a ) + (J − 1)QM Re s(b )]
2
QM Re s(a ) + (J − 1)QM Re s(b )
m̂ = n QM Re sComb =
N [QM Re s(a)]2 + [(J − 1)QM Re s(b)]2 J
g.l. Re s(a ) g.l. Re s(b )
n n n
n n ∑ Y = nβˆ
i o + βˆ 1 ∑ Xi + βˆ 2 ∑ Xi2
∑ Yi = nβˆ o + βˆ 1 ∑ Xi
i=1 i=1 i=1
n n n n
i=1
n n
i=1
n ∑ Yi Xi = βˆ o ∑ Xi + βˆ 1 ∑ Xi2 + βˆ 2 ∑ Xi3
∑ Yi Xi = βˆ o ∑ Xi + βˆ 1 ∑ Xi2
i=1 i=1 i=1 i=1
n n n n
i=1 i=1 i=1
∑ Yi Xi2 = βˆ o ∑ Xi2 + βˆ 1 ∑ Xi3 + βˆ 2 ∑ Xi4
i=1 i=1 i=1 i=1
2
n
∑ Yi
SQTotal = ∑ Yi − i=1
n
SQ Re gressão SQ Re gressão
2
R2 = R2 =
i=1 n SQTotal SQTratamen tos
2 2
n n
∑ Yi ∑ Yi
SQ Re gressão = βˆ o ∑ Yi + βˆ 1 ∑ Yi Xi − i=1 SQ Re gressão = βˆ o ∑ Yi +βˆ ∑ Yi Xi + βˆ 2 ∑ Yi Xi − i=1
n n n n n
2
3
Anexo 1 – Formulário e Tabelas
________________________________________________________________________________________________________
Tabela 1 – Área de uma distribuição normal padrão
4
CRP 192 – Iniciação à Estatística – 2011/I
____________________________________________________________________________________________________________________
Tabela 2 – Valores de t em níveis de 10% a 0,1% de probabilidade (Tabela Bilateral)
5
Anexo 1 – Formulário e Tabelas
________________________________________________________________________________________________________
Tabela 3 – Valores de χ 2 em níveis de 0,5% a 99,5% de probabilidade
6
CRP 192 – Iniciação à Estatística – 2011/I
____________________________________________________________________________________________________________________
Tabela 4 – Limites unilaterais de F ao nível de 1% de probabilidade, para o caso de F > 1
7
Anexo 1 – Formulário e Tabelas
________________________________________________________________________________________________________
Tabela 5 – Limites unilaterais de F ao nível de 5% de probabilidade, para o caso de F > 1
8
CRP 192 – Iniciação à Estatística – 2011/I
____________________________________________________________________________________________________________________
Tabela 6 – Valores da amplitude total estudentizada (q), para uso no teste de Tukey, ao nível de 1% de probabilidade
9
Anexo 1 – Formulário e Tabelas
________________________________________________________________________________________________________
10
CRP 192 – Iniciação à Estatística – 2011/I
____________________________________________________________________________________________________________________
Tabela 7 – Valores da amplitude total estudentizada (q), para uso no teste de Tukey, ao nível de 5% de probabilidade
11
Anexo 1 – Formulário e Tabelas
________________________________________________________________________________________________________
12
CRP 192 – Iniciação à Estatística – 2011/I
____________________________________________________________________________________________________________________
Tabela 8 – Valores da amplitude total estudentizada (z), para uso no teste de Duncan, ao nível de 1% de probabilidade
13
Anexo 1 – Formulário e Tabelas
________________________________________________________________________________________________________
Tabela 9 – Valores da amplitude total estudentizada (z), para uso no teste de Duncan, ao nível de 5% de probabilidade
14