Escolar Documentos
Profissional Documentos
Cultura Documentos
Livro Probabilidade Estatistica 2a Ed
Livro Probabilidade Estatistica 2a Ed
= + + + + + + + + + = 193 20 0 25 17 23 15 28 26 29 10 X
3 , 19
10
193
= = =
n
x
x ,
portanto mdia de vida til dos aparelhos so 19,3 anos.
PUC Minas Virtual 49 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
Dados Tabelados
Sem intervalo de Classe
n
n x
x
i
n
i
i
=1
X
i
: valor observado
n
i
: n de observaes por classe
n : n de observaes totais
Com intervalo de Classe
n
n x
X
i
n
i
i
=1
s vezes, a mdia pode ser um nmero diferente de todos os da srie de dados
que ela representa.
4.3. Moda (M
o
): Dados agrupados e no agrupados em classes
o valor que ocorre com maior freqncia em um conjunto de dados, e que de-
nominado valor modal. Baseado nesse contexto, um conjunto de dados pode apre-
sentar mais de uma moda. Nesse caso, dizemos ser multimodais; caso contrrio,
quando no existe um valor predominante, dizemos que amodal.
Dados no tabelados: o valor modal o predominante na distribuio.
Exemplo: Nos valores abaixo, qual o valor modal?
3 4 4 5 6 7 8 9 9 9 10 11 12 13
Soluo: M
o
= 9
Dados tabelados
Sem intervalo de Classe: O valor modal o valor que possuir maior freqn-
cia.
Exemplo:
Classes 0 1 2 3 4 5 6
i
x
: ponto mdio da classe
n
i
: n de observaes
PUC Minas Virtual 50 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
N 06 11 09 08 08 05 01 48
Soluo: o valor predominante o nmero 1, que ocorreu 11 vezes.
Temos, portanto, M
o
=1.
Com intervalo de classe: tratando-se de dados agrupados em classe, a moda
no percebida to facilmente como nos casos anteriores. Para calcular o va-
lor modal nesses casos, podemos utilizar os seguintes processos:
1 Processo: Frmula de Czuber
) ( ) (
inf
post mo ant mo
ant mo
Mo
n n n n
n n
h l Mo
+
+ =
onde constatamos:
Classe Modal: Classe de maior freqncia
n
mo:
freqncia simples da classe modal
n
ant
: freqncia simples anterior classe modal
n
post
: freqncia simples posterior classe modal
l
inf
: limite inferior da classe modal
h
Mo
: intervalo de classe modal
2 Processo: Frmula de Pearson
X Md M
o
2 3 =
onde constatamos:
M
d
= Mediana
X = Mdia
PUC Minas Virtual 51 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
Exemplo - Determinar a moda para a distribuio:
Classes 0|--- 1 1|--- 2 2|--- 3 3|--- 4 4|--- 5
n
i
3 10 17 8 5 43
Soluo: Utilizando a frmula de Czuber
a classe modal a classe 2|----3
l
inf
= 2
h
Mo
= 1
n
Mo
= 17
n
ant
= 10
n
post
=8
Substituindo esses valores na frmula, encontramos: M
o
= 2,44
4.4. Mediana (M
d
): Dados agrupados e no agrupados em classes
A mediana uma medida de posio. , tambm, uma separatriz, pois divide o
conjunto em duas partes iguais, com o mesmo nmero de elementos. O valor da
mediana encontra-se no centro da srie estatstica organizada, de tal forma que o
nmero de elementos situados antes desse valor (mediana) igual ao nmero de
elementos que se encontram aps esse mesmo valor (mediana).
Dados no tabelados
Para uma srie com nmero mpar de itens: a mediana corresponde ao valor
central.
E
Md -
elemento mediano: indica a posio da mediana.
n mpar
E
Md
= (n+1)/2
) (E
Md
X Md =
A mediana ser o termo de ordem (n+1)/2.
PUC Minas Virtual 52 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
Para uma srie com nmero par de itens: no h termo central nico, mas,
sim, dois termos centrais. A mediana ser dada por:
n par
E
Md
= n/2
2
X X
Md
1) (E ) (E
Md Md
+
+
=
A mediana ser a mdia aritmtica entre os termos centrais.
Dados tabelados:
Neste caso, o problema consiste em determinar o ponto do intervalo em que est
compreendida a mediana.
Sem intervalo de classe: devemos, primeiro, obter a localizao da mediana
na srie atravs do termo de ordem:
2
n
E
MD
=
Uma vez localizada a posio da mediana, devemos verificar o valor numrico da
varivel correspondente a essa posio.
Com intervalo de classe: localizada a classe mediana, calculamos o valor da
mediana pela frmula:
Md
ant
n
N
2
n
Md
+ =
Md
h l
inf
onde temos:
l
inf
: limite inferior da classe mediana.
h
Mo
: intervalo de classe mediana.
n
Md
: freqncia simples absoluta na classe mediana.
N
ant
: freqncia acumulada absoluta anterior classe mediana.
Classe Mediana: classe onde est o elemento mediano.
PUC Minas Virtual 53 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
4.5. Mdia Geomtrica (M
G
): Dados agrupados e no agrupados em classes
Dados no tabelados
A mdia geomtrica de um conjunto de N nmeros x
1
, x
2
,x
3
,
......x
n
a raiz de or-
dem N do produto desses nmeros:
N
n G
x x x x M ..... . .
3 2 1
=
Dados agrupados
Sem intervalo de classe
X
i
: valor observado
n
i
: n de observaes da classe
N
n
n
n n n
G
n
x x x x M ....
3 2 1
3 2 1
=
Com intervalo de classe
i
x : ponto mdio
n
i
: n de observaes
n
G
x x x x M ....
3 2 1
N n n n n
n 3 2 1
=
4.6. Mdia Harmnica (M
h
): Dados agrupados e no agrupados em classes
Sejam x
1
, x
2
, x
3,
......x
n
, valores de x, associados s freqncias absolutas n
1
, n
2
,
n
3
,......n
n
, respectivamente.
A mdia harmnica de X definida por:
=
=
+ + + +
=
n
i i
i
n
n
x
n
n
x
n
x
n
x
n
x
n
n
Mh
1 3
3
2
2
1
1
........
Para dados no agrupados n = 1.
Para dados agrupados sem intervalo de classe x
i
o valor da varivel.
Para dados agrupados com intervalo de classe x
i
o ponto mdio da classe.
PUC Minas Virtual 54 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
4.7. Separatrizes: Quartis, Decis e Percentis
So valores que ocupam determinados lugares de uma distribuio de freqncia.
Podemos classific-las em:
Quartis: dividem a distribuio em 4 partes iguais
Q
i
= quartil i=1,2,3
Q
1
= 1 quartil, valor situado de tal modo na srie que uma quarta parte (25%)
dos dados menor que ele e as trs quartas partes restantes (75%) so maio-
res.
Q
2
= 2 quartil, evidentemente, coincide com a Mediana (Q
2
= Md).
Q
3
= 3 quartil, valor situado de tal modo que as trs quartas partes (75 %) dos
termos so menores que ele e uma quarta parte 25 % maior.
h
n
N
n
l Q
Q
ant
Q
.
4
1
1
1
|
.
|
\
|
+ = h
n
N
n
l Q
Q
ant
Q
.
4
3
3
3
3
|
.
|
\
|
+ =
Onde temos:
l
inf
: limite inferior da classe do quartil considerado
h
Q
: intervalo de classe do quartil considerado
n
Q
: freqncia simples absoluta do quartil considerado
N
ant
: freqncia acumulada anterior classe do quartil considerado
Decis: dividem a distribuio em 10 partes iguais
D
i
= decil i=1,2,3, , 9
1 Passo: Calcula-se em que K = 1,2,3,......,9;
2 Passo: Identifica-se a classe D
K
, pela N
ac
;
3 Passo: Aplica-se a frmula:
l
DK
: limite inferior da Classe D
k
N : tamanho da amostra
h : amplitude da classe
n
DK:
freqncia da classe
N
(ant):
freqncia acumulada da classe
h
n
N
KN
l D
K
K
D
ant
D K
|
.
|
\
|
+ =
) (
10
PUC Minas Virtual 55 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
Percentis: : dividem a distribuio em 100 partes iguais.
P
i
= centil i=1,2,3, , 99
1 Passo: Calcula-se em que K = 1,2,3,4,............98,99
2 Passo: Pela N
ac
identifica-se a classe P
i
3 Passo: Aplica-se a frmula
l
PK
: limite inferior da classe
em que, K = 1,2,3,...,98,99.
N : tamanho da amostra
N
(ant):
freqncia acumulada anterior classe
h : amplitude da classe
n
PK
: freqncia da classe
h
n
N
KN
l P
K
K
P
ant
P K
|
.
|
\
|
+ =
) (
100
Exemplo:
1- Num acampamento infantil, foram obtidas as seguintes estaturas:
Estaturas 120|--- 128 128|---136 136|--- 144 144|--- 152 152|--- 160
frequencia 6 12 16 13 7
Calcule:
a) O 1 Quartil (Q
1
);
b) o 4 Decil (D
4
);
Soluo:
Primeiro vamos estruturar a tabela de distribuio de Freqncias, como esta-
mos trabalhando com intervalos de classe , temos que calcular os pontos m-
dios de cada classe. Depois iremos utilizar as frmulas para cada item que que-
remos calcular.
PUC Minas Virtual 56 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
i Estaturas (cm) n N X
i
(Ponto mdio)
1 120|--- 128 6 6 124
2 128 |--- 136 12 18 132
3 136 |--- 144 16 34 138
4 144 |--- 152 13 47 148
5 152 |--- 160 7 54 156
Total 54
a) Calculo de Q
1
,
Para calcular Q
1
, temos que primeiro identificar a classe que esta o valor, para
isto consideramos :
5 , 13
4
54
4
= =
N
, que vamos neste momento arredondar para 14, pela frequencia
acumulada procuramos a classe que encontra o 14 elemento, que a 2 classe
com limites de 128 |--- 136.
Agora usamos a formula para calcular Q
1
h
n
N
n
l Q
Q
ant
Q
.
4
1
1
1
|
.
|
\
|
+ =
Onde:
l
inf
: limite inferior da classe do quartil considerado = 128
h
Q
: intervalo de classe do quartil considerado = 8
n
Q
: freqncia simples absoluta do quartil considerado = 12
N
ant
: freqncia acumulada anterior classe do quartil considerado =6
Substituindo estes valores na expresso acima temos
( )
133 8 *
12
6 5 , 13
128
1
=
+ = Q
PUC Minas Virtual 57 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
b) Calculo de D
4
Primeiro identificamos a classe que esta o valor;
27 6 , 21
10
54 4
10
= = =
x KN
, atravs da freqncia acumulada identificamos a clas-
se que encontra o 27 , que a 3 classe com limites de 136 |--- 144
Agora usamos a frmula
h
n
N
KN
l D
K
K
D
ant
D K
|
.
|
\
|
+ =
) (
10
onde:
l
DK
: limite inferior da Classe D
k = 136
N : tamanho da amostra = 54
h : amplitude da classe = 8
n
DK:
freqncia da classe = 16
N
(ant):
freqncia acumulada da classe anterior = 18
Substituindo estes valores na expresso acima temos:
( )
8 , 137 8 *
16
18 6 , 21
136
4
=
+ = D
PUC Minas Virtual 58 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
UNIDADE 5
Medidas de Disperso
5.1. Disperso
5.2. Assimetria
5.3. Curtose
A interpretao de dados estatsticos exige que se realize um nmero
maior de estudos, alm das medidas de posio. Nesta unidade, vere-
mos que as medidas de disperso servem para verificar a representati-
vidade das medidas de posio, que o nosso principal objetivo.
5.1. Disperso
So medidas estatsticas utilizadas para avaliar o grau de variabilidade, ou disper-
so, dos valores em torno da mdia. Servem para medir a representatividade da
mdia.
Absoluta
Amplitude (A)
Varincia (S
2
)
Desvio padro (S)
Relativa
Coeficiente de Variao (CV)
PUC Minas Virtual 59 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
Amplitude Total (A)
a diferena entre o maior e o menor dos valores da srie. A utilizao da amplitu-
de total como medida de disperso muito limitada, pois sendo uma medida que
depende apenas dos valores externos, instvel, no sendo afetada pela disperso
dos valores internos.
Varincia (S
2
)
A varincia leva em considerao os valores extremos e os valores intermedirios,
isto , expressa melhor os resultados obtidos. A varincia relaciona os desvios em
torno da mdia, ou, mais especificamente, a mdia aritmtica dos quadrados dos
desvios.
Dados Brutos Dados Agrupados
2
2
2
1 1
|
|
.
|
\
|
=
n
n x
n
n x
S
i i i i
1
) (
2
_
1 2
=
=
n
x x
S
i
n
i
Onde temos que:
Para dados agrupados sem intervalo de classe, x
i
o valor da varivel.
Para dados agrupados com intervalo de classe, x
i
o ponto mdio da classe.
Para dados amostrais, o denominador n-1; para dados
populacionais, usamos no denominador o valor de n.
Sendo a varincia calculada a partir dos quadrados dos desvios, ela um nmero
em unidade quadrada em relao varivel em questo, o que, sob o ponto de
vista prtico, um inconveniente; por isso, tem pouca utilidade na estatstica des-
critiva, mas extremamente importante na inferncia estatstica e em combinaes
de amostras.
PUC Minas Virtual 60 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
Desvio Padro (S)
O desvio-padro a medida mais usada na comparao de diferenas entre conjuntos de
dados, por ter grande preciso. O desvio padro determina a disperso dos valores em rela-
o mdia e calculado por meio da raiz quadrada da varincia.
2
S S =
Coeficiente de Variao (CV)
Trata-se de uma medida relativa de disperso til para a comparao em termos
relativos do grau de concentrao. O coeficiente de variao a relao entre o
desvio padro (S) e a mdia x . da mdia de sries distintas.
x
S
CV =
Diz- se que uma distribuio tem:
Baixa disperso: CV 15%
Mdia disperso: 15%< CV<30%
Alta disperso: CV 30%
5.2. Assimetria
Estas medidas referem-se forma da curva de uma distribuio de freqncia,
mais especificamente do polgono de freqncia ou do histograma.
Denomina-se assimetria o grau de afastamento de uma distribuio da unidade de
simetria.
Em uma distribuio simtrica, tem-se igualdade dos valores da mdia, mediana
e moda.
PUC Minas Virtual 61 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
Simetria
Md Mo X = =
Toda distribuio deformada sempre assimtrica. Entretanto, a assimetria pode
dar-se na cauda esquerda ou na direita da curva de freqncias.
Em uma distribuio assimtrica positiva, ou assimetria direita, tem-se:
Assimetria direita (ou positiva)
X Md Mo < <
Mo Md
X
Em uma distribuio assimtrica negativa, ou assimetria esquerda,
predominam valores inferiores Moda.
Assimetria esquerda (ou negativa)
Mo Md X < <
X
Md Mo
PUC Minas Virtual 62 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
Existem vrias frmulas para o clculo do coeficiente de assimetria. As mais utiliza-
das so:
1 Coeficiente de Pearson
M
o
: valor modal (moda)
S : Desvio padro
X : Mdia
S
Mo x
AS
=
2 coeficiente de Pearson
Q
1
: valor do 1 Quartil
Q
3
: valor do 3 Quartil
M
d
: valor da Mediana
1 3
3 1
2
Q Q
Md Q Q
AS
+
=
Quando
AS = 0, diz-se que a distribuio simtrica.
AS > 0, diz-se que a distribuio assimtrica positiva ( direita)
AS > 0, diz-se que a distribuio assimtrica positiva ( direita)
5.3. Curtose
Curtose o grau de achatamento (ou afilamento) de uma distribuio em comparao com
uma distribuio padro (chamada curva normal). De acordo com o grau de curtose, classifi-
camos trs tipos de curvas de freqncia:
Mesocrtica: uma curva bsica de referncia chamada curva padro ou curva normal;
PUC Minas Virtual 63 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
Platicrtica: uma curva mais achatada (ou mais aberta) que a curva normal;
Leptocrtica: uma curva mais afilada que a curva normal;
Para medir o grau de curtose utiliza-se o coeficiente:
Q
1
: valor do 1 Quartil
Q
3
: valor do 3 Quartil
P
10
: valor do percentil 10
P
90
: valor do percentil 90
) (
10 90
1 3
2 P P
Q Q
K
=
Se K= 0,263, diz-se que a curva correspondente distribuio de freqncia
mesocrtica.
Se K > 0,263, diz-se que a curva correspondente distribuio de freqncia
platicrtica.
Se K < 0,263, diz-se que a curva correspondente distribuio de freqncia
leptocrtica.
PUC Minas Virtual 64 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
UNIDADE 6
Probabilidade
6.1. Experimento aleatrio, espao amostral e eventos
6.2. Probabilidade: Definio clssica; Probabilidade e
freqncia relativa
6.3. Tipos de eventos
6.4. Axiomas de Probabilidade
6.5. Probabilidade condicional e independncia de eventos
Nesta unidade, vamos ver que a probabilidade expressa por meio de va-
lores numricos as possibilidades da ocorrncia dos resultados de um
fenmeno. So objetivos desta unidade:
Definir e determinar os possveis espaos amostrais de determinados
fenmenos;
Determinar a probabilidade de ocorrncia de um determinado fen-
meno.
Formar um conhecimento slido dos valores probabilsticos que sero
utilizados nas prximas unidades.
6.1. Experimento aleatrio, espao amostral e eventos
Introduo
Todas as vezes que se estudam fenmenos de observao, cumpre-se distinguir o
prprio fenmeno e o modelo matemtico (determinstico ou probabilstico) que
melhor o explique.
Os fenmenos estudados pela estatstica so fenmenos cujo resultado, mesmo em
condies normais de experimentao, varia de uma observao para outra, dificul-
tando dessa maneira a previso de um resultado.
A observao de um fenmeno casual recurso poderoso para se entender a varia-
bilidade do mesmo. Entretanto, com suposies adequadas e sem observar direta-
mente o fenmeno, podemos criar um modelo terico que reproduza de forma bas-
PUC Minas Virtual 65 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
tante satisfatria a distribuio das freqncias quando o fenmeno observado
diretamente. Tais modelos so os chamados modelos de probabilidades.
Os fenmenos determinsticos conduzem sempre a um mesmo resultado quando as
condies iniciais so as mesmas. Ex: tempo de queda livre de um corpo. Mantidas
as mesmas condies, as variaes obtidas para o valor do tempo de queda livre de
um corpo so extremamente pequenas (em alguns casos, desprezveis).
Os fenmenos aleatrios podem conduzir a diferentes resultados e mesmo quando
as condies iniciais so as mesmas, existe a imprevisibilidade do resultado. Ex:
lanamento de um dado.
Podemos considerar os experimentos aleatrios como fenmenos produzidos pelo
homem.
Lanamento de uma moeda honesta;
Lanamento de um dado;
Lanamento de duas moedas;
Retirada de uma carta de um baralho completo, de 52 cartas;
Determinao da vida til de um componente eletrnico.
A anlise desses experimentos revela que:
Cada experimento poder ser repetido indefinidamente sob as mesmas
condies;
No se conhece em particular valor o do experimento a priori, porm po-
de-se descrever todos os possveis resultados as possibilidades;
Quando o experimento for repetido um grande nmero de vezes, surgir
uma regularidade.
Para a explicao desses fenmenos (fenmenos aleatrios), adota-se um modelo
matemtico probabilstico.
Para melhor entendimento desta unidade, interessante relembrar alguns concei-
tos bsicos no estudo das probabilidades tais como:
Espao Amostral
Um dos conceitos matemticos fundamentais utilizados no estudo das probabilida-
des o de conjunto. Um conjunto uma coleo de objetos ou itens que possuem
PUC Minas Virtual 66 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
caracterstica(s) comum(ns). importante definir cuidadosamente o que constitui o
conjunto em que estamos interessados, a fim de podermos decidir se determinado
elemento ou no membro do conjunto.
Conjunto uma coleo bem definida de objetos ou itens.
A probabilidade s tem sentido no contexto de um espao amostral, que o con-
junto de todos os resultados possveis de um experimento. O termo experimen-
to sugere a incerteza do resultado antes de fazermos as observaes. Os resulta-
dos de um experimento (ex: a ocorrncia de um raio, uma viagem etc.) chamam-
se eventos.
Evento Aleatrio (E)
qualquer subconjunto de um espao amostral. tambm o resultado obtido de
cada experimento aleatrio, que no previsvel.
Espao Amostral (S)
Espao amostral de um experimento aleatrio o conjunto de todos os possveis
resultados desse experimento.
Exemplos de Espaos Amostrais:
S = { c, r } ( composto de 2 eventos)
S = { 1, 2, 3, 4, 5, 6 } ( composto de 6 eventos)
S = { (c, r), (c, c), (r, c), (r, r)} ( composto de 8 eventos)
Genericamente, se o n de pontos (elementos do espao amostral) amostrais de
um espao amostral finito n, ento o nmero de eventos dado por 2
n
.
Exemplo: No lanamento de 5 moedas, o nmero de pontos amostrais
(resultados possveis) 2
5
= 32. Portanto, S= 32.
O complemento de um evento constitudo de todos os resultados no espao a-
mostral que no faam parte do evento.
Os eventos so mutuamente excludentes, quando no tm elemento em comum.
Ou se no podem ocorrer simultaneamente.
PUC Minas Virtual 67 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
Exemplo:
Na extrao de uma s carta, os eventos a carta de copas e a carta
de ouros so mutuamente excludentes, porque uma carta no pode
ser ao mesmo tempo de copas e de ouros.
J os eventos a carta de copas e a carta uma figura no so mu-
tuamente excludentes, porque algumas cartas de copas so tambm fi-
guras.
Muitas vezes, til representar graficamente um espao amostral, porque isso tor-
na mais fcil visualizar-lhe os elementos.
S
A A
A A
Os eventos A e A so complementares.
S
B B A A
Os eventos A e B so mutuamente
excludentes porque no se interceptam.
S
B B A A
Os eventos A e B no so mutuamente excludentes,
pois tm alguns elementos em comum.
Operaes com Eventos Aleatrios
Consideremos um espao amostral finito:
{ }
n
S = .... , ,
3 2 1
PUC Minas Virtual 68 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
Sejam A e B dois eventos de S, as seguintes operaes so definidas:
A) Reunio A B O evento reunio formado pelos pontos amostrais que per-
tencem a pelo menos um dos eventos.
{ } B ou A S B A =
1 1 1
/ ) (
S S A A
B B o evento que ocorre se A
ocorre ou B ocorre, ou am-
bos ocorrem
B) Interseo A B O evento interseo formado pelos pontos amostrais que
pertencem simultaneamente aos eventos A e B.
{ B e A S B
i i i
= } A
Obs: Se A B = , A e B so eventos
mutuamente exclusivos
o evento que ocorre se A e
B ocorrem
S S
A A B B
C) Complementao S A = A
c
o evento que ocorre se A no ocorre.
{ } A S A
i i
c
=
A A
C C
A A
S S
PUC Minas Virtual 69 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
6.2. Probabilidade: Definio Clssica; Probabilidade e freqncia relativa
Dado um experimento aleatrio, E e S o espao amostral, probabilidade de um
evento A P(A) - uma funo definida em S que associa a cada evento um
nmero real, satisfazendo os seguintes axiomas:
0 < P(A) <1
P(S) = 1
Se A e B forem eventos mutuamente exclusivos, ( A B)=), ento:
P (A B)=P(A)+P(B)
Chamamos de probabilidade de um evento A (A S) o nmero real P(A), tal que:
NTC
NCF(A)
Casos de Total Nmero
A) ( Favorveis Casos de Nmero
P(A) = =
6.3. Tipos de eventos
Chamamos de evento qualquer subconjunto do espao amostral S de um experi-
mento aleatrio.
Assim, qualquer que seja E, se E S (E est contido em S), ento E um evento
de S.
Evento Certo aquele que ocorre em qualquer realizao do experimento aleat-
rio.
Se E = S, E chamado evento certo.
Evento Elementar aquele formado por um nico elemento do espao amostral.
Se E S e E um conjunto unitrio, E chamado evento elementar.
Evento Impossvel - aquele que no ocorre em nenhuma realizao de um expe-
rimento aleatrio. Se E = , E chamado evento impossvel.
Evento Complementar seja um evento A qualquer, o evento A (chamado de
complementar de A), tal que A=S-A, ou seja, um outro conjunto formado pelos
elementos que pertencem a S e no pertencem a A.
PUC Minas Virtual 70 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
Eventos Equiprovveis
Quando se associa a cada ponto amostral a mesma probabilidade, o espao amos-
tral chama-se equiprovvel ou uniforme. Os eventos E
i
,i=1,2,3......n so equipro-
vveis quando P(E
i
)=P(E
2
)=P(E
n
)=P, isto , quando todos tm a mesma probabili-
dade de ocorrer: P=1/n.
Se os n pontos amostrais (eventos) so equiprovveis, a probabilidade de cada um
dos pontos amostrais 1/n .
n
r
A P
n
r A P = |
.
|
\
|
= ) ( ) (
1
Exemplo:
Retira-se uma carta de um baralho completo de 52 cartas. Qual a pro-
babilidade de sair um rei ou uma carta de espadas?
Soluo:
) ( ) ( ) ( ) ( B A P B P A P B A P + =
Eventos mutuamente exclusivos
Dois eventos A e B so denominados mutuamente exclusivos se eles no puderem
ocorrer simultaneamente, isto , A B = .
Evento impossvel
Exemplo:
E = Jogar um dado e observar o resultado. Sejam os eventos A= ocorrer
n par e B= ocorrer n mpar.
{ } 6 , 5 , 4 , 3 , 2 , 1 = S
Ento, A e B so mutuamente exclusivos, pois a ocorrncia de um n-
mero par e mpar no pode ser verificada em decorrncia da mesma ex-
perincia.
PUC Minas Virtual 71 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
6.4. Axiomas de Probabilidade
1 Se o conjunto vazio (evento impossvel), ento P()=0.
2 Teorema do evento complementar: Se A
c
o complemento do evento A, ento:
P(Ac) = 1 P(A)
3 Teorema da soma: Se A e B so dois eventos quaisquer, ento:
P(A B) = P (A) + P (B) P (A B)
Se tomssemos apenas P(A B) = P (A) + P (B), estaramos, considerando duas
vezes a probabilidade de interseo.
Teoria da Contagem
Dados dois eventos, o primeiro dos quais pode ocorrer de m maneiras distintas e o
segundo pode ocorrer de n maneiras distintas, ento os dois eventos conjuntamen-
te podem ocorrer de m.n maneiras distintas. O clculo da probabilidade de um e-
vento reduz-se a um problema de contagem. Assim que a Anlise Combinatria
tem fundamental importncia para se contar o n de casos favorveis e o total de
casos. Para problemas simples ou com poucos elementos, pode-se contr o nmro
de resultados de forma direta, sem necessidade de recorrer s frmulas matemti-
cas da anlise combinatria. Para problemas menos simples, recorre-se s combi-
naes e arranjos para determinar o nmero de casos.
Combinao
o O Nmero de combinaes de r elementos combinados p a p sendo
p<r e calculado por:
)! ( !
!
,
p r p
r
p
r
C
p r
=
|
|
.
|
\
|
=
Notao: O Smbolo fatorial ! denota o produto dos inteiros positivos em ordem
decrescente. Por exemplo, 6! = 6.5.4.3.2.1= 720. Por definio , 0! = 1.
PUC Minas Virtual 72 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
Exemplo: Quantas comisses de trs pessoas podem ser formadas com
um grupo de dez pessoas?
120
7 2 3
7 8 9 10
3
10
3 10
= =
|
|
.
|
\
|
=
! . .
! . . .
,
C
Podemos ter 120 comisses diferentes compostos com 3 pessoas.
Arranjos
o O nmero de arranjos de r elementos calculado por:
)! (
!
,
p r
r
A
p r
=
Exemplo: Considerando um grupo de dez pessoas, quantas chapas dife-
rentes podemos ter para uma eleio de presidente, tesoureiro e secre-
trio?
720
5040
3628800
! 7
3628800
)! 3 10 (
! 10
3 , 10
= = =
= A
Podemos ter 720 chapas diferentes.
OBS: Quando queremos selecionar r elementos de um conjunto de n elementos
distintos sem levar em conta a ordem, estamos considerando combinaes, quando
contamos separadamente ordenaes diferentes dos mesmos elementos temos
arranjos.
PUC Minas Virtual 73 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
6.5. Probabilidade Condicional e Independncia de Eventos
Probabilidade Condicional
O evento em que ambos, A e B, ocorrem chamado A interseo B; portanto, a
probabilidade do evento A ocorrer, dado que B ocorreu, de:
) (
) (
) (
B P
B A P
B A P
=
Isso significa que a probabilidade de A ocorrer, dado que B ocorreu, igual pro-
babilidade de ocorrncia simultnea de A e B dividida pela probabilidade de ocor-
rncia de B. (Note-se que essa definio no se aplica quando P(B)=0, porque en-
to estaramos dividindo por zero).
Exemplo:
Dois dados so lanados. Consideremos os eventos
A={(x
1
,x
2
) / x
1
+x
2
=10} e B={(x
1
,x
2
) / x
1
> x
2
},
onde x
1
o resultado do dado 1 e x
2
o resultado do dado 2. Avaliar
P(A); P(B); P(A/B) e P(B/A).
Soluo:
P(A)= 3/36 =1/12
P(B) =15/36 =5/12
P(A/B)=1/15
P(B/A)=1/3
Teorema do Produto
A probabilidade da ocorrncia simultnea de dois eventos, A e B, do mesmo espa-
o amostral, igual ao produto da probabilidade de um deles pela probabilidade
condicional do outro, dado o primeiro.
PUC Minas Virtual 74 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
) (
) (
) (
B P
B A P
B A P
=
) (
) (
) (
A P
B A P
A B P
=
Independncia Estatstica
Um evento A considerado independente de um outro evento B se a probabilidade
de A igual probabilidade condicional de A dado B.
Exemplo: Em um lote de 12 peas, 4 so defeituosas, 2 peas so reti-
radas uma aps a outra, sem reposio. Qual a probabilidade de que
ambas sejam boas?
A={a 1 pea boa}
B={a 2 pea boa}
P(A B)= P(A). P(B/A)= 8/12.7/11=14/33
Isto , se P(A)=P(A/B) evidente que, se A independente de B, B
independente de A; P(B)=P(B/A). Se A e B so independentes, ento
temos que
P(A B)=P(A).P(B)
Regra de Bayes
Sejam A
1
, A
2
, A
3
,......A
n
, n eventos mutuamente exclusivos tais que A
1
A
2
A
n
=
S.
Sejam P(A
i
) as probabilidades conhecidas dos vrios eventos e B um evento qual-
quer de S, tal que so conhecidas todas as probabilidades condicionais P(B/A
i
).
) / ( ). ( ...... ) / ( ). ( ) / ( ). (
) / ( ). (
) / (
2 2 1 1 n n
i i
i
A B P A P A B P A P A B P A P
A B P A P
B A P
+ + +
=
OBS: O Teorema de Bayes tambm chamado de Teorema da Probabilidade a Pos-
teriori. Ele relaciona uma das parcelas da probabilidade total com a prpria probabi-
lidade total.
PUC Minas Virtual 75 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
uma generalizao da probabilidade condicional ao caso de mais de dois eventos.
Exemplos:
1. Sendo P(A) = 1/3, P(B)= e P(A B)=11/12, calcular P(A/B).
Soluo:
Como
) (
) (
) / (
B P
B A P
B A P
= ) ( ) ( x p x X E
Chamamos varincia de X ao valor:
=
=
) ( ) (
)] ( [ ) ( ) (
2 2
2 2
x p x X E
onde
X E X E X Var
E de desvio padro de X a
) ( ) ( X Var X DP =
PUC Minas Virtual 80 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
Distribuies Discretas de Probabilidade
1. Distribuio de Bernoulli
Seja um experimento aleatrio E realizado repetidas vezes, sempre nas mesmas
condies, de tal forma que o resultado pode ser um Sucesso (s) (se acontecer o
evento que nos interessa) ou um Fracasso (f) (se o evento no se realizar).
Seja X a varivel aleatria: Sucesso ou Fracasso
p ) P(x q x P
q p p
x X
= = = =
= = =
= =
1 e ) 0 (
1 ) p(x ) p(x P(X)
(fracasso) 0 ou x (sucesso) 1
2 1
2 1
Essas condies caracterizam um conjunto de Provas de Bernoulli ou um experi-
mento de Bernoulli, e sua funo probabilidade dada por:
x x
q p x X P
= =
1
. ) (
Principais caractersticas
Mdia: p p q x P x X E
i
i
i
= + = =
=
. 1 . 0 ) ( ) (
1
0
Varincia:
pq p p p p X Var
p p q x P x X E
X E X E X Var
i
i
i
= = =
= + = =
=
=
) 1 ( ) (
1 0 ) ( ) (
)] ( [ ) ( ) (
2
2 2
1
0
2 2
2 2
PUC Minas Virtual 81 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
2. Distribuio Binomial
Uma varivel aleatria tem distribuio binomial quando o experimento ao qual
est relacionada apresenta apenas dois resultados (sucesso ou fracasso). Este mo-
delo fundamenta-se nas seguintes hipteses:
n provas independentes e do mesmo tipo so realizadas;
cada prova admite dois resultados Sucesso ou Fracasso;
a probabilidade de sucesso em cada prova p e de fracasso 1- p = q
Define-se a Varivel X que conta o nmero de sucesso nas n realizaes do expe-
rimento.
(X pode assumir os valores 0, 1, 2, 3, ......., n.)
Fazendo sucesso corresponder a 1 e fracasso, a 0, temos:
Para X = 0 , uma seqncia de n zeros : 000000....000.
n
q q q q q q q X P = = = ..... . . . . ) 0 (
Para X = 1, uma seqncia do tipo: 1000....0; 01000....0; 001000...0; sero n
seqncias, cada uma com um nico sucesso e n-1 fracassos:
1
. . ) 1 (
= =
n
q p n X P
Para X= x, tem-se x sucessos e (n-x) fracassos, correspondendo s seqncias
com x algarismos 1 e n-x zeros. Cada seqncia ter probabilidade e como
h seqncias distintas, tem-se:
x n x
q p
|
|
.
|
\
|
x
n
x n x
q p
x
n
x X P
|
|
.
|
\
|
= = ) (
Expresso geral da
distribuio Binomial
PUC Minas Virtual 82 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
Principais caractersticas:
Mdia: p n X E . ) ( =
Varincia: Var q p n X . . ) ( =
Exemplo: Uma moeda no viciada lanada 8 vezes. Encontre a proba-
bilidade de:
a) dar 5 caras;
b) pelo menos uma cara;
c) no mximo 2 caras.
Soluo:
a) x = sair cara, p=0,5 ( probabilidade do sucesso de X), q= 0,5 ( pro-
babilidade do fracasso de X0, n = 8 ( nmero de repeties do evento).
% 88 , 21 21875 , 0 5 , 0 .
6 . 120
40320
5 , 0 . 5 , 0 .
)! 5 8 ( ! 5
! 8
) 5 (
8 5 8 5
= = =
= =
X P
b) P(x1)= 1 { P(X=0)} = 1-{ q
n
} = 1- 0,5
8
= 0,9960 = 99,6%
c) P(X2) = P(X=0)+ P(x=1) + P(X=2) , utilizando as frmulas dos i-
tens anteriores calcula-se as probabilidades.
3. Distribuio de Poisson
Consideremos a probabilidade de ocorrncia de sucessos em um determinado inter-
valo. A probabilidade da ocorrncia de um sucesso no intervalo proporcional ao
intervalo. A probabilidade de mais de um sucesso nesse intervalo bastante pe-
quena em relao probabilidade de um sucesso.
PUC Minas Virtual 83 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
Seja X o nmero de sucessos no intervalo; temos, ento:
!
.
) (
k
e
k X P
k
= =
mdia. a onde
A varivel X assim definida tem distribuio de Poisson.
A distribuio de Poisson muito usada na distribuio do nmero de:
Carros que passam por um cruzamento por minuto, durante uma certa hora do
dia;
Erros tipogrficos por pgina, em um material impresso;
Defeitos por unidade (m, m, m, etc.,,) por pea fabricada;
Colnias de bactrias numa dada cultura por 0,01mm, numa plaqueta de mi-
croscpio;
Mortes por ataque de corao por ano, numa cidade;
Problemas de filas de espera em geral, e outros.
Principais caractersticas:
Mdia: = ) ( X E
Varincia: = ) ( X Var
OBS: Muitas vezes, no uso da binomial, acontece que n muito grande e p muito
pequeno. Podemos, ento, fazer uma aproximao de binomial pela distribuio de
Poisson, da seguinte forma:
np =
Exemplo: Em mdia, so feitas 2 chamadas por hora para certo telefo-
ne. Calcular a probabilidade de se receber no mximo 3 chamadas em 2
horas e a probabilidade de nenhuma chamada em 90 minutos.
Soluo:
= 2 por hora, para 2 horas = 4
P(X3)= P(X=0)+P(X=1)+P(X=2)+P(X=3)
PUC Minas Virtual 84 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
P(X3) =
! 3
.
! 2
.
! 1
.
! 0
.
3 2 1 0
+ + +
e e e e
P(X3) =
6
4 .
2
4 .
1
4 .
1
4 .
3 4 2 4 1 4 0 4
+ + +
e e e e
P(X3) = % 34 , 43 4334 , 0 66 , 23 666 , 10 8 4
4 4 4 4 4
= = = + + +
e e e e e
Agora para 90 minutos =3 ( 1 hora (60 minutos) =2)
P(X=0)=
3
0 3
1
3 .
= e
e
= 0,0498 = 4,98 %
7.6. Distribuio contnua: Normal - propriedades, distribuio normal
padro, a Normal como aproximao da Binomial
Uma varivel aleatria, cujos valores so expressos em uma escala contnua,
chamada de varivel aleatria contnua.
Podemos construir modelos tericos para v.a.s contnuas, escolhendo adequada-
mente a funo de densidade de probabilidade (f.d.p.), que uma funo indicado-
ra da probabilidade nos possveis valores de X.
Assim, a rea sob a f.d.p. entre dois pontos a e b nos d a probabilidade da varivel
assumir valores entre a e b, conforme ilustrado na figura 1, apresentada a seguir.
a b
P(a<X<b)
Figura 1 Probabilidade como rea sob a curva entre dois pontos
PUC Minas Virtual 85 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
Portanto, podemos escrever:
= < <
b
a
dx x f b X a P ) ( ) (
Da relao entre a probabilidade e a rea sob a funo, a incluso, ou no, dos ex-
tremos a e b na expresso acima no afetar os resultados. Assim, iremos admitir
) ( ) ( ) ( ) ( b X a P b X a P b X a P b X a P = < = < = < <
Teoricamente, qualquer funo f(x) que seja no negativa e cuja rea total sob a
curva seja igual unidade, isto ,
=1 ) ( dx x f
caracterizar uma v.a. contnua.
Dada a v.a. contnua X, assumindo os valores no intervalo entre a e b, chamamos
valor mdio ou esperana matemtica de X ao valor
=
b
a
dx x f x X E ) ( ) (
Chamamos varincia de X ao valor
=
=
b
a
dx x f x X E
onde
X E X E X Var
) ( ) (
)] ( [ ) ( ) (
2 2
2 2
e de desvio padro de X a
) ( ) ( X Var X DP =
Se X uma v.a. contnua com f.d.p. f(x), definimos a sua funo de distribuio
acumulada F(x) como:
= =
x
dt t f x X P x F ) ( ) ( ) (
PUC Minas Virtual 86 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
1 - Distribuio Normal
A distribuio normal a mais importante das distribuies de probabilidades. Co-
nhecida como a curva em forma de sino, a distribuio normal tem sua origem
associada aos erros de mensurao. sabido que quando se efetuam repetidas
mensuraes de determinada grandeza com um aparelho equilibrado, no se chega
ao mesmo resultado todas as vezes; obtm-se, ao contrrio, um conjunto de valo-
res que oscilam, de modo aproximadamente simtrico, em torno do verdadeiro va-
lor. Construindo-se o histograma desses valores, obtm-se uma figura com forma
aproximadamente simtrica. Gauss deduziu matematicamente a distribuio normal
como distribuio de probabilidade dos erros de observao, denominando-a ento
lei normal dos erros.
Supunha-se inicialmente que todos os fenmenos da vida real devessem ajustar-se
a uma curva em forma de sino; em caso contrrio, suspeitava-se de alguma anor-
malidade no processo de coleta de dados. Da a designao de curva normal.
A observao cuidadosa subseqente mostrou, entretanto, que essa pretensa uni-
versalidade da curva, ou distribuio normal, no correspondia realidade. De fato,
no so poucos os exemplos de fenmenos da vida real representados por distribu-
ies no normais, curvas assimtricas, por exemplo. Mesmo assim, a distribuio
normal desempenha papel preponderante na estatstica, e os processos de infern-
cia nela baseados tm larga aplicao.
A distribuio normal tem sua funo de densidade de probabilidade dada por
f(x) =
( ) 1
2
2
2
2
exp
(
(
x
< < x
Como pode-se observar atravs da equao acima, a distribuio normal inclui os
parmetros e , os quais possuem os seguintes significados:
: posio central da distribuio (mdia,
x
)
: disperso da distribuio (desvio padro,
x
)
Se uma varivel aleatria X tem distribuio normal com mdia e varincia
2
,
escrevemos: X N( ,
2
).
A figura 2 ilustra uma curva normal tpica, com seus parmetros descritos grafica-
mente.
PUC Minas Virtual 87 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
: mdia
: desvio padro
x
f(x)
Figura 2 - Curva normal tpica
Propriedades da distribuio normal
Para uma mesma mdia e diferentes desvios padro , a distribuio que tem
maior desvio padro se apresenta mais achatada, acusando maior disperso em
torno da mdia. A que tem menor desvio padro apresenta pico mais acentuado e
maior concentrao em torno da mdia. A figura 3 compara trs curvas normais,
com a mesma mdia, porm, com desvios padro diferentes. A curva A se apresen-
ta mais dispersa que a curva B, que por sua vez se apresenta mais dispersa que a
curva C. Nesse caso,
A
>
B
>
C
.
Distribuies normais com o mesmo desvio padro e mdias diferentes possuem a
mesma disperso, mas diferem quanto localizao. Quanto maior a mdia, mais
direita est a curva. A figura 4 ilustra o fato, onde a curva A possui mdia maior
que a curva B (
A
>
B
).
A
B
C
Figura 3 - Distribuies normais com mesma mdia e desvios padro diferentes
PUC Minas Virtual 88 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
B
B A
Figura 4 - Distribuies normais com mesmo desvio padro e mdias diferentes
Como descrito anteriormente, a probabilidade de uma varivel assumir valores en-
tre a e b igual rea sob a curva entre esses dois pontos. A determinao dessas
probabilidades realizada matematicamente atravs da integrao da funo de
densidade de probabilidade entre os pontos a e b de interesse. No caso da normal,
a integral no pode ser calculada exatamente e a probabilidade entre dois pontos
s pode ser obtida de forma aproximada, por mtodos numricos. Essa tarefa
facilitada atravs do uso da distribuio normal padro definida a seguir.
No caso da distribuio normal, algumas dessas reas - com os pontos a e b, fun-
o da mdia e do desvio padro so bastante difundidas e esto representa-
das na figura 5:
68.26 %
99.73 %
+ +3
+2
-
-2
-3
95.46 %
Figura 5 - Probabilidades da distribuio normal
Portanto, 68,26% dos valores populacionais caem entre os limites definidos como
mdia mais ou menos um desvio padro ( 1); 95,46% dos valores caem entre
PUC Minas Virtual 89 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
mdia mais ou menos dois desvios padro ( 2); e 99,73% dos valores caem
entre mdia mais ou menos trs desvios padro ( 3).
A distribuio normal padro
A distribuio normal particular com mdia 0 e desvio padro 1 chamada de dis-
tribuio normal padro e costuma ser denotada por Z.
Se X N( ,
2
), ento, a varivel aleatria definida por
Z =
X
ter uma distribuio N(0,1). Essa transformao ilustrada pela figura 6:
+ +3
+2
-
-2
-3
X
X -
0 1 2 3 -1 -2 -3
Z
Figura 6 - Transformao de uma N( ,
2
) para uma N(0,1)
A rea esquerda de um valor especificado da N(0,1) encontra-se tabelada.
Utilizando-se a transformao acima, podemos obter as probabilidades para
qualquer N( ,
2
). O procedimento ilustrado atravs do exemplo abaixo.
Exemplo:
Extrudados tubulares possuem tenso de escoamento (tenso a partir da qual o
material se deforma plasticamente), que segue uma distribuio normal com mdia
de 210 MPa com desvio padro de 5 MPa. Em notao estatstica, X N(210 ,5
2
).
desejado que tais extrudados tenham tenso de escoamento de pelo menos 200
MPa. Portanto, a probabilidade do extrudado no atingir a especificao desejada :
PUC Minas Virtual 90 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
Soluo:
P(X < 200) = P Z = P(Z < -2). <
|
\
|
.
|
200 210
5
A figura 7 mostra a transformao realizada e a rea desejada.
180 190 200 210 220 230 240
X
-6 -4 -2 0 2 4 6
Z
P(X<200)
P(Z<-2)
Figura 7 - Probabilidade do extrudado no atingir a especificao desejada
Para clculo dessa probabilidade, utilizamos a tabela de distribuio normal padro-
nizada ( que esta no apndice do livro indicado na bibliografia bsica). Observe que
a tabela traz apenas a P(Z<z) para z no negativo (z 0). As propriedades que se
seguem podem ser deduzidas a partir da simetria da densidade em relao mdia
0, e so teis na obteno de outras reas no tabuladas.
P(Z>z) = 1 - P(Z<z)
P(Z<-z) = P(Z>z)
P(Z>-z) = P(Z<z)
PUC Minas Virtual 91 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
-z z
1 - P(Z < z) P(Z < -z)
Figura 8 - reas correspondentes na distribuio normal
Utilizando as relaes apresentadas acima, a probabilidade do extrudado no aten-
der especificao
P(X < 200) = P(Z < -2) = P(Z > 2) = 1 - P(Z < 2)
que, atravs da tabela da N(0,1) igual a
P (X < 200) = 1 - 0,97725 = 0,02275.
= 2,275%
PUC Minas Virtual 92 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
UNIDADE 8
Inferncia Estatstica
8.1. Populao e amostra; Estatsticas e parmetros;
Distribuies amostrais
Simetr
8.2. Estimao
8.3. Testes de Hipteses
Trata-se do processo de obter informaes sobre uma populao a partir
de resultados observados na amostra.
De modo geral, tem-se uma populao com grande nmero de elemen-
tos e deseja-se, a partir de uma amostra dessa populao, conhecer o
mais prximo possvel algumas caractersticas da populao.
Toda concluso tirada por uma amostragem, quando generalizada para
a populao, vir acompanhada de um grau de incerteza ou risco.
Ao conjunto de tcnicas e procedimentos que permitem dar ao pesqui-
sador um grau de confiabilidade, de confiana nas afirmaes que faz
para a populao, baseadas nos resultados das amostras, damos o no-
me de Inferncia Estatstica.
O problema fundamental da Inferncia Estatstica, portanto, medir o
grau de incerteza ou risco dessas generalizaes. Os instrumentos da
Inferncia Estatstica permitem a viabilidade das concluses por meio de
afirmaes estatsticas.
8.1. Populao e amostra; Estatsticas e parmetros;
Distribuies amostrais
Se um conjunto de dados consiste de todas as observaes possveis (concebveis
ou hipotticas), chamado uma populao; se um conjunto de dados se consiste
apenas de uma parte dessas observaes, chamado uma amostra.
PUC Minas Virtual 93 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
Um dos principais objetivos da maioria dos estudos, anlises ou pesquisas estatsti-
cas fazer generalizaes seguras - com base em amostras em relao s popu-
laes das quais se extraram as amostras.
Definies
Parmetro: a medida usada para escrever uma caracterstica numrica populacio-
nal. Genericamente representado por . A mdia (), a varincia (
2
) e o coefici-
ente de correlao () so alguns exemplos de parmetros populacionais.
Estimador: tambm denominado estatstica de um parmetro populacional. uma
caracterstica numrica determinada na amostra, uma funo de seus elementos.
Genericamente, representado por . A mdia amostral (x) e a varincia amostral
(s
2
) so alguns dos exemplos de estimadores.
PARMETROS:
ESTIMADORES: AMOSTRAS
POPULAO
Distribuio Amostral
Considere todas as possveis amostras de tamanho n que podem ser extradas de
determinada populao. Se para cada uma delas se calcular um valor do estimador,
tem-se uma distribuio amostral desse estimador. Como o estimador uma vari-
vel aleatria, pode-se determinar suas caractersticas, isto , encontrar sua mdia,
varincia, desvio-padro.
As distribuies amostrais so fundamentais para o processo de inferncia estatsti-
ca.
Distribuio amostral da Mdia
Sabe-se que
n
x
x
i
= ' (mdia aritmtica) um estimador da mdia populacional .
O estimador x uma varivel aleatria; portanto, busca-se conhecer sua distribui-
o de probabilidade.
PUC Minas Virtual 94 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
Teorema 1 A mdia da distribuio amostral das mdias, denotada por (x),
igual mdia populacional .
E (x) = (x) =
Assim, provado que a mdia das mdias amostrais igual mdia populacional.
Teorema 2 Se a populao infinita, ou se a amostragem com reposio, ento
a varincia da distribuio amostral das mdias, denotada por
2
(x), dada por:
2
2
'
) ' (
n
x VAR
x
= =
Teorema 3 Se a populao finita, ou se a amostragem sem preposio, ento
a varincia da distribuio amostral das mdias dada por:
|
.
|
\
|
=
1
) ' (
2
2
N
n N
n
x
1
'
=
N
n N
n
x
Sendo que: (x) =
Teorema 4 - Se a populao tem ou no distribuio normal com mdia e varin-
cia
2
, ento a distribuio das mdias amostrais ser normalmente distribuda com
mdia e varincia
n
2
.
Esses quatro teoremas provam que a mdia amostral (x) tem distribuio normal
com mdia igual mdia da populao () e varincia dada por
n
2
para popula-
es infinitas, assim como
|
.
|
\
|
1
2
N
n N
n
\
|
n
N x
2
; '
ou
|
|
.
|
\
|
|
.
|
\
|
1
; '
2
N
n N
n
N x
PUC Minas Virtual 95 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
com distribuies padronizadas dadas por:
n
x
Z
i
i
=
ou
|
.
|
\
|
=
1 N
n N
n
x
Z
i
i
Exemplo:
Temos uma populao de 5000 alunos de uma faculdade. Sabemos que
a altura mdia dos alunos de 175 cm e o desvio padro, de 5 cm. Reti-
ramos uma amostra sem reposio, de tamanho n = 100. Qual o valor
do desvio padro amostral?
Soluo:
X : N (175 , 25 cm)
=
=
cm
cm
5
175
Ento ( ) 175 = = x E
x
E 4988 , 0
1 5000
25 5000
10
5
1
=
=
N
n N
n
x
8.2. Estimao
H dois tipos fundamentais de estimao: por ponto e por intervalo.
Estimao pontual
O problema da estimao pontual surge quando estamos interessados em alguma
caracterstica numrica de uma distribuio desconhecida (ex: mdia, varincia) e
desejamos calcular, a partir de observaes, um nmero que inferimos que seja
uma aproximao da caracterstica numrica em questo.
Para ilustrar alguns dos problemas com os quais nos deparamos quando estimamos
a mdia de uma populao com base em dados amostrais, vamos recorrer a um
PUC Minas Virtual 96 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
estudo em que planejadores industriais procuraram determinar o tempo mdio que
um adulto leva para montar um rob fcil de montar. Com uma amostra aleat-
ria, obtm-se os seguintes dados (em minutos) para 36 pessoas que montaram o
rob:
17 13 18 19 17 21 29 22 16 28
21 15 26 23 24 20 8 17 17 21
32 18 25 22 16 10 20 22 19 14
30 22 12 24 28 11
A mdia desta amostra x = 19,9 minutos. Na ausncia de qualquer outra infor-
mao, podemos tomar esta cifra como uma estimativa de , o verdadeiro tempo
mdio que um adulto leva para montar o rob.
Esse tipo de estimativa chamada estimativa pontual, pois consiste de um nico
nmero, ou um nico ponto na escala dos nmeros reais. Embora se trate da forma
mais comum de expressar estimativas, ela deixa margem para no poucas ques-
tes. Por exemplo, no nos diz em quantas informaes a estimativa se baseia,
nem tampouco nos informa sobre o tamanho possvel do erro.
Estimao por intervalo
A estimao por pontos de um parmetro no possui uma medida do possvel erro
cometido na estimao, da surge a idia de construir os intervalos de confiana,
que so baseados na distribuio amostral do estimador pontual.
Uma maneira de expressar a preciso da estimao estabelecer limites que, com
certa probabilidade, incluam o verdadeiro valor do parmetro da populao. Esses
limites so chamados limites de confiana: determinam um intervalo de confian-
a, no qual dever estar o verdadeiro valor do parmetro. Logo, a estimao por
intervalo consiste na fixao de dois valores tais que (1 - ) seja a probabilidade de
que o intervalo, por eles determinado, contenha o verdadeiro valor do parmetro.
: nvel de incerteza ou grau de desconfiana
1 - : coeficiente de confiana ou nvel de confiabilidade.
Portanto, nos d a medida da incerteza desta inferncia (nvel de significncia).
Logo, a partir das informaes de amostra, devemos calcular os limites de um in-
PUC Minas Virtual 97 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
tervalo, valores crticos que em (1 - )% dos casos inclua o valor do parmetro a
estimar e em % dos casos no inclua o valor do parmetro.
Intervalo de confiana (IC) para a mdia populacional ()
quando a Varincia (
2
) conhecida.
Como se sabe, o estimador de x. Tambm conhecida a distribuio de
probabilidade de x:
|
|
.
|
\
|
n
N x
2
; '
\
|
|
.
|
\
|
1
; '
2
N
n N
n
N x
=
'
Fixando-se um nvel de confiana 1 - , tem-se:
Ou seja:
=
|
.
|
\
|
1
2 2
Z Z Z P
PUC Minas Virtual 98 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
Substituindo-se o valor de Z, tem-se:
=
|
|
|
|
.
|
\
|
1
2
'
2
Z
n
x
Z P
Resolvendo-se as duas inequaes para , tem-se o intervalo de confiana para a
mdia populacional () quando a varincia (
2
) conhecida:
= |
.
|
\
|
+ 1
2
'
2
'
n
Z x
n
Z x P
Como poder ser verificado, a aplicao da frmula extremamente simples. Fixa-
se o valor de 1 - , ou (1 - )100= %, e observa-se na tabela de distribuio nor-
mal padro o valor das abscissas que deixam /2 em cada uma das caudas. Com
os valores de x (mdia amostral), =desvio padro da populao, que neste caso
conhecido, e n (tamanho da amostra), constri-se o intervalo.
Para o caso de populaes finitas, usa-se a seguinte frmula:
=
|
|
.
|
\
|
1
1 2
'
1 2
'
N
n N
n
Z x
N
n N
n
Z x P
Exemplo:
A durao da vida de uma pea de equipamento tal que =5 horas.
Foram amostradas 100 dessas peas, obtendo-se a mdia de 500 horas.
Deseja-se construir um intervalo de confiana para a verdadeira durao
mdia da pea com um nvel de 95%.
Soluo:
= 5 ; n = 100 x=500 (1 - )100=95%
PUC Minas Virtual 99 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
o grfico da distribuio normal padro ser:
2,5% 2,5%
95%
-1,96 1,96
lembre-se que para descobrir a abscissa 1,96, entrou-se na tabela de
distribuio normal padronizada com o valor 0,475 = 47,5 , j que a ta-
bela de faixa central.
Substituindo na formula :
= |
.
|
\
|
+ 1
2
'
2
'
n
Z x
n
Z x P
% 95
100
5
96 , 1 500
100
5
96 , 1 500 = |
.
|
\
|
+ P
Efetuando os clculos temos:
P(499,02 500,98) = 95%
8.3. Testes de Hipteses
Trata-se de uma tcnica para se fazer inferncia estatstica. Ou seja, a partir de um
teste de hipteses realizado com os dados amostrais, pode-se fazer inferncias so-
bre a populao.
Principais conceitos
Hipteses Estatstica Trata-se de uma suposio quanto ao valor de um parme-
tro populacional, ou quanto natureza da distribuio de probabilidade de uma
varivel populacional. So exemplos de hipteses estatsticas:
a) Os chips da marca A tm vida mdia H : =
0
;
PUC Minas Virtual 100 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
b) O nvel de inteligncia de uma populao de universitrios H : =
0;
c) O ao produzido pelo processo A mais duro que o ao produzido pelo proces-
so B:
A
>
B;
d) A altura mdia da populao brasileira de 1,65m, isto : H :=1,65m;
e) A varincia populacional dos salrios vale R$ 5.000
2
, isto : H :
2
=5.000
2
;
f) A proporo de paulistas com a doena X de 40 %, ou seja: H : p=0,40;
g) A distribuio dos pesos dos alunos da nossa faculdade normal;
h) A chegada de navios ao porto de Santos descrita por uma distribuio de
Poisson.
Formulamos duas hipteses bsicas:
H
o
: hiptese nula ou da existncia;
H
1
: hiptese alternativa.
Testamos hipteses para tomarmos uma deciso entre duas alternativas. Por essa
razo, o Teste de Hiptese um Processo de Deciso Estatstica.
Tipos de Hiptese Designa-se por H
0,
chamada hiptese nula, a hiptese estatsti-
ca a ser testada, e por H
1
a hiptese alternativa. A hiptese nula expressa uma i-
gualdade, enquanto a hiptese alternativa dada por uma desigualdade.
Exemplo:
bicaudal) teste um a origem (d bilaterais testes para
)
`
=
m H
m H
65 , 1 :
65 , 1 :
1
0
direita) unilateral teste um a origem (d direita s unilaterai testes para
)
`
>
=
m H
m H
65 , 1 :
65 , 1 :
1
0
esquerda) unicaudal teste um a origem (d esquerda s unilaterai testes para
)
`
<
=
m H
m H
65 , 1 :
65 , 1 :
1
0
O procedimento padro para a realizao de um Teste de Hipteses o seguinte:
Define-se as hipteses do teste: nula e alternativa;
Fixa-se um nvel de significncia ;
Levanta-se uma amostra de tamanho n e calcula-se uma estimativa
0
do par-
metro ;
PUC Minas Virtual 101 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
Usa-se para cada tipo de teste uma varivel cuja distribuio amostral do esti-
mador dos parmetros seja a mais concentrada em torno do verdadeiro valor do
parmetro;
Calcula-se com o valor do parmetro
0
, dado por H
0
, o valor crtico, valor obser-
vado na amostra ou valor calculado (V
calc
);
Fixa-se duas regies: uma de no rejeio de H
0
(RNR) e uma de rejeio de H
0
ou crtica (RC) para o valor calculado, ao nvel de risco dado;
Se o valor observado (V
calc
) Regio de No Rejeio, a deciso a de no re-
jeitar H
0
;
Se V
calc
Regio Crtica, a deciso a de rejeitar H
0
.
Devemos observar que quando se fixa , determinamos para os testes bilaterais,
por exemplo, valores crticos (tabelados), V
, tais que:
P(|V
calc
|< V
)=1 - RNR
P(|V
calc
| V
)= RC
Testes de Hipteses para a Mdia de Populaes
normais com varincias (
2
) conhecidas
Testes Bilaterais
De uma populao normal com varincia 36, toma-se uma amostra casual de ta-
manho 16, obtendo-se x=43. Ao nvel de 10%, testar as hipteses:
=
45
45
1
0
:
:
H
H
Soluo: Como o teste para mdia de populaes normais com varincia conheci-
da, usaremos a varivel Z: N(0,1) como critrio.
2
=36 x=43 n=16
PUC Minas Virtual 102 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
'
'
x
H
x
Z
=
n
x
=
'
Como o teste bilateral e =10%, a Regio de No Rejeio, (RNR), :
P(|Z|< Z
)=1 - P(|Z|<1,64)=0,90
Z
=Z5%=1,64
E a Regio de Rejeio (RC) dada por
( ) 10 0 64 1 , ) , ( = = Z P Z Z P
Como Z
calc
=-1,33
Temos que Z
calc
RNR
Logo, a deciso no rejeitarmos H
0
, isto , a mdia de 45, com 10% de risco de
no rejeitarmos uma hiptese falsa.
Testes Unilateral (Monocaudal) Esquerda
Uma fbrica anuncia que o ndice de nicotina dos cigarros da marca X apresenta-se
abaixo de 26 mg por cigarro. Um laboratrio realiza 10 anlises do ndice obtendo:
26,24,23,22,28,25,27,26,28,24. Sabe-se que o ndice de nicotina dos cigarros da
marca X se distribui normalmente com varincia 5,36 mg2. Pode-se aceitar a afir-
mao do fabricante, ao nvel de 5%?
PUC Minas Virtual 103 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
<
=
26
26
1
0
:
:
H
H
RNR= (-1,64; +)
RC = (- ; -1,64]
Z
calc
RNR
No se rejeita H
0
, isto , ao nvel de 5% podemos concluir que a afirmao do fa-
bricante falsa.
Testes Unilateral (Monocaudal) Direita
Um fabricante de lajotas de cermica introduz um novo material em sua fabricaao
e acredita que aumentar a resistncia mdia, que de 206 kg. A resistncia das
lajotas tem distribuio normal, com desvio padro de 12 kg. Retira-se uma amos-
tra de 30 lajotas, obtendo-se X =210 kg. Ao nvel de 10%, pode o fabricante acei-
tar que a resistncia mdia de suas lajotas tenha aumentado?
>
=
206
206
1
0
:
:
H
H
PUC Minas Virtual 104 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
RNR=(- ; 1,28)
RC = [1,28; +)
Z
calc
RC
Como Z
calc
> Z
, rejeita-se H
0
, isto , ao nvel de 10% o fabricante pode concluir
que a resistncia mdia de suas lajotas aumentou.
Erros de Deciso
Tipos de Erro H dois tipos possveis de erro ao testar uma hiptese estatstica.
Pode-se rejeitar uma hiptese quando ela , de fato, verdadeira, ou aceitar uma
hiptese quando ela , de fato, falsa. A rejeio de uma hiptese verdadeira
chamada erro tipo I. A aceitaao de uma hiptese falsa constitui um erro tipo II.
As probabilidades desses dois tipos de erros so designadas, respectivamente, por
e .
A probabilidade do erro tipo I denomidada nvel de significncia do teste.
Resumindo:
Realidade
H
0
verdadeira H
0
falsa
Aceitar H
0
Deciso Correta (1-) Erro tipo II ()
Deciso
Rejeitar H
0
Erro tipo I () Deciso Correta (1 - )
Observe que o erro tipo I s poder ser cometido se se rejeitar H
0;
e o erro do tipo
II, quando se aceitar H
0
.
O objetivo, obviamente, reduzir ao mnimo as probabilidades dos dois tipos de
erros. Infelizmente, essa uma tarefa difcil porque, para uma amostra de deter-
minado tamanho, a probabilidade de se incorrer em um erro tipo II aumenta me-
dida que diminui a probabilidade do erro I. E vice-versa. A reduo simultnea dos
erros poder ser alcanada pelo aumento do tamanho da amostra.
PUC Minas Virtual 105 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
UNIDADE 9
Correlao e Regresso Linear
9.1. Diagrama de disperso
Simetr
9.2. Correlao Linear
9.3. Coeficiente de Correlao Linear
9.4. Regresso Reta de regresso
(ou reta de mnimos quadrados ou reta de ajuste)
Em muitas situaes, torna-se interessante e til estabelecer uma rela-
o entre duas ou mais variveis. A matemtica estabelece vrios tipos
de relaes entre variveis, por exemplo, as relaes funcionais e as
correlaes.
Relaes Funcionais
So relaes matemticas expressas por sentenas matemticas, cujos exemplos
apresentamos a seguir:
rea do retngulo (A=a.b) a relao entre os lados do retngulo;
Densidade de massa (d
m
= m/v) a relao entre a massa e o volume de um
corpo;
Permetro de uma circunferncia (C=2R) a relao entre o comprimento da
circunferncia e o valor do raio.
Relaes Estatsticas e Correlaes
So relaes estabelecidas aps uma pesquisa. Com base nos resultados da pes-
quisa, so feitas comparaes que eventualmente podem conduzir (ou no) liga-
o entre as variveis.
Exemplo: relao entre a idade e a estatura de uma criana, ou a rela-
o entre a classe social de uma pessoa e o nmero de viagens por ela
realizado.
PUC Minas Virtual 106 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
No estudo estatstico, a relao entre duas ou mais variveis denomina-se correla-
o. A utilidade e importncia das correlaes entre duas variveis podem conduzir
descoberta de novos mtodos, cujas estimativas so vitais em tomadas de deci-
ses.
9.1. Diagrama de disperso
O diagrama de disperso um grfico cartesiano em que cada um dos eixos cor-
responde s variveis correlacionadas. A varivel dependente (Y) situa-se no eixo
vertical e o eixo das abscissas reservado para a varivel independente (X). Os
pares ordenados formam uma nuvem de pontos.
A configurao geomtrica do diagrama de disperso pode estar associada a uma
linha reta (correlao linear), uma linha curva (correlao curvilnea) ou, ainda, ter
os pontos dispersos de maneira que no definam nenhuma configurao linear;
nesta ltima situao, no h correlao.
0
10
20
30
40
50
60
70
80
90
100
0 1 2 3 4 5 6
Correlao Linear
0
2
4
6
8
10
12
14
16
18
0 1 2 3 4 5
Correlao Curvilnea
Figura 9.1. Diagramas de disperso
9.2. Correlao Linear
Correlao linear uma correlao entre duas variveis, cujo grfico aproxima-se
de uma linha. uma linha de tendncia, porque procura acompanhar a tendncia
da distribuio de pontos, que pode corresponder a uma reta ou a uma curva. Por
outro lado, , tambm, uma linha mdia, porque procura deixar a mesma quanti-
dade de pontos abaixo e acima da linha.
PUC Minas Virtual 107 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
0
5
10
15
20
25
0 1 2 3 4 5 6
Correlao Linear positiva
0
10
20
30
40
50
60
70
80
90
100
0 1 2 3 4 5 6
Correlao Linear negativa
5
5,5
6
6,5
7
7,5
8
8,5
0 2 4 6 8 10 12 14
No h correlao
0
2
4
6
8
10
12
14
16
18
0 1 2 3 4 5
Relao curvilnea direta
Figura 9.2. Diagramas de disperso de diversos tipos de correlao.
Para definir se a correlao entre as variveis corresponde a uma linha reta ou a
uma curva, pode-se utilizar modos qualitativos ou quantitativos.
No modo qualitativo, vai imperar o bom senso do pesquisador para verificar qual
o grau de intensidade na correlao entre as variveis; isso significa o estabeleci-
mento de uma relao numrica que medir o nvel da correlao.
9.3. Coeficiente de Correlao Linear (r)
O coeficiente de correlao linear pode ser apresentado como uma medida de
correlao, pois tem como objetivo indicar o nvel de intensidade que ocorre na
correlao entre as variveis. O coeficiente de correlao linear pode ser positivo ou
negativo. O sinal positivo do coeficiente de correlao linear indica que o sentido da
correlao corresponde a uma reta de inclinao descendente, e o sinal negativo
corresponde a uma reta de inclinao ascendente. Uma das formas de medir o coe-
ficiente de correlao linear foi desenvolvido por Pearson e recebe o nome de coefi-
PUC Minas Virtual 108 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
ciente de correlao de Pearson. O coeficiente de correlao de Pearson mede o
grau de ajustamento dos valores em torno de uma reta.
Coeficiente de Correlao de Pearson (r):
( )( )
( ) | | ( ) | |
=
2
2
2
2
*
i i i i
i i i i
y y n x x n
y x y x n
r
Temos
r = o coeficiente de Pearson
n = o nmero de observaes
x
i
= varivel independente
y
i
=varivel dependente
O valor do coeficiente de correlao r tem a variao entre +1 e 1, ou seja, est
limitado entre os valores do Intervalo[-1,+1].
r = +1 (correlao positiva entre as variveis);
r = - 1 (correlao perfeita negativa entre as variveis);
r = 0 (no h correlao entre as variveis ou, ainda, a correlao no linear,
caso exista).
Quanto mais prximo o valor de r estiver do valor 1, mais forte a correlao line-
ar.
Quanto mais prximo o valor de r estiver do valor 0, mais fraca a correlao line-
ar.
Em geral, multiplica-se o valor de r por 100; dessa forma, o resultado passa a ser
expresso em porcentagem. Na prtica, estabelecem-se critrios para verificar os
diversos nveis do fraco ao forte, chegando at o perfeito:
0<|r|<0,3 : a correlao fraca e fica difcil estabelecer relao entre as vari-
veis. Em porcentagem: 0<|r|< 30%;
0,3 |r|< 0,6 : a correlao fraca, porm, podemos considerar a existncia de
relativa correlao entre as variveis. Em porcentagem: 30%
|r| <60%;
PUC Minas Virtual 109 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
0,6 |r| <1 : a correlao de mdia para forte; a relao entre as variveis
significativa, o que permite coerncia com poucos conflitos na obteno das con-
cluses. Em porcentagem: 60%
|r| 100%.
Exemplo:
Uma pesquisa pretende verificar se h correlao significativa entre o
peso total do lixo descartado, por dia, numa empresa com o peso do
papel contido nesse lixo.
Hotel H
1
H
2
H
3
H
4
H
5
H
6
H
7
H
8
H
9
H
10
Peso
total
10,4
7
19,85 21,2
5
24,3
6
27,38 58,09 33,6
1
35,75 38,33 49,14
Peso do
papel
2,43 5,12 6,88 6,22 8,84 8,76 7,54 8,47 9,55 11,43
De acordo com os dados, fazemos a representao grfica. Os pares ordenados
formam o diagrama de disperso.
0
2
4
6
8
10
12
14
10 20 30 40 50 60 70
Peso total do lixo
P
e
s
o
d
o
p
a
p
e
l
Figura 9.3. Correlao entre o peso total do lixo
descartado e o peso do papel contido nesse lixo
PUC Minas Virtual 110 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
Para se verificar o grau de correlao entre as variveis, calcula-se o coeficiente de
correlao linear pela frmula do coeficiente de correlao de Pearson:
( )( )
( ) | | ( ) | |
=
2
2
2
2
*
i i i i
i i i i
y y n x x n
y x y x n
r
Peso total (x
i
) Peso papel (y
i
) x
i
y
i
x
i
2
y
i
2
H
1
10,47 2,43 25,44 109,62 5,90
H
2
19,85 5,12 101,63 394,02 26,21
H
3
21,25 6,88 146,20 451,56 47,33
H
4
24,36 6,22 151,52 593,41 38,69
H
5
27,38 8,84 242,04 749,66 78,15
H
6
28,09 8,76 246,07 789,05 76,74
H
7
33,61 7,54 253,42 1129,63 56,85
H
8
35,73 8,47 302,63 1276,63 71,74
H
9
38,33 9,55 366,05 1469,19 91,20
H
10
49,14 11,43 561,67 2414,74 130,64
288,21 75,24 2396,68 9377,52 623,47
( )( )
( ) | | ( ) | |
=
2
2
2
2
*
i i i i
i i i i
y y n x x n
y x y x n
r
] ) 24 , 75 ( 47 , 623 * 10 [ * ] ) 21 , 288 ( 52 , 9377 * 10 [
24 , 75 * 21 , 288 68 , 2396 * 10
2 2
= r
9206 , 0
57 , 2478
83 , 2281
573,59 * 710,21 * 10
2281,83
] 5661,1 - 7 , 6234 [ * ] 83065 2 , 93775 [
9 , 21684 8 , 23966
= = =
= r
PUC Minas Virtual 111 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
% 1 , 92 ou 921 , 0 = = r r
Observamos, assim: 1 6 , 0 r . Esse resultado indica que h uma forte correlao
entre as variveis ou, ainda, que a correlao entre as duas variveis bastante
significativa. Nesse caso, podemos concluir haver coerncia na afirmao de que
existe correlao entre o peso total do lixo descartado e o peso do papel contido
nesse lixo.
9.4. Regresso Reta de regresso
(ou reta de mnimos quadrados ou reta de ajuste)
A correlao linear uma correlao entre duas variveis, cujo grfico aproxima-se
de uma linha. O grfico cartesiano que representa essa linha denominado dia-
grama de disperso. Para poder avaliar melhor a correlao entre as variveis,
interessante obter a equao da reta; essa reta chamada de reta de regresso e
a equao que a representa a equao de regresso. O diagrama de disperso
construdo de acordo com os dados amostrais de n observaes e a equao de
regresso dada pela expresso:
Y= aX + b Y = aX + b
X a varivel independente
YY a varivel dependente; na verdade, a varivel correlacionada com a vari-
vel X e sobre a qual se obtm um valor estimado.
Esse tipo de notao, de Y para Y, caracteriza que no se trata de uma relao
funcional para a determinao da reta, e sim de uma relao estatstica, em que a
distribuio est baseada em estimativas de dados colhidos por amostragem.
Sendo a e b os parmetros de equao da reta, esses podem ser calculados por
meio das frmulas:
x a y b
x x n
y x y x n
a
i i
i i i i
=
=
) (
*
2 2
PUC Minas Virtual 112 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
Sendo:
n = nmero de observaes dos dados amostrais
y = valor mdio da varivel y; o clculo faz-se pela expresso
n
y
y
i
=
x = valor mdio da varivel x; o clculo faz-se pela expresso
n
x
x
i
=
Exemplo:
Determine a equao da reta de regresso do exemplo anterior, que tra-
ta de uma pesquisa entre o peso total do lixo descartado por dia com o
peso do papel contido nesse lixo.
Para a obteno da equao da reta de regresso, elabora-se inicialmente uma ta-
bela contendo nas colunas as variveis dependentes (y
i
), as independentes (x
i
) e os
produtos x
i
y
i
e x
i
2
.
Clculo do parmetro a da equao da reta:
83065 - 93775,2
21684,9 - 23996,8
) 21 , 288 ( 52 , 9377 * 10
24 , 75 * 288 68 , 2396 * 10
) (
*
2 2 2
=
=
i i
i i i i
x x n
y x y x n
a
213 , 0
2 , 10710
83 , 2281
= = a
Clculo do parmetro b da equao da reta:
82 , 28
10
21 , 288
e 52 , 7
10
24 , 75
= = = = x y
1,38 6,14 - 7,52 28,82 * 0,213 - 7,52 = = = = x a y b
Uma vez calculados os parmetros a e b, pode-se escrever a equao da reta:
Y = 0,213 X + 1,38
PUC Minas Virtual 113 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
Para o traado de uma reta, basta que se conhea dois de seus pontos. Assim, com
base na equao da reta acima, pode-se estabelecer dois pontos para X e Y.
Para X = 0, temos Y = 1,38
Para X = 50, temos Y = 12,03
De acordo com os pontos P
1
(0;1,38) e P
2
(50;12,03), pode-se traar a reta de re-
gresso.
y = 0,2131x + 1,3836
0
2
4
6
8
10
12
14
0 10 20 30 40 50 60
Figura 9.4. Correlao entre o peso total do lixo
descartado e o peso do papel contido nesse lixo
Com base no conhecimento da equao da reta, pode-se interpolar e extrapolar
valores.
Interpolao: a interpolao ocorre quando o valor considerado pertence ao in-
tervalo da tabela, porm, no figura entre os dados coletados.
Supondo-se o valor 15 kg para o peso total do lixo descartado, pode-se estimar o
peso de papel contido nesse lixo. Uma vez que 15 kg no um dado coletado e,
conseqentemente, no pertence tabela de dados, utiliza-se a equao da reta
para determinar o valor correspondente ao peso do papel.
Para 15 kg de lixo descartado, estima-se que haja 4,58 kg de papel contido nesse
lixo.
PUC Minas Virtual 114 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
Extrapolao: a extrapolao ocorre quando o valor considerado no pertence ao
intervalo da tabela, e tambm no figura entre os dados coletados.
Suponha que o peso do lixo descartado seja de 60 kg. Esse valor no um dado
coletado e nem se encontra dentro do intervalo [10,47, 49,14]. Essa situao
semelhante anterior e utiliza-se a equao de reta para determinar o peso do
papel.
Para 60 kg de lixo descartado, estima-se, por extrapolao, que haja 14,16 kg de
papel contido nesse lixo.
PUC Minas Virtual 115 Probabilidade e Estatstica
voltar sumrio
voltar sumrio
Referncias Bibliogrficas
BUSSAB, W.O. e Morettin, P.A. Estatstica Bsica. So Paulo: Atual, 1987.
FONSECA, J.S. e Martins, G.A. Curso de Estatstica. So Paulo: Atlas, 1993.
LAPPONI, J.C. Estatstica usando Excel 5 e 6. So Paulo: Lapponi Treinamento e
Editora, 1997.
MORETTIN, L.G. Estatstica Bsica Vol. 2 Inferncia. So Paulo: Makron Books,
1999.
MORETTIN, L.G. Estatstica Bsica Vol.1 Probabilidade. So Paulo: Makron Bo-
oks, 1999.
STEVENSON,W.J. Estatstica Aplicada Administrao. So Paulo: Harbra, 1996.
TIBONI,C.G. R. Estatstica Bsica para o curso de Turismo. So Paulo: Atlas, 2002.
TOLEDO, G. L. e Ovalle, I.I. Estatstica Bsica. So Paulo: Atlas, 1985.
PUC Minas Virtual 116 Probabilidade e Estatstica
voltar sumrio
voltar sumrio