Escolar Documentos
Profissional Documentos
Cultura Documentos
2011
SUMRIO
1 Introduo 4
1.1 Amostragem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.1.1 Amostragem Simples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.1.2 Amostragem Sistemtica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.1.3 Amostragem Estratificada . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.2 Mtodo Estatstico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2 Estatstica Descritiva 9
2.1 Tipo de Variveis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.2 Grficos e Tabelas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2.1 Variveis Qualitativas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2.2 Variveis Quantitativas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.3 Somatrio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.4 Medidas de Posio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.4.1 Mdia Aritmtica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.4.2 Mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.4.3 Moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.4.4 Simetria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.5 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.5.1 Variveis Quantitativas Discretas . . . . . . . . . . . . . . . . . . . . . . . . 20
2.5.1.1 Dados Originais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.5.1.2 Dados Agrupados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.5.2 Variveis Quantitativas Contnuas . . . . . . . . . . . . . . . . . . . . . . . . 21
2.5.2.1 Dados Originais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.5.2.2 Dados Agrupados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.6 Medidas de disperso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.6.1 Amplitude Total . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.6.2 Varincia e Desvio Padro . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.6.3 Coeficiente de Variao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.6.4 Erro Padro da Mdia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.7 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.7.1 Variveis Quantitativas Discretas . . . . . . . . . . . . . . . . . . . . . . . . 26
2.7.1.1 Dados Originais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.7.1.2 Dados Agrupados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.7.2 Variveis Quantitativas Contnuas . . . . . . . . . . . . . . . . . . . . . . . . 27
2.7.2.1 Dados Originais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.7.2.2 Dados Agrupados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3 Noes de Probabilidade 30
3.1 Espao Amostral e Eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.1.1 Operao com eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.2 Probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.2.1 Probabilidade Condicional e Independncia de Eventos . . . . . . . . . . . . 33
3.2.2 rvores de probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.2.3 Varivel Aleatria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3.3 Distribuies Discretas de Probabilidade . . . . . . . . . . . . . . . . . . . . . . . 38
3.3.1 Esperana Matemtica e Varincia de uma VAD . . . . . . . . . . . . . . . . 39
3.3.2 Distribuio Uniforme Discreta . . . . . . . . . . . . . . . . . . . . . . . . . 40
3.3.2.1 Parmetros Caractersticos da Distribuio Uniforme . . . . . . . . . 40
3.3.3 Distribuio Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
3.3.3.1 Parmetros Caractersticos da Distribuio Uniforme . . . . . . . . . 41
3.3.4 Distribuio Binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.3.4.1 Parmetros Caractersticos da Distribuio Binomial . . . . . . . . . 43
3.3.5 Distribuio de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3.3.5.1 Parmetros Caractersticos da Distribuio de Poisson . . . . . . . . . 45
3.4 Distribuies Contnuas de Probabilidade . . . . . . . . . . . . . . . . . . . . . . . 46
3.4.1 Esperana Matemtica e Varincia de uma fdp . . . . . . . . . . . . . . . . 48
3.4.2 Distribuio Uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.4.2.1 Parmetros Caractersticos da Distribuio Uniforme . . . . . . . . . 50
3.4.3 Distribuio Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.5 Distribuies Amostrais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
3.5.1 Distribuio Amostral da Mdia (X) . . . . . . . . . . . . . . . . . . . . . . 55
3.5.1.1 Teorema do Limite Central (TLC) . . . . . . . . . . . . . . . . . . . . 55
3.5.1.2 Distribuio t de student . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.5.2 Distribuio amostral para proporo . . . . . . . . . . . . . . . . . . . . . . 58
3.5.3 Distribuio Amostral da Varincia . . . . . . . . . . . . . . . . . . . . . . . 59
3.5.3.1 Distribuio Qui-Quadrado . . . . . . . . . . . . . . . . . . . . . . . . 59
3.5.3.2 Distribuio F . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
4 Inferncia Estatstica 66
4.1 Estimao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
4.1.1 Estimao Pontual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
4.1.2 Estimao Intervalar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
4.1.2.1 Intervalo de Confiana para proporo p . . . . . . . . . . . . . . . . 67
4.1.2.2 Intervalo de Confiana para mdia . . . . . . . . . . . . . . . . . . 68
4.1.2.3 Intervalo de Confiana para varincia 2 e para o desvio padro . 70
4.2 Teoria da Deciso Estatstica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
4.2.1 Teste de Hiptese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
4.2.2 Teste para uma nica mdia . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
4.2.3 Teste de hipteses para propores . . . . . . . . . . . . . . . . . . . . . . . 73
4.2.4 Resumo das etapas aplicadas a qualquer teste de hipteses . . . . . . . . . 74
4.3 Regresso e Correlao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
1
INTRODUO
Estatstica descritiva - a parte que tem por objetivo organizar, apresentar e sintetizar
dados observados de determinada populao, sem pretenes de tirar concluses de carter
extensivo.
Amostra (n) - um subconjunto da populao e dever ser considerada finita, a amostra deve
ser selecionada seguindo certas regras e deve ser representativa, de modo que ela represente
todas as caractersticas da populao como se fosse uma fotografia desta.
Dados estatsticos: qualquer caracterstica que possa ser observada ou medida de alguma
maneira. As matrias-primas da estatstica so os dados observveis.
Varivel: aquilo que se deseja observar para se tirar algum tipo de concluso, geralmente
as variveis para estudo so selecionadas por processos de amostragem. Os smbolos uti-
lizados para representar as variveis so as letras maisculas do alfabeto, tais como X, Y,
Z, ... que pode assumir qualquer valor de um conjunto de dados. As variveis podem ser
classificadas dos seguintes modos:
1.1 AMOSTRAGEM
muito dispendioso entrevistar cada pessoa de toda uma populao; recorremos, ento,
as amostras;
O melhor mtodo de escolha de uma amostra a escolha aleatria, isto , que toda amostra
possvel tenha a mesma chance de ser escolhida.
Numeramos os alunos de 01 a 90
Sorteamos um nmero entre 1 e F S. Esse nmero simbolizado por m, que ser o primeiro
elemento da amostra.
Exemplo: Uma rua contm 1000 prdios, dos quais desejamos obter uma amostra sistemtica
formada por 100 deles.
F S = 1000/100 = 10
100o elemento da amostra = (100 1)10 + 7 = 997 > 997o elemento da populao.
Coleta da dados - Consiste na obteno dos dados referentes ao trabalho que desejamos
fazer.;
A coleta pode ser: Direta - diretamente da fonte ou Indireta - feita atravs de outras
fontes.
Os dados podem ser obtidos pela prpria pessoa (primrios) ou se baseia no registro
de terceiros (secundrios).
Apurao dos dados - Consiste em resumir os dados, atravs de uma contagem e agrupa-
mento. um trabalho de coordenao e de tabulao.
Apresentao dos dados - a fase em que vamos mostrar os resultados obtidos na coleta e
na organizao. Esta apresentao pode ser:
Anlise e interpretao dos dados - a fase mais importante e tambm a mais delicada.
Tira concluses que auxiliam o pesquisador a resolver seu problema.
2
ESTATSTICA DESCRITIVA
A estatstica descritiva parte da estatstica que lida com a organizao, resumo e apresen-
tao de dados. Esta feita por meio de:
Tabelas;
Grficos;
Variveis discretas: so aquelas variveis que pode assumir somente valores inteiros
num conjunto de valores. gerada pelo processo de contagem
Exemplos: nmero de filhos, nmero de empregados, nmero de processos.
Variveis contnuas: so aquelas variveis que podem assumir um valor dentro de um
intervalo de valores. gerada pelo processo de medio
Exemplos: presso arterial, idade, salrio, atraso de transmisso de bytes por uma
rede de internet.
Estatstica Descritiva 10
Para resumir dados qualitativos, utiliza-se contagens, propores, porcentagens, taxas por
1000, taxas por 1.000.000, etc, dependendo da escala apropriada. Por exemplo, se encontrar-
mos que 7 empresas com faturamento mensal acima de R$20.000,00 em uma amostra de 500
propriedades, poderamos expressar isto como uma proporo (0,014) ou percentual (1,4%).
Freqentemente o primeiro passo da descrio de dados criar uma tabela de frequncias.
Antes de montar a tabela de distribuio de frequncias temos algumas definies:
Frequncia - medida que quantifica a ocorrncia dos valores de uma varivel a um dado
conjunto de dados. As frequncias podem ser:
fa
fr =
n
f p = 100 f r
Para resumir separadamente cada varivel podemos utilizar a tabelas simples, que so na
maioria das vezes suficientes para descrever dados qualitativos especialmente quando existem
poucas categorias.
Para a varivel Microrganismos , podemos utilizar as frequncias apresentadas na tabela 2.2:
Estatstica Descritiva 11
Para a varivel qualidade no atendimento, alm das frequncias utilizadas para a varivel
Microrganismos, podemos utilizar mais duas frequncias:
Frequncia Acumulada (FA)- obtida pelo soma das frequncias absolutas;
Frequncia Percentual Acumulada (FP) - obtida pela soma das frequncias percentuais.
Dados qualitativos so usualmente bem ilustrados num simples grfico de barras onde a altura
da barra igual frequncia. O grfico na Figura 2.1 apresenta as frequncias percentuais da
Tabela 2.2.
Em alguns casos podemos estar interessados em resumir duas variveis qualitativas ao mesmo
tempo, neste caso vamos estudar a relao entre duas variveis qualitativas que pode ser repre-
sentada em uma tabulao cruzada. Nesta tabela conta-se quantos valores correspondem a cada
par de possveis resultados, para as duas variveis. O resultado pode ser apresentado como
frequncia absoluta ou relativa, em relao as colunas ou as linhas (nunca ambas).
O grfico de barras, com barras justapostas de acordo com categorias diferentes, pode ser
usado para apresentar a relao entre duas variveis qualitativas.
Estatstica Descritiva 12
Da mesma forma que as variveis qualitativas, podemos resumir dados quantitativos por
meio de tabelas de frequncias, entretanto a distino entre as variveis quantitativas discretas
e contnuas na forma de preparao destas tabelas.
A tabela de distribuio de frequncias de uma varivel discreta , em geral bastante seme-
lhante das variveis qualitativas ordinais, pois os valores inteiros que a varivel assume podem
ser considerados como "categorias", ou "classes naturais".
Exemplo: Sejam dados referentes a um levantamento onde observou-se 20 rochas, nas quais
contou-se o nmero de minerais comuns encontrados em cada rocha.
Estatstica Descritiva 13
informao j que no temos idia de como se distribuem as observaes dentro de cada classe.
Para isso temos duas definies:
Amplitude (A) - corresponde a diferena enter o maior valor e o menor valor de um conjunto
de dados;
Amplitude da classe (c) - consiste na diferena entre o limite superior e o limite inferior de
uma classe em uma distribuio de frequncia.
Decidir sobre o numero de classes k, entre 5 e 20. Para que a deciso no seja totalmente
arbitrria pode-se usar a raiz quadrada do total de valores como o nmero de classes, ou
seja, k
= n
A
c=
k1
c
LI1 = M in
2
LS1 = LI1 + c
sendo que o limite inferior da segunda classe LI2 igual ao LS1 , e assim
LS2 = LI2 + c
Aps a construo das classes, so contados quantos dados esto contidos em cada classe
e se obtem as frequncias.
k = 30 = 5, 91 6
A = M ax M in = 9, 63 3, 70 = 5, 93
A 5, 93
c = = = 1, 19
k1 4
c 1, 19
LI1 = M in = 3, 70 = 3, 7 0, 6 = 3, 10
2 2
fr
df a =
c
2.3 SOMATRIO
Observaes:
n
X n
X n
X
xi yi 6= xi yi
i=1 i=1 i=1
n n
!2
X X
x2i 6= xi
i=1 i=1
3
X 3
X
Sabendo que xi = 6, x2i = 14, determinar
i=1 i=1
3
X 3
X X3
a) (xi + 1) = xi + 1=6+3=9
i=1 i=1 i=1
3
X X3 3 3 3
X X X
b) (xi 1)2 = x2i 2xi + 1 = x2i 2 xi + 1 = 14 12 + 3 = 5
i=1 i=1 i=1 i=1 i=1
N
X
xi
i=1
=
N
em que
f ai o freqncia absoluta de xi
Estatstica Descritiva 19
A mdia calculada dos dados originais e dados agrupados podem ser diferentes, devido ao
erro de agrupamento. O erro de agrupamento obtido fazendo a diferena entre o valor obtido
pelos dados originais e o valor obtido pelos dados agrupados.
2.4.2 Mediana
Num conjunto de dados ordenados, a mediana (Md ) o valor que deixa metade da freqncia
abaixo dele. A mediana, como a mdia, possui a mesma unidade de cada observao.
A mediana pode ser obtida por meio da expresso:
X n+1 se n for mpar
2
Md =
X n2 +X n+2
2
2
se n for par
n1
Md = LIi + c
n2
em que:
2.4.3 Moda
1
Mo = LIi + c
1 + 2
2.4.4 Simetria
A determinao das medidas de posio permite discutir sobre a simetria da distribuio dos
dados.
Distribuio simtrica - X = Md = Mo
2.5 EXEMPLOS
Sejam dados referentes a um levantamento onde observou-se 25 rochas, nas quais contou-se
o nmero de minerais comuns encontrados em cada rocha.
Para calcular a moda, basta verificar o valor que mais se repete, logo 5.
Estatstica Descritiva 21
Mdia
n
X
f ai xi
105
X= i=1
n = = 4, 2
=4
X 25
f ai
i=1
n+1 25 + 1
= = 13
2 2
Assim,
n
X
f ai xi
290, 55
X= i=1
n = = 9, 685
= 9, 68
X 30
f ai
i=1
n 30
= = 15
2 2
Assim a classe mediana a que contm a freqncia acumulada 15, ou seja a classe 8, 97 ` 10, 32.
Ento temos:
LIi = 8, 97
c=1,35
n1 = 15 10 = 5
n2 = 10
n1 5
Md = LIi + c = 8, 97 + 1, 35 = 8, 97 + 0, 67 = 9, 64
n2 10
1
Mo = LIi + c
1 + 2
Estatstica Descritiva 23
LIi = 8, 97;
c = 1, 35;
1 = 10 7 = 3;
2 = 10 6 = 4
1 3
Mo = LIi + c = 8, 97 + 1, 35 = 8, 97 + 0, 58 = 9, 55
1 + 2 3+4
Na tabela 2.13 apresentado uma comparao dos valores obtidos pelos dados originais e
agrupados.
Tabela 2.13: Comparao dos valores obtidos pelos dados originais e agrupados
Medida Descritiva Dados Originais Dados Agrupados Erro de agrupamento
X 9,72 9,68 0,04
Md 9,81 9,64 0,17
M0 no se aplica 9,55
Estatstica Descritiva 24
Amplitude Total (A) a diferena entre o maior e o menor valor da amostra. Essa medida
bastante simples, e obtida pela expresso:
A = M ax M in
Para dados agrupados a amplitude total a diferena entre o ponto mdio da ltima e da
primeira classe.
Para expressar variabilidade a amplitude total no muito usada, pois baseia-se em apenas
dois dados.
A varincia baseada pela quadrado dos desvios dos dados em relao mdia.Esta medida
expressa na unidade dos dados ao quadrado.
N
X
(xi )2
i=1
2 =
N
k
X
(xi )2 f ai
i=1
2 = k
X
f ai
i=1
O desvio padro a raz quadrada positiva da varincia. Esta medida expressa na mesma
unidade dos dados.
Para a populao o desvio padro representada por
= 2
O coeficiente de variao (CV ) uma medida de disperso que expressa o desvio padro em
termos da mdia de forma percentual
S
CV = 100
X
Se as amostras tiverem unidade diferentes ou mdias diferentes o CV pode ser utilizado para
comparar a variabilidade entre duas amostras.
O erro padro da mdia uma medida de disperso que d a preciso com que a mdia
populacional est sendo estimada. obtido pela frmula
S
S(X) =
n
em que:
S o desvio padro da amostra;
Estatstica Descritiva 26
n o tamanho da amostra.
2.7 EXEMPLOS
Sejam dados referentes a um levantamento onde observou-se 25 rochas, nas quais contou-se
o nmero de minerais comuns encontrados em cada rocha.
A amplitude total
A = M ax M in = 8 1 = 7
O desvio padro
3, 04 = 1, 7435595
p
S= S2 = =2
O coeficiente de variao
S 2
CV = 100 = 100 = 50%
X 4
O erro padro da mdio
S 2
S(X) = = = 0, 4
n 25
A amplitude total
A = M ax M in = 8 1 = 7
Estatstica Descritiva 27
O desvio padro
S 2 = 3, 04 = 1, 7435595
p
S= =2
O coeficiente de variao
S 2
CV = 100 = 100 = 50%
X 4
O erro padro da mdio
S 2
S(X) = = = 0, 4
n 25
Amplitude total
A = M ax M in = 12, 34 6, 94 = 5, 40
O desvio padro
2, 0750 = 1, 4404760
p
S= S2 = = 1, 44
O coeficiente de variao
S 1, 44
CV = 100 = 100 = 14, 81%
X 9, 72
S 1, 44
S(X) = = = 0, 262906
= 0, 26
n 30
A = M ax M in = 12, 34 6, 94 = 5, 40
Estatstica Descritiva 29
O desvio padro
2, 5746 = 1, 604556
p
S= S2 = = 1, 60
O coeficiente de variao
S 1, 60
CV = 100 = 100 = 16, 53%
X 9, 68
Tabela 2.18: Comparao entre as medidas de disperso obtidas pelo dados no agrupados e
agrupados
Medida Descritiva Dados Originais Dados Agrupados Erro de agrupamento
A 5,40 5,40 0
S2 2,0750 2,5746 0,4996
S 1,44 1,60 0,16
CV 14,81% 16,53% 1,72
S(X) 0,26 0,29 0,03
3
NOES DE PROBABILIDADE
J vimos que para se obter informaes sobre alguma caracterstica da populao, podemos
utilizar uma amostra. Estudaremos agora a probabilidade, que uma ferramenta usada e neces-
sria para se fazer ligaes entre a amostra e a populao, de modo que a partir de informaes
da amostra se possa fazer afirmaes sobre caractersticas da populao.
As probabilidades so utilizadas para exprimir a chance de ocorrncia de determinado evento.
O estudo das probabilidades importante pois elas so a base para o estudo estatstico
A teoria de probabilidades tem por objetivo o estudo de fenmenos aleatrios. Um fenmeno
chamado de aleatrio se ele tem a seguinte propriedade: quando observado repetidamente sob
as mesmas condies ele produz resultados diferentes. Mesmo que a chance da ocorrncia seja
alta, os resultados no so conhecidos antes de ocorrer, mas de certa forma, mantm uma certa
regularidade, o que permite determinar a chance de ocorrncia; a Probabilidade.
Exemplos:
= {1, 2, 3, 4, 5, 6}
3.2 PROBABILIDADE
n 3 1
P (A) = = = = 0, 5 = 50%
N 6 2
P () = 1; P () = 0
Domnio da Probabilidade
0 P (A) 1
P (A B) = P (A) + P (B) P (A B)
5
P (A B) = = 0, 83 = 83%
6
3 4 2 5
P (A B) = P (A) + P (B) P (A B) = + = = 0, 83 = 83%
6 6 6 6
em que A B = {4, 6}
Probabilidade complementar
P (Ac ) = 1 P (A)
No exemplo do lanamento de um dado seja o evento A = {3, 4, 5, 6}, ento Ac = {1, 2},
logo
4 2
P (A) = e P (Ac ) =
6 6
utilizando a regra da probabilidade complementar teriamos:
4 64 2
P (Ac ) = 1 P (A) = 1 = =
6 6 6
Noes de Probabilidade 33
Numa pesquisa sobre esporte na escola entrevistou-se 500 alunos, e obteve os seguintes dados:
no praticar esporte?
50
P (B C = = 0, 10
500
200
P (A) = = 0, 4
500
P (A B)
P (A|B) = , P (B) 6= 0.
P (B)
Isso significa que a probabilidade de A ocorrer, dado que B ocorreu, igual probabilidade
de ocorrncia simultnea de A e B dividida pela probabilidade de ocorrncia de B.
Exemplo: Na tabela a seguir temos dados referentes a alunos matriculados em trs cursos de
uma universidade em dado ano.
Qual a probabilidade de escolhermos um aluno ao acaso e ele ser:
Noes de Probabilidade 34
40
P (H Adm) = = 0, 2285
175
P (P si M )
P (P si|M ) =
P (M )
10
175 10 175 10
= 100 = = = 0, 10
175
175 100 100
Das expresses acima resulta a regra do produto, que se refere ao clculo da probabilidade
do evento interseo,
P (A B) = P (A|B).P (B)
A ordem do condicionamento pode ser invertida. Para trs eventos, por exemplo, pode-se
escrever:
A contruo de uma rvore de probabilidade fornece uma ferramenta muito til para a
soluo de problemas envolvendo duas ou mais etapas. A rvore consiste em uma representao
grfica na qual diversas possibilidades so representadas, juntamente com as respectivas proba-
bilidades condicionadas a cada situao. Isso permite, pela utilizao direta da regra do produto
das probabilidades, associar a cada n terminal da rvore a respectiva probabilidade.
O uso das rvores de probabilidade ajudam e simplificam o entendimento da aplicao de
dois teoremas que sero apresentados a seguir, conforme ser visto no exemplo.
Exemplo: Em certo colgio, 5% dos homens e 2% das mulheres tm mais de 1,80m de altura.
Por outro lado, 40% dos estudantes so homens. Sorteando-se um estudante aleatoriamente,
qual a probabilidade de:
Supondo que sua varivel aleatria acertar a questo, temos que o ocorrncia no espao
amostral pode ser:
CCC CCE CEC CEE ECC ECE EEC EEE
= , , , , , , ,
3 2 2 1 2 1 1 0
111 1
P (CCC) = =
555 125
114 4
P (CCE) = =
555 125
141 4
P (CEC) = =
555 125
144 16
P (CEE) = =
555 125
411 4
P (ECC) = =
555 125
414 16
P (ECE) = =
555 125
441 16
P (EEC) = =
555 125
444 64
P (EEE) = =
555 125
Noes de Probabilidade 37
Pode-se construir uma tabela, em que X o nmero de questes corretas e f(x) a probabi-
lidade de ocorrer o resultado X.
x 0 1 2 3
f(x) 64/125 48/125 12/125 1/125
A distribuio discreta descreve quantidades aleatrias (dados de interesse) que podem as-
sumir valores particulares e os valores so finitos. Por exemplo, uma varivel aleatria discreta
pode assumir somente os valores 0 e 1, ou qualquer inteiro no negativo, etc.
Exemplos
1. Lana-se uma moeda 10 vezes e anota-se o nmero de caras. Este nmero pode ser 0, 1, 2
...10.
2. Em uma pesquisa de mercado feita com 200 pessoas, perguntam-se estes compram um
determinado produto. O nmero de pessoas que compram o produto varia de 0 a 200.
3. Conta-se o nmero de acidentes que ocorrem em uma rodovia num feriado prolongado. O
nmero de acidentes em questo pode ser: 0, 1, 2... Como no temos um valor que limite
esse nmero, supomos que o nmero de acidentes qualquer inteiro no negativo.
Existem vrias distribuies discretas ou modelos probabilsticos discretos que podem ser
usados em diversas situaes prticas. O problema determinar qual modelo mais adequado
para a situao em estudo, e como aplic-lo adequadamente.
A distribuio discreta uma funo f (x) que associa a cada valor x da varivel aleatria a
sua respectiva probabilidade. Esta funo deve atender duas condies:
1. f (x) 0;
X
2. f (x) = 1
x 0 1 2 3
f(x) 64/125 48/125 12/125 1/125
1. f (x) 0;
f (x) ou P (x) ou P (X = x)
Noes de Probabilidade 39
Outra forma de representar uma distribuio de probabilidade de uma varivel alearia por
meio de sua funo de distribuio acumulado, que definida por
n
X
F (x) = P (X x) = P (X = xi )
i=1
x 0 1 2 3
f(x) 64/125 48/125 12/125 1/125
x 0 1 2 3
F(x) 64/125 112/125 124/125 125/125
Definio: Seja X uma V.A.D., com valores possveis x1, x2, ..., xn; Seja P (xi ) = P (X =
xi ), i = 1, 2, ..., n. Ento, o valor esperado de X (ou Esperana Matemtica de X), denotado por
E(X) definido como
X
E(X) = xi P (xi )
i=1
4
X 64 48 12 1 48 24 3
E(X) = xi P (xi ) = 0 +1 +2 +3 =0+ + + = 0, 60
125 125 125 125 125 125 125
i=1
4
X 64 48 12 1
V (x) = (xi E(X))2 P (xi ) = (0 0, 60)2 + (1 0, 60)2 + (2 0, 60)2 + (3 0, 60)2
125 125 125 125
i=1
64 48 12 1
= 0, 36 + 0, 16 + 1, 96 + 5, 76
125 125 125 125
23, 04 7, 68 23, 52 5, 76 60
= + + + = = 0, 48
125 125 125 125 125
V (X) = E(X 2 ) (E(X))2
4
2
X 64 48 12 1 64 48 12 1
E(X ) = x2i P (xi ) = 02 + 12 + 22 + 32 =0 +1 +4 +9
125 125 125 125 125 125 125 125
i=1
48 48 9 105
= 0+ + + = = 0, 84
125 125 125 125
V (X) = 0, 84 (0, 60)2 = 0, 84 0, 36 = 0, 48
a mais simples das distribuies discretas e recebe o nome de uniforme porque todos os
valores da varivel aleatria so assumidos com a mesma probabilidade.
Exemplo o lanamento de um dado no viciado, definindo como X, a varivel aleatria que
representa a face voltada para cima, X assume os valores x = 1, 2, 3, 4, 5, 6 com a mesma proba-
bilidade 1/6.
A distribuio uniforme neste caso dada por
1
f (x) = para x = 1, 2, 3, 4, 5, 6
6
1
f (x) = para x = x1 , x2 , x3 , ..., xk
k
k numero de termos.
Verifica-se ento que f (x) depende de k.
1. Mdia = k+1
2
6+1
No exemplo dos dados = 2 = 3, 5
2
2. Varincia 2 = k 121
62 1
No exemplo dos alrgicos sigma2 == 12 = 2, 92 s
Na prtica existem muitos experimentos que admitem apenas dois resultados. Exemplos:
Noes de Probabilidade 41
Situaes com alternativas dicotmicas podem ser representadas genericamente por respostas
do tipo sucesso-fracasso.
Esses experimentos recebem o nome de ensaio de Bernoulli e originam uma varivel alea-
tria com distribuio Bernoulli. Neste caso, consideramos uma experincia com dois possveis
resultados
Sucesso P (sucesso) = p;
Fracasso P (f racasso) = q.
Temos que:
= {Sucesso, F racasso} P () = 1
p+q =1 q =1p
1. Mdia = p
6+1
No exemplo dos dados = 2 = 3, 5
2. Varincia 2 = pq
62 1
No exemplo dos alrgicos sigma2 == 12 = 2, 92 s
Na maior parte das vezes, so realizados n ensaios de Bernoulli. O interesse est no nmero
X de ocorrncias de sucessos.
Exemplos:
3. verificar, num dado instante, o nmero de processadores ativos, num sistema com multi-
processadores;
3. para o qual a probabilidade de sucesso em cada ensaio sempre igual a p, 0 < p < 1
Noes de Probabilidade 42
f (x) = Cxn px q nx
f (x) = Cx5 px q 5x ; x = 0, 1, 2, 4, 5
1. x = 0 homem
f (x) = C05 p0 q 50
0 5
5! 1 1
=
0! (5 0)! 2 2
1
= = 0, 0313 ou 3, 13%
32
2. x = 2 homens
f (x) = C25 p2 q 52
2 3
5! 1 1
=
2! (5 2)! 2 2
20 1 1 10
= = = 0, 3125 ou 31, 25%
2 48 32
Exemplo: Lanada oito moedas (ou uma moeda oito vezes), qual a chance de obter
Trs caras?
A varivel aleatria x neste caso o nmero de caras obtidos no lanamento, logo neste caso
o sucesso sair cara nas moedas lanadas. Assim temos:
1
n = 8, p = = 0, 5 q = 1 q = 1 0, 5 = 0, 5
2
Noes de Probabilidade 43
A funo de probabilidade
f (x) = Cxn px q nx
P [X = 3] = C38 p3 q 83
8!
= (0, 5)3 (0, 5)5
3! (8 3)!
= 56 0, 125 0, 03125 = 0, 2187 ou 21, 87%
P [X 3] = P [X = 0] + P [X = 1] + P [X = 2] + P [X = 3]
P [X = 0] = C08 p0 q 80 = 0, 0039
P [X = 1] = C18 p1 q 81 = 0, 0313
P [X = 2] = C28 p2 q 82 = 0, 1094
P [X = 3] = 0, 2187
P [X 3] = 0, 0039 + 0, 0313 + 0, 1094 + 0, 2187 = 0, 3633 ou 36, 33%
P [X 4] = P [X = 4] + P [X = 5] + P [X = 6] + P [X = 7] + P [X = 8]
ou
P [X 4] = 1 P [X < 4] = 1 (P [X = 0] + P [X = 1] + P [X = 2] + P [X = 3])
= 1 0, 3633 = 0, 6367 ou 63, 67%
1. Mdia = np
2. Varincia 2 = npq
3. Desvio Padro = npq
2. Varincia 2 = 8 0, 5 0, 5 = 2
3. Desvio Padro = npq = 2 = 1, 41
Noes de Probabilidade 44
x
f (x) = e , x = 0, 1, 2, 3, ....
x!
em que:
Exemplo: O nmero mdio de dias por ano que ocorrem chuvas acima de 50mm.h1 em uma
determinada regio 1,5. Qual a probabilidade de haver mais de dois dias com chuvas acima
dessa intensidade.
x
P [X = x] = e
x!
P [X > 2] = 1 P [X 2] = 1 (P [X = 0] + P [X = 1] + P [X = 2])
1, 50
P [X = 0] = = e1,5 = 0, 2231
0!
1, 51
P [X = 1] = = e1,5 = 0, 3347
1!
1, 52
P [X = 2] = = e1,5 = 0, 2510
2!
P [X > 2] = 1 (0, 2231 + 0, 3347 + 2510) = 1 0, 8088 = 0, 1912 ou 19, 12%
A distribuio de Poisson tambm conhecida na prtica com lei dos eventos raros. Evento
raro pode ser considerado quando n 50 e p 0, 10.Nestes casos podemos utilizar a distribuio
de Poisson para probabilidades de situaes que seriam utilizadas uma distribuio binomial.
Noes de Probabilidade 45
x
P [X = x] = e
x!
3, 62
P [X = 2] = = e3,6 0, 1770ou 17, 70%
2!
1. Mdia =
No exemplo dos alrgicos = 3, 6
2. Varincia 2 =
No exemplo dos alrgicos 2 = 3, 6 s
3. Desvio Padro =
No exemplo da sementes = 3, 6 = 1, 9
Noes de Probabilidade 46
1. Mede-se a altura de uma mulher em uma cidade. O valor encontrado um nmero real.
Aqui tambm sabemos que esse nmero no passa de 3 metros, mas conveniente considerar
qualquer numero real positivo.
2. Em um exame fsico para selecionar um jogador de futebol medido o peso de cada candi-
dato; aqui tambm consideramos que o resultado pode ser qualquer nmero real positivo.
4. Para pacientes que se apresentam num hospital a primeira atitude medir-se a temperatura;
o valor da temperatura um nmero real que se pode considerar compreendido entre 35o
e 42o C.
As variveis continuas ficam completamente definidas por qualquer uma das seguintes funes
Funo densidade de probabilidade f (x) - definida para todo o x em que a varivel est
definida.
F (x) = P (X x)
1. f (x) 0 x R
Z
2. f (x)dx = 1
R
No casa das variveis contnuas a funo de distribuio acumulada, que definida por
Z x
F (x) = P (X x) = f (x)dx
Ex.: O tempo gasto, em minutos, por um estudante para responder a uma questo de um
teste uma varivel aleatria contnua com funo dada por
(
x
4 para 1 x 3
f (x) =
0 para outros valores
3 3 3
1 x2 32 12
Z Z Z Z
x x 1 1 1 9 1 18
f (x)dx = dx = dx = xdx = = = = =1
4 1 4 4 1 4 2 1 4 2 2 4 2 2 42
Noes de Probabilidade 48
Definio: Seja X uma V.A. continua, com fdp f (x). Ento, o valor esperado de X (ou
Esperana Matemtica de X), denotado por E(X) definido como
Z
E(X) = xf (x)dx
em que Z
2
E(X ) = x2 f (x)dx
em que:
rea de um retngulo
A = B.h
1
= (b a)
ba
A = 1
1 2
P (0 x 2) = b.h = 2. = = 0, 4
5 5
P (0 x 2) = F (2) F (0)
2+2 4
F (2) = =
5 5
0+2 2
F (0) = =
5 5
4 2 2
P (0 x 2) = = = 0, 4
5 5 5
(x )2
1
f (x) = exp , < x <
2 2 2 2
1. simtrica em relao a ;
2. O ponto mximo de f(x) ocorre em x = . Neste ponto as trs medidas de posio (mdia,
moda e mediana) se confundem;
Noes de Probabilidade 51
Devido a dificuldade de resoluo dessa integral, procurou-se mtodos alternativos para obten-
o das probabilidades. Uma das formas mais utilizadas por meio de tabela de probabilidades
de uma distribuio Normal padro (Z).
Uma propriedade interessante de uma varivel aleatria X que segue qualquer distribuio
Normal a de que ela pode ser transformada em uma varivel normal padro Z, por meio da
expresso
x
z=
As reas referentes varivel Z so geralmente tabeladas do tipo
P (0 < Z < z)
Exemplo: A produo diria de uma fabricante de tintas uma varivel aleatria X com
distribuio normal com mdia = 10000gales e varincia 2 = 1000000gales2 . A direo
dessa fabrica quer criar um bnus de incentivo aos funcionrios, que ser pago se a produo
mdia diria exceder 11000gales. Qual a probabilidade da empresa pagar o bnus? Quero saber
P (X > 11000), primeiro vamos padronizar esta varivel, sendo = 2 = 1000000 = 1000
Primeiro vamos padronizar esta varivel
x 11000 10000
z= = = 1, 0
1000
Assim,
P (X > 11000) = (Z > 1, 0)
Noes de Probabilidade 52
Como a tabela me fornece apenas o valor de que est entre 0 e z, ento temos
Ento
P (9000 < x < 9500) = P (1 < z < 0, 5)
Como na tabela tem apenas valores postivos e a distribuio normal simtrica temos que
P (0, 5 < z < 1, 0) = P (0 < z < 1, 0) P (0 < z < 0, 5) = 0, 3413 0, 1915 = 0, 1498
Qual a probabilidade da empresa produzir entre 9500 e 11000 gales por dia. Utilizando as
padronizaes j realizadas temos que
Assim,
P (0, 5 < z < 1, 0) = P (0 < z < 1, 0) + P (0 < z < 0, 5) = 0, 3413 + 0, 1915 = 0, 5328
Noes de Probabilidade 54
Tabela 3.2: Distribuio Normal - probabilidade do valor de z padronizado estar entre 0 e o valor
tabulado nas margens
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549
0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852
0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133
0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890
2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916
2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964
2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974
2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981
2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986
3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990
3,1 0,4990 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,4993
3,2 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995
3,3 0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997
3,4 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998
3,5 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998
3,6 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,7 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,8 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,9 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000
Noes de Probabilidade 55
Ao retirarmos uma amostra aleatria de uma populao e calcularmos a partir desta amostra
qualquer quantidade, encontramos a estatstica, ou seja, chamaremos os valores calculados em
funo dos elementos da amostra de estatsticas.
Se a populao tem distribuio normal, ento a mdia amostral ter uma distribuio
aproximadamente normal, independentemente da forma da distribuio de frequncias da
populao de onde foi retirada a amostra;
x
z=
n
Exemplo: Uma industria eltrica fabrica lmpadas que tm vida til distribuda com mdia
de 800horas e varincia igual 1600(horas)2 . Qual a probabilidade de uma amostra aleatria de
tamanho n = 64 ter vida til superio a 806, 65horas
Temos que = 800 e 2 = 1600 e = 40, ento X = 800 e X 2 = 1600 ,
64
Queremos P (X > 10, 0), primeiro vamos padronizar
x 806, 65 800 6, 65
z= = = = 1, 33
40 40
n 64 8
Ento:
P (X > 806, 65) = P (z > 1, 33) = 0, 5 P (0 < z < 1, 33) = 0, 5 0, 4082 = 0, 0918
Existe uma curva para cada tamanho de amostra (n) e o valor = n 1 (nmero de graus
de liberdade) usado para obteno de valores na tabela;
Exemplo: Seja uma amostra n = 15. Qual o valor de t acima do qual tem-se 5% de
probabilidade. = 0, 05, = 15 1 = 14, pela tabela temos que t=1,761
Considere que uma populao a proporo de elementos que portadores de certa caracterstica
p . Definindo uma varivel aleatria, da seguinte maneira
(
1 se o indivduo for portador da caractristica
X=
0 se o indivduo nofor portador da caractristica
Assim, pelo Teorema Limite Central, quando n grande (n > 30), a proporo amostral p de
sucessos em n ensaios de Bernoulli tem distribuio aproximadamente normal com mdia = p
e varincia 2 = pq
n , e assim podemos utilizar a padronizao:
p p p
z= = q
pq
n
exemplo:
Noes de Probabilidade 59
H casos em que se est mais interessado na varincia do que na mdia da amostra. Por
exemplo, em filas de espera. Mesmo conhecendo-se o tempo mdio de espera, a informao do
grau de variabilidade deste tempo importante. A distribuio usada neste caso conhecida
como Distribuio Qui-Quadrado, definida como:
(n 1)S 2
2 =
2
1
f (x) = x/21 ex/2 I{x0} ,
2/2 (/2)
Da mesma forma que a distribuio t, existe uma curva para distribuio Qui-quadrado para
cada tamanho de amostra (n) e o valor = n 1 (nmero de graus de liberdade) usado para
obteno de valores na tabela.
Exemplo: Uma amostra com n = 15. Qual o valor que deixa sua direita 5% da rea?
= 0, 05, = 15 1 = 14, pela tabela temos que t=1,761
3.5.3.2 Distribuio F
S12 12
F =
S22 22
1 +2
1 21 1
1
2 2 x 2
f (x) = 1 +2
1
2
1 x 2
2 2 1+ 2
Para se obter valores tabelados da distribuio F, necessrio observar dois graus de libera-
dade 1 = n1 1 e 2 = n2 1, o primeiro associado varincia amostral do numerador, e o
segundo associado varincia amostral do denominador.
A tabela de F informa o valor acima do qual se encontra a area e existe uma tabela para
cada valor e diferentes combinaes de 1 e 2 .
Tabela 3.5: Limites unilaterais de F ao nvel de 10% de probabilidade com os graus de liberdade
1 e 2
2 1
1 2 3 4 5 6 7 8 9 10 11
1 39,863 49,500 53,593 55,833 57,240 58,204 58,906 59,439 59,858 60,195 60,473
2 8,526 9,000 9,162 9,243 9,293 9,326 9,349 9,367 9,381 9,392 9,401
3 5,538 5,462 5,391 5,343 5,309 5,285 5,266 5,252 5,240 5,230 5,222
4 4,545 4,325 4,191 4,107 4,051 4,010 3,979 3,955 3,936 3,920 3,907
5 4,060 3,780 3,619 3,520 3,453 3,405 3,368 3,339 3,316 3,297 3,282
6 3,776 3,463 3,289 3,181 3,108 3,055 3,014 2,983 2,958 2,937 2,920
7 3,589 3,257 3,074 2,961 2,883 2,827 2,785 2,752 2,725 2,703 2,684
8 3,458 3,113 2,924 2,806 2,726 2,668 2,624 2,589 2,561 2,538 2,519
9 3,360 3,006 2,813 2,693 2,611 2,551 2,505 2,469 2,440 2,416 2,396
10 3,285 2,924 2,728 2,605 2,522 2,461 2,414 2,377 2,347 2,323 2,302
11 3,225 2,860 2,660 2,536 2,451 2,389 2,342 2,304 2,274 2,248 2,227
12 3,177 2,807 2,606 2,480 2,394 2,331 2,283 2,245 2,214 2,188 2,166
13 3,136 2,763 2,560 2,434 2,347 2,283 2,234 2,195 2,164 2,138 2,116
14 3,102 2,726 2,522 2,395 2,307 2,243 2,193 2,154 2,122 2,095 2,073
15 3,073 2,695 2,490 2,361 2,273 2,208 2,158 2,119 2,086 2,059 2,037
20 2,975 2,589 2,380 2,249 2,158 2,091 2,040 1,999 1,965 1,937 1,913
30 2,881 2,489 2,276 2,142 2,049 1,980 1,927 1,884 1,849 1,819 1,794
40 2,835 2,440 2,226 2,091 1,997 1,927 1,873 1,829 1,793 1,763 1,737
50 2,809 2,412 2,197 2,061 1,966 1,895 1,840 1,796 1,760 1,729 1,703
60 2,791 2,393 2,177 2,041 1,946 1,875 1,819 1,775 1,738 1,707 1,680
120 2,748 2,347 2,130 1,992 1,896 1,824 1,767 1,722 1,684 1,652 1,625
240 2,727 2,325 2,107 1,968 1,871 1,799 1,742 1,696 1,658 1,625 1,598
2 1
12 13 14 15 20 30 40 50 60 120 240
1 60,705 60,903 61,073 61,220 61,740 62,265 62,529 62,688 62,794 63,061 63,194
2 9,408 9,415 9,420 9,425 9,441 9,458 9,466 9,471 9,475 9,483 9,487
3 5,216 5,210 5,205 5,200 5,184 5,168 5,160 5,155 5,151 5,143 5,138
4 3,896 3,886 3,878 3,870 3,844 3,817 3,804 3,795 3,790 3,775 3,768
5 3,268 3,257 3,247 3,238 3,207 3,174 3,157 3,147 3,140 3,123 3,114
6 2,905 2,892 2,881 2,871 2,836 2,800 2,781 2,770 2,762 2,742 2,732
7 2,668 2,654 2,643 2,632 2,595 2,555 2,535 2,523 2,514 2,493 2,482
8 2,502 2,488 2,475 2,464 2,425 2,383 2,361 2,348 2,339 2,316 2,304
9 2,379 2,364 2,351 2,340 2,298 2,255 2,232 2,218 2,208 2,184 2,172
10 2,284 2,269 2,255 2,244 2,201 2,155 2,132 2,117 2,107 2,082 2,069
11 2,209 2,193 2,179 2,167 2,123 2,076 2,052 2,036 2,026 2,000 1,986
12 2,147 2,131 2,117 2,105 2,060 2,011 1,986 1,970 1,960 1,932 1,918
13 2,097 2,080 2,066 2,053 2,007 1,958 1,931 1,915 1,904 1,876 1,861
14 2,054 2,037 2,022 2,010 1,962 1,912 1,885 1,869 1,857 1,828 1,813
15 2,017 2,000 1,985 1,972 1,924 1,873 1,845 1,828 1,817 1,787 1,771
20 1,892 1,875 1,859 1,845 1,794 1,738 1,708 1,690 1,677 1,643 1,626
30 1,773 1,754 1,737 1,722 1,667 1,606 1,573 1,552 1,538 1,499 1,478
40 1,715 1,695 1,678 1,662 1,605 1,541 1,506 1,483 1,467 1,425 1,402
50 1,680 1,660 1,643 1,627 1,568 1,502 1,465 1,441 1,424 1,379 1,354
60 1,657 1,637 1,619 1,603 1,543 1,476 1,437 1,413 1,395 1,348 1,321
120 1,601 1,580 1,562 1,545 1,482 1,409 1,368 1,340 1,320 1,265 1,232
240 1,573 1,552 1,533 1,516 1,451 1,376 1,332 1,302 1,281 1,219 1,180
Noes de Probabilidade 64
Tabela 3.7: Limites unilaterais de F ao nvel de 2,5% de probabilidade com os graus de liberdade
1 e 2
2 1
1 2 3 4 5 6 7 8 9 10 11
1 647,789 799,500 864,163 899,583 921,848 937,111 948,217 956,656 963,285 968,627 973,025
2 38,506 39,000 39,165 39,248 39,298 39,331 39,355 39,373 39,387 39,398 39,407
3 17,443 16,044 15,439 15,101 14,885 14,735 14,624 14,540 14,473 14,419 14,374
4 12,218 10,649 9,979 9,605 9,364 9,197 9,074 8,980 8,905 8,844 8,794
5 10,007 8,434 7,764 7,388 7,146 6,978 6,853 6,757 6,681 6,619 6,568
6 8,813 7,260 6,599 6,227 5,988 5,820 5,695 5,600 5,523 5,461 5,410
7 8,073 6,542 5,890 5,523 5,285 5,119 4,995 4,899 4,823 4,761 4,709
8 7,571 6,059 5,416 5,053 4,817 4,652 4,529 4,433 4,357 4,295 4,243
9 7,209 5,715 5,078 4,718 4,484 4,320 4,197 4,102 4,026 3,964 3,912
10 6,937 5,456 4,826 4,468 4,236 4,072 3,950 3,855 3,779 3,717 3,665
11 6,724 5,256 4,630 4,275 4,044 3,881 3,759 3,664 3,588 3,526 3,474
12 6,554 5,096 4,474 4,121 3,891 3,728 3,607 3,512 3,436 3,374 3,321
13 6,414 4,965 4,347 3,996 3,767 3,604 3,483 3,388 3,312 3,250 3,197
14 6,298 4,857 4,242 3,892 3,663 3,501 3,380 3,285 3,209 3,147 3,095
15 6,200 4,765 4,153 3,804 3,576 3,415 3,293 3,199 3,123 3,060 3,008
20 5,871 4,461 3,859 3,515 3,289 3,128 3,007 2,913 2,837 2,774 2,721
30 5,568 4,182 3,589 3,250 3,026 2,867 2,746 2,651 2,575 2,511 2,458
40 5,424 4,051 3,463 3,126 2,904 2,744 2,624 2,529 2,452 2,388 2,334
50 5,340 3,975 3,390 3,054 2,833 2,674 2,553 2,458 2,381 2,317 2,263
60 5,286 3,925 3,343 3,008 2,786 2,627 2,507 2,412 2,334 2,270 2,216
120 5,152 3,805 3,227 2,894 2,674 2,515 2,395 2,299 2,222 2,157 2,102
240 5,088 3,746 3,171 2,839 2,620 2,461 2,341 2,245 2,167 2,102 2,047
2 1
12 13 14 15 20 30 40 50 60 120 24
1 976,708 979,837 982,528 984,867 993,103 1001,414 1005,598 1008,117 1009,800 1014,020 1016,
2 39,415 39,421 39,427 39,431 39,448 39,465 39,473 39,478 39,481 39,490 39,4
3 14,337 14,304 14,277 14,253 14,167 14,081 14,037 14,010 13,992 13,947 13,9
4 8,751 8,715 8,684 8,657 8,560 8,461 8,411 8,381 8,360 8,309 8,28
5 6,525 6,488 6,456 6,428 6,329 6,227 6,175 6,144 6,123 6,069 6,04
6 5,366 5,329 5,297 5,269 5,168 5,065 5,012 4,980 4,959 4,904 4,87
7 4,666 4,628 4,596 4,568 4,467 4,362 4,309 4,276 4,254 4,199 4,17
8 4,200 4,162 4,130 4,101 3,999 3,894 3,840 3,807 3,784 3,728 3,69
9 3,868 3,831 3,798 3,769 3,667 3,560 3,505 3,472 3,449 3,392 3,36
10 3,621 3,583 3,550 3,522 3,419 3,311 3,255 3,221 3,198 3,140 3,11
11 3,430 3,392 3,359 3,330 3,226 3,118 3,061 3,027 3,004 2,944 2,91
12 3,277 3,239 3,206 3,177 3,073 2,963 2,906 2,871 2,848 2,787 2,75
13 3,153 3,115 3,082 3,053 2,948 2,837 2,780 2,744 2,720 2,659 2,62
14 3,050 3,012 2,979 2,949 2,844 2,732 2,674 2,638 2,614 2,552 2,52
15 2,963 2,925 2,891 2,862 2,756 2,644 2,585 2,549 2,524 2,461 2,42
20 2,676 2,637 2,603 2,573 2,464 2,349 2,287 2,249 2,223 2,156 2,12
30 2,412 2,372 2,338 2,307 2,195 2,074 2,009 1,968 1,940 1,866 1,82
40 2,288 2,248 2,213 2,182 2,068 1,943 1,875 1,832 1,803 1,724 1,68
50 2,216 2,176 2,140 2,109 1,993 1,866 1,796 1,752 1,721 1,639 1,59
60 2,169 2,129 2,093 2,061 1,944 1,815 1,744 1,699 1,667 1,581 1,53
120 2,055 2,014 1,977 1,945 1,825 1,690 1,614 1,565 1,530 1,433 1,37
240 1,999 1,958 1,921 1,888 1,766 1,628 1,549 1,497 1,460 1,354 1,28
4
INFERNCIA ESTATSTICA
Nas geologia, assim como em qualquer outra cincia, existe a necessidade de obter-se con-
cluses (fazer inferncias) a respeito de parmetros de uma populao. A impossibilidade de
avaliar toda a populao faz com que a partir de amostras possamos obter estimativas daqueles
parmetros. A teoria da estimao preocupa-se com a obteno do respectivo estimador para
um determinado parmetro.
Parmetro: uma constante (um nmero) que caracteriza uma populao. Exemplo: mdia
populacional , varincia populacional 2 , etc. Em geral, os parmetros so desconhecidos.
Estimador: uma expresso algbrica utilizada para obter um valor aproximado de um
parmetro. Exemplo:
Xn
xi
i=1
X=
n
.
Estimativa: o valor numrico de um estimador. determinada usando os dados amostrais.
Exemplo: Mediante uma pesquisa queremos conhecer o tamanho mdio da superfcie agrcola
produtiva das propriedades rurais do Brasil.
Estimador:
n
X
xi
i=1
X=
n
.
4.1 ESTIMAO
um processo de induo, na qual usamos dados extrados de uma amostra para produzir
inferncia sobre a populao. Esta inferncia s ser vlida se a amostra for significativa.
Inferncia Estatstica 67
1. Estimao Pontual;
2. Estimao Intervalar
usada quando a partir da amostra procura-se obter um nico valor de certo parmetro
populacional, ou seja, obter estimativas a partir dos valores amostrais.
A estimativas so os valores amostrais obtidos para a mdia, varincia, proporo, etc. Os
valores de X, S 2 , S estimam, respectivamente , 2 e .
P (a b) = 1
Dessa maneira ser o nvel de significncia, isto , o erro que se estar cometendo ao afirmar
que o parmetro est entre o limite inferior e o superior calculado.
Consideremos uma populaco cujos elementos podem ser classificados em dois tipos: Sucesso
e Insucesso. Pretende-se estimar a proporo p de sucessos na populao.
Dada uma amostra de tamanho n, uma estimativa pontual de p dada por p = nx . Nesse caso
a estimativa obtida por uma varivel aleatria X que representa o nmero de sucessos contidos
numa amostra de tamanho n. E desta forma temos que X tem uma distribuio binomial. Numa
distribuio binomial podemos utilizar os parmetros caracteristicos n, p e q. Esse parmetros
podem ser utilizados para uma aproximao a uma distribuio normal, considerando = np e
2 = npq.
Assim, se n for suficientemente grande o intervalo de confiana para uma proporo pode ser
obtido da seguinte forma:
r r !
pq pq
P p z 2 p p + z 2 =1
n n
Exemplo: Foi tomado uma amostra de 30 arenitos, em 12 deles foram encontrados estratifica-
o cruzada. Obtenha o intervalo de confiana de 95% para proporo de estratificao cruzada
na amostra de arenito.
Nesse caso o sucesso a presena estratificao cruzada em arenito, assim
x 12
p = = = 0, 40
n 30
Inferncia Estatstica 68
0, 05
1 = 0, 95 = 1 0, 95 = 0, 05 = = 0, 025
2 2
Assim,
IC95% () = [0, 32; 0, 48]
Exemplo: Foi tomada uma amostra de 15 gros de quartzo e medido o maior eixo, fornecendo
uma mdia 1, 2mm e varincia de 0,09mm2 . Encontre um intervalo de confiana de 95% para a
mdia do maior eixo de gros de quartzo.
Primeiramente temos que obter o valor tabelado de t, como queremos o intervalo de confiana
a 95%, temos que:
0, 05
1 = 0, 95 = 1 0, 95 = 0, 05 = = 0, 025
2 2
Olhando na tabela o valor que deixa 0,025 de rea acima com = 15 1 = 14, temos
t 2 = 2, 145 Temos que: X = 1, 2, S 2 = 0, 09 S = 0, 09 = 0, 3
Inferncia Estatstica 69
S S
P X t X + t2
=1
2n n
0, 3 0, 3
P 1, 2 2, 145 1, 2 + 2, 145 = 0, 95
15 15
P (1, 2 0, 17 1, 2 + 0, 166) = 0, 95
P (1, 03 1, 37) = 0, 95
Assim,
IC95% () = [1, 03; 1, 37]
Pelo Teorema Limite Central, quando a amostra suficientemente grande (n 30), a mdia
2
amostral X tem, aproximadamente, distribuico normal de mdia X = e varincia X 2 =
n
Assim, a distribuio amostral da mdia amostral uma distribuio normal. Na prtica o
valor de no , em geral, conhecido. Uma vez que a amostra suficientemente grande, a subs-
tituico de pelo seu estimador S na varivel Z, no invalida que esta tenha aproximadamente
distribuico normal. Ento quando n 30 pode-se utilizar a distribuio Normal para obter o
intervalo de confiana para a mdia.
S S
P X z X + z 2
=1
n
2 n
Exemplo: No exemplo do maior eixo de gros de quartzo suponha que tenho sido tomada
uma amostra de tamanho 121.
Nesse caso temos:
X = 1, 2 S 2 = 0, 09 S =
p
0, 09 = 0, 3 n = 31 = 0, 025
2
S S
P X t X + t2
=1
2n n
0, 3 0, 3
P 1, 2 1, 98 1, 2 + 1, 98 = 0, 95
121 121
P (1, 2 0, 05 1, 2 + 0, 05) = 0, 95
P (1, 15 1, 25) = 0, 95
Quando a populao da qual foi amostra foi coletada for Normal, pode-se obter um intervalo
de confiana para a varincia 2 dada por:
!
(n 1)S 2 (n 1)S 2
P 2 =1
2 1 2
Exemplo: No exemplo dos 15 gros de quartzo, obter o intervalo de confiana de 95% para a
varincia e para o desvio padro do maior eixo.
Temos que 0,05
2 = 0, 025, nesse caso precisamos obter na tabela Qui-Quadrado o valores 0,025
e 10,025 = 0,975 , com = 14 graus de liberdade, ento
Nesse exemplo foi fornecido o desvio padro amostral S = 15, assim a varincia amostral
S2 = 152 = 225.
!
(n 1)S 2 2 (n 1)S 2
P = 0, 95
2 1 2
14 0, 09 2 14 0, 09
P = 0, 95
26, 119 5, 629
P 0, 0482 2 0, 2238 = 0, 95
Assim,
IC95% ( 2 ) = [0, 0482; 0, 2238] IC95% () = [0, 22; 0, 47]
Inferncia Estatstica 71
uma metodologia estatstica que permite tomar deciso sobre uma ou mais populaes
baseando no conhecimento de informaes da amostra.
Ao tentarmos a fixao de decises, conveniente a formulao de suposies ou de conjeturas
acerca das populaes de interesse, que, em geral, consistem em consideraes sobre parmetros
das mesmas. Essas suposies, que podem ser ou no verdadeiras, so denominadas de Hipteses
Estatsticas, que podem ser:
Ao testar uma hiptese estabelecida, a probabilidade mxima com a qual se sujeitaria a correr
o risco de um erro do tipo I denominada de Nvel de Significncia do Teste e representada
por .
Estudaremos testes de hipteses com uma hiptese nula (H0 ) e uma hiptese alternativa
(Ha ). A partir da formulao de (H0 ) e (Ha ), podemos definir se teste de hiptese unilateral
ou bilateral.
Consideremos o parmetro estudado e 0 valor inicialmente suposto para. Podemos formular
as seguintes hipteses:
(
H0 : = 0
Teste Bilateral
H1 : 6= 0
(
H0 : = 0
Teste Unilateral
H1 : > 0
(
H0 : = 0
Teste Unilateral
H1 : < 0
Suponha que X uma varivel aleatria Normal com mdia desconhecida e varincia 2
desconhecida. E queremos testar a hiptese de que a mdia igual a um certo valor especificado
Inferncia Estatstica 72
Para testar a hiptese, toma-se uma amostra aleatria de n 30 observaes com varincia
desconhecida se calcula a estatstica
x 0
tc =
S
n
Rejeita-se H0
Para testar a hiptese, toma-se uma amostra aleatria de n > 30 observaes com varincia
desconhecida se calcula a estatstica
x 0
zc =
S
n
Rejeita-se H0
Exemplo: Foram medidos, em mm, o eixo maior de 9 gros de quartzo em uma lmina de
arenito, obtendo-se mdia X = 0, 9mm e desvio padro S = 0, 3. Deseja-se testar a hiptese nula,
utilizando a significncia = 0, 05 de que essa amostra provm de um corpo arenoso (populao)
cuja mdia = 0, 5mm.
Temos as seguintes hipteses (
H0 : = 0, 5
H1 : > 0, 5
x 0 0, 9 0, 5
tc = = 0,3 =4
S
9
n
Nesse caso, trata-se de um teste unilateral, considerando o grau de liberdade = n 1 =
9 1 = 8 temos o valor tabelado para t t0,05 = 1, 860.
Concluso: Como 4 > 1, 860 |tc | > t rejeita-se H0 ao nvel de 5% de significncia, logo
essa amostra proveniente de outra populao.
Exemplo: Foram retiradas 36 amostras de uma jazida de carvo, em que foram medidos os
valores de espessura obtendo-se mdia de 1,12 e varincia de 0,25. Deseja-se testar a hiptese
nula, utilizando a significncia = 0, 05 de que essa amostra igual ao de uma jazida cuja
espessura mdia = 1, 22. (
H0 : = 1, 22
H1 : 6= 1, 22
Inferncia Estatstica 73
x 0 1, 12 1, 22
zc = = 0,5 = 1, 22
S
36
n
Nesse caso, trata-se de um teste bilateral, temos que observar o valor tabelado para z 2 =
z 0,05
2 = z0,025 = 1, 960.
Concluso: Observando |zc | = 1, 22, temos que como 1, 22 < 1, 96 |zc | < z 2 no existe
evidncias para rejeitar H0 ao nvel de 5% de significncia, logo a espessura mdia dessa jazida
igual a 1,22
Assim como para a mdia, existem testes de hipteses associados a propores, estes testes
so a respeito do parmetro populacional p. Com os dados coletados de uma amostra de tamanho
n, pode-se verificar o numero de sucessos X, e estimar a proporo p.
As hipteses a serem testadas a respeito do parmetro p, so as seguintes:
(
H0 : p = p 0
Teste Bilateral
H1 : p 6= p0
(
H0 : p = p 0
Teste Unilateral
H1 : p > p0
(
H0 : p = p 0
Teste Unilateral
H1 : p < p0
Para obter os valores de z tabelados, o mais prtico consultar a tabela de t, na ltima linha,
quando os graus de liberdades so suficientemente grandes.
Exemplo: Deseja-se testar se a proporo de estratificao em arenitos igual a 0,30, utili-
zando a significncia = 0, 05. Para isso foi tomado uma amostra de 30 arenitos, em 12 deles
foram encontrados estratificao cruzada.
Temos que p0 = 0, 30 q0 = 1 p0 = 1 0, 30 = 0, 70, nmero de sucessos X = 12, tamanho
da amostra n = 30, assim temos:
X 12
p = = = 0, 40
n 30
Inferncia Estatstica 74
p p0 0, 40 0, 30
zc = r =r = 1, 20
p0 q0 0, 3 0, 7
n 30
Nesse caso, trata-se de um teste bilateral, temos que observar o valor tabelado para z 2 =
z 0,05
2 = z0,025 = 1, 960.
Concluso: Observando |zc | = 1, 20, temos que como 1, 20 < 1, 96 |zc | < z 2 no existe
evidncias para rejeitar H0 ao nvel de 5% de significncia, logo a proporo de estratificao
cruzada estatisticamente igual a 0,30
2. Selecionar a estatstica de teste que ser usada para decidir rejeitar ou no a hiptese nula.
4. Usar o nvel de significncia para desenvolver regra de deciso que indica os valores
crticos da estatstica de teste que levar a rejeio de H0 .
Nas unidades anteriores, descrevemos a distribuio de valores de uma nica varivel, com
esse objetivo aprendemos a calcular medidas de tendncia central e variabilidade. Porm, se
considerarmos duas ou mais variveis surge um novo problema: as relaes que podem existir
entre as variveis estudadas.
Por exemplo, a relaes entre Peso e altura.
Para estudar a relao entre duas variveis quantitativas na utilizamos a anlise de regresso
e correlao destas variveis.
Correlao um nmero entre -1 e 1 que mede o grau de relacionamento entre duas variveis
quantitativas
Regresso o estudo que busca ajustar uma equao a um conjunto de dados de forma que
a relao entre duas variveis quantitativas possa ser expressa matematicamente.
Definimos um conjunto de variveis (x, y), sendo x a varivel independente e y a varivel
dependente.A primeira forma de verificar a relao de duas variveis traar o grfico de disperso
dos dados.
O grfico de disperso contm uma varivel independente representada no eixo horizontal e
a varivel dependente representada no eixo vertical.
sendo que:
r = 0 - ausncia de correlao.
O valor obtido para o coeficiente de correlao amostral tem como finalidade estimar o po-
pulacional, ou seja, verificar se na populao existe uma associao entre as variveis em estudo.
Desta forma, deve ser realizado um teste de hiptese sobre o coeficiente populacional, com
base no resultado obtido na amostra, que pode ser definido da seguinte maneira:
(
H0 : = 0
H1 : 6= 0
r0
tc = q
1r2
n2
x 10 12 14 16 18 20 22
y 11,8 10,2 12,1 13,2 15,1 15,4 15,6
Inferncia Estatstica 77
n
X
xi
i 112
x = = = 16
n 7
n
X
yi
i 93, 4
y = = = 13, 3
nX 7
(xi x)(yi y)
r = sXi X
(xi x)2 (yi y)2
i i
49, 6
= = 0, 9148
112 26, 25
Verificou-se que o valor da correlao r=0,9148. Vamos testar a hiptese se este valor
diferente de zero.
(
H0 : = 0
H1 : 6= 0
Temos v = n 2 = 7 2 = 5 graus de liberdade
r0 0, 9148
tc = q =q = 5, 06
1r2 10,91482
n2 5
Inferncia Estatstica 78
y = a + bx +
em que:
A anlise de varincia uma tcnica utilizada para se testar o ajuste da equao como um
todo, ou seja, um teste para verificar se a equao de regresso obtida significativa ou no.
X
SQTotal = (yi y)2
i
!2
X
(xi x)(yi y)
i
SQRegresso =
x)2
P
i (xi
SQErro = SQTotal SQRegresso
QMRegresso = SQRegresso
SQErro
QMErro =
n2
(
H0 : a = 0 ou b = 0
H1 : a 6= 0 e b 6= 0
Inferncia Estatstica 79
SQRegresso
r2 = 0 < r2 < 1
SQTotal
ele representa a porcentagem da variao total que explicada pela equao de regresso, quanto
maior o seu valor melhor.
Aps ter verificado o ajuste da equao de regresso pode-se utiliza-la para fazer previses
dentro da magnitude da varivel.
Exemplo: Utilizando o exemplo das espcies de branquipodos do Permiano.
Vamos ajustar o modelo
y = a + bx
y = 6, 26 + 0, 44x