Escolar Documentos
Profissional Documentos
Cultura Documentos
Probabilidade e Estatstica
Sonia Maria Barros Barbosa Correa
2 Edio
voltar sumrio
voltar sumrio
PUCMINAS, 2003
Pontifcia Universidade Catlica de
Minas Gerais
Gro Chanceler
Dom Serafim Fernandes de Arajo
Reitor
Prof. Pe. Geraldo Magela Teixeira
CDU: 519.2
Impresso no Brasil
voltar sumrio
voltar sumrio
sumrio
Unidade 1 Natureza e Fundamentos do Mtodo Estatstico........................ 07
voltar sumrio
voltar sumrio
4.1. Introduo......................................................................... 48
5.3 Curtose............................................................................ 63
voltar sumrio
voltar sumrio
voltar sumrio
voltar sumrio
voltar sumrio
voltar sumrio
UNIDADE 1
Natureza e Fundamentos do Mtodo Estatstico
voltar sumrio
voltar sumrio
voltar sumrio
voltar sumrio
voltar sumrio
voltar sumrio
Amostragem
Populao e amostra
voltar sumrio
voltar sumrio
Estatstica Descritiva
voltar sumrio
voltar sumrio
A tomada de decises sobre a populao, com base em estudos feitos sobre os da-
dos da amostra, constitui o problema central da inferncia estatstica.
Probabilidade
Definio do problema
voltar sumrio
voltar sumrio
Planejamento
Coleta de dados
Apurao dos dados
Apresentao dos dados
Definio do problema
Planejamento
Outros elementos importantes que devem ser tratados nesta mesma fase so:
voltar sumrio
voltar sumrio
Antes de comear a analisar os dados, conveniente que lhes seja dado algum tra-
tamento prvio, a fim de torn-los mais expressivos. A quarta etapa do processo ,
ento, a da apurao ou sumarizao, que consiste em resumir os dados atravs de
sua contagem e agrupamento. Pode ser manual, eletromecnica ou eletrnica.
Por mais diversa que seja a finalidade, os dados devem ser apresentados sob forma
adequada, tornando mais fcil o exame do fenmeno que est sendo objeto de tra-
tamento estatstico.
voltar sumrio
voltar sumrio
Nesta ltima etapa, o interesse maior reside em tirar concluses que auxiliem o
pesquisador a resolver seu problema. A anlise dos estatsticos est ligada essenci-
almente ao clculo de medidas, cuja finalidade principal descrever o fenmeno.
Assim, o conjunto de dados a ser analisado pode ser expresso por nmeros-
resumo, as estatsticas que evidenciam as caractersticas particulares desse conjun-
to. O significado exato de cada um dos valores obtidos atravs do clculo das vrias
medidas estatsticas disponveis deve ser bem interpretado. possvel mesmo, nes-
ta fase, arriscar algumas generalizaes, as quais envolvero, como mencionado
anteriormente, algum grau de incerteza, porque no se pode estar seguro de que o
que foi constatado para aquele conjunto de dados (a amostra) se verificar igual-
mente para a populao.
Define-se srie estatstica como toda e qualquer coleo de dados estatsticos refe-
ridos a uma mesma ordem de classificao: quantitativa. No sentido mais amplo,
srie uma sucesso de nmeros referidos a qualquer varivel. Se os nmeros
expressarem dados estatsticos, a srie ser chamada de srie estatstica.
Em sentido mais restrito, pode-se dizer que uma srie estatstica uma sucesso
de dados estatsticos referidos a caracteres qualitativos, ao passo que uma suces-
voltar sumrio
voltar sumrio
As tabelas servem para apresentar sries estatsticas. Conforme varie um dos ele-
mentos da srie, podemos classific-la em:
voltar sumrio
voltar sumrio
voltar sumrio
voltar sumrio
Srie Cronolgica
Exemplo:
Janeiro 2300
Fevereiro 1800
Maro 2200
Abril 2210
Maio 2360
Junho 2600
Julho 2690
Agosto 3050
Setembro 3500
Outubro 3440
Novembro 3100
Dezembro 2760
TOTAL ANUAL 31510
voltar sumrio
voltar sumrio
Srie Geogrfica
Paran 2230
So Paulo 10090
Outros 420
voltar sumrio
voltar sumrio
Srie Especfica
Tambm chamada de srie categrica ou srie por categoria, identifica-se pelo ca-
rter varivel de fator especificativo. Assim, deve-se ter:
Exemplos:
Linha A 6450
Linha B 9310
Linha C 15750
At 80 41 326
voltar sumrio
voltar sumrio
Exemplos:
A) Srie especfico-temporal
B) Srie geogrfico-temporal
Fonte: IPEA
Unidade de Produo
Produo 1937 1938 1939
Fonte: Anurio Estatstico do Brasil IBGE - (Dados alterados para melhor compreenso)
voltar sumrio
voltar sumrio
Observao:
Nem sempre uma tabela representa uma srie estatstica. Por vezes, os dados
reunidos no revelam uniformidade, sendo meramente um aglomerado de in-
formaes gerais sobre determinado assunto, as quais, embora teis, no apre-
sentam a consistncia necessria para se configurar uma srie estatstica.
voltar sumrio
voltar sumrio
O ttulo do grfico deve ser o mais claro e completo possvel. Quando necessrio,
deve-se acrescentar subttulos;
A escala horizontal deve ser lida da esquerda para a direita, e a vertical de baixo
para cima;
voltar sumrio
voltar sumrio
Grfico em Linhas
500
400
300
vendas
200
100
0
1971 1972 1973 1974 1975 1976 1977
anos
Grfico em Colunas
Populao
100
80
60
40
Populao
20
0
1940 1950 1960 1970
voltar sumrio
voltar sumrio
Grfico em Barras
Populao do Brasil
1970
1960
Populao do
1950 Brasil
1940
0 20 40 60 80 100
Grfico em Setores
1975 90
1976 120
1977
Total
O total representado pelo crculo, que fica dividido em tantos setores quantas so
as partes. Os setores so tais que suas reas so respectivamente proporcionais
aos dados da srie.
voltar sumrio
voltar sumrio
Obtemos cada setor por meio de uma regra de trs simples e direta, lembrando
que o total da srie corresponde a 360.
Total __________360
Parte___________ x
Para 1975: 360 - 360 Para 1976: 360 - 360 Para 1977: 360 - 360
90 - x 120 - x 150 - x
x = 90 x = 120 x = 150
Receita do Municipio X
1975
1976
1977
Grfico Polar
o grfico ideal para representar sries temporais cclicas, isto , sries que apre-
sentam em seu desenvolvimento determinada periodicidade, como, por exemplo, a
variao da precipitao pluviomtrica ao longo do ano, ou da temperatura ao lon-
go do dia, o consumo de energia eltrica durante o ms ou o ano, etc.
voltar sumrio
voltar sumrio
Exemplo:
Janeiro 12
Fevereiro 13
Maro 14
Abril 12
Maio 15
Junho 19
Julho 17
Agosto 18
Setembro 14
Outubro 16
Novembro 12
Dezembro 18
Jan
20
Dez Fev
15
Nov 10 Mar
5
Out 0 Abr
Set Mai
Ago Jun
Jul
voltar sumrio
voltar sumrio
UNIDADE 2
Amostragem
2.1. Importncia da Amostragem
2.2. Conceitos Fundamentais
2.3. Amostragem Aleatria Simples
2.4. Amostragem Aleatria Estratificada
2.5. Amostragem por Conglomerado
2.6. Amostragem Sistemtica
voltar sumrio
voltar sumrio
Para que possamos fazer inferncias vlidas sobre a populao a partir de uma a-
mostra, preciso que essa seja representativa. Uma das formas de se conseguir
representatividade fazer com que o processo de escolha da amostra seja, de al-
guma forma, aleatrio. Alm disso, a aleatoriedade permite o clculo de estimativas
dos erros envolvidos no processo de inferncia.
voltar sumrio
voltar sumrio
Amostragem Intencional;
Amostragem por Quotas.
voltar sumrio
voltar sumrio
Observao:
voltar sumrio
voltar sumrio
que ler trs colunas para conseguirmos valores entre 001 e 300. Se o nmero
sorteado superar o nmero de elementos rotulados, abandona-se o nmero sor-
teado, prosseguindo-se o processo. Considerando 9 linha e 5 coluna temos
como resposta : 124,056,094,143,014.
Exemplo:
Resoluo:
De igual tamanho;
Proporcional.
No primeiro tipo, sorteia-se igual nmero de elementos em cada estrato. Esse pro-
cesso utilizado quando o nmero de elementos por estrato for aproximadamente
o mesmo.
voltar sumrio
voltar sumrio
N N de unidades da populao
n N de unidades das amostras Na na n
Na N de unidades do estrato A = na = .Na
na N de amostras de A N n N
Exemplo:
Resoluo:
M 54 5,4 5
F 36 3,6 4
Total 90 9,0 9
voltar sumrio
voltar sumrio
Uma amostra por conglomerado uma amostra aleatria simples na qual cada uni-
dade de amostragem um grupo, ou um conglomerado de elementos.
Exemplo:
voltar sumrio
voltar sumrio
N
K=
n
OBS: Para valores de K=N/n , arredondar para o valor inteiro menor.
OBS: 0<b K
3 - Composio da Amostra:
1 item b
2 item b + K
3 item b + 2k
Exemplo:
Soluo:
3 item 12 + 2*25 = 62
20 item 12 +19*25 = 487
voltar sumrio
voltar sumrio
COLUNA 1 5 9 13 17 21 25 29 33 37 41 45 49
LINHA
01 9486 9821 6074 1432 0995 0157 0071 9871 6678 0140 9522 0995 1735
02 3155 9878 3359 8244 8952 0084 1558 4775 1699 1652 2555 4765 2709
03 6136 2824 6030 4256 3870 5725 2204 5318 8337 3867 6184 2018 3522
04 7249 9182 8669 7423 1768 8147 7285 8390 9134 9863 9486 9821 6074
05 0071 9871 6678 0140 9522 0995 1735 1248 9807 1910 3155 9878 3359
06 1558 4775 1699 1652 2555 4765 2709 0561 4397 1135 6136 2824 6030
07 2204 5318 8337 3867 6184 2018 3522 0941 5569 5800 7249 9182 8669
08 7285 8390 9134 9863 9486 9821 6074 1432 0995 0157 0071 9871 6678
09 1735 1248 9807 1910 3155 9878 3359 8244 8952 0084 1558 4775 1699
10 2709 0561 4397 1135 6136 2824 6030 4256 3870 5725 2204 5318 8337
11 3522 0941 5569 5800 7249 9182 8669 7423 1768 8147 7285 8390 9134
12 6074 1432 0995 0157 0071 9871 6678 0140 9522 0995 1735 1248 9807
13 3359 8244 8952 0084 1558 4775 1699 1652 2555 4765 2709 0561 4397
14 6030 4256 3870 5725 2204 2318 8337 3867 6184 2018 3522 0941 5569
15 8669 7423 1768 8147 7285 8390 9134 9863 9486 9821 6074 1432 0995
16 6678 0140 9522 0995 1735 1248 9807 1910 3155 9878 3359 8244 8952
17 1699 1652 2555 4765 2709 0561 4397 1135 6136 2824 6030 4256 3870
18 8337 3867 6184 2018 3522 0941 5569 5800 7249 9182 8669 7423 1768
19 9134 9863 9486 9821 6074 1432 0995 0157 0071 9871 6678 0140 9522
20 9807 1910 3155 9878 3359 8244 8952 0084 1558 4775 1699 1652 2555
21 4397 1135 6136 2824 6030 4256 3870 5725 2204 5318 8337 3867 6184
22 5569 5800 7249 9182 8669 7423 1768 8147 7285 8390 9134 9863 8486
23 0995 0157 0071 9871 6678 0140 9522 0995 1735 1248 9807 1910 3155
24 8952 0084 1558 4775 1699 1652 2555 4765 2709 0568 4397 1135 6136
25 3870 5725 2204 5318 8337 3867 6184 2018 3522 0941 5569 5800 7249
26 7425 3566 6151 4731 6489 2491 2765 8525 7849 1488 8833 2597 1333
27 8961 8175 0879 6945 8029 9119 5990 1063 9444 8320 1740 6131 9907
28 3298 6173 1741 3874 9321 3748 7507 0170 0568 9112 1275 0924 3054
29 2276 4898 2394 1098 4063 5393 0226 8144 4778 7471 1764 4939 8063
30 9557 8114 1576 9767 1486 7161 5606 6295 3503 5050 9549 2500 9666
31 8650 1920 2533 7755 5324 3731 3414 2153 3815 0626 5718 8679 6801
32 2885 8101 1467 0080 7962 5999 9562 5819 1562 6793 2065 0239 8253
33 1841 8626 0344 4344 7446 0867 6157 8935 4413 2363 7187 8980 2488
34 4638 8030 0018 7760 9819 4276 0650 3516 5159 9236 3257 1694 7157
35 1320 7033 1218 5605 4206 2878 0230 1740 4553 8729 5827 7176 8703
36 1488 5803 6790 9368 0465 4819 0065 7633 3950 2109 7027 5824 5057
37 4353 4347 8565 2231 8789 4231 2585 0157 2037 7835 1320 8999 9181
38 7816 5817 9764 8789 7387 2172 0896 1038 6047 9539 3510 1343 8098
39 8600 9738 5415 8426 7152 8705 5829 0164 8330 9152 6045 8129 2293
40 1057 1550 8773 3003 4302 4034 2478 1078 0429 7189 0778 3260 5969
voltar sumrio
voltar sumrio
UNIDADE 3
Distribuio de Freqncia
3.1. Conceitos
3.2. Elementos de uma distribuio de freqncia: amplitude total,
limites de classe, amplitude do intervalo de classe, ponto
mdio da classe, freqncia absoluta, relativa e acumulada
3.3. Regras Gerais para a elaborao de uma distribuio
de freqncia
3.4. Grficos representativos de uma distribuio de freqncia:
histograma, polgono de freqncia e ogiva
3.1. Conceitos
voltar sumrio
voltar sumrio
J F M A M J J A S O N D
1995 6 2 5 1 0 3 2 1 3 5 5 3
1996 5 4 2 1 3 4 1 4 5 4 0 1
1997 3 1 2 4 3 1 4 1 0 3 0 2
1998 2 2 0 3 1 4 2 0 1 1 5 2
0 0 0 0 0 0 1 1 1 1 1 1
1 1 1 1 1 2 2 2 2 2 2 2
2 2 3 3 3 3 3 3 3 3 4 4
4 4 4 4 4 5 5 5 5 5 5 6
voltar sumrio
voltar sumrio
Exemplo: peso de alunos: 55,5 kg; 61,0kg; 63,4 kg; 68,1 kg.......
distncia entre cidades: 35,5 km; 48,6 km; 100,10 km; ....
N de aparelhos
N de meses
com defeitos
0 06
1 11
2 09
3 08
4 08
5 05
6 01
Total 48
voltar sumrio
voltar sumrio
Notas N de alunos
0 |--- 20 020
20 |--- 40 065
40 |--- 60 230
60 |--- 80 160
Total 580
150 154 155 157 160 161 162 164 166 169
151 155 156 158 160 161 162 164 167 170
152 155 156 158 160 161 163 164 168 172
153 155 156 160 160 161 163 165 168 173
A = 173 150 = 23
voltar sumrio
voltar sumrio
3.2.2. Nmero de classes (K) e Classe (i) no existe regra fixa para se
determinar o nmero de classes. Podemos utilizar:
Ou
h=A/K
H = 23/ 6 = 3,83 h = 4
voltar sumrio
voltar sumrio
i Classes n
1 150 | 154 4
2 154 | 158 9
3 158 | 162 11
4 162 | 166 8
5 166 | 170 5
6 170 | 174 3
40
L2=158
l2 = 154
linf + Lsup
xi =
2
154 + 158
x2 = = 156 x 2 = 156
2
3.2.6. Freqncias
voltar sumrio
voltar sumrio
ni
fi =
n
Exemplo: considerando a segunda classe do exemplo anterior, temos:
f2 = 9/40=0,225 .
Ni
Fi =
n
Exemplo: para o exemplo anterior, F4 = 0,8 .
voltar sumrio
voltar sumrio
K = 1 + 3,3 log n ou k = n
3. Determinar a amplitude do intervalo de classe;
A
h=
k
4. Determinar os limites de classe;
Exemplo:
33 35 35 39 41 41 42 45 47 48
50 52 53 54 55 55 57 59 60 60
61 64 65 65 65 66 66 66 67 68
69 71 73 73 74 74 76 77 77 78
80 81 84 85 85 88 89 91 94 97
voltar sumrio
voltar sumrio
i Classes n Ni fi Fi xj
1 30 | 40 4 4 0,08 0,08 35
2 40 | 50 6 10 0,12 0,20 45
3 50 | 60 8 18 0,16 0,36 55
4 60 | 70 13 31 0,26 0,62 65
5 70 | 80 9 40 0,18 0,80 75
6 80 | 90 7 47 0,14 0,94 85
7 90 |100 3 50 0,06 1,0 95
50 1
Histograma
ni
12
30 40 50 60 70 80 90 100
voltar sumrio
voltar sumrio
Polgono de Freqncia
ni
12
35 45 55 65 75 85 95 Ponto mdio
50
47
40
31
18
10
30 40 50 60 70 80 90 classes
100
voltar sumrio
voltar sumrio
ni
12
1 2 3 4 5 6 xi
voltar sumrio
voltar sumrio
UNIDADE 4
Medidas de Posio
4.1. Introduo
4.2. Mdia aritmtica simples e ponderada e suas propriedades
4.3. Moda: Dados agrupados e no agrupados em classes
4.4. Mediana: Dados agrupados e no agrupados em classes
4.5. Mdia Geomtrica: Dados agrupados
e no agrupados em classes
4.6. Mdia Harmnica: Dados agrupados
e no agrupados em classes
4.7. Separatrizes: Quartis, Decis e Percentis
4.1. Introduo
Nas sees anteriores, vimos a sintetizao dos dados sob a forma de tabelas, gr-
ficos e distribuies de freqncias. Agora, vamos destacar o clculo das medidas
que possibilitam localizar a maior concentrao de valores de uma dada distribui-
o, isto , se ela se localiza no incio, no meio ou no final, ou, ainda, se h uma
distribuio por igual. Tais medidas possibilitam comparaes de sries de dados
entre si pelo confronto desses nmeros.
Medidas de posio;
Medidas de variabilidade ou disperso;
Medidas de assimetria;
Medidas de curtose.
voltar sumrio
voltar sumrio
A mdia aritmtica;
A mediana;
A moda.
A mediana;
Os quartis;
Os decis;
Os percentis.
Dados no tabelados
n
xi : valor observado
xi n : nmero total de observaes
x= i =1
n
Exemplo: Suponha que o tempo de vida til de 10 aparelhos de telefone so:
10 29 26 28 15 23 17 25 0 20. Qual a mdia de vida til
destes aparelhos?
Soluo: X = 10 + 29 + 26 + 28 + 15 + 23 + 17 + 25 + 0 + 20 = 193
x=
x = 193 = 19,3 ,
n 10
portanto mdia de vida til dos aparelhos so 19,3 anos.
voltar sumrio
voltar sumrio
Dados Tabelados
x n i i
Xi : valor observado
ni : n de observaes por classe
x = i =1
n : n de observaes totais
n
o valor que ocorre com maior freqncia em um conjunto de dados, e que de-
nominado valor modal. Baseado nesse contexto, um conjunto de dados pode apre-
sentar mais de uma moda. Nesse caso, dizemos ser multimodais; caso contrrio,
quando no existe um valor predominante, dizemos que amodal.
3 4 4 5 6 7 8 9 9 9 10 11 12 13
Soluo: Mo= 9
Dados tabelados
Sem intervalo de Classe: O valor modal o valor que possuir maior freqn-
cia.
Exemplo:
Classes 0 1 2 3 4 5 6
voltar sumrio
voltar sumrio
N 06 11 09 08 08 05 01 48
nmo nant
Mo = linf + hMo
(nmo nant ) + (nmo n post )
onde constatamos:
M o = 3Md 2 X
onde constatamos:
Md = Mediana
X = Mdia
voltar sumrio
voltar sumrio
ni 3 10 17 8 5 43
Dados no tabelados
Para uma srie com nmero mpar de itens: a mediana corresponde ao valor
central.
n mpar Md = X (E Md )
EMd = (n+1)/2
voltar sumrio
voltar sumrio
Para uma srie com nmero par de itens: no h termo central nico, mas,
sim, dois termos centrais. A mediana ser dada por:
n par X (E Md ) + X (E Md +1)
EMd = n/2 Md =
2
Dados tabelados:
n
E MD =
2
n
2 Nant
Md = linf + hMd
nMd
onde temos:
voltar sumrio
voltar sumrio
Dados no tabelados
M G = N x1.x2 . x3 .....xn
Dados agrupados
Xi : valor observado
M G = N x1n1 x2 n 2 x3 n3 ....xn n n ni : n de observaes da classe
x i : ponto mdio
M G = N x1n1 x 2 n2 x 3 n3 ....x n nn ni : n de observaes
Sejam x1, x2, x3,......xn, valores de x, associados s freqncias absolutas n1, n2,
n3,......nn, respectivamente.
n n
Mh = =
n1 n 2 n 3 nn n
ni
+
x1 x 2
+
x3
+ ........ +
xn
i =1 xi
voltar sumrio
voltar sumrio
Qi = quartil i=1,2,3
Q1 = 1 quartil, valor situado de tal modo na srie que uma quarta parte (25%)
dos dados menor que ele e as trs quartas partes restantes (75%) so maio-
res.
Q2 = 2 quartil, evidentemente, coincide com a Mediana (Q2 = Md).
Q3 = 3 quartil, valor situado de tal modo que as trs quartas partes (75 %) dos
termos so menores que ele e uma quarta parte 25 % maior.
n 3n
N ant N ant
Q3 = lQ3 + .h
4 4
Q1 = lQ1 + .h
nQ1 nQ3
Onde temos:
Di = decil i=1,2,3, , 9
voltar sumrio
voltar sumrio
Pi = centil i=1,2,3, , 99
Exemplo:
Estaturas 120|--- 128 128|---136 136|--- 144 144|--- 152 152|--- 160
frequencia 6 12 16 13 7
Calcule:
a) O 1 Quartil (Q1);
b) o 4 Decil (D4);
Soluo:
voltar sumrio
voltar sumrio
Total 54
a) Calculo de Q1,
Para calcular Q1, temos que primeiro identificar a classe que esta o valor, para
isto consideramos :
N 54
= = 13,5 , que vamos neste momento arredondar para 14, pela frequencia
4 4
acumulada procuramos a classe que encontra o 14 elemento, que a 2 classe
com limites de 128 |--- 136.
n
N ant
4
Q1 = lQ1 + .h
nQ1
Onde:
linf : limite inferior da classe do quartil considerado = 128
Q1 = 128 +
(13,5 6) * 8 = 133
12
voltar sumrio
voltar sumrio
b) Calculo de D4
Primeiro identificamos a classe que esta o valor;
KN 4 x54
= = 21,6 = 27 , atravs da freqncia acumulada identificamos a clas-
10 10
se que encontra o 27 , que a 3 classe com limites de 136 |--- 144
Agora usamos a frmula
KN
N ( ant )
+ h
10
DK = l DK
nDK
onde:
lDK: limite inferior da Classe Dk = 136
N : tamanho da amostra = 54
h : amplitude da classe = 8
nDK: freqncia da classe = 16
N(ant): freqncia acumulada da classe anterior = 18
D4 = 136 +
(21,6 18) * 8 = 137,8
16
voltar sumrio
voltar sumrio
UNIDADE 5
Medidas de Disperso
5.1. Disperso
5.2. Assimetria
5.3. Curtose
5.1. Disperso
Absoluta
Amplitude (A)
Varincia (S2)
Desvio padro (S)
Relativa
voltar sumrio
voltar sumrio
Varincia (S2)
2
n
( xi x)
_
2
S2 =
xi2 ni
xi ni
S =
2 i =1
n 1
n 1 n 1
Onde temos que:
Sendo a varincia calculada a partir dos quadrados dos desvios, ela um nmero
em unidade quadrada em relao varivel em questo, o que, sob o ponto de
vista prtico, um inconveniente; por isso, tem pouca utilidade na estatstica des-
critiva, mas extremamente importante na inferncia estatstica e em combinaes
de amostras.
voltar sumrio
voltar sumrio
S = S2
S
CV =
x
5.2. Assimetria
voltar sumrio
voltar sumrio
Simetria
X = Mo = Md
Mo < Md < X
Mo Md X
X < Md < Mo
X Md Mo
voltar sumrio
voltar sumrio
1 Coeficiente de Pearson
2 coeficiente de Pearson
Quando
5.3. Curtose
Mesocrtica: uma curva bsica de referncia chamada curva padro ou curva normal;
voltar sumrio
voltar sumrio
Platicrtica: uma curva mais achatada (ou mais aberta) que a curva normal;
Q1 : valor do 1 Quartil
Q3 Q1 Q3 : valor do 3 Quartil
K=
2(P90 P10 ) P10 : valor do percentil 10
P90 : valor do percentil 90
voltar sumrio
voltar sumrio
UNIDADE 6
Probabilidade
Nesta unidade, vamos ver que a probabilidade expressa por meio de va-
lores numricos as possibilidades da ocorrncia dos resultados de um
fenmeno. So objetivos desta unidade:
Introduo
voltar sumrio
voltar sumrio
Espao Amostral
voltar sumrio
voltar sumrio
S = { c, r } ( composto de 2 eventos)
S = { 1, 2, 3, 4, 5, 6 } ( composto de 6 eventos)
S = { (c, r), (c, c), (r, c), (r, r)} ( composto de 8 eventos)
voltar sumrio
voltar sumrio
Exemplo:
Muitas vezes, til representar graficamente um espao amostral, porque isso tor-
na mais fcil visualizar-lhe os elementos.
Os eventos A e A so complementares.
A
A
Os eventos A e B so mutuamente
A B
excludentes porque no se interceptam.
S
S
Operaes com Eventos Aleatrios
S = { 1 , 2 , 3 .... n }
voltar sumrio
voltar sumrio
A B = {1 () S / 1 A ou 1 B }
A B = {i S i A e i B }
o evento que ocorre se A e
B ocorrem
Obs: Se A B = , A e B so eventos
A B mutuamente exclusivos
Ac = {i S i A}
AC
voltar sumrio
voltar sumrio
P(S) = 1
P (A B)=P(A)+P(B)
voltar sumrio
voltar sumrio
Eventos Equiprovveis
1 r
P ( A) = r P ( A) =
n n
Exemplo:
Soluo:
P( A B) = P ( A) + P( B) P ( A B )
Exemplo:
S = {1,2,3,4,5,6}
Ento, A e B so mutuamente exclusivos, pois a ocorrncia de um n-
mero par e mpar no pode ser verificada em decorrncia da mesma ex-
perincia.
voltar sumrio
voltar sumrio
P(Ac) = 1 P(A)
Teoria da Contagem
Dados dois eventos, o primeiro dos quais pode ocorrer de m maneiras distintas e o
segundo pode ocorrer de n maneiras distintas, ento os dois eventos conjuntamen-
te podem ocorrer de m.n maneiras distintas. O clculo da probabilidade de um e-
vento reduz-se a um problema de contagem. Assim que a Anlise Combinatria
tem fundamental importncia para se contar o n de casos favorveis e o total de
casos. Para problemas simples ou com poucos elementos, pode-se contr o nmro
de resultados de forma direta, sem necessidade de recorrer s frmulas matemti-
cas da anlise combinatria. Para problemas menos simples, recorre-se s combi-
naes e arranjos para determinar o nmero de casos.
Combinao
r r!
Cr ,p = =
p p! (r p )!
voltar sumrio
voltar sumrio
10 10.9.8.7!
C10,3 = = = 120
3 3.2.7!
Arranjos
r!
Ar , p =
(r p)!
voltar sumrio
voltar sumrio
Probabilidade Condicional
P( A B)
P( A B) =
P (B )
Isso significa que a probabilidade de A ocorrer, dado que B ocorreu, igual pro-
babilidade de ocorrncia simultnea de A e B dividida pela probabilidade de ocor-
rncia de B. (Note-se que essa definio no se aplica quando P(B)=0, porque en-
to estaramos dividindo por zero).
Exemplo:
Soluo:
P(A/B)=1/15
P(B/A)=1/3
Teorema do Produto
voltar sumrio
voltar sumrio
P( A B) P( A B)
P( A B) = P (B A ) =
P (B ) P ( A)
Independncia Estatstica
P(A B)=P(A).P(B)
Regra de Bayes
P( Ai ).P( B / Ai )
P ( Ai / B) =
P ( A1 ).P ( B / A1 ) + P( A2 ).P( B / A2 ) + ...... + P( An ).P( B / An )
voltar sumrio
voltar sumrio
Exemplos:
Soluo:
P( A B)
Como P ( A / B ) = , devemos calcular P(A B).
P( B)
1/ 6 2
P(A B)= 2/12=1/6 logo, P(A/B) = =
3/ 4 9
Soluo:
Temos que :
P(M/Ma)= ? (Probabilidade de ser mulher dado que tem mais que 1,80 m)
voltar sumrio
voltar sumrio
P( M ) * P( Ma / M ) 0,4 * 0,02
P ( M / Ma) = =
P( M ) * P( Ma / M ) + P ( H ) * P( Ma / H ) (0,4 * 0,02) + (0,6 * 0,05)
0,008
P ( M / Ma) = = 0,21 = 21%
0,038
Soluo
Temos que :
P(A) = 0,4
P(B) = 0,5
P(C)= 0,10
P(D/A) = 0,03
P(D/B) = 0,05
P(D/C) = 0,02
P(B/D) = ?
P( B) * P( D / B)
P( B / D) =
P( A) * P ( D / A) + P( B) * P( D / B) + P(C ) * P ( D / C )
0,5 * 0,05
P( B / D) =
0,4 * 0,03 + 0,5 * 0,05 + 0,1 * 0,02
0,025
P( B / D) = = 0,641 = 64,1%
0,039
voltar sumrio
voltar sumrio
UNIDADE 7
Variveis Aleatrias
S X
R
s
Varivel
Aleatria X(s)
Exemplo:
voltar sumrio
voltar sumrio
Uma vez definida a varivel aleatria, existe interesse no clculo dos valores das
probabilidades correspondentes.
{(xi,p(xi), I=1,2,.n}
a funo que associa a cada valor assumido pela varivel aleatria a probabilida-
de do evento correspondente, isto :
voltar sumrio
voltar sumrio
Uma funo X, definida sobre o espao amostral e assumindo valores num conjunto
enumervel de pontos do conjunto real, dita uma varivel aleatria discreta.
p(x) = P(X = x)
E ( X ) = x p( x)
Var ( X ) = E ( X 2 ) [ E ( X )] 2
onde
E ( X 2 ) = x 2 p( x)
E de desvio padro de X a
DP( X ) = Var ( X )
voltar sumrio
voltar sumrio
1. Distribuio de Bernoulli
X x1 = 1 (sucesso) ou x 2 = 0 (fracasso)
P(X) p(x 1 ) = p p(x 2 ) = 1 p = q
P ( x = 0) = q e P(x = 1 ) = p
P ( X = x) = p x .q 1 x
Principais caractersticas
1
Mdia: E ( X ) = xi P( xi ) = 0.q + 1. p = p
i =0
Varincia:
Var ( X ) = E ( X 2 ) [ E ( X )]2
1
E ( X 2 ) = xi2 P ( xi ) = 0 2 q + 12 p = p
i =0
Var ( X ) = p p 2 = p (1 p) = pq
voltar sumrio
voltar sumrio
2. Distribuio Binomial
P ( X = 0) = q.q.q.q.q.....q = q n
P ( X = 1) = n. p.q n 1
voltar sumrio
voltar sumrio
Principais caractersticas:
Mdia: E ( X ) = n. p
a) dar 5 caras;
b) pelo menos uma cara;
c) no mximo 2 caras.
Soluo:
a) x = sair cara, p=0,5 ( probabilidade do sucesso de X), q= 0,5 ( pro-
babilidade do fracasso de X0, n = 8 ( nmero de repeties do evento).
8! 40320
P ( X = 5) = .0,5 5.0,585 = .0,58 = 0,21875 = 21,88%
5!(8 5)! 120.6
3. Distribuio de Poisson
voltar sumrio
voltar sumrio
e .k
P( X = k ) = onde a mdia.
k!
Carros que passam por um cruzamento por minuto, durante uma certa hora do
dia;
Erros tipogrficos por pgina, em um material impresso;
Defeitos por unidade (m, m, m, etc.,,) por pea fabricada;
Colnias de bactrias numa dada cultura por 0,01mm, numa plaqueta de mi-
croscpio;
Mortes por ataque de corao por ano, numa cidade;
Problemas de filas de espera em geral, e outros.
Principais caractersticas:
Mdia: E ( X ) =
Varincia: Var ( X ) =
OBS: Muitas vezes, no uso da binomial, acontece que n muito grande e p muito
pequeno. Podemos, ento, fazer uma aproximao de binomial pela distribuio de
Poisson, da seguinte forma:
= np
Soluo:
= 2 por hora, para 2 horas = 4
P(X3)= P(X=0)+P(X=1)+P(X=2)+P(X=3)
voltar sumrio
voltar sumrio
e .0 e .1 e .2 e .3
P(X3) = + + +
0! 1! 2! 3!
e 4 .4 0 e 4 .41 e 4 .4 2 e 4 .4 3
P(X3) = + + +
1 1 2 6
4 4 4 4
P(X3) = e + 4e + 8e + 10,666e = 23,66e = 0,4334 = 43,34%
4
Assim, a rea sob a f.d.p. entre dois pontos a e b nos d a probabilidade da varivel
assumir valores entre a e b, conforme ilustrado na figura 1, apresentada a seguir.
P(a<X<b)
a b
voltar sumrio
voltar sumrio
Da relao entre a probabilidade e a rea sob a funo, a incluso, ou no, dos ex-
tremos a e b na expresso acima no afetar os resultados. Assim, iremos admitir
Teoricamente, qualquer funo f(x) que seja no negativa e cuja rea total sob a
curva seja igual unidade, isto ,
f ( x)dx = 1
caracterizar uma v.a. contnua.
b
E ( X ) = x f ( x)dx
a
Var ( X ) = E ( X 2 ) [ E ( X )] 2
onde
b
E ( X 2 ) = x 2 f ( x)dx
a
e de desvio padro de X a
DP( X ) = Var ( X )
Se X uma v.a. contnua com f.d.p. f(x), definimos a sua funo de distribuio
acumulada F(x) como:
x
F ( x) = P ( X x) = f (t )dt
voltar sumrio
voltar sumrio
1 - Distribuio Normal
1 (x )2
f(x) = exp < x <
2 2 2
Como pode-se observar atravs da equao acima, a distribuio normal inclui os
parmetros e , os quais possuem os seguintes significados:
2
Se uma varivel aleatria X tem distribuio normal com mdia e varincia ,
2
escrevemos: X N( , ).
A figura 2 ilustra uma curva normal tpica, com seus parmetros descritos grafica-
mente.
voltar sumrio
voltar sumrio
f(x)
: mdia
: desvio padro
Para uma mesma mdia e diferentes desvios padro , a distribuio que tem
maior desvio padro se apresenta mais achatada, acusando maior disperso em
torno da mdia. A que tem menor desvio padro apresenta pico mais acentuado e
maior concentrao em torno da mdia. A figura 3 compara trs curvas normais,
com a mesma mdia, porm, com desvios padro diferentes. A curva A se apresen-
ta mais dispersa que a curva B, que por sua vez se apresenta mais dispersa que a
curva C. Nesse caso, A > B > C.
B
A
voltar sumrio
voltar sumrio
B A
B A
99.73 %
95.46 %
68.26 %
-3 - + +3
-2 +2
Portanto, 68,26% dos valores populacionais caem entre os limites definidos como
mdia mais ou menos um desvio padro ( 1); 95,46% dos valores caem entre
voltar sumrio
voltar sumrio
mdia mais ou menos dois desvios padro ( 2); e 99,73% dos valores caem
entre mdia mais ou menos trs desvios padro ( 3).
2
Se X N( , ), ento, a varivel aleatria definida por
X
Z=
X
-3 - + +3
-2 +2
X-
Z
-3 -2 -1 0 1 2 3
Exemplo:
voltar sumrio
voltar sumrio
Soluo:
200 210
P(X < 200) = P Z < = P(Z < -2).
5
P(X<200)
X
180 190 200 210 220 230 240
P(Z<-2)
Z
-6 -4 -2 0 2 4 6
P(Z>z) = 1 - P(Z<z)
P(Z<-z) = P(Z>z)
P(Z>-z) = P(Z<z)
voltar sumrio
voltar sumrio
-z z
P(X < 200) = P(Z < -2) = P(Z > 2) = 1 - P(Z < 2)
= 2,275%
voltar sumrio
voltar sumrio
UNIDADE 8
Inferncia Estatstica
voltar sumrio
voltar sumrio
Definies
POPULAO PARMETROS:
AMOSTRAS ESTIMADORES:
Distribuio Amostral
voltar sumrio
voltar sumrio
E (x) = (x) =
Assim, provado que a mdia das mdias amostrais igual mdia populacional.
2
VAR ( x ' ) = 2
x' =
n
2 N n N n
( x' ) =
2
x' =
n N 1 n N 1
Esses quatro teoremas provam que a mdia amostral (x) tem distribuio normal
2
com mdia igual mdia da populao () e varincia dada por para popula-
n
2 N n
es infinitas, assim como para populaes finitas. Ou, ainda:
n N 1
2 2 N n
x' N ; ou x' N ;
n n N 1
voltar sumrio
voltar sumrio
xi xi
Zi = Zi =
ou N n
n n N 1
Exemplo:
Soluo:
= 175cm
X : N (175 , 25 cm)
= 5cm
Ento ()
x = E x = 175
N n 5 5000 25
E x = = = 0,4988
n N 1 10 5000 1
8.2. Estimao
Estimao pontual
Para ilustrar alguns dos problemas com os quais nos deparamos quando estimamos
a mdia de uma populao com base em dados amostrais, vamos recorrer a um
voltar sumrio
voltar sumrio
17 13 18 19 17 21 29 22 16 28
21 15 26 23 24 20 8 17 17 21
32 18 25 22 16 10 20 22 19 14
30 22 12 24 28 11
voltar sumrio
voltar sumrio
2
x' N ; para as populaes infinitas,
n
2 N n
x' N ; para as populaes finitas.
n N 1
x'
Z =
n
Ou seja: P Z Z Z = 1
2 2
voltar sumrio
voltar sumrio
x'
P Z Z =1
2 2
n
P x' Z x '+ Z =1
2 n 2 n
N n N n
P x ' Z x '+ Z =1
2 n N 1 2 n N 1
Exemplo:
Soluo:
voltar sumrio
voltar sumrio
2,5% 2,5%
95%
-1,96 1,96
Substituindo na formula :
P x' Z x '+ Z =1
2 n 2 n
5 5
P 500 1,96 500 + 1,96 = 95%
100 100
Principais conceitos
voltar sumrio
voltar sumrio
Testamos hipteses para tomarmos uma deciso entre duas alternativas. Por essa
razo, o Teste de Hiptese um Processo de Deciso Estatstica.
Tipos de Hiptese Designa-se por H0, chamada hiptese nula, a hiptese estatsti-
ca a ser testada, e por H1 a hiptese alternativa. A hiptese nula expressa uma i-
gualdade, enquanto a hiptese alternativa dada por uma desigualdade.
Exemplo:
H 0 : = 1,65m
para testes bilaterais (d origem a um teste bicaudal)
H1 : 1,65m
H 0 : = 1,65m
para testes unilaterais direita (d origem a um teste unilateral direita)
H1 : > 1,65m
H 0 : = 1,65m
para testes unilaterais esquerda (d origem a um teste unicaudal esquerda)
H1 : < 1,65m
voltar sumrio
voltar sumrio
Usa-se para cada tipo de teste uma varivel cuja distribuio amostral do esti-
mador dos parmetros seja a mais concentrada em torno do verdadeiro valor do
parmetro;
Calcula-se com o valor do parmetro 0, dado por H0, o valor crtico, valor obser-
vado na amostra ou valor calculado (Vcalc);
Fixa-se duas regies: uma de no rejeio de H0 (RNR) e uma de rejeio de H0
ou crtica (RC) para o valor calculado, ao nvel de risco dado;
Se o valor observado (Vcalc) Regio de No Rejeio, a deciso a de no re-
jeitar H0;
Se Vcalc Regio Crtica, a deciso a de rejeitar H0.
P(|Vcalc| V)= RC
Testes Bilaterais
De uma populao normal com varincia 36, toma-se uma amostra casual de ta-
manho 16, obtendo-se x=43. Ao nvel de 10%, testar as hipteses:
H 0 : = 45
H1 : 45
Soluo: Como o teste para mdia de populaes normais com varincia conheci-
da, usaremos a varivel Z: N(0,1) como critrio.
voltar sumrio
voltar sumrio
x ' H 0
Z=
x
'
x' =
n
Z=Z5%=1,64
P ( Z Z ) = P ( Z 1,64) = 0,10
Como Zcalc=-1,33
Logo, a deciso no rejeitarmos H0, isto , a mdia de 45, com 10% de risco de
no rejeitarmos uma hiptese falsa.
Uma fbrica anuncia que o ndice de nicotina dos cigarros da marca X apresenta-se
abaixo de 26 mg por cigarro. Um laboratrio realiza 10 anlises do ndice obtendo:
26,24,23,22,28,25,27,26,28,24. Sabe-se que o ndice de nicotina dos cigarros da
marca X se distribui normalmente com varincia 5,36 mg2. Pode-se aceitar a afir-
mao do fabricante, ao nvel de 5%?
voltar sumrio
voltar sumrio
H 0 : = 26
H1 : < 26
RNR= (-1,64; +)
RC = (- ; -1,64]
Zcalc RNR
H 0 : = 206
H1 : > 206
voltar sumrio
voltar sumrio
RNR=(- ; 1,28)
RC = [1,28; +)
Zcalc RC
Como Zcalc > Z, rejeita-se H0, isto , ao nvel de 10% o fabricante pode concluir
que a resistncia mdia de suas lajotas aumentou.
Erros de Deciso
Tipos de Erro H dois tipos possveis de erro ao testar uma hiptese estatstica.
Pode-se rejeitar uma hiptese quando ela , de fato, verdadeira, ou aceitar uma
hiptese quando ela , de fato, falsa. A rejeio de uma hiptese verdadeira
chamada erro tipo I. A aceitaao de uma hiptese falsa constitui um erro tipo II.
Resumindo:
Realidade
H0 verdadeira H0 falsa
Observe que o erro tipo I s poder ser cometido se se rejeitar H0; e o erro do tipo
II, quando se aceitar H0.
voltar sumrio
voltar sumrio
UNIDADE 9
Relaes Funcionais
So relaes estabelecidas aps uma pesquisa. Com base nos resultados da pes-
quisa, so feitas comparaes que eventualmente podem conduzir (ou no) liga-
o entre as variveis.
voltar sumrio
voltar sumrio
100 18
90 16
80 14
70
12
60
10
50
8
40
30 6
20 4
10 2
0 0
0 1 2 3 4 5 6 0 1 2 3 4 5
Correlao linear uma correlao entre duas variveis, cujo grfico aproxima-se
de uma linha. uma linha de tendncia, porque procura acompanhar a tendncia
da distribuio de pontos, que pode corresponder a uma reta ou a uma curva. Por
outro lado, , tambm, uma linha mdia, porque procura deixar a mesma quanti-
dade de pontos abaixo e acima da linha.
voltar sumrio
voltar sumrio
25 100
90
20 80
70
15 60
50
10 40
30
5 20
10
0 0
0 1 2 3 4 5 6 0 1 2 3 4 5 6
8,5 18
8 16
14
7,5
12
7 10
6,5 8
6
6
4
5,5 2
5 0
0 2 4 6 8 10 12 14 0 1 2 3 4 5
No modo qualitativo, vai imperar o bom senso do pesquisador para verificar qual
o grau de intensidade na correlao entre as variveis; isso significa o estabeleci-
mento de uma relao numrica que medir o nvel da correlao.
voltar sumrio
voltar sumrio
n xi yi ( xi )( yi )
r=
[n x 2
i
2
][
( xi ) * n yi2 ( yi )
2
]
Temos
r = o coeficiente de Pearson
n = o nmero de observaes
xi = varivel independente
yi =varivel dependente
Quanto mais prximo o valor de r estiver do valor 1, mais forte a correlao line-
ar.
Quanto mais prximo o valor de r estiver do valor 0, mais fraca a correlao line-
ar.
Em geral, multiplica-se o valor de r por 100; dessa forma, o resultado passa a ser
expresso em porcentagem. Na prtica, estabelecem-se critrios para verificar os
diversos nveis do fraco ao forte, chegando at o perfeito:
voltar sumrio
voltar sumrio
0,6 |r| <1 : a correlao de mdia para forte; a relao entre as variveis
significativa, o que permite coerncia com poucos conflitos na obteno das con-
cluses. Em porcentagem: 60% |r| 100%.
Exemplo:
Hotel H1 H2 H3 H4 H5 H6 H7 H8 H9 H10
Peso 10,4 19,85 21,2 24,3 27,38 58,09 33,6 35,75 38,33 49,14
total 7 5 6 1
Peso do 2,43 5,12 6,88 6,22 8,84 8,76 7,54 8,47 9,55 11,43
papel
14
12
10
Peso do papel
0
10 20 30 40 50 60 70
Peso total do lixo
voltar sumrio
voltar sumrio
n xi yi ( xi )( yi )
r=
[n x 2
i
2
][
( xi ) * n yi2 ( yi )
2
]
n xi yi ( xi )( yi )
r=
[n x 2
i
2
][
( xi ) * n yi2 ( yi )
2
]
10 * 2396,68 288,21 * 75,24
r=
[10 * 9377,52 (288,21) 2 ] * [10 * 623,47 (75,24) 2 ]
voltar sumrio
voltar sumrio
r = 0,921 ou r = 92,1%
Observamos, assim: 0,6 r 1 . Esse resultado indica que h uma forte correlao
entre as variveis ou, ainda, que a correlao entre as duas variveis bastante
significativa. Nesse caso, podemos concluir haver coerncia na afirmao de que
existe correlao entre o peso total do lixo descartado e o peso do papel contido
nesse lixo.
A correlao linear uma correlao entre duas variveis, cujo grfico aproxima-se
de uma linha. O grfico cartesiano que representa essa linha denominado dia-
grama de disperso. Para poder avaliar melhor a correlao entre as variveis,
interessante obter a equao da reta; essa reta chamada de reta de regresso e
a equao que a representa a equao de regresso. O diagrama de disperso
construdo de acordo com os dados amostrais de n observaes e a equao de
regresso dada pela expresso:
Y= aX + b Y = aX + b
X a varivel independente
n xi yi xi * yi
a= b = y ax
n xi2 ( xi ) 2
voltar sumrio
voltar sumrio
Sendo:
Exemplo:
2281,83
a= = 0,213
10710,2
75,24 288,21
y= = 7,52 e x= = 28,82
10 10
Y = 0,213 X + 1,38
voltar sumrio
voltar sumrio
Para o traado de uma reta, basta que se conhea dois de seus pontos. Assim, com
base na equao da reta acima, pode-se estabelecer dois pontos para X e Y.
14
y = 0,2131x + 1,3836
12
10
0
0 10 20 30 40 50 60
Para 15 kg de lixo descartado, estima-se que haja 4,58 kg de papel contido nesse
lixo.
voltar sumrio
voltar sumrio
Suponha que o peso do lixo descartado seja de 60 kg. Esse valor no um dado
coletado e nem se encontra dentro do intervalo [10,47, 49,14]. Essa situao
semelhante anterior e utiliza-se a equao de reta para determinar o peso do
papel.
voltar sumrio
voltar sumrio
Referncias Bibliogrficas
voltar sumrio