Escolar Documentos
Profissional Documentos
Cultura Documentos
Estatistica Basica 1 PDF
Estatistica Basica 1 PDF
ESTATSTICA BSICA
Presidente Prudente
2008
ndice
1.0 Introduo.......................................................................................................... 2
1.1 O que Estatstica.............................................................................................. 3
3.0 Medidas-resumo............................................................................................... 17
4.1 Introduo.......................................................................................................... 20
4.2 Associao entre variveis Qualitativas............................................................. 21
4.3 Medidas de Associao...................................................................................... 22
4.4 Associao entre Variveis Quantitativas.......................................................... 22
4.5 Associao entre Variveis Qualitativas e Quantitativas................................... 24
4.6 Exerccios........................................................................................................... 25
5.0 Probabilidade................................................................................................... 26
5.1 Introduo.......................................................................................................... 26
5.2 Probabilidade condicional e independncia....................................................... 27
5.3 Exerccios........................................................................................................... 28
Bibliografia ............................................................................................................ 30
1
1.0 Introduo
2
1.1 O Que Estatstica
3
2.0 Resumo de Dados
Exemplo 1.0
4
Tabela 1.0
Informaes sobre estado civil, grau de instruo, nmero de filhos, salrio
(expresso como frao do salrio mnimo), idade (medida em anos e meses) e
procedncia de 36 empregados da seo de oramentos da Companhia.
De modo geral, para cada elemento investigado numa pesquisa, tem-se associado
um (ou mais de um) resultado correspondendo realizao de uma caracterstica
(ou caractersticas). Por exemplo, considerando a varivel estado civil, para cada
empregado pode-se associar um dos resultados, solteiro ou casado (note que poderia
haver outras possibilidades, como separado, divorciado, mas somente as duas
mencionadas foram consideradas no estudo).
Resumindo
Como as variveis so classificadas e outros exemplos:
5
Uma varivel originalmente quantitativa pode ser coletada de forma qualitativa.
Por exemplo, a varivel idade, medida em anos completos, quantitativa (contnua);
mas, se for informada apenas a faixa etria (0 a 5 anos, 6 a 10 anos, etc...), qualitativa
(ordinal). Outro exemplo o peso dos lutadores de boxe, uma varivel quantitativa
(contnua) se trabalha com o valor obtido na balana, mas qualitativa (ordinal) se o
classificarmos nas categorias do boxe (peso-pena, peso-leve, peso-pesado, etc.).
Outro ponto importante que nem sempre uma varivel representada por nmeros
quantitativa.
O nmero do telefone de uma pessoa, o nmero da casa, o nmero de sua
identidade. s vezes o sexo do indivduo registrado na planilha de dados como 1 se
macho e 2 se fmea, por exemplo. Isto no significa que a varivel sexo passou a ser
quantitativa!
Exemplo 1.2
A tabela apresenta a distribuio de freqncia da varivel grau de instruo,
usando os dados da tabela 1.0.
Tabela 1.1. Freqncia e porcentagem dos 36 empregados da seo de oramentos
da Companhia MB segundo o grau de instruo.
6
2.3 Grficos
Tabela 1.3.
7
Figura 1.0
Grfico em Barras para a varivel Grau de Instruo
18
18
16
14
12
12
Freqncia (ni)
10
6
6
4
0
Fundamental Mdio Superior
Grau de Instruo
Figura 1.1
Grfico em Setores para a varivel Grau de Instruo
50%
Fundamental
Mdio
33%
Superior
17%
8
(i) Grfico em Barras
Tabela 1.4
Freqncias e Porcentagens dos empregados da seo de oramentos da
Companhia MB, segundo o nmero de filhos.
Figura 1.2
Grfico de Barra para a varivel Nmeros de Filhos
35
35
30
25
25
Porcentagem
20
20
15
15
10
5 0 5
0
0 1 2 3 4 5
Nmeros de Filhos
9
Exemplo1.3: Considere a varivel tempo, em segundos, entre carros que passam
por um cruzamento, viajando na mesma direo.
6, 3, 5, 6, 4, 3, 5, 4, 6, 3, 4, 5, 2, 10.
Figura 1.3
2 3 4 5 6 7 8 9 10
(iii) Histograma
Tabela 1.5
Freqncias e Porcentagens dos 36 empregados da seo de oramentos da
companhia MB, por faixas de salrio.
10
Figura 1.4
Histograma da varivel Salrio
0,09
0,08
0,07 0,0833
D en sid a d e d e F req n cia
0,06 0,0695
0,05
0,0556
0,04
0,03 0,0347
0,02
0,01 0,007
0
04 |-- 08 08 |-- 12 12 |-- 16 16 |-- 20 20 |-- 24
Classes de Salrios
11
Tabela 1.6
Dvida Externa do Brasil de 1956 a 2006, em Milhes de Dlares.
Ano Dvida Ano Dvida Ano Dvida
1956 2736 1973 14857 1990 123439
1957 2491 1974 20032 1991 123910
1958 2870 1975 25115 1992 135949
1959 3160 1976 32145 1993 145726
1960 3738 1977 37951 1994 148295
1961 3291 1978 52187 1995 159256
1962 3533 1979 55803 1996 179935
1963 3612 1980 64259 1997 199998
1964 3294 1981 73963 1998 241644
1965 3823 1982 85487 1999 241468
1966 3771 1983 93745 2000 236156
1967 3440 1984 102127 2001 226067
1968 4092 1985 105171 2002 227689
1969 4635 1986 111203 2003 235414
1970 6240 1987 121188 2004 220182
1971 8284 1988 113511 2005 187987
1972 11464 1989 115506 2006 191999
Fonte: IPEADATA
Figura 1.5
Grfico de Linhas para a varivel Dvida Externa do Brasil no perodo 1956 a 2006
250000
200000
Dvida em Milhes de Dlares
150000
100000
50000
0
56
58
60
62
64
66
68
70
72
74
76
78
80
82
84
86
88
90
92
94
96
98
00
02
04
06
19
19
19
19
19
19
19
19
19
19
19
19
19
19
19
19
19
19
19
19
19
19
20
20
20
20
Ano
12
2.4 Ramo-e-Folhas
Exemplo 1.4
53 70 84 69 77 87 53 82 67 54
70 71 95 51 74 55 63 85 53 64
82 78 55 69 72 59 55 73 52 50
5 01233345559
6 34799
7 00123478
8 22457
9 5
2.5 Exerccios
1) Um questionrio foi aplicado aos alunos do primeiro ano de uma escola fornecendo
as seguintes informaes:
13
Toler: Tolerncia ao cigarro: (I) Indiferente, (P) Incomoda Pouco e (M)
Incomoda Muito;
Exer: Horas de atividade fsica, por semana;
Cine: Nmero de vezes que vai ao cinema por semana;
OpCine: Opinio a respeito das salas de cinema na cidade: (B) regular a boa e (M)
muito boa
TV: Horas gastas assistindo TV, por semana
OpTV: Opinio da programao na TV: (R) Ruim, (M) Mdia, (B) Boa e (N)
no sabe.
Tabela A
ID Turma Sexo Idade Alt Peso Filh Fuma Toler Exer Cine Opcine Tv OpTV
1 A F 17 1,60 60,5 2 No P 0 1 B 16,5 R
2 A F 18 1,69 55,0 1 No M 0 1 B 7 R
3 A M 18 1,85 72,8 2 No P 5 2 M 15 R
... ... ... ... ... ... ... ... ... ... ... ... ... ...
49 B M 17 1,80 71,0 1 No P 7 0 M 14 R
50 B M 18 1,83 86,0 1 No P 7 7 M 20 B
Fonte: Magalhes e Pedroso de Lima (2004).
(b) Bacias Hidrogrficas (A: Amaznica, P:Platina, SF:So Francisco, N:do Nordeste,
L:do Leste, S:do Sul);
Resoluo Varivel Qualitativa Nominal
14
(c) Nmero de sementes germinadas (0, 1, 2, 3, 4, 5);
Resoluo Varivel Quantitativa Discreta
Tabela B: Informaes sobre estado civil, grau de instruo, numero de filhos, salrio
(expresso como frao do salrio mnimo) e procedncia de 36 empregados da seo de
oramento da Companhia MB.
Tabela B
(a)Estado Civil
Resoluo
Estado Civil f
Freqncia ni
Porcentagem 100x
i
Solteiro 4 57,14
Casado 3 42,85
Total 7 100,00
Resoluo
15
c) Idade
Resoluo
Idade f
Freqncia n i
Porcentagem
i
26 32 2 28,27
32 38 2 28,57
38 42 3 42,85
Total 7 100,00
8 11 8 12 14 13 11 14 14 15
6 10 14 19 6 12 7 5 8 8
10 16 10 12 12 8 11 6 7 12
7 10 14 5 12 7 9 12 11 9
14 8 14 8 12 10 12 22 7 15
Resoluo
10
9
8
7 7
7
6
Freqncia
5 5
5
4
4
3
3
2 2 2
2
1 1 1 1
0
5 6 7 8 9 10 11 12 13 14 15 16 19 22
Nmero de Erros
16
3.0 Medidas - Resumo
Mdia
_
A mdia a medida mais popular e representada por x , ela representa o ponto de
equilbrio da distribuio de seus valores.
Considere uma varivel x com observaes representadas, por x 1 ,x 2 ,.....x n . A
mdia desse conjunto a soma dos valores divididos pelo nmero total de observaes.
Isto
n
x + x 2 + x3 + + x n x i
x= 1 = i =1
n n
Mediana
A mediana representada por md obs o valor que ocupa a posio central dos
dados ordenados. o valor que divide os dados, isto , metade dos dados ser maior que a
mediana e metade ser menor.
Considere a seguinte srie de valores: 5, 2, 6, 13, 9, 15, 10.
De acordo com a definio de mediana, o primeiro passo a ser dado ordenar o
conjunto de valores: 2, 5, 6, 9, 10, 13, 15. O valor que divide a srie em duas partes iguais
9. Logo, a mediana 9.
Moda
A moda dada pelo valor mais freqente do conjunto de dados.
Mximo e Mnimo
O mximo o valor maior da observao do conjunto de dados, enquanto que o
mnimo a menor observao.
17
Definio 1.0: Amplitude de uma varivel em um conjunto de dados
( x x ) 2 + ( x 2 x ) 2 + ( x3 x ) 2 + + ( x n x ) 2 (x i x)2
s2 = 1 = i =1
n 1 n 1
1 n 2 2
s = xi n ( x )
2
n 1 i =1
3.3 Quantis
Tanto a mdia como o desvio padro podem no ser medidas adequadas para
representar um conjunto de dados, pois:
So afetadas, de forma exagerada, pois valores extremos:
Apenas com estes dois valores no temos idia da simetria ou assimetria da
distribuio dos dados.
Para contornar esses fatos, outras medidas tm de ser consideradas.
Vimos que a medida um valor que deixa metade dos dados abaixo dela e metade
acima. De modo geral, podemos definir uma medida, chamada quantil de ordem p
p-quantil, indicada por q(p), onde uma proporo qualquer 0<p<1, tal que 100% das
observaes sejam menores do que q(p).
18
q(0,25):1 Quartil=25 Percentil
q(0,50):2Quartil=Mediana=50Percentil
q(0,75):3Quartil=75Percentil
Exemplo 1.3
3.5 Exerccios
Resoluo
25 x0 + 20 x1 + 3 x 2 + 1x3 + 1x 4
x = = 0,66
50
b) Calcule a varincia?
25(0 0,66) 2 + 20(1 0,66) 2 + 3(2 0,66) 2 + 1(3 0,66) 2 + 1(4 0,66) 2
Var= =0,704
50
d) Se o livro tem 500 pginas, qual o nmero total de erros esperado no livro?
19
2) Medidas da pulsao de 15 ndios nativos dos Alpes Peruanos esto apresentadas a
seguir:
64 64 68 68 76 60 72 88 60 68 80 60 72 88 60
Mediana=68
(b) Calcule: Mnimo, Q1, Q2, Q3 e Mximo;
Resoluo
Maximo=60
Mnimo=60
q(0,25) = Q1 = 60
q(0,50) = Q2 = 68
q(0,75) = Q3 =76
4.1 Introduo
20
4.2 Associao entre Variveis Qualitativas
Exemplo 1.4
Queremos verificar se existe ou no associao entre o sexo e a carreira escolhida
por 200 alunos de Economia e Administrao.
A partir dessa tabela podemos observar que independentemente do sexo, 60% das
pessoas preferem Economia a 40% preferem Administrao ( observe na coluna de
total)
No havendo dependncia entre as variveis esperaramos essas mesmas
propores para cada sexo. Observando a tabela, vemos que as propores do sexo
masculino (61% e 39%) e do sexo feminino (60% e 40%). Esses resultados parecem
indicar no haver dependncia entre que, neste caso, as variveis sexo e escolha do
curso parece ser no associados.
21
4.3 Medidas de Associao
X2
C= ,
X2 +n
X2
T= n
(r 1)( s 1)
Exemplo 1.5
Neste tipo de grfico temos os possveis pares de valores (x ,y), na ordem que
aparecem.
Para o exemplo, vemos que parece haver uma associao entre as variveis,
porque no conjunto a medida que aumenta o tempo de servio, aumenta o numero de
clientes.
22
Tabela1.5: Numero de anos de servio (x) por numero de clientes (y) de agentes de uma
Companhia de Seguros.
Tabela 1.5
Agente Anos de Servios(x) Nmeros de clientes (y)
A 2 48
B 3 50
C 4 56
D 5 52
E 4 43
F 6 60
G 7 62
Fonte: Bussab e Morettin (2002)
Figura1.7
Grficos de disperso para as variveis (x) anos de servios e (y): numero de clientes.
Grfico de Disperso
70
7
Numeros de clientes
60 6
4
50 3 5
2
4
40 Grfico de
30 Disperso
20
10
0
0 2 4 6 8
Anos de Servios
23
Se por acaso os pontos dos grficos estivessem disperso e sem ordem de
crescimento ou de diminuio havendo acumulao entres eles, no haver associao
entre as variveis.
Exemplo1.6
_ _
( x x)( y i y )
Cov (x,y) = i =1 i
n
,
n
24
Ou seja, a mdia dos produtos dos valores centrados das variveis.
Com essa definio, o coeficiente de correlao pode ser escrito como,
Cov( x, y )
Corr (x, y) =
dp ( x).dp ( y )
4.6 Exerccios
Com base na tabela abaixo, voc concluiria que o tipo de atividade est
relacionada ao fato de as embarcaes serem de propriedades estatal ou particular ?
Encontre uma medida de dependncia entre as variveis.
Atividades
Propriedades Total
Costeira Fluvial Internacional
Resoluo
Tabela de desvio
Atividades
Propriedades Total
Costeira Fluvial Internacional
25
5.0 Probabilidade
5.1 Introduo
Considera-se probabilidade como sendo uma funo P(.) que atribui valores
numricos aos eventos do espao amostral.
Definio: Probabilidade
i)0 P(A) 1, A
ii)P()=1
n n
iii)P Aj = p ( Aj ) , com os Aj ' s distintos
j =1 j =1
26
Sejam A e B eventos de . Ento
P(A B) =P(A) +P(B)-P(A B)
P(A B ) = P ( A B ) P ( B ),
Com P(B)>0.
P( A C j ) P (C j )
P(C j A ) = k
, j = 1,2,3,......, k .
P( A C ) P(C )
i =1
i i
27
5.3 Exerccios
Resoluo
62
835
Resoluo
Resoluo
P(H R ) = P ( H ) + P ( R ) P ( H R )
476 287 92
P(H R ) = + = 0,803
835 835 835
d)O filme ser policial dado que foi alugado por um homem?
Resoluo
P( P H )
P(P H ) =
P( H )
248 476
P(P H ) = = P( P H ) = 0,91
476 835
28
Companhia MB
29
Bibliografia
30