Escolar Documentos
Profissional Documentos
Cultura Documentos
Apostila de Estatística
Apostila de Estatística
de
Estatstica
2 Semestre/2009
Professora: Janaina Pereira
IFRJ - Instituto Federal de Educao, Cincia e
Tecnologia - Rio de Janeiro
CAPITULO 1
O que estatstica?
a cincia que fornece mtodos para coleta, organizao, descrio, anlise e
interpretao dos dados e para utilizao dos mesmos na tomada de decises.
A Estatstica trabalha com fenmenos coletivamente tpicos, isto , com fenmenos
ligados a coletividade e que podem ser repetidos.
Fenmenos determinsticos: J se conhece a priori o resultado.
Ex.: Preo total a pagar pela aquisio de uma determinada quantidade de um
produto.
Fenmeno aleatrio: Conhecemos todos os possveis resultados, mas no se sabe
o resultado concreto que ir acontecer.
Ex.: lanamento de um dado honesto.
A estatstica se divide em duas partes:
(1) ESTATSTICA DESCRITIVA: Responsvel pela coleta, organizao e descrio
dos dados observados.
(2) ESTATSTICA INDUTIVA OU INFERENCIAL: Responsvel pela anlise e
interpretao dos dados.
A estatstica trabalha com fenmenos de natureza aleatria, logo o clculo das
probabilidades essencial para o estudo da Estatstica indutiva.
Fases do mtodo estatstico:
- Coleta dos dados: Feito atravs de registros nascimento, casamento, bitos,
importao e exportao de mercadoria, banco de dados de empresas, questionrios,....
- Crtica dos dados: Para verificar possveis erros por parte dos informantes, por
distrao ou m interpretao das perguntas que lhe forem feitas.
- Exposio ou apresentao dos dados: Tabulao e grficos.
- Anlise dos resultados: Concluso sobre o todo (POPULAO) a partir de
informaes fornecidas por parte representativa do todo (AMOSTRA).
POPULAO: o conjunto de indivduos ou objetos que apresentam pelo menos uma
caracterstica comum.
AMOSTRA: um subconjunto finito de uma populao.
EXERCCIO DE FIXAO
1) O que estatstica?
2) O que populao?
3) o que amostra?
4) A Estatstica se divide em duas partes. Cite e explique cada uma delas.
5) Quais so as fases do mtodo estatstico?
6) Qual a diferena entre varivel qualitativa e quantitativa?
7) Classifique as variveis em qualitativas, quantitativas contnuas ou quantitativas
discreta.
a) Populao: Alunos de uma escola.
Varivel: Cor da pele ___________________________
b) Populao: Casais residentes em um bairro.
Varivel: N de filhos ___________________________
c) Populao: Jogadas de um dado.
Varivel: O ponto obtido em cada jogada______________________
d) Populao: Peas produzidas por certa mquina.
Varivel: Nmero de peas produzidas por hora_________________
e) Populao: Aparelho produzido em uma linha de montagem.
Varivel: N de defeitos por unidade__________________________
f) Populao: Pessoas residentes em uma cidade.
Varivel: Idade ___________________________
g) Populao: Bolsa de valores de So Paulo.
Varivel: N de aes negociadas_________________________
h) Populao: Funcionrios de uma empresa.
Varivel: Salrio ___________________________
i) Populao: Pregos produzidos por uma mquina.
Varivel: Comprimento do prego_________________________
j) Populao: Casais residentes em uma cidade.
Varivel: Sexo dos filhos ___________________________
8) Dizer quais dos seguintes itens representam dados discretos e quais representam dados
contnuos.
a) Altura de precipitao da chuva em centmetros, de uma cidade durante vrios
meses do ano.____________________________
b) Velocidade de um automvel em km/h._________________________
c) Nmero de notas de vinte dlares em circulao nos Estados Unidos, em qualquer
poca._________________________________
d) Valor
total
das
aes
vendidas
diariamente
na
Bolsa
de
Valores.______________________
e) Nmero de estudantes matriculados em uma universidade, em certo nmero de
anos._____________________________
QUALITATIVA
QUANT. DISCRETA
QUANT. DISCRETA
QUANT. DISCRETA
QUANT. DISCRETA
QUANT. CONTNUA
QUANT. DISCRETA
QUANT. DISCRETA
QUANT. CONTNUA
QUALITATIVA
a)
b)
c)
d)
e)
CONTNUA
CONTNUA
DISCRETA
DISCRETA
DISCRETA
8.
9.
a) CONTNUA
b) CONTNUA
c) CONTNUA
CAPITULO 2
O objetivo da estatstica sintetizar os valores que uma ou mais variveis podem assumir
e isso ela consegue apresentando esses valores em TABELAS E GRFICOS.
TABELAS ESTATSTICAS
COLUNA
INDICADORA
Produo de caf
Brasil - 1978-82
ANOS
1978
1979
1980
1981
1982
CORPO
PRODUO
(1.000 T)
2.535
2.666
2.122
3.750
2.007
TTULO
CABEALHO
CASA OU CLULA
LINHAS
Fonte: IBGE
RODAP
COLUNA NUMRICA
SRIES ESTATSTICAS
Definio: Srie Estatstica toda tabela que apresenta a distribuio de um conjunto de
dados em funo da poca, do local ou da espcie.
Classificao das Sries Estatsticas:
PRODUO (1.000 t)
2005
2006
51.138
52.223
FONTE: IBGE.
NMERO
DE ANOS
7,5
7,0
7,0
5,9
FONTE: APA.
PRODUTOS
Gros
Farelo
leo
QUANTIDADE
(em bilhes de
toneladas)
20,5
14,2
2,4
FONTE:
Companhia
Nacional
Abastecimento (Conab).
de
GRFICOS ESTATSTICOS
O grfico estatstico uma forma de apresentar os dados estatsticos, com o objetivo de
mostrar uma impresso mais rpida do fenmeno em estudo, com simplicidade, clareza e
veracidade.
Sempre que possvel a escala vertical deve ser escolhida de modo a aparecer na
linha o valor zero;
A escala horizontal deve ser lida da esquerda para direita e a escala vertical deve
ser lida de baixo para cima.
REBANHOS BRASILEIROS
BRASIL 1988
Bovinos
Sunos
Ovinos
Caprinos
EXERCCIO DE FIXAO
1) Construa as tabelas referentes aos dados pesquisados e classifique-as:
a)
Dados referentes produo de borracha natural nos anos de 1991 (29.243 toneladas),
1992 (30.712 toneladas) e 1993 (40.663 toneladas). Fonte IBGE.
b)
c)
GABARITO
1.
a) TEMPORAL
b) ESPECFICA
c) GEOGRFICA
10
CAPITULO 3
Aps a coleta de dados relativos a um determinado fenmeno em estudo, que compem
uma amostra, obtemos um conjunto de dados que ser tabulado.
Por exemplo:
TABELA 1: ALTURA DOS ALUNOS
166
162
155
154
160
161
152
161
161
168
163
156
150
163
160
172
162
156
155
153
160
173
155
157
165
160
169
156
167
155
151
158
164
164
170
158
160
168
164
161
Observe que os dados no esto organizados. Dessa forma ela recebe o nome de DADOS
BRUTOS.
Precisamos organizar os dados atravs de uma ordenao crescente ou decrescente.
TABELA 2: ALTURA DOS ALUNOS
150
151
152
153
154
155
155
155
155
156
156
156
157
158
158
160
160
160
160
160
161
161
161
161
162
162
162
162
164
164
164
164
166
167
168
168
169
170
172
173
Obteremos uma segunda ordenao que receber o nome de ROL (seqncia ordenada
dos dados brutos).
Dessa forma podemos saber com facilidade qual a menor altura (150) e qual a maior
(173); qual a amplitude de variao (173-150=23cm); qual o ponto mdio (160+161)/2 =
160,5.
Ainda assim, a varivel observada (altura dos alunos) ser mais facilmente estudada
quando dispusermos os valores ordenados em uma coluna e ao lado de cada valor o
nmero de vezes que aparece repetido. Obtemos dessa forma uma tabela que recebe o
nome de DISTRIBUIO DE FREQNCIA.
11
Outra soluo aceitvel e mais conveniente para diminui o tamanho da tabela quando o
nmero de valores da varivel grande, seria agrup-los em vrios intervalos. Nesse caso
a tabela passa a ser denominada: DISTRIBUIO DE FREQNCIA POR
INTERVALO DE CLASSE.
L-se: 4 alunos tm altura entre 150 e 154 anos (exclusive) intervalo fechado
esquerda.
12
AT
, onde
i
Exemplo:
n = 40
Ento,
40 =
3,833 4
i
i
6
13
24/4 = 6
f
i 1
Fi f1 f 2 ..... f k f i
i 1
Exemplo:
14
162 cm.
(3) FREQNCIA RELATIVA ( fri ): a razes entre a freqncia simples a
freqncia total.
fri
fi
k
f
i 1
Exemplo:
fr3
f3
40
f
i 1
11
0,275
40
Fri
Fi
k
f
i 1
15
Fr3
F3
40
f
i 1
24
0,600
40
Polgono de freqncias
Freqncia Simples:
Freqncia Acumulada: As bases dos retngulos vo estar centradas nos pontos mdios
das classes.
16
Exemplo:
17
CAPITULO 4
MEDIDAS DE POSIO: MDIA, MODA e MEDIANA;
O estudo sobre a Distribuio de Freqncia permitiu descrever, de um modo geral, os
valores que uma varivel pode assumir. Agora precisamos de um indicativo
generalizado.
O modo mais comum de se obter esse tipo de informao atravs das MEDIDAS DE
POSIO, estatstica que representa posio relativa da distribuio em relao ao eixo
horizontal.
As medidas de posio mais importantes so as MEDIDAS DE TENDNCIA
CENTRAL recebem esse nome pelo fato dos dados observados, em geral, se agruparem
em torno dos valores centrais.
So elas: MDIA ARITMTICA, MODA, MEDIANA, SEPARATRIZES, QUARTIS e
PERCENTIS.
Essas medidas quando bem interpretadas, podem fornecer-nos informaes muito
valiosas com respeito s sries estatsticas, ou seja, com estas medidas tenta-se encontrar
um valor numrico que represente o comportamento tpico da serei em estudo.
(1) MDIA ARITMTICA SIMPLES ( x )
MDIA PARA DADOS NO AGRUPADOS (dados brutos ou rol): Quando
desejamos conhecer a mdia dos dados no agrupados, determinamos a mdia
aritmtica simples.
n
x
i 1
n
de valores.
Ex.: Produo leiteira diria da vaca A, durante uma semana, foi de 10, 14, 13, 15, 16, 18
e 12 litros. Qual a produo mdia da semana.
x
10 14 13 15 16 18 12 98
14litros
7
7
x
i 1
n
f
i 1
fi
, observe que f i a freqncia simples de cada varivel que neste caso
i
18
Exemplo:
x
i 1
4
f
i 1
fi
50
5
10
fi
Resposta: 5,6
fixi
x
i 1
n
f
i 1
fi
,
i
pm
i 1
f
i 1
fi
46
4,6
10
19
Exerccio:
Resposta: 161 cm
Uma vez agrupado os dados basta fixar o valor da varivel de MAIOR freqncia. A
moda nesse caso 3.
20
f pos
f ant f pos
*
b) Moda de CZUBER: Mo l
h*
D1
h*
D1 D2
Onde :
l * o limite inferior da classe modal
f pos a freqncia simples da classe posterior a classe modal
f ant a freqncia simples da classe anterior a classe modal
f * a freqncia simples da classe modal
h * a amplitude do intervalo da classe modal
D1 f
f ant
D2 f
f pos
Resposta.: 50
Observao:
21
1
2
, ento, a mediana ser a mdia dos valores que ocupam estas posies.
Exemplos:
Exemplo:
1)
N de meninos
0
1
2
3
4
Total
fi
2
6
10
12
4
34
Fi
2
8
18
30
34
22
2 meninos.
2
2)
22
X
12
14
15
16
17
20
Total
fi
1
2
1
2
1
1
8
Fi
1
3
4
6
7
8
15 16
15,5
2
Resposta: 8
Fant
2
Md l *
h*
f*
Onde:
l * o limite inferior da classe mediana
n
a posio da mediana na srie
2
Fant a freqncia acumulada da classe anterior classe mediana
f * a freqncia simples da classe mediana
h * a amplitude do intervalo de classe que contm a mediana
Exemplo:
idade
3 |--- 6
6 |--- 9
9 |--- 12
12 |--- 15
15 |--- 18
fi
Fi
2
5
7
3
2
total
2
7
14
17
19
19
Fant
2
h* =
Md l *
*
f
9,5 7 3
7
=10,1
fi
Fi
8
23
10
11
16
13
5
1
64
Observao:
No caso de existir uma freqncia acumulada exatamente igual a
n
, a Mediana ser o
2
fi
1
3
9
7
4
2
26
Fi
1
4
13
20
24
26
Fant
= 20 13 4 10 =3
2
*
*
Md l
h
9
f*
Nota:
1) A mediana pode coincidir ou no com um elemento da srie. Vimos que, quando
tivermos um nmero de elementos mpar na srie de dados, h coincidncia.
Quanto o nmero de elementos de uma srie par, na h coincidncia.
2) A mediana depende da posio e no dos valores centrais na srie ordenada.
3) Usamos a mediana quando desejamos obter o ponto que divide a distribuio em
partes iguais e quando h valores extremos afetando de uma maneira acentuada a
mdia.
24
(3) SEPARATRIZES
As separatrizes, como o prprio nome sugere so medidas que separam a srie em partes
iguais.
QUARTIS: So valores de uma srie que a dividem em 4 partes iguais. Assim temos:
Q1 = 1 quartil: Separa a seqncia ordenada deixando 25% dos valores a sua esquerda
Clculo do QUARTIL
o mesmo clculo de mediana sendo que
n
deve ser substitudo por k
2
f
4
, onde k
Qk l *
Fant .h *
*
f
Exemplo:
1. Calcule o Q1 da seqncia X: 2, 5, 8, 5, 5, 10, 1, 12, 12, 11, 13, 15.
Ordenar a srie:
k
f
4
12
3
4
Q1 = 5
24
Calcule o Q1 e Q3
f
4
Q1 154
40
10 (classe 2)
4
10 4. 4 156,67
9
f
4
Q3 162
40
30 (classe4)
4
30 24. 4 165
8
QUINTIS: Quando dividimos uma srie em 5 partes iguais, cada parte ficar com 20%
dos elementos da srie. Assim temos:
K1 = 1 quintil separa a seqncia ordenada deixando 20% dos valores a sua esquerda
Clculo do QUINTIL
25
n
deve ser substitudo por k
2
, onde k
Kk l*
Fant .h *
*
f
f
5
40
16
5
k 2 158
(classe 3)
16 13. 4 159
11
50
100
150
200
250
300
N de notas
10
28
12
2
1
1
54
Resposta: 70,71
26
DECIS: Quando dividimos uma srie em 10 partes iguais, cada parte ficar com 10% dos
elementos da srie. Assim temos:
D1 = 1 decil separa a seqncia ordenada deixando 10% dos valores a sua esquerda e
Clculo do DECIL
o mesmo clculo de mediana sendo que
f
n
deve ser substitudo por k i , onde k
2
10
Dk l *
10
Fant .h *
*
f
27
Clculo do PERCENTIL
o mesmo clculo de mediana sendo que
f
n
deve ser substitudo por k i , onde k
2
100
Pk l *
Fant .h *
100
*
f
28
f
100
40
3,2
100
(classe 1)
P8 150
3,2 0. 4 153,2
4
Podemos notar que os quartis, quintis e decis podem ser expressos em termos dos
precentis.
Q1=P25
Q2=P50
Q3=P75
K1=P20
K2=P40
K3=P60
K4=P80
D1=P10
D2=P20
D3=P30
D4=P40
D5=P50
D6=P60
D7=P70
D8=P80
D9=P90
29
CAPITULO 5:
MEDIDAS DE DISPERSO OU VARIABILIDADE
As medidas de disperso ou variabilidade servem para avaliar o quanto os dados so
semelhantes, descreve ento o quanto os dados distam do valor central.
Dessas medidas, estudaremos as seguintes:
- Medidas de variao absoluta: Amplitude total, Varincia e o Desvio Padro.
- Medidas de variao relativa: Coeficiente de Variao.
(1) MEDIDAS DE VARIAO ABSOLUTA
Amplitude Total: a diferena entre o maior e o menor valor observado. Tem o
inconveniente de s levar em conta os dois valores extremos da srie, no levando em
considerao os valores intermedirios. Ela apenas uma indicao aproximada da
disperso ou variabilidade.
AT = L (Max) l (min)
Varincia e Desvio Padro: A varincia e o desvio padro so medidas que levam em
considerao a totalidade dos valores da varivel em estudo, o que faz delas ndices de
variabilidade bastante estveis e, por isso mesmo, os mais geralmente empregados.
Clculo da Varincia ( x ): A varincia a mdia aritmtica do quadrado dos desvios
2
(2x )
(x
i 1
x)
(2x )
ou
(x
i 1
x)2 fi
f
i 1
xi
i 1
5. - Dividir a soma por (n-1) quando se tratar de dados amostrais, ou simplesmente por
n se os dados representam todos os valores de uma populao.
30
Sendo a varincia calculada a partir dos quadrados dos desvios, ela um nmero em
unidade quadrada em relao varivel em questo, o que, sob o ponto de vista prtico,
um inconveniente.
Por isso mesmo, imaginou-se uma nova medida que tem a interpretao prtica,
denominada desvio padro, definida como a raiz quadrada da varincia.
Desvio Padro: ( x ) x2
Observao:
(1) O desvio padro sempre ser positivo!
(2) O desvio padro de uma srie indica o quanto os dados esto afastados da mdia e,
que se os dados so iguais, o valor da medida zero.
Exemplo 7: Em uma turma de aluno, verificaram-se atravs da anlise das notas de 15
alunos (amostra), os seguintes desempenhos:
Alunos
Conceito na Prova
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Total
Mdia
Desvio Padro
4,3
4,5
9
6
8
6,7
7,5
10
7,5
6,3
8
5,5
9,7
9,3
7,5
109,8
7,32
1,77
Xi X
9,1204
7,9524
2,8224
1,7424
0,4624
0,3844
0,0324
7,1824
0,0324
1,0404
0,4624
3,3124
5,6644
3,9204
0,0324
44,16
3,155
Xi X
i 1
Varincia
n
31
Observamos no exemplo, que a mdia das provas, foi estimada em 7,32 com desvio
padro em 1,77. Conclumos que a maioria das notas concentrou-se em 9,09 e 5,55.
Exerccio: Calcular a mdia aritmtica e o desvio padro dos seguintes dados relativos
dosagem de hemoglobina verificada numa amostra de 12 animais bovinos (mg).
15
14
13
11
13
14
13,5
Varincia = 3,583mg2
12
16
14,5
12
( x)
. a razo entre o desvio padro e a mdia
x
. Usado
10,2
2,2
10,6
2,5
9,8
1,8
10,0
1,9
9,8
2,0
10,4
1,7
9,2
1,9
32
CAPITLO 6:
EXPERIMENTO ALEATRIO,
PROBABILIDADE.
ESPAO
AMOSTRAL,
EVENTOS
DEFINIES:
EXPERIMENTO ALEATRIO:
lanamento do dado).
EVENTOS (A): Chamamos de evento qualquer subconjunto do espao amostral S de um
experimento aleatrio.
Exemplo: Lanamento de um dado:
Espao amostral: S={1, 2, 3, 4, 5, 6}
Eventos:
a) Obter um nmero par na face superior:
A={2, 4, 6} => A S , logo, A um evento de S.
33
n ( A)
n( S ) , onde n(A) o nmero de elementos de A e n(S) o nmero de
elementos de S.
n(S) = 2
A = {Ca}
n(A) = 1
1
2
P(A) =
EVENTOS COMPLEMENTARES
Exemplo: Pesquisa afirma que de um grupo de 100 pacientes fumantes aparecem as
seguintes evidncias1.
Eventos (evidncias): e1 = Normal; e2 = Bronquite; e3 = Cncer no Pulmo;
e4 = Tuberculose
Espao Amostral: = {Normal; Bronquite; Cncer no Pulmo; Tuberculose}
Evidncias
Normal
Bronquite
Cncer no Pulmo
Tuberculose
N de Pacientes
25
60
10
5
0,05
100
Considere estas evidncias as mais comuns entre pacientes. Suponha tambm que as evidncias acima
sejam exclusivas.
34
Normal
Bronquite
Cncer no Pulmo
Tuberculose
N de Pacientes
25
60
10
10
5
15
0,15
100 100 100
SITUAO ESCOLAR
At o Nvel Mdio
10
15
25
Nvel Superior
35
20
55
Total
45
35
80
35 55 20 70
0,8750
80 80 80 80
EVENTOS INDEPENDENTES
Dois eventos so independentes quando a ocorrncia ou a no ocorrncia de um evento
no tem efeito algum na probabilidade de ocorrncia do outro evento. Quando lanamos
dois dados, o resultado obtido em um deles independe do resultado obtido no outro.
P(A e B) = P(AB) = P(A)P(B)
35
P ( BeA) P ( B A)
=
P ( A)
P ( A)
SEXO
M
20
5
25
F
15
10
25
Total
35
15
50
20
P( M / B)
0,5714
35
P( B / M )
P (F / B)
15
0,4286
35
P (B / F)
20
0,80
25
15
0,60
25
(0,40)
36
EXERCCIO DE FIXAO
1) Qual a probabilidade de sair s de ouros quanto retiramos uma carta de um
baralho de 52 cartas?
2) Qual a probabilidade de sair um rei quanto retiramos uma carta de um baralho de
52 cartas?
3) Um lote de 12 peas, 4 so defeituosas. Sendo retirada uma pea, calcule?
a- A probabilidade de essa pea ser defeituosa:
b- A probabilidade de essa pea no ser defeituosa:
4) No lanamento de dois dados, calcule a probabilidade de se obter soma igual a 5.
5) De dois baralhos de 52 cartas retiram-se, simultaneamente, uma carta do primeiro
baralho e uma carta do segundo baralho. Qual a probabilidade de a carta do
primeiro baralho ser um rei e a do segundo baralho ser o 5 de paus?
6) Uma urna A contm: 3 bolas brancas, 4 pretas, 2 verdes; Uma urna B contm: 5
bolas brancas, 2 pretas, 1 verde; Uma urna C contm: 2 bolas brancas, 3 pretas e 4
verdes. Uma bola retirada de cada urna. Qual a probabilidade de as 3 bolas
retiradas da primeira, segunda e terceira urnas serem, respectivamente, branca,
preta e verde?
7) De um baralho de 52 cartas retiram-se, ao acaso, duas cartas sem reposio. Qual
a probabilidade de a primeira carta ser o s de paus e a segunda ser o rei de paus?
8) Qual a probabilidade de sair uma figura quando retiramos uma carta de um
baralho de 52 cartas?
9) Qual a probabilidade de sair uma carta de copas ou de ouros quando retiramos
uma carta de um baralho de 52 cartas?
10) No lanamento de um dado, qual a probabilidade de se obter um nmero no
inferior a 5?
37
GABARITO
1.
A = sair s de ouros
2.
A = sair rei
P(A)=1/52
P(A)=4/52
3.
a) A= a pea ser defeituosa
P(A)=4/12
P(B)=8/12
4.
A= a soma ser 5
5.
A= sair rei
P(A) = 4/36
B= sair 5 de paus
P(A E B) = P(A)x P(B) = 4/52 x 1/52 = 4/2704
6.
A= 3 bolas retiradas da primeira, segunda e terceira urnas serem, respectivamente,
branca, preta e verde
P(A)=3/9x 2/8 x 4/9 = 24/648
7.
8.
Figuras = valete, dama e rei
A= sair uma figura
P(A) = 12/52
9.
10.
P(A)=1/6
38
CAPTULO 07
DISTRIBUIO DE PROBABILIDADE
Quando conhecemos todos os valores de uma varivel aleatria juntamente com suas
respectivas probabilidade, temos uma distribuio de probabilidade.
Exemplo: Distribuio de probabilidade no nmero de acidentes areos com a GOL,
dentre sete acidentes.
Os
valores
denotados
0+
representam probabilidades muito
pequenas;
p x 1
2) Para qualquer evento A implica que p(x) deve estar entre 0 e 1 para qualquer valor de
x: 0 P ( x) 1
MDIA DE UMA DISTRIBUIO DE PROBABILIDADE
n
E X xi p xi
i 1
VAR X 2 xi E X p xi
2
i 1
39
EXERCCIO DE FIXAO
1) Determine se dada uma distribuio de probabilidade. Nos casos em que no
descrita uma distribuio de probabilidade, identifique a condio que no satisfeita. E
quando for descrita uma distribuio de probabilidade, determine sua mdia e desvio
padro.
a) Se sua faculdade contrata os 4 prximos funcionrios sem distino de sexo e o
conjunto de candidatos grande, com nmeros iguais de homens e mulheres, a
tabela a seguir d a distribuio de probabilidade do nmero x de mulheres
contratadas.
Resposta: 2 e 1
b) Ao avaliar riscos de crdito, Jefferson investiga o nmero de cartes de crdito
que a pessoa tem. Com x sendo o nmero de cartes de crdito que os adultos
possuem a tabela a seguir d a distribuio de probabilidade para um conjunto de
solicitantes.
41
Notao:
p => probabilidade de sucesso
q => probabilidade de fracasso
x => denota um nmero especfico de sucessos em n provas, podendo ser qualquer inteiro
entre 0 e n, inclusive.
P(x) => denota a probabilidade de obter exatamente x sucessos em n provas.
Parmetros da Distribuio Binomial: X ~ B (n, p )
Clculo da Probabilidade de uma Distribuio Binomial:
P X x ( nx ). p x .(1 p ) n x
P X x ( nx ). p x .(1 p ) n x C n , x . p x .(1 p ) n x
n!
. p x .q n x
(n x)! x!
Para x = 0, 1, 2, .....,n
Mdia de uma Distribuio Binomial: E(x) = np
Varincia da Distribuio Binomial: V(x) = npq
Obs.: lembrando que 0! = 1 (por definio)
Exerccio:
1) Aplicando a frmula da probabilidade binomial, determine a probabilidade de
obter 3 estudantes canhotos em uma turma de 15 estudantes, dado que 10% da
populao so canhotos. Isto determine P(3), se n=15, x=3, p=0,1 e 1=0,9.
Resposta: 0,1285
42
EXERCCIO DE FIXAO
1) Suponha que em um experimento binomial, uma prova se repita n vezes.
Determine a probabilidade de x sucessos, dada a probabilidade p de sucesso em
uma prova:
Respostas:
a) n = 3, x= 2, p=0,9
(0,243)
b) n=8, x=7, p=0,99
(0,0745)
c) n=10, x=4, p=0,30
(0,2001)
d) n=6, x=1, p=0,05
(0,2321)
2) Uma firma afirma que 20% de suas pastilhas de chocolate M&M so vermelhas.
Determine a probabilidade de que, em 15 pastilhas M&M escolhidas
aleatoriamente, exatamente 20%, ou seja, 3 pastilhas sejam vermelhas.
Resposta: 0,250
3) Acredita-se que 20% dos moradores das proximidades de uma grande indstria
siderrgica tm alergia aos poluentes lanados ao ar. Admitindo que este
percentual de alrgicos real (correto), calcule a probabilidade de que pelo menos
4 moradores tenham alergia entre 13 selecionados ao acaso.
Resposta: 0,252
4) Trs em cada quatro alunos de uma universidade fizeram cursinho antes de prestar
vestibular. Se 16 alunos so selecionados ao acaso, qual a probabilidade de que:
Respostas
a) Pelo menos 12 tenham feito cursinho?
(0,6302)
b) No mximo 13 tenham feito cursinho?
(0,8029)
c) Exatamente 12 tenham feito cursinho?
(0,2252)
43
44
45
46
47
.e
1 x
(Pi): ( 3,14159)
e: ( 2,71828).
- A probabilidade de qualquer evento a rea sob a curva de densidade entre os valores
de X que compe o evento.
- A rea total sob qualquer curva de densidade 1, de modo que a probabilidade de um
evento varia entre 0 e 1.
- Parmetros da Distribuio Normal X ~ N ( , 2 )
Mdia da Distribuio Normal: E(X) =
Varincia da Distribuio Normal: VAR(X) = 2
Algumas propriedades da Distribuio Normal:
P(X=x) = f(X) = 0 (pois no existe a probabilidade no ponto e sim na rea)
f(X) simtrica ao redor da mdia, ou seja, a probabilidade de ocorrer valor
menor do que a mdia igual a probabilidade de ocorrer valor menor do que a
mdia.
A curva normal depende de duas constantes, e 2:
- corresponde ao centro da simetria da curva e 2 graficamente, fornece a
distncia do centro da simetria aos pontos onde a curva muda de sentido.
48
. Para isso,
dada por:
Exemplo:
1) Se j X a varivel aleatria que representa os dimetros dos parafusos produzidos por
certa mquina. Suponha que essa varivel tenha Distribuio Normal com mdia 2cm e
desvio padro 0,04cm.
a) A probabilidade de um parafuso ter um dimetro com valor entre 2 e 2,05 :
P (2 X 2,05) P (
2 2 X 2,05 2
0,04
b) P(-1,25<Z<0) =
c) P(0,8<Z<1,23) =
d) P(Z>0,6) =
Obs.: Quando temos uma varivel aleatria com distribuio Normal, nosso principal
interesse obter a probabilidade de essa varivel aleatria assumir um valor em um
determinado intervalo.
49
0,00
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
0,0
0,000000
0,003989
0,007978
0,011966
0,015953
0,019939
0,023922
0,027903
0,031881
0,035856
0,1
0,039828
0,043795
0,047758
0,051717
0,055670
0,059618
0,063559
0,067495
0,071424
0,075345
0,2
0,079260
0,083166
0,087064
0,090954
0,094835
0,098706
0,102568
0,106420
0,110261
0,114092
0,3
0,117911
0,121720
0,125516
0,129300
0,133072
0,136831
0,140576
0,144309
0,148027
0,151732
0,4
0,155422
0,159097
0,162757
0,166402
0,170031
0,173645
0,177242
0,180822
0,184386
0,187933
0,5
0,191462
0,194974
0,198468
0,201944
0,205401
0,208840
0,212260
0,215661
0,219043
0,222405
0,6
0,225747
0,229069
0,232371
0,235653
0,238914
0,242154
0,245373
0,248571
0,251748
0,254903
0,7
0,258036
0,261148
0,264238
0,267305
0,270350
0,273373
0,276373
0,279350
0,282305
0,285236
0,8
0,288145
0,291030
0,293892
0,296731
0,299546
0,302337
0,305105
0,307850
0,310570
0,313267
0,9
0,315940
0,318589
0,321214
0,323814
0,326391
0,328944
0,331472
0,333977
0,336457
0,338913
1,0
0,341345
0,343752
0,346136
0,348495
0,350830
0,353141
0,355428
0,357690
0,359929
0,362143
1,1
0,364334
0,366500
0,368643
0,370762
0,372857
0,374928
0,376976
0,379000
0,381000
0,382977
1,2
0,384930
0,386861
0,388768
0,390651
0,392512
0,394350
0,396165
0,397958
0,399727
0,401475
1,3
0,403200
0,404902
0,406582
0,408241
0,409877
0,411492
0,413085
0,414657
0,416207
0,417736
1,4
0,419243
0,420730
0,422196
0,423641
0,425066
0,426471
0,427855
0,429219
0,430563
0,431888
1,5
0,433193
0,434478
0,435745
0,436992
0,438220
0,439429
0,440620
0,441792
0,442947
0,444083
1,6
0,445201
0,446301
0,447384
0,448449
0,449497
0,450529
0,451543
0,452540
0,453521
0,454486
1,7
0,455435
0,456367
0,457284
0,458185
0,459070
0,459941
0,460796
0,461636
0,462462
0,463273
1,8
0,464070
0,464852
0,465620
0,466375
0,467116
0,467843
0,468557
0,469258
0,469946
0,470621
1,9
0,471283
0,471933
0,472571
0,473197
0,473810
0,474412
0,475002
0,475581
0,476148
0,476705
2,0
0,477250
0,477784
0,478308
0,478822
0,479325
0,479818
0,480301
0,480774
0,481237
0,481691
2,1
0,482136
0,482571
0,482997
0,483414
0,483823
0,484222
0,484614
0,484997
0,485371
0,485738
2,2
0,486097
0,486447
0,486791
0,487126
0,487455
0,487776
0,488089
0,488396
0,488696
0,488989
2,3
0,489276
0,489556
0,489830
0,490097
0,490358
0,490613
0,490863
0,491106
0,491344
0,491576
2,4
0,491802
0,492024
0,492240
0,492451
0,492656
0,492857
0,493053
0,493244
0,493431
0,493613
2,5
0,493790
0,493963
0,494132
0,494297
0,494457
0,494614
0,494766
0,494915
0,495060
0,495201
2,6
0,495339
0,495473
0,495604
0,495731
0,495855
0,495975
0,496093
0,496207
0,496319
0,496427
2,7
0,496533
0,496636
0,496736
0,496833
0,496928
0,497020
0,497110
0,497197
0,497282
0,497365
2,8
0,497445
0,497523
0,497599
0,497673
0,497744
0,497814
0,497882
0,497948
0,498012
0,498074
2,9
0,498134
0,498193
0,498250
0,498305
0,498359
0,498411
0,498462
0,498511
0,498559
0,498605
3,0
0,498650
0,498694
0,498736
0,498777
0,498817
0,498856
0,498893
0,498930
0,498965
0,498999
3,1
0,499032
0,499065
0,499096
0,499126
0,499155
0,499184
0,499211
0,499238
0,499264
0,499289
3,2
0,499313
0,499336
0,499359
0,499381
0,499402
0,499423
0,499443
0,499462
0,499481
0,499499
3,3
0,499517
0,499534
0,499550
0,499566
0,499581
0,499596
0,499610
0,499624
0,499638
0,499651
3,4
0,499663
0,499675
0,499687
0,499698
0,499709
0,499720
0,499730
0,499740
0,499749
0,499758
3,5
0,499767
0,499776
0,499784
0,499792
0,499800
0,499807
0,499815
0,499822
0,499828
0,499835
3,6
0,499841
0,499847
0,499853
0,499858
0,499864
0,499869
0,499874
0,499879
0,499883
0,499888
3,7
0,499892
0,499896
0,499900
0,499904
0,499908
0,499912
0,499915
0,499918
0,499922
0,499925
3,8
0,499928
0,499931
0,499933
0,499936
0,499938
0,499941
0,499943
0,499946
0,499948
0,499950
3,9
0,499952
0,499954
0,499956
0,499958
0,499959
0,499961
0,499963
0,499964
0,499966
0,499967
4,0
0,499968
0,499970
0,499971
0,499972
0,499973
0,499974
0,499975
0,499976
0,499977
0,499978
50
EXERCCIO DE FIXAO
1) Determinar o valor, ou valores, de z em cada um dos casos, nos quais as reas
referem-se s limitadas pela curva normal:
Resposta:
a) a rea entre 0 e z 0,3770
(z= 1,16)
b) a rea a esquerda de z 0,8621
(z=1,09)
2) O peso mdio de 500 estudantes do sexo masculino de uma determinada
universidade 75,5kg e o desvio padro de 7,5 kg. Admitindo-se que os pesos
esto distribudos normalmente, determinar quantos estudantes pesam:
Resposta
a) entre 60 e 77,5kg
(P(-2,06<z<0,266)=0,6 => 300 estudantes)
b) mais do que 92,5kg
(P(z>2,26)=0,0119 = > 6 estudantes)
3) A mdia dos dimetros internos de uma amostra de 200 arruelas produzidas por
certa mquina 0,502 polegadas e o desvio padro 0,005 polegadas. A
finalidade para a qual essas arruelas so fabricadas permite a tolerncia mxima,
para o dimetro, de 0,496 a 0,508 polegadas; se isso no se verifica, as arruelas
sero consideradas defeituosas. Determinar a porcentagem de arruelas defeituosas
produzidas pela mquina, admitindo-se que os dimetros so distribudos
normalmente.
Resposta: 23,02%
4) Se z normalmente distribuda, com mdia zero e varincia 1, determinar:
Resposta:
a) P(z>-1,64) =
(0,9495)
b) P(-1,96<z<1,96) =
(0,95)
c) P(0<z<1,44) =
(0,4251)
d) P(-0,85<z<0) =
(0,3023)
e) P(-1,48<z<2,05) =
(0,9104)
f)
P(0,72<z<1,86) =
(0,2044)
51
CAPITULO 8
INTRODUO
A REGRESSO e a CORRELAO so tcnicas utilizadas para estimar uma
relao que possa existir na populao, enquanto as tcnicas anteriormente estudadas
(Medidas de Tendncia Central e de Disperso: Mdia, Desvio Padro, Varincia, etc.)
servem para estimar um nico parmetro populacional.
A anlise de correlao e regresso compreende a anlise de dados amostrais para
saber se e como duas ou mais variveis esto relacionadas uma com a outra numa
populao.
A correlao mede a fora, ou grau, de relacionamento entre duas variveis; a
regresso d a equao que descreve o relacionamento em termos matemticos.
(1) CORRELAO
Definio: Quando duas variveis esto ligadas por uma relao estatstica, dizemos que
existe correlao entre elas.
Por exemplo:
- A circunferncia C e o raio r esto perfeitamente correlacionados, porque C 2 r.
- As variveis altura e peso de indivduos revelariam alguma correlao.
Diagrama de disperso: O diagrama de disperso um grfico onde pontos no espao
cartesiano XY so usados para representar simultaneamente os valores de duas variveis
quantitativas medidas em um conjunto de dados.
52
Por exemplo:
Um dos objetivos dos pesquisadores neste estudo encontrar uma maneira de conhecer o
peso do urso atravs de uma medida mais fcil de se obter do que a direta (carregar uma
balana para o meio da selva e colocar os ursos em cima dela) como, por exemplo, uma
medida de comprimento (altura, permetro do trax, etc.).
O problema estatstico aqui encontrar uma varivel que tenha uma relao forte com o
peso, de modo que, a partir de seu valor medido, possa ser calculado (estimado) o valor
peso indiretamente, atravs de uma equao matemtica.
O primeiro passo para encontrar esta varivel fazer o diagrama de disperso das
variveis candidatas (eixo horizontal) versus o peso (eixo vertical), usando os pares de
informaes de todos os ursos. Voc pode tentar as variveis: idade, altura, comprimento
da cabea, largura da cabea, permetro do pescoo e permetro do trax.
A Figura mostra a relao entre peso e altura e entre peso e permetro do trax.
Analisando o grfico:
1) Podemos ver que, tanto a altura quanto o permetro do trax so fortemente associados
ao peso do urso, no sentido de que quanto mais alto o urso ou quanto maior a medida de
seu trax, mais pesado ele ser.
2) Note que este crescimento linear para o permetro do trax e no-linear para a altura.
3) Os pontos esto mais dispersos no grfico da altura, a varivel mais adequada para
estimar o peso o permetro do trax.
53
Grfico 1
(+)
Grfico 2 (-)
Grfico 3 (nula)
Clculo do Coeficiente de Correlao Linear de Pearson
Definio: Dado n pares de valores (x1, y1), (x2, y2), ..., (xn, yn), o coeficiente entre as
duas variveis X e Y dado pela mdia dos valores dos produtos padronizados das
variveis.
n x i y i x i y i
n x
2
i
x i n y i y i
2
Indica o grau de intensidade entre duas variveis e ainda o sentido dessa correlao
(positivo ou negativo).
S deve ser utilizado com variveis contnuas.
A partir dos valores de r, podemos verificar o tipo da correlao existente entre as
variveis estudadas, conforme tabela seguinte:
Valor de r
0,0
0,0 ----| 0,3
0,3 ----| 0,6
0,6 ----| 0,9
0,9 ----| 0,99
1,0
Correlao
Nula
Fraca
Media
Forte
Fortssima
Perfeita
54
Exemplo: Considerando uma amostra aleatria, formada por dez dos 98 alunos de uma
classe da faculdade A e pelas notas obtidas por eles em Matemtica e Estatstica:
10 x 473 65 x 65
(10 x 481 65 )(10 x 475 65 )
2
4730 4225
(4810 4225)(4750 4225)
505
585 x525
505
0,911
554,18
Concluso: O resultado nos indica uma correlao linear positiva altamente significativa
entre as duas variveis.
Se o relacionamento entre X e Y for consistente e necessitamos fazer uma predio para o
valor de Y, conhecido um valor de X, atravs de uma formula matemtica adequada,
podemos aplicar a chamada ANLISE DE REGRESSO SIMPLES.
55
EXERCCIO DE FIXAO
1) Observou-se que o volume mensal de lixo gerado em uma cidade, em funo do
nmero de dormitrios das residncias, o seguinte (em m3):
No Dormitrios
Volume de lixo
1
2
0,15 0,29
3
0,45
4
0,57
(-0,983)
20
40
1.110 1.250
10
100
70
1.000
1950
1600
(0,9969)
56
(2) REGRESSO
Objetivo: A regresso linear simples constitui uma tentativa de estabelecer uma equao
matemtica linear (linha reta) que descreva o relacionamento entre duas variveis.
Para obter uma reta de regresso, n pares de observaes das variveis so utilizados.
Considerando Y como a varivel dependente ou varivel resposta e, X como a varivel
independente ou preditora, a reta de regresso dada por:
Y = + X + u
o coeficiente linear (intercepto), ou seja, o ponto onde a reta corta o eixo Y;
o coeficiente angular, ou seja, determina a inclinao da reta.
Graficamente:
+ X + u
+ X
X+1
57
tal que
ei yi (a bxi )
x y
i 1
n
x
i 1
2
i
nx y
a y bx
nx
a = 0, logo Y bX
Exemplo:
1) Um laboratrio est interessado em medir o efeito da temperatura sobre a potncia de
um antibitico. Dez amostras de 50 gramas cada foram guardadas a diferentes
temperaturas, e aps 15 dias, mediu-se a potncia. Os resultados esto no quadro abaixo.
Temperatura
Potncia
30
38
36
43
50
32
54
26
60
33
73
19
78
27
82
23
91
14
95
21
r 0,882
Podemos concluir que o grfico se trata de uma correlao retilnea, de modo a permitir o
ajustamento de uma reta, imagem da funo Y = + X + u. (se no houvesse uma
correlao significativa, nossa melhor predio da potncia do antibitico seria
y 27,6 ).
58
x y
i 1
n
x
i 1
2
i
nx y
nx 2
0,35114
4534,9
46.655 10(64,9) 2
(Coef. Linear)
a y bx 27,6 ( 0,35114 ) 64,9 50,389
Logo,
Y 50,389 0,35114 X
Coeficiente
4,3424
0,0465
59
Resposta:
Y = varivel dependente = quantidade apostada
X = varivel independente = freqncia do pblico
A equao da reta ser:
Y a bX 4,3424 0,0465 X
Assim, o valor apostado quando a freqncia zero (0) de 4,3424 mil dlares.
Alm disso, para cada 100 pessoas a mais na pista o total apostado subir em 0,0465.
Uma importante funo de determinar a reta de regresso para duas variveis a
possibilidade de realizar previses, ou seja, uma vez que obtemos a reta de regresso,
podemos escolher um valor de interesse para a varivel independente (X) e determinar o
valor esperado para a varivel dependente (Y).
60
EXERCCIO DE FIXAO
1) Observou-se que o volume mensal de lixo gerado em uma cidade, em funo do
nmero de dormitrios das residncias, o seguinte (em m3):
No Dormitrios
Volume de lixo
1
2
0,15 0,29
3
0,45
4
0,57
(y = -1,3831x + 176)
(65,352)
20
40
1.110 1.250
10
100
70
1.000
1950
1600
a)
b)
c)
d)
(2.452,575)
61
r 2 : COEFICIENTE DE DETERMINAO
Uma das formas de determinar se o modelo encontrado satisfatrio para explicar
os dados calculando o COEFICIENTE DE DETERMINAO do modelo. Esse
coeficiente compara a variabilidade do modelo com a variabilidade total dos dados.
CLCULO DO r 2 :
n
r2
( y
i 1
n
(y
i 1
y) 2
y) 2
SQE
SQT
( y
i 1
y)2 .
A variabilidade total (soma dos quadrados total) pode ser calculada como:
n
(y
i 1
y) 2 .
62
Observao:
Exemplo 1: Calcular e interpretar o coeficiente de determinao R2 para os dados do
primeiro exerccio.
Temperatura
(X)
30
36
50
54
60
73
78
82
91
95
Potncia
(Y)
38
43
32
26
33
19
27
23
14
21
Valores
preditos ( y )
39.86
37.75
32.83
31.43
29.32
24.76
23.00
21.60
18.44
17.03
y
(y
i 1
i 1
( y i y ) 2
108.16
237.16
19.36
2.56
29.16
73.96
0.36
21.16
184.96
43.56
150.21
103.01
27.40
14.67
2.97
8.07
21.13
36.01
83.92
111.63
27,6
y) 2
720,4
y)2
559,02
( y
( yi y ) 2
R2
0,7759
63
EXERCCIO DE FIXAO
Uma amostra de 5 ratos da raa Wistar foi obtida e suas idades (em dias) e pesos (em
gramas) so apresentados na tabela abaixo:
Idade (dias)
30
34
38
42
46
64
Bibliografia
TRIOLA, Mrio F., Introduo ESTATSTICA - 7 Edio Rio de
Janeiro: LTC Livros Tcnicos e Cientficos Editora S.A.
CRESPO, Antnio Arnot, Estatstica Fcil 18 Edio So Paulo,
2002.
65