Você está na página 1de 66

Apostila

de
Estatstica

2 Semestre/2009
Professora: Janaina Pereira
IFRJ - Instituto Federal de Educao, Cincia e
Tecnologia - Rio de Janeiro

IFRJ Instituto Federal de Educao, Cincia e Tecnologia Rio de Janeiro


Professora: Janaina Pereira

CAPITULO 1
O que estatstica?
a cincia que fornece mtodos para coleta, organizao, descrio, anlise e
interpretao dos dados e para utilizao dos mesmos na tomada de decises.
A Estatstica trabalha com fenmenos coletivamente tpicos, isto , com fenmenos
ligados a coletividade e que podem ser repetidos.
Fenmenos determinsticos: J se conhece a priori o resultado.
Ex.: Preo total a pagar pela aquisio de uma determinada quantidade de um
produto.
Fenmeno aleatrio: Conhecemos todos os possveis resultados, mas no se sabe
o resultado concreto que ir acontecer.
Ex.: lanamento de um dado honesto.
A estatstica se divide em duas partes:
(1) ESTATSTICA DESCRITIVA: Responsvel pela coleta, organizao e descrio
dos dados observados.
(2) ESTATSTICA INDUTIVA OU INFERENCIAL: Responsvel pela anlise e
interpretao dos dados.
A estatstica trabalha com fenmenos de natureza aleatria, logo o clculo das
probabilidades essencial para o estudo da Estatstica indutiva.
Fases do mtodo estatstico:
- Coleta dos dados: Feito atravs de registros nascimento, casamento, bitos,
importao e exportao de mercadoria, banco de dados de empresas, questionrios,....
- Crtica dos dados: Para verificar possveis erros por parte dos informantes, por
distrao ou m interpretao das perguntas que lhe forem feitas.
- Exposio ou apresentao dos dados: Tabulao e grficos.
- Anlise dos resultados: Concluso sobre o todo (POPULAO) a partir de
informaes fornecidas por parte representativa do todo (AMOSTRA).
POPULAO: o conjunto de indivduos ou objetos que apresentam pelo menos uma
caracterstica comum.
AMOSTRA: um subconjunto finito de uma populao.

IFRJ Instituto Federal de Educao, Cincia e Tecnologia Rio de Janeiro


Professora: Janaina Pereira

Exemplo: Digamos que a Secretaria Estadual de Educao queira pesquisar o grau de


satisfao dos alunos no que se refere qualidade da merenda escolar.
Populao: Alunos da rede estadual.
Amostra: Parte do total de alunos que representa o todo (populao).
Varivel em estudo: variveis que possam informar a satisfao dos alunos com a
merenda escolar.
As variveis podem ser QUANTITATIVAS ou QUALITATIVAS.
Qualitativas: quando seus valores so expressos por atributos.
Exemplos: Populao: Candidatos a um exame de vestibular.
Varivel: sexo (masculino ou feminino).
Quantitativa: Quando seus valores so expressos em nmeros. Podem ser subdivididas
em discretas (assumem valores enumerveis, nmeros inteiros no-negativos, contagens)
e contnuas (assumem valores num certo intervalo, medies).
Exemplos: Populao: casais residentes em uma cidade.
Variveis: Nmero de filhos (quantitativa discreta)
Idade (quantitativa continua)
Peso dos alunos (quantitativa contnua)

IFRJ Instituto Federal de Educao, Cincia e Tecnologia Rio de Janeiro


Professora: Janaina Pereira

EXERCCIO DE FIXAO
1) O que estatstica?
2) O que populao?
3) o que amostra?
4) A Estatstica se divide em duas partes. Cite e explique cada uma delas.
5) Quais so as fases do mtodo estatstico?
6) Qual a diferena entre varivel qualitativa e quantitativa?
7) Classifique as variveis em qualitativas, quantitativas contnuas ou quantitativas
discreta.
a) Populao: Alunos de uma escola.
Varivel: Cor da pele ___________________________
b) Populao: Casais residentes em um bairro.
Varivel: N de filhos ___________________________
c) Populao: Jogadas de um dado.
Varivel: O ponto obtido em cada jogada______________________
d) Populao: Peas produzidas por certa mquina.
Varivel: Nmero de peas produzidas por hora_________________
e) Populao: Aparelho produzido em uma linha de montagem.
Varivel: N de defeitos por unidade__________________________
f) Populao: Pessoas residentes em uma cidade.
Varivel: Idade ___________________________
g) Populao: Bolsa de valores de So Paulo.
Varivel: N de aes negociadas_________________________
h) Populao: Funcionrios de uma empresa.
Varivel: Salrio ___________________________
i) Populao: Pregos produzidos por uma mquina.
Varivel: Comprimento do prego_________________________
j) Populao: Casais residentes em uma cidade.
Varivel: Sexo dos filhos ___________________________
8) Dizer quais dos seguintes itens representam dados discretos e quais representam dados
contnuos.
a) Altura de precipitao da chuva em centmetros, de uma cidade durante vrios
meses do ano.____________________________
b) Velocidade de um automvel em km/h._________________________
c) Nmero de notas de vinte dlares em circulao nos Estados Unidos, em qualquer
poca._________________________________
d) Valor
total
das
aes
vendidas
diariamente
na
Bolsa
de
Valores.______________________
e) Nmero de estudantes matriculados em uma universidade, em certo nmero de
anos._____________________________

IFRJ Instituto Federal de Educao, Cincia e Tecnologia Rio de Janeiro


Professora: Janaina Pereira

9) Estabelecer quais dos dados seguintes so discretos e quais so contnuos.


a) Temperatura registrada a cada meia hora em um posto de
meteorologia.______________________
b) Vida mdia das vlvulas de televiso produzidas por uma determinada
companhia.___________________________
c) Comprimento de 1000 parafusos produzidos numa fbrica. __________________
GABARITO
7.
a)
b)
c)
d)
e)
f)
g)
h)
i)
j)

QUALITATIVA
QUANT. DISCRETA
QUANT. DISCRETA
QUANT. DISCRETA
QUANT. DISCRETA
QUANT. CONTNUA
QUANT. DISCRETA
QUANT. DISCRETA
QUANT. CONTNUA
QUALITATIVA

a)
b)
c)
d)
e)

CONTNUA
CONTNUA
DISCRETA
DISCRETA
DISCRETA

8.

9.
a) CONTNUA
b) CONTNUA
c) CONTNUA

IFRJ Instituto Federal de Educao, Cincia e Tecnologia Rio de Janeiro


Professora: Janaina Pereira

CAPITULO 2
O objetivo da estatstica sintetizar os valores que uma ou mais variveis podem assumir
e isso ela consegue apresentando esses valores em TABELAS E GRFICOS.
TABELAS ESTATSTICAS

TABELA UM QUADRO QUE RESUME UM CONJUNTO DE


OBSERVAES

COLUNA
INDICADORA

Produo de caf
Brasil - 1978-82
ANOS

1978
1979
1980
1981
1982

CORPO

PRODUO
(1.000 T)

2.535
2.666
2.122
3.750
2.007

TTULO
CABEALHO
CASA OU CLULA
LINHAS

Fonte: IBGE

RODAP

COLUNA NUMRICA
SRIES ESTATSTICAS
Definio: Srie Estatstica toda tabela que apresenta a distribuio de um conjunto de
dados em funo da poca, do local ou da espcie.
Classificao das Sries Estatsticas:

SRIE HISTRICA, CRONOLGICA, TEMPORAIS: Descrevem valores


da varivel, em determinado local, discriminados segundo intervalos de tempo.
(OS DADOS VARIAM COM O TEMPO).
PRODUO MEDIA DE SOJA NO
BRASIL - 2005-2006
ANOS

PRODUO (1.000 t)

2005
2006

51.138
52.223

FONTE: IBGE.

IFRJ Instituto Federal de Educao, Cincia e Tecnologia Rio de Janeiro


Professora: Janaina Pereira

SRIES GEOGRFICAS, ESPACIAIS, TERRITORIAIS OU DE


LOCALIZAO: Descrevem valores da varivel, em determinado instante,
discriminados segundo regies. (OS DADOS VARIAM NO LOCAL).
DURAO MDIA
DOS ESTUDOS
SUPERIORES 1994
PASES
Itlia
Alemanha
Frana
Holanda

NMERO
DE ANOS
7,5
7,0
7,0
5,9

FONTE: APA.

SRIES ESPECFICAS OU CATEGRICAS: Descrevem valores da varivel


em determinado tempo e local, discriminados segundo especificaes e categorias
(OS DADOS VARIAM DE ACORDO COM A ESPCIE OU QUALIDADE DO
FENMENO).
EXPORTAO
BRASILEIRA2005

PRODUTOS

Gros
Farelo
leo

QUANTIDADE
(em bilhes de
toneladas)
20,5
14,2
2,4

FONTE:
Companhia
Nacional
Abastecimento (Conab).

de

SRIES CONJUGADAS, TABELAS DE DUPLA ENTRADA: Quando


precisamos apresentar em uma nica tabela a variao de valores de mais de uma
varivel (OS DADOS SO RELATIVOS A 2 OU 3 ASPECTOS
SIMULTANEAMENTE).

IFRJ Instituto Federal de Educao, Cincia e Tecnologia Rio de Janeiro


Professora: Janaina Pereira

GRFICOS ESTATSTICOS
O grfico estatstico uma forma de apresentar os dados estatsticos, com o objetivo de
mostrar uma impresso mais rpida do fenmeno em estudo, com simplicidade, clareza e
veracidade.

Ttulos completos e o mais claro possvel;

Sempre que possvel a escala vertical deve ser escolhida de modo a aparecer na
linha o valor zero;

A escala horizontal deve ser lida da esquerda para direita e a escala vertical deve
ser lida de baixo para cima.

Tipos mais comuns de grficos:

Grfico em colunas ou em barras

IFRJ Instituto Federal de Educao, Cincia e Tecnologia Rio de Janeiro


Professora: Janaina Pereira

Grfico de linhas ou em curva

Grfico em setores ou de pizza:


Rebanhos Brasileiros
Brasil - 1988
Espcie
Quantidades
(milhes de cabeas)
Bovinos
140
Sunos
32
Ovinos
20
Caprinos
11
Total
203
Fonte: IBGE

REBANHOS BRASILEIROS
BRASIL 1988

Bovinos
Sunos
Ovinos
Caprinos

IFRJ Instituto Federal de Educao, Cincia e Tecnologia Rio de Janeiro


Professora: Janaina Pereira

EXERCCIO DE FIXAO
1) Construa as tabelas referentes aos dados pesquisados e classifique-as:
a)

Dados referentes produo de borracha natural nos anos de 1991 (29.243 toneladas),
1992 (30.712 toneladas) e 1993 (40.663 toneladas). Fonte IBGE.

b)

Dados referentes Avicultura Brasileira no ano de 1992 segundo as seguintes espcies:


galinhas (204.160 cabeas), Galos, frangos, frangas e pintos (435.465 cabeas) e
Codornas (2.488 cabeas). Fonte IBGE.

c)

Dados referentes ao total de vacinao contra a Poliomilite no ano de 1993 segundo as


seguintes regies: Norte (211.209), Nordeste (631.040), Sudeste (1.119.708), Sul
(418.785) e Centro-oeste (185.823). Fonte Ministrio da sade.

GABARITO
1.
a) TEMPORAL
b) ESPECFICA
c) GEOGRFICA

10

IFRJ Instituto Federal de Educao, Cincia e Tecnologia Rio de Janeiro


Professora: Janaina Pereira

CAPITULO 3
Aps a coleta de dados relativos a um determinado fenmeno em estudo, que compem
uma amostra, obtemos um conjunto de dados que ser tabulado.
Por exemplo:
TABELA 1: ALTURA DOS ALUNOS
166
162
155
154

160
161
152
161

161
168
163
156

150
163
160
172

162
156
155
153

160
173
155
157

165
160
169
156

167
155
151
158

164
164
170
158

160
168
164
161

Observe que os dados no esto organizados. Dessa forma ela recebe o nome de DADOS
BRUTOS.
Precisamos organizar os dados atravs de uma ordenao crescente ou decrescente.
TABELA 2: ALTURA DOS ALUNOS
150
151
152
153

154
155
155
155

155
156
156
156

157
158
158
160

160
160
160
160

161
161
161
161

162
162
162
162

164
164
164
164

166
167
168
168

169
170
172
173

Obteremos uma segunda ordenao que receber o nome de ROL (seqncia ordenada
dos dados brutos).
Dessa forma podemos saber com facilidade qual a menor altura (150) e qual a maior
(173); qual a amplitude de variao (173-150=23cm); qual o ponto mdio (160+161)/2 =
160,5.
Ainda assim, a varivel observada (altura dos alunos) ser mais facilmente estudada
quando dispusermos os valores ordenados em uma coluna e ao lado de cada valor o
nmero de vezes que aparece repetido. Obtemos dessa forma uma tabela que recebe o
nome de DISTRIBUIO DE FREQNCIA.

11

IFRJ Instituto Federal de Educao, Cincia e Tecnologia Rio de Janeiro


Professora: Janaina Pereira

Outra soluo aceitvel e mais conveniente para diminui o tamanho da tabela quando o
nmero de valores da varivel grande, seria agrup-los em vrios intervalos. Nesse caso
a tabela passa a ser denominada: DISTRIBUIO DE FREQNCIA POR
INTERVALO DE CLASSE.

L-se: 4 alunos tm altura entre 150 e 154 anos (exclusive) intervalo fechado
esquerda.

12

IFRJ Instituto Federal de Educao, Cincia e Tecnologia Rio de Janeiro


Professora: Janaina Pereira

Critrio para calcular o nmero de classes a ser utilizado.


Observao: No obrigatrio! O bom senso tambm funciona.
CRITRIO DA RAIZ
Se a seqncia estatstica contm n elementos e se indicarmos por i o nmero de classes a
ser utilizado, ento:
i

Onde n = nmero total de observaes.

Amplitude do intervalo de classe que chamaremos de h determinada por: h


AT a Amplitude Total e

AT
, onde
i

Exemplo:
n = 40
Ento,

40 =

6,324, portanto o inteiro mais prximo 6.

Devemos trabalhar com o inteiro mais prximo da raiz de n, o inteiro imediatamente


anterior e o inteiro imediatamente superior.
Logo, as opes para i so: 5, 6 ou 7.
Ento, a amplitude do intervalo de classe (h) determinada por:
h

AT L (Max) - l (min) 173 - 150

3,833 4
i
i
6

ELEMENTOS DE UMA DISTRIBUIO DE FREQNCIA.


(1) CLASSE (i): So intervalos de variao da varivel.
Ex.: Intervalo 150 a 154 define a 1 classe (i=1),
i = 1, 2, 3,......, k
i = classe
k = nmero total de classes.
(2) LIMITES DE CLASSE: So os extremos de cada classe.
l i = Limite inferior
Li = Limite superior
Ex.: Na primeira classe: l i = 150 e Li = 154.

13

IFRJ Instituto Federal de Educao, Cincia e Tecnologia Rio de Janeiro


Professora: Janaina Pereira

(3) AMPLITUDE DE UM INTERVALO DE CLASSE ( hi ): a medida do intervalo


que define a classe. Diferena entre o limite superior e inferior da classe.
Ex.: Na primeira classe: l i = 150 e Li = 154.
hi = Li l i = 154 150 = 4 cm.
(4) AMPLITUDE TOTAL DA DISTRIBUIO (AT): a diferena entre o Limite
superior da ultima classe e o Limite inferior da primeira classe.
AT = L(Max) l(min)
Ex.: 174 150 = 24 cm
Observe que quando as classes possuem o mesmo intervalo vale a relao:
AT
k
hi

24/4 = 6

(6 = Nmero total de classes)

(5) PONTO MDIO DE UMA CLASSE ( pm i ): o ponto que divide o intervalo de


classe em duas partes iguais.
Ex.: Classe 1: (150 + 154)/2 = 152 cm
TIPOS DE FREQNCIA:
(1) FREQNCIA SIMPLES OU ABSOLUTA ( f i ): o nmero de observaes
correspondentes a classe ou a um valor.
Exemplo:

f 1 = 4 => freqncia da classe 1 e f 2 = 9 => freqncia da classe 2.


k

A soma de todas as freqncias ser:

f
i 1

n , n = nmero total de observaes.

(2) FREQNCIA ACUMULADA ( Fi ): o total das freqncias de todos os valores


inferiores ao limite superior do intervalo de classe.
k

Fi f1 f 2 ..... f k f i
i 1

Exemplo:
14

IFRJ Instituto Federal de Educao, Cincia e Tecnologia Rio de Janeiro


Professora: Janaina Pereira

F3 f1 f 2 f 3 f i 4 9 11 24 , ou seja, existem 24 alunos com estatura inferior a


i 1

162 cm.
(3) FREQNCIA RELATIVA ( fri ): a razes entre a freqncia simples a
freqncia total.

fri

fi
k

f
i 1

Exemplo:

fr3

f3

40

f
i 1

11
0,275
40

(4) FREQNCIA ACUMULADA RELATIVA ( Fri ): a freqncia acumulada da


classe dividida pela freqncia total da distribuio.

Fri

Fi
k

f
i 1

15

IFRJ Instituto Federal de Educao, Cincia e Tecnologia Rio de Janeiro


Professora: Janaina Pereira

Fr3

F3

40

f
i 1

24
0,600
40

REPRESENTAO GRFICA DE UMA DISTRIBUIO DE FREQNCIA.


Histograma
Consiste em um conjunto de retngulos, tantos quantos forem s classes de uma
distribuio.
As classes so as bases dos retngulos (tantas partes quantas forem s classes)
A escala para marcao dos pontos no eixo Y corresponde s freqncias.
Exemplo:

Polgono de freqncias
Freqncia Simples:

Freqncia Acumulada: As bases dos retngulos vo estar centradas nos pontos mdios
das classes.

16

IFRJ Instituto Federal de Educao, Cincia e Tecnologia Rio de Janeiro


Professora: Janaina Pereira

Exemplo:

17

IFRJ Instituto Federal de Educao, Cincia e Tecnologia Rio de Janeiro


Professora: Janaina Pereira

CAPITULO 4
MEDIDAS DE POSIO: MDIA, MODA e MEDIANA;
O estudo sobre a Distribuio de Freqncia permitiu descrever, de um modo geral, os
valores que uma varivel pode assumir. Agora precisamos de um indicativo
generalizado.
O modo mais comum de se obter esse tipo de informao atravs das MEDIDAS DE
POSIO, estatstica que representa posio relativa da distribuio em relao ao eixo
horizontal.
As medidas de posio mais importantes so as MEDIDAS DE TENDNCIA
CENTRAL recebem esse nome pelo fato dos dados observados, em geral, se agruparem
em torno dos valores centrais.
So elas: MDIA ARITMTICA, MODA, MEDIANA, SEPARATRIZES, QUARTIS e
PERCENTIS.
Essas medidas quando bem interpretadas, podem fornecer-nos informaes muito
valiosas com respeito s sries estatsticas, ou seja, com estas medidas tenta-se encontrar
um valor numrico que represente o comportamento tpico da serei em estudo.
(1) MDIA ARITMTICA SIMPLES ( x )
MDIA PARA DADOS NO AGRUPADOS (dados brutos ou rol): Quando
desejamos conhecer a mdia dos dados no agrupados, determinamos a mdia
aritmtica simples.
n

x
i 1

, onde ( x ) a mdia aritmtica, ( xi ) os valores da varivel e (n) o nmero

n
de valores.
Ex.: Produo leiteira diria da vaca A, durante uma semana, foi de 10, 14, 13, 15, 16, 18
e 12 litros. Qual a produo mdia da semana.
x

10 14 13 15 16 18 12 98

14litros
7
7

MDIA PARA DADOS AGRUPADOS SEM INTERVALO DE CLASSE.


n

x
i 1
n

f
i 1

fi
, observe que f i a freqncia simples de cada varivel que neste caso
i

funciona como fator de ponderao (MDIA ARITMTICA PONDERADA).

18

IFRJ Instituto Federal de Educao, Cincia e Tecnologia Rio de Janeiro


Professora: Janaina Pereira

Exemplo:

x
i 1
4

f
i 1

fi

50
5
10

Exerccio: Calcule a Mdia.


Varivel estudada X(idade): 2, 5, 5, 5, 5, 6, 6, 6, 8, 8
IDADES
2
5
6
8
Total

fi

Resposta: 5,6

fixi

MDIA PARA DADOS AGRUPADOS COM INTERVALO DE CLASSE.


n

x
i 1
n

f
i 1

fi
,
i

( pmi ) o ponto mdio de cada intervalo de classe.


( f i ) a freqncia simples de cada intervalo de classe.
Exemplo:

pm
i 1

f
i 1

fi

46
4,6
10

19

IFRJ Instituto Federal de Educao, Cincia e Tecnologia Rio de Janeiro


Professora: Janaina Pereira

Exerccio:

Resposta: 161 cm

(2) MODA (Mo)


o valor que ocorre com maior freqncia em uma srie de dados. Quando uma srie
de dados no apresentar moda chamaremos de AMODAL. Dois valores na srie, duas
modas, chamaremos de BIMODAL.
MODA PARA DADOS NO AGRUPADOS (dados brutos ou rol)
Exemplo:

MODA PARA DADOS AGRUPADOS SEM INTERVALO DE CLASSE.


Basta verificar o valor da varivel de maior freqncia.

Uma vez agrupado os dados basta fixar o valor da varivel de MAIOR freqncia. A
moda nesse caso 3.

20

IFRJ Instituto Federal de Educao, Cincia e Tecnologia Rio de Janeiro


Professora: Janaina Pereira

Exerccio: Qual a moda e o tipo para os dados agrupados em freqncia:

DADOS AGRUPADOS COM INTERVALO DE CLASSE.


A classe que apresentar a maior freqncia denominada CLASSE MODAL que servir
de base para os seguintes clculos:
*
a) Moda de KING: Mo l

f pos
f ant f pos

*
b) Moda de CZUBER: Mo l

h*

D1
h*
D1 D2

Onde :
l * o limite inferior da classe modal
f pos a freqncia simples da classe posterior a classe modal
f ant a freqncia simples da classe anterior a classe modal
f * a freqncia simples da classe modal
h * a amplitude do intervalo da classe modal
D1 f

f ant

D2 f

f pos

Exerccio: Calcule a moda utilizando os dois mtodos

Resposta.: 50
Observao:

21

IFRJ Instituto Federal de Educao, Cincia e Tecnologia Rio de Janeiro


Professora: Janaina Pereira

1) A moda utilizada quando desejamos obter uma medida rpida e aproximada de


posio ou quando o valor da distribuio deve ser o valor mais tpico da distribuio.
2) A moda uma medida de posio, pois indica a regio das mximas freqncias.
(3) MEDIANA (Md)
o valor que divide o conjunto de dados ordenados em duas metades, com metade dos
valores acima da mediana e a metade dos valores abaixo dela. Quando o nmero de
observaes (n) mpar, a mediana o valor que ocupa a posio central. Quando n for
par, h duas posies centrais no conjunto, ento a mediana a mdia aritmtica dos dois
valores que ocupam as posies centrais.
MEDIANA PARA DADOS AGRUPADOS SEM INTERVALO DE CLASSE.
n 1

1) Se n for mpar (n=nmero de observaes), o valor mediano ser o de ordem

ou seja, o valor do elemento que ocupa est posio ser a mediana.


2) Se n for par, o rol admite dois termos centrais que ocupam as posies. O de ordem
n

2

1
2

, ento, a mediana ser a mdia dos valores que ocupam estas posies.

Exemplos:

Exemplo:
1)
N de meninos
0
1
2
3
4
Total

fi
2
6
10
12
4
34

valor da srie => Md

Fi
2
8
18
30
34

A mediana vai ser a mdia entre o 17 valor e o 18

22
2 meninos.
2

2)

22

IFRJ Instituto Federal de Educao, Cincia e Tecnologia Rio de Janeiro


Professora: Janaina Pereira

X
12
14
15
16
17
20
Total

fi
1
2
1
2
1
1
8

Fi
1
3
4
6
7
8

A mediana ser a mdia entre o 4 e o 5 elemento da srie => Md


Exerccios: Calcule a mediana.

15 16
15,5
2

Resposta: 8

MEDIANA PARA DADOS AGRUPADOS COM INTERVALO DE CLASSE.


n

Fant
2

Md l *
h*
f*

Onde:
l * o limite inferior da classe mediana
n
a posio da mediana na srie
2
Fant a freqncia acumulada da classe anterior classe mediana
f * a freqncia simples da classe mediana
h * a amplitude do intervalo de classe que contm a mediana

Exemplo:
idade
3 |--- 6
6 |--- 9
9 |--- 12
12 |--- 15
15 |--- 18

fi

Fi
2
5
7
3
2

total

2
7
14
17
19

19

Fant
2
h* =
Md l *
*
f

9,5 7 3
7

=10,1

Exerccio: Calcule a mediana para o caso da distribuio de freqncia abaixo:


Salrio
450 |--- 550

fi

Fi
8
23

IFRJ Instituto Federal de Educao, Cincia e Tecnologia Rio de Janeiro


Professora: Janaina Pereira

550 |--- 650


650 |--- 750
750 |--- 850
850 |--- 950
950 |--- 1.050
1.050 |-- 1.150
total

10
11
16
13
5
1
64

Observao:
No caso de existir uma freqncia acumulada exatamente igual a

n
, a Mediana ser o
2

limite superior da classe correspondente.


Por exemplo:
Classes
0 |---10
10 |---20
20 |---30
30 |---40
40 |---50
50 |---60
total

fi
1
3
9
7
4
2
26

Fi
1
4
13
20
24
26

Fant
= 20 13 4 10 =3
2

*
*
Md l
h
9
f*

Nota:
1) A mediana pode coincidir ou no com um elemento da srie. Vimos que, quando
tivermos um nmero de elementos mpar na srie de dados, h coincidncia.
Quanto o nmero de elementos de uma srie par, na h coincidncia.
2) A mediana depende da posio e no dos valores centrais na srie ordenada.
3) Usamos a mediana quando desejamos obter o ponto que divide a distribuio em
partes iguais e quando h valores extremos afetando de uma maneira acentuada a
mdia.

24

(3) SEPARATRIZES
As separatrizes, como o prprio nome sugere so medidas que separam a srie em partes
iguais.
QUARTIS: So valores de uma srie que a dividem em 4 partes iguais. Assim temos:
Q1 = 1 quartil: Separa a seqncia ordenada deixando 25% dos valores a sua esquerda

e 75% dos valores a sua direita.


Q2 = 2 quartil: Separa a seqncia ordenada deixando 50% dos valores a sua esquerda

e 50% dos valores a sua direita.


Q3 = 3 quartil: Separa a seqncia ordenada deixando 75% dos valores a sua esquerda

e 25% dos valores a sua direita.


Pode-se observar que o 2 quartil e a mediana tem os mesmos valores, pois ambos
dividem uma srie ordenada em duas partes iguais.
!---------!---------!---------!---------!
Q1
Q2
Q3
!-------------------!-------------------!
Md

Clculo do QUARTIL
o mesmo clculo de mediana sendo que

n
deve ser substitudo por k
2

f
4

, onde k

o nmero de ordem do quartil.


k fi

Qk l *

Fant .h *

*
f

Exemplo:
1. Calcule o Q1 da seqncia X: 2, 5, 8, 5, 5, 10, 1, 12, 12, 11, 13, 15.
Ordenar a srie:
k

f
4

X: 1, 2, 5, 5, 5, 8, 10, 11, 13, 15

12
3
4

Q1 = 5

24

Calcule o Q1 e Q3

f
4

Q1 154

40
10 (classe 2)
4

10 4. 4 156,67
9

f
4

Q3 162

40
30 (classe4)
4

30 24. 4 165
8

Exerccio: Para os dados agrupados em freqncia, encontre o primeiro e segundo quartil.


Resposta: 4 e 6

QUINTIS: Quando dividimos uma srie em 5 partes iguais, cada parte ficar com 20%
dos elementos da srie. Assim temos:
K1 = 1 quintil separa a seqncia ordenada deixando 20% dos valores a sua esquerda

e 80% dos valores a sua direita.


K 2 = 2 quintil separa a seqncia ordenada deixando 40% dos valores a sua esquerda

e 60% dos valores a sua direita.


K 3 = 3 quintil separa a seqncia ordenada deixando 60% dos valores a sua esquerda

e 40% dos valores a sua direita.


K 4 = 4 quintil separa a seqncia ordenada deixando 80% dos valores a sua esquerda

e 20% dos valores a sua direita.


!---------!---------!---------!---------!---------!
K3
K1
K2
K4

Clculo do QUINTIL
25

o mesmo clculo de mediana sendo que

n
deve ser substitudo por k
2

, onde k

o nmero de ordem do quintil.


k fi

Kk l*

Fant .h *

*
f

Exemplo: Considerando a tabela de distribuio de freqncia por intervalo de classe,


calcule K2.

f
5

40
16
5

k 2 158

(classe 3)

16 13. 4 159
11

Exerccio: A distribuio de freqncia abaixo representa o consumo por nota de 54 notas


fiscais emitidas durante um dia em uma loja de departamentos. Calcule o quintil de
ordem 2.
Consumo por nota (R$)

0 |---50 |---100 |---150 |---200 |---250 |---Total

50
100
150
200
250
300

N de notas

10
28
12
2
1
1
54

Resposta: 70,71

26

DECIS: Quando dividimos uma srie em 10 partes iguais, cada parte ficar com 10% dos
elementos da srie. Assim temos:
D1 = 1 decil separa a seqncia ordenada deixando 10% dos valores a sua esquerda e

90% dos valores a sua direita.


D2 = 2 decil separa a seqncia ordenada deixando 20% dos valores a sua esquerda

e 80% dos valores a sua direita.


D3 = 3 decil separa a seqncia ordenada deixando 30% dos valores a sua esquerda e

70% dos valores a sua direita.


.
.
.
D8 = 8 decil separa a seqncia ordenada deixando 80% dos valores a sua esquerda e

20% dos valores a sua direita.


D9 = 9 decil separa a seqncia ordenada deixando 90% dos valores a sua esquerda e

10% dos valores a sua direita.


!---!---!---!---!---!---!---!---!---!---!
D1 D2 D3 D4 D5 D6 D7 D8 D9

Clculo do DECIL
o mesmo clculo de mediana sendo que

f
n
deve ser substitudo por k i , onde k
2
10

o nmero de ordem do decil.


k fi

Dk l *

10

Fant .h *

*
f

Exemplo: Considerando a tabela de distribuio de freqncia por intervalo de classe,


calcule D3.
fi 3 40 12 (classe 2)
k
10
10
12 4. 4 154 3,555 157,55
D 2 154
9

27

Exerccio: Uma empresa de aviao observou em seus registros recentes, o tempo de


mo-de-obra gasto na reviso completa de um motor de jato. O seguinte quadro foi
obtido. Calcule o decil de ordem 3.
Resposta: 9,44

PERCENTIS ou CENTIL: So valores de uma srie que a dividem em 100 partes


iguais. Cada parte ficar com 1% dos elementos da srie. Assim temos:
P1 = 1 percentil: separa a seqncia ordenada deixando 1% dos valores a sua esquerda e

99% dos valores a sua direita.


P2 = 2 percentil: separa a seqncia ordenada deixando 2% dos valores a sua esquerda e

98% dos valores a sua direita.


P3 = 3 percentil: separa a seqncia ordenada deixando 3% dos valores a sua esquerda e

97% dos valores a sua direita.


.
.
P98 = 98 percentil: separa a seqncia ordenada deixando 98% dos valores a sua

esquerda e 2% dos valores a sua direita.


P99 = 99 percentil: separa a seqncia ordenada deixando 99% dos valores a sua

esquerda e 1% dos valores a sua direita.


!---!---!---!---!---!---!---!---!---!---!
P10 P20 P30 P40 P50 P60 P70 P80 P90

Clculo do PERCENTIL
o mesmo clculo de mediana sendo que

f
n
deve ser substitudo por k i , onde k
2
100

o nmero de ordem do percentil.


k fi

Pk l *

Fant .h *
100

*
f

28

Exemplo: Considerando a tabela de distribuio de freqncia por intervalo de classe,


calcule P8.

f
100

40
3,2
100

(classe 1)

P8 150

3,2 0. 4 153,2
4

Podemos notar que os quartis, quintis e decis podem ser expressos em termos dos
precentis.
Q1=P25
Q2=P50
Q3=P75

K1=P20
K2=P40
K3=P60
K4=P80

D1=P10
D2=P20
D3=P30
D4=P40
D5=P50
D6=P60
D7=P70
D8=P80
D9=P90

29

CAPITULO 5:
MEDIDAS DE DISPERSO OU VARIABILIDADE
As medidas de disperso ou variabilidade servem para avaliar o quanto os dados so
semelhantes, descreve ento o quanto os dados distam do valor central.
Dessas medidas, estudaremos as seguintes:
- Medidas de variao absoluta: Amplitude total, Varincia e o Desvio Padro.
- Medidas de variao relativa: Coeficiente de Variao.
(1) MEDIDAS DE VARIAO ABSOLUTA
Amplitude Total: a diferena entre o maior e o menor valor observado. Tem o
inconveniente de s levar em conta os dois valores extremos da srie, no levando em
considerao os valores intermedirios. Ela apenas uma indicao aproximada da
disperso ou variabilidade.
AT = L (Max) l (min)
Varincia e Desvio Padro: A varincia e o desvio padro so medidas que levam em
considerao a totalidade dos valores da varivel em estudo, o que faz delas ndices de
variabilidade bastante estveis e, por isso mesmo, os mais geralmente empregados.
Clculo da Varincia ( x ): A varincia a mdia aritmtica do quadrado dos desvios
2

(em relao mdia).


n

(2x )

(x
i 1

x)

(2x )

ou

(x
i 1

x)2 fi

f
i 1

Etapas do clculo da Varincia:


1. - Calcular a mdia aritmtica X
2. - Subtrair a mdia X de cada valor x i do conjunto xi x , o que chamamos de
desvio;
2
3. - Elevar cada desvio ao quadrado ( x i x )
4. - Somar os quadrados dos desvios

xi
i 1

5. - Dividir a soma por (n-1) quando se tratar de dados amostrais, ou simplesmente por
n se os dados representam todos os valores de uma populao.

30

Sendo a varincia calculada a partir dos quadrados dos desvios, ela um nmero em
unidade quadrada em relao varivel em questo, o que, sob o ponto de vista prtico,
um inconveniente.
Por isso mesmo, imaginou-se uma nova medida que tem a interpretao prtica,
denominada desvio padro, definida como a raiz quadrada da varincia.
Desvio Padro: ( x ) x2
Observao:
(1) O desvio padro sempre ser positivo!
(2) O desvio padro de uma srie indica o quanto os dados esto afastados da mdia e,
que se os dados so iguais, o valor da medida zero.
Exemplo 7: Em uma turma de aluno, verificaram-se atravs da anlise das notas de 15
alunos (amostra), os seguintes desempenhos:
Alunos

Conceito na Prova

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Total
Mdia
Desvio Padro

4,3
4,5
9
6
8
6,7
7,5
10
7,5
6,3
8
5,5
9,7
9,3
7,5
109,8
7,32
1,77

Xi X

9,1204
7,9524
2,8224
1,7424
0,4624
0,3844
0,0324
7,1824
0,0324
1,0404
0,4624
3,3124
5,6644
3,9204
0,0324
44,16
3,155

Xi X
i 1
Varincia
n

31

Observamos no exemplo, que a mdia das provas, foi estimada em 7,32 com desvio
padro em 1,77. Conclumos que a maioria das notas concentrou-se em 9,09 e 5,55.
Exerccio: Calcular a mdia aritmtica e o desvio padro dos seguintes dados relativos
dosagem de hemoglobina verificada numa amostra de 12 animais bovinos (mg).
15

14

13

11

Resp.: Mdia = 13,083mg

13

14

13,5

Varincia = 3,583mg2

12

16

14,5

12

Desvio padro = 1,892mg

(2) MEDIDAS DE VARIAO RELATIVA


O coeficiente de variao: CV ( x)

( x)
. a razo entre o desvio padro e a mdia
x

aritmtica da srie dos dados. Pode ser expresso em percentual

. Usado

para comparar a variabilidade de diferentes grupos de dados.

Exerccio: Os dados abaixo referem-se as medidas da altura de parafusos e do dimetro


de rolamentos. Determine o coeficiente de variao, para verificar em relao a qual
medida (parafuso ou rolamento) a variabilidade maior, sabendo-se que o desvio padro
dos parafusos de 0,46 cm e dos rolamentos de 0,27 cm?
Parafusos (cm)
Rolamentos (cm)

10,2
2,2

10,6
2,5

9,8
1,8

10,0
1,9

9,8
2,0

10,4
1,7

9,2
1,9

Resposta: CVp = 4,6 e CVr = 13,5. Os rolamentos apresentam maior variabilidade.

32

CAPITLO 6:
EXPERIMENTO ALEATRIO,
PROBABILIDADE.

ESPAO

AMOSTRAL,

EVENTOS

DEFINIES:
EXPERIMENTO ALEATRIO:

So aqueles que, mesmo repetidos vrias vezes sob

condies semelhantes, apresentam resultados imprevisveis.


Ex.: Em uma jogada de futebol, provvel que seu time: perca; que ele ganha; que ele
empate.
ESPAO AMOSTRAL (S): Cada experimento aleatrio corresponde, em geral, a vrios
resultados possveis. O conjunto desses resultados possveis recebe o nome de espao
amostral ou conjunto universo, representado por S.
Exemplo: Lanamento de uma moeda: S = {Ca, Co}
Lanamento de um dado: S={1, 2, 3, 4, 5, 6}
Cada um dos elementos de S que correspondem a um resultado recebe o nome de
PONTO AMOSTRAL, por exemplo, 2

a S => 2 um ponto amostral de S (no caso do

lanamento do dado).
EVENTOS (A): Chamamos de evento qualquer subconjunto do espao amostral S de um
experimento aleatrio.
Exemplo: Lanamento de um dado:
Espao amostral: S={1, 2, 3, 4, 5, 6}
Eventos:
a) Obter um nmero par na face superior:
A={2, 4, 6} => A S , logo, A um evento de S.

33

Seja S o seu espao amostral. Se todos os elementos de S tem a mesma chance de


acontecer, ento, chamamos de PROBABILIDADE DE UM EVENTO A, A S , o
nmero real P(A), tal que:
P ( A)

n ( A)
n( S ) , onde n(A) o nmero de elementos de A e n(S) o nmero de

elementos de S.

Exemplos: Considere o lanamento de uma moeda e o evento A obter cara.


S= {Ca, Co}

n(S) = 2

A = {Ca}

n(A) = 1

1
2

P(A) =

EVENTOS COMPLEMENTARES
Exemplo: Pesquisa afirma que de um grupo de 100 pacientes fumantes aparecem as
seguintes evidncias1.
Eventos (evidncias): e1 = Normal; e2 = Bronquite; e3 = Cncer no Pulmo;
e4 = Tuberculose
Espao Amostral: = {Normal; Bronquite; Cncer no Pulmo; Tuberculose}
Evidncias

Normal

Bronquite

Cncer no Pulmo

Tuberculose

N de Pacientes

25

60

10

Se a probabilidade de um paciente apresentar tuberculose de 0,05. Ento se abordarmos


um paciente, ao acaso, qual a probabilidade de que ele tenha tuberculose ausente.
Resoluo:
e4: paciente tem tuberculose: P(e 4 )
Como: P(e 4 ) P (e 4 ) 1

5
0,05
100

Ento, P(e 4 ) 1 P(e 4 ) 1 0,05 0,95 onde e4

significa: paciente tem tuberculose ausente.


Assim, a chance de abordarmos um paciente que tem tuberculose ausente 95%.

Considere estas evidncias as mais comuns entre pacientes. Suponha tambm que as evidncias acima
sejam exclusivas.

34

EVENTOS MUTUAMENTE EXCLUSIVOS


Se os mesmos elementos no podem ocorrer simultaneamente.
P(AB) = P(A) + P(B), a probabilidade de que um ou outro se realize igual a soma das
probabilidades.
Exemplo: Considerando os dados do exemplo (1).
Evidncias

Normal

Bronquite

Cncer no Pulmo

Tuberculose

N de Pacientes

25

60

10

Se abordarmos um paciente, ao acaso, qual a probabilidade de que ele tenha cncer de


pulmo ou tuberculose?
Resoluo: P(e3 e4 ) P(e3 ) P(e 4 )

10
5
15

0,15
100 100 100

EVENTOS QUE NO SO MUTUAMENTE EXCLUSIVOS


P(AB) = P(A) + P(B) - P(AB)
De um grupo de 80 pessoas considere:
SITUAO
EMPREGATCIA
Empregada
Desempregada
Total

SITUAO ESCOLAR
At o Nvel Mdio
10
15
25

Nvel Superior
35
20
55

Total
45
35
80

A probabilidade de uma pessoa estar desempregada ou ter nvel superior.


Resoluo:
P ( D S ) P ( D) P ( S ) P ( D S )

35 55 20 70

0,8750
80 80 80 80

EVENTOS INDEPENDENTES
Dois eventos so independentes quando a ocorrncia ou a no ocorrncia de um evento
no tem efeito algum na probabilidade de ocorrncia do outro evento. Quando lanamos
dois dados, o resultado obtido em um deles independe do resultado obtido no outro.
P(A e B) = P(AB) = P(A)P(B)
35

Exemplo: Se dois por cento da populao apresenta esquizofrenia. A probabilidade de se


encontrar duas pessoas com esquizofrenia ausente :
Resoluo:
P ( Esquizofrenia Esquizofre nia ) P ( Esquizofrenia ) P ( Esquizofrenia ) 0,98 0,98 0,9604

Ou seja, a chance de ambos apresentarem esquizofrenia de 96,04%.


EVENTOS DEPENDENTES
Quando dois eventos so dependentes, o conceito de probabilidade condicional
empregado para indicar a probabilidade de ocorrncia de um evento relacionado. A
expresso P(B/A) indica a probabilidade de ocorrer o evento B, dado que tenha ocorrido
o evento A. Note que B/A no uma frao.
P(B/A) =

P ( BeA) P ( B A)
=
P ( A)
P ( A)

Exemplo: Em um grupo de 50 turistas temos as seguintes variveis descritas abaixo:


NACIONALIDADE
Brasileiro (B)
Estrangeiro (E)
Total

SEXO
M
20
5
25

F
15
10
25

Total
35
15
50

Calcule as seguintes probabilidades:


a) O turista ser masculino se brasileiro.

e) O turista ser brasileiro se masculino.

20
P( M / B)
0,5714
35

P( B / M )

b) O turista ser masculino se estrangeiro.


P(M / E )
(0,3333)
c) O turista ser feminino se brasileiro.

f) O turista ser estrangeiro se masculino.


P( E / M )
(0,20)
g) O turista ser brasileiro se feminino.

P (F / B)

15
0,4286
35

d) O turista ser feminino se estrangeiro.


P( F / E )
(0,6667)

P (B / F)

20
0,80
25

15
0,60
25

h) O turista ser estrangeiro se feminino.


P( E / F )

(0,40)

36

EXERCCIO DE FIXAO
1) Qual a probabilidade de sair s de ouros quanto retiramos uma carta de um
baralho de 52 cartas?
2) Qual a probabilidade de sair um rei quanto retiramos uma carta de um baralho de
52 cartas?
3) Um lote de 12 peas, 4 so defeituosas. Sendo retirada uma pea, calcule?
a- A probabilidade de essa pea ser defeituosa:
b- A probabilidade de essa pea no ser defeituosa:
4) No lanamento de dois dados, calcule a probabilidade de se obter soma igual a 5.
5) De dois baralhos de 52 cartas retiram-se, simultaneamente, uma carta do primeiro
baralho e uma carta do segundo baralho. Qual a probabilidade de a carta do
primeiro baralho ser um rei e a do segundo baralho ser o 5 de paus?
6) Uma urna A contm: 3 bolas brancas, 4 pretas, 2 verdes; Uma urna B contm: 5
bolas brancas, 2 pretas, 1 verde; Uma urna C contm: 2 bolas brancas, 3 pretas e 4
verdes. Uma bola retirada de cada urna. Qual a probabilidade de as 3 bolas
retiradas da primeira, segunda e terceira urnas serem, respectivamente, branca,
preta e verde?
7) De um baralho de 52 cartas retiram-se, ao acaso, duas cartas sem reposio. Qual
a probabilidade de a primeira carta ser o s de paus e a segunda ser o rei de paus?
8) Qual a probabilidade de sair uma figura quando retiramos uma carta de um
baralho de 52 cartas?
9) Qual a probabilidade de sair uma carta de copas ou de ouros quando retiramos
uma carta de um baralho de 52 cartas?
10) No lanamento de um dado, qual a probabilidade de se obter um nmero no
inferior a 5?

37

GABARITO
1.

A = sair s de ouros

2.

A = sair rei

P(A)=1/52
P(A)=4/52

3.
a) A= a pea ser defeituosa

P(A)=4/12

b) B=a pea ser perfeita

P(B)=8/12

4.

A= a soma ser 5

A={(1,4), (2,3), (3,2), (4,1)}

5.

A= sair rei

P(A) = 4/36

B= sair 5 de paus
P(A E B) = P(A)x P(B) = 4/52 x 1/52 = 4/2704
6.
A= 3 bolas retiradas da primeira, segunda e terceira urnas serem, respectivamente,
branca, preta e verde
P(A)=3/9x 2/8 x 4/9 = 24/648
7.

C= sair s de paus e reis de paus


P(C1 e C2)= P(C1). P(C2/C1) = 1/52 x 1/51 = 1/2652

8.
Figuras = valete, dama e rei
A= sair uma figura
P(A) = 12/52
9.

A= sair copas ou ouros

P(A)=13/52 + 13/52 = 26/52

10.

A= nmero maior que 5

P(A)=1/6

38

CAPTULO 07
DISTRIBUIO DE PROBABILIDADE
Quando conhecemos todos os valores de uma varivel aleatria juntamente com suas
respectivas probabilidade, temos uma distribuio de probabilidade.
Exemplo: Distribuio de probabilidade no nmero de acidentes areos com a GOL,
dentre sete acidentes.

A probabilidade de 0 acidentes com


a GOL (dentre sete acidentes)
0,210;

Os
valores
denotados
0+
representam probabilidades muito
pequenas;

A representao grfica de uma DISTRIBUIO DE PROBABILIDADES feita


atravs do HISTOGRAMA DE PROBABILIDADES, semelhantes ao HISTOGRAMA
DE FREQNCIA, sendo que a escala vertical apresenta probabilidades, em lugar das
correspondentes freqncias.
Condies para uma DISTRIBUIO DE PROBABILIDADE:
1) A soma de todas as probabilidades individuais 1:

p x 1

2) Para qualquer evento A implica que p(x) deve estar entre 0 e 1 para qualquer valor de
x: 0 P ( x) 1
MDIA DE UMA DISTRIBUIO DE PROBABILIDADE
n

E X xi p xi
i 1

VARINCIA DE UMA DISTRIBUIO DE PROBABILIDADE


n

VAR X 2 xi E X p xi
2

i 1

39

EXERCCIO DE FIXAO
1) Determine se dada uma distribuio de probabilidade. Nos casos em que no
descrita uma distribuio de probabilidade, identifique a condio que no satisfeita. E
quando for descrita uma distribuio de probabilidade, determine sua mdia e desvio
padro.
a) Se sua faculdade contrata os 4 prximos funcionrios sem distino de sexo e o
conjunto de candidatos grande, com nmeros iguais de homens e mulheres, a
tabela a seguir d a distribuio de probabilidade do nmero x de mulheres
contratadas.

Resposta: 2 e 1
b) Ao avaliar riscos de crdito, Jefferson investiga o nmero de cartes de crdito
que a pessoa tem. Com x sendo o nmero de cartes de crdito que os adultos
possuem a tabela a seguir d a distribuio de probabilidade para um conjunto de
solicitantes.

Resposta: 2,8 e 2,52


2)Seja X uma varivel aleatria discreta assumido valores no conjunto {1, 2, 3} e com
distribuio de probabilidade dada por:

a. Calcule a mdia de X. (resposta: 2,165)


b. Calcule a ( P x 2 (resposta: 0,666)
c. Calcule a ( P x 2 (resposta: 0,5)
3)O tempo T, em minutos, necessrio para um operrio processar certa pea uma
varivel aleatria com a seguinte distribuio de probabilidade:

Calcule o tempo mdio de processamento.

Resposta: 4,6 minutos

DISTRIBUIES ESTATSTICAS: DISCRETA E CONTNUA


40

(1) DISTRIBUIO BINOMIAL (discreta)


Vimos que uma varivel aleatria associa um valor numrico a cada resultado de um
experimento aleatrio e uma distribuio de probabilidade associa uma probabilidade a
cada valor de uma varivel aleatria.
Veremos agora como determinar as probabilidades para uma categoria importante de
distribuio de probabilidades: OS EXPERIMENTOS BINOMIAIS.
Os experimentos binomiais tm a caracterstica de apresentarem exatamente dois
resultados complementares: SUCESSO E FRACASSO.
Exemplo: Em processos industriais: as peas falham ou no falham.
Na medicina: um paciente sobrevive ou morre.
Em propaganda, um consumidor reconhece um produto ou no.
Definio:
Um experimento binomial um experimento que satisfaz as seguintes condies:
1. O experimento deve comportar um nmero fixo de provas (n).
2. As provas devem ser independentes (o resultado de qualquer prova no afeta
as probabilidades das outras provas.)
3. Cada prova deve ter todos os resultados classificados em duas categorias
(sucesso e fracasso).
4. As probabilidades devem permanecer constantes para cada prova.
Quando fazemos um experimento binomial, a distribuio da varivel aleatria x
chamada uma DISTRIBUIO BINOMIAL.

41

Notao:
p => probabilidade de sucesso
q => probabilidade de fracasso
x => denota um nmero especfico de sucessos em n provas, podendo ser qualquer inteiro
entre 0 e n, inclusive.
P(x) => denota a probabilidade de obter exatamente x sucessos em n provas.
Parmetros da Distribuio Binomial: X ~ B (n, p )
Clculo da Probabilidade de uma Distribuio Binomial:
P X x ( nx ). p x .(1 p ) n x
P X x ( nx ). p x .(1 p ) n x C n , x . p x .(1 p ) n x

n!
. p x .q n x
(n x)! x!

Para x = 0, 1, 2, .....,n
Mdia de uma Distribuio Binomial: E(x) = np
Varincia da Distribuio Binomial: V(x) = npq
Obs.: lembrando que 0! = 1 (por definio)
Exerccio:
1) Aplicando a frmula da probabilidade binomial, determine a probabilidade de
obter 3 estudantes canhotos em uma turma de 15 estudantes, dado que 10% da
populao so canhotos. Isto determine P(3), se n=15, x=3, p=0,1 e 1=0,9.
Resposta: 0,1285

42

EXERCCIO DE FIXAO
1) Suponha que em um experimento binomial, uma prova se repita n vezes.
Determine a probabilidade de x sucessos, dada a probabilidade p de sucesso em
uma prova:
Respostas:
a) n = 3, x= 2, p=0,9
(0,243)
b) n=8, x=7, p=0,99
(0,0745)
c) n=10, x=4, p=0,30
(0,2001)
d) n=6, x=1, p=0,05
(0,2321)
2) Uma firma afirma que 20% de suas pastilhas de chocolate M&M so vermelhas.
Determine a probabilidade de que, em 15 pastilhas M&M escolhidas
aleatoriamente, exatamente 20%, ou seja, 3 pastilhas sejam vermelhas.
Resposta: 0,250
3) Acredita-se que 20% dos moradores das proximidades de uma grande indstria
siderrgica tm alergia aos poluentes lanados ao ar. Admitindo que este
percentual de alrgicos real (correto), calcule a probabilidade de que pelo menos
4 moradores tenham alergia entre 13 selecionados ao acaso.
Resposta: 0,252
4) Trs em cada quatro alunos de uma universidade fizeram cursinho antes de prestar
vestibular. Se 16 alunos so selecionados ao acaso, qual a probabilidade de que:
Respostas
a) Pelo menos 12 tenham feito cursinho?
(0,6302)
b) No mximo 13 tenham feito cursinho?
(0,8029)
c) Exatamente 12 tenham feito cursinho?
(0,2252)

43

44

45

46

47

(2) DISTRIBUIO NORMAL OU GAUSS (contnua)


Se X uma varivel aleatria contnua, ento X assume todos os valores em um intervalo
de nmeros reais ().
- A distribuio de probabilidade de X descrita por uma curva de densidade, ou funo
de densidade.
f x

.e

1 x

(Pi): ( 3,14159)
e: ( 2,71828).
- A probabilidade de qualquer evento a rea sob a curva de densidade entre os valores
de X que compe o evento.
- A rea total sob qualquer curva de densidade 1, de modo que a probabilidade de um
evento varia entre 0 e 1.
- Parmetros da Distribuio Normal X ~ N ( , 2 )
Mdia da Distribuio Normal: E(X) =
Varincia da Distribuio Normal: VAR(X) = 2
Algumas propriedades da Distribuio Normal:
P(X=x) = f(X) = 0 (pois no existe a probabilidade no ponto e sim na rea)
f(X) simtrica ao redor da mdia, ou seja, a probabilidade de ocorrer valor
menor do que a mdia igual a probabilidade de ocorrer valor menor do que a
mdia.
A curva normal depende de duas constantes, e 2:
- corresponde ao centro da simetria da curva e 2 graficamente, fornece a
distncia do centro da simetria aos pontos onde a curva muda de sentido.

48

Distribuio Normal Padro:


Na prtica desejamos calcular probabilidades para diferentes valores de e
a varivel

. Para isso,

cuja distribuio X ~ N ( , 2 ) transformada numa forma padronizada

com distribuio X ~ N (0,1) (distribuio normal padro), pois tal distribuio


tabelada. A quantidade
Z

dada por:

Exemplo:
1) Se j X a varivel aleatria que representa os dimetros dos parafusos produzidos por
certa mquina. Suponha que essa varivel tenha Distribuio Normal com mdia 2cm e
desvio padro 0,04cm.
a) A probabilidade de um parafuso ter um dimetro com valor entre 2 e 2,05 :
P (2 X 2,05) P (

2 2 X 2,05 2

) P(0 Z 1,25) 0,3944


0,04

0,04

b) P(-1,25<Z<0) =
c) P(0,8<Z<1,23) =
d) P(Z>0,6) =
Obs.: Quando temos uma varivel aleatria com distribuio Normal, nosso principal
interesse obter a probabilidade de essa varivel aleatria assumir um valor em um
determinado intervalo.

49

Tabela: Probabilidades da Distribuio Normal

0,00

0,01

0,02

0,03

0,04

0,05

0,06

0,07

0,08

0,09

0,0

0,000000

0,003989

0,007978

0,011966

0,015953

0,019939

0,023922

0,027903

0,031881

0,035856

0,1

0,039828

0,043795

0,047758

0,051717

0,055670

0,059618

0,063559

0,067495

0,071424

0,075345

0,2

0,079260

0,083166

0,087064

0,090954

0,094835

0,098706

0,102568

0,106420

0,110261

0,114092

0,3

0,117911

0,121720

0,125516

0,129300

0,133072

0,136831

0,140576

0,144309

0,148027

0,151732

0,4

0,155422

0,159097

0,162757

0,166402

0,170031

0,173645

0,177242

0,180822

0,184386

0,187933

0,5

0,191462

0,194974

0,198468

0,201944

0,205401

0,208840

0,212260

0,215661

0,219043

0,222405

0,6

0,225747

0,229069

0,232371

0,235653

0,238914

0,242154

0,245373

0,248571

0,251748

0,254903

0,7

0,258036

0,261148

0,264238

0,267305

0,270350

0,273373

0,276373

0,279350

0,282305

0,285236

0,8

0,288145

0,291030

0,293892

0,296731

0,299546

0,302337

0,305105

0,307850

0,310570

0,313267

0,9

0,315940

0,318589

0,321214

0,323814

0,326391

0,328944

0,331472

0,333977

0,336457

0,338913

1,0

0,341345

0,343752

0,346136

0,348495

0,350830

0,353141

0,355428

0,357690

0,359929

0,362143

1,1

0,364334

0,366500

0,368643

0,370762

0,372857

0,374928

0,376976

0,379000

0,381000

0,382977

1,2

0,384930

0,386861

0,388768

0,390651

0,392512

0,394350

0,396165

0,397958

0,399727

0,401475

1,3

0,403200

0,404902

0,406582

0,408241

0,409877

0,411492

0,413085

0,414657

0,416207

0,417736

1,4

0,419243

0,420730

0,422196

0,423641

0,425066

0,426471

0,427855

0,429219

0,430563

0,431888

1,5

0,433193

0,434478

0,435745

0,436992

0,438220

0,439429

0,440620

0,441792

0,442947

0,444083

1,6

0,445201

0,446301

0,447384

0,448449

0,449497

0,450529

0,451543

0,452540

0,453521

0,454486

1,7

0,455435

0,456367

0,457284

0,458185

0,459070

0,459941

0,460796

0,461636

0,462462

0,463273

1,8

0,464070

0,464852

0,465620

0,466375

0,467116

0,467843

0,468557

0,469258

0,469946

0,470621

1,9

0,471283

0,471933

0,472571

0,473197

0,473810

0,474412

0,475002

0,475581

0,476148

0,476705

2,0

0,477250

0,477784

0,478308

0,478822

0,479325

0,479818

0,480301

0,480774

0,481237

0,481691

2,1

0,482136

0,482571

0,482997

0,483414

0,483823

0,484222

0,484614

0,484997

0,485371

0,485738

2,2

0,486097

0,486447

0,486791

0,487126

0,487455

0,487776

0,488089

0,488396

0,488696

0,488989

2,3

0,489276

0,489556

0,489830

0,490097

0,490358

0,490613

0,490863

0,491106

0,491344

0,491576

2,4

0,491802

0,492024

0,492240

0,492451

0,492656

0,492857

0,493053

0,493244

0,493431

0,493613

2,5

0,493790

0,493963

0,494132

0,494297

0,494457

0,494614

0,494766

0,494915

0,495060

0,495201

2,6

0,495339

0,495473

0,495604

0,495731

0,495855

0,495975

0,496093

0,496207

0,496319

0,496427

2,7

0,496533

0,496636

0,496736

0,496833

0,496928

0,497020

0,497110

0,497197

0,497282

0,497365

2,8

0,497445

0,497523

0,497599

0,497673

0,497744

0,497814

0,497882

0,497948

0,498012

0,498074

2,9

0,498134

0,498193

0,498250

0,498305

0,498359

0,498411

0,498462

0,498511

0,498559

0,498605

3,0

0,498650

0,498694

0,498736

0,498777

0,498817

0,498856

0,498893

0,498930

0,498965

0,498999

3,1

0,499032

0,499065

0,499096

0,499126

0,499155

0,499184

0,499211

0,499238

0,499264

0,499289

3,2

0,499313

0,499336

0,499359

0,499381

0,499402

0,499423

0,499443

0,499462

0,499481

0,499499

3,3

0,499517

0,499534

0,499550

0,499566

0,499581

0,499596

0,499610

0,499624

0,499638

0,499651

3,4

0,499663

0,499675

0,499687

0,499698

0,499709

0,499720

0,499730

0,499740

0,499749

0,499758

3,5

0,499767

0,499776

0,499784

0,499792

0,499800

0,499807

0,499815

0,499822

0,499828

0,499835

3,6

0,499841

0,499847

0,499853

0,499858

0,499864

0,499869

0,499874

0,499879

0,499883

0,499888

3,7

0,499892

0,499896

0,499900

0,499904

0,499908

0,499912

0,499915

0,499918

0,499922

0,499925

3,8

0,499928

0,499931

0,499933

0,499936

0,499938

0,499941

0,499943

0,499946

0,499948

0,499950

3,9

0,499952

0,499954

0,499956

0,499958

0,499959

0,499961

0,499963

0,499964

0,499966

0,499967

4,0

0,499968

0,499970

0,499971

0,499972

0,499973

0,499974

0,499975

0,499976

0,499977

0,499978

50

EXERCCIO DE FIXAO
1) Determinar o valor, ou valores, de z em cada um dos casos, nos quais as reas
referem-se s limitadas pela curva normal:
Resposta:
a) a rea entre 0 e z 0,3770
(z= 1,16)
b) a rea a esquerda de z 0,8621
(z=1,09)
2) O peso mdio de 500 estudantes do sexo masculino de uma determinada
universidade 75,5kg e o desvio padro de 7,5 kg. Admitindo-se que os pesos
esto distribudos normalmente, determinar quantos estudantes pesam:
Resposta
a) entre 60 e 77,5kg
(P(-2,06<z<0,266)=0,6 => 300 estudantes)
b) mais do que 92,5kg
(P(z>2,26)=0,0119 = > 6 estudantes)
3) A mdia dos dimetros internos de uma amostra de 200 arruelas produzidas por
certa mquina 0,502 polegadas e o desvio padro 0,005 polegadas. A
finalidade para a qual essas arruelas so fabricadas permite a tolerncia mxima,
para o dimetro, de 0,496 a 0,508 polegadas; se isso no se verifica, as arruelas
sero consideradas defeituosas. Determinar a porcentagem de arruelas defeituosas
produzidas pela mquina, admitindo-se que os dimetros so distribudos
normalmente.
Resposta: 23,02%
4) Se z normalmente distribuda, com mdia zero e varincia 1, determinar:
Resposta:
a) P(z>-1,64) =
(0,9495)
b) P(-1,96<z<1,96) =
(0,95)
c) P(0<z<1,44) =
(0,4251)
d) P(-0,85<z<0) =
(0,3023)
e) P(-1,48<z<2,05) =
(0,9104)
f)
P(0,72<z<1,86) =
(0,2044)

51

CAPITULO 8
INTRODUO
A REGRESSO e a CORRELAO so tcnicas utilizadas para estimar uma
relao que possa existir na populao, enquanto as tcnicas anteriormente estudadas
(Medidas de Tendncia Central e de Disperso: Mdia, Desvio Padro, Varincia, etc.)
servem para estimar um nico parmetro populacional.
A anlise de correlao e regresso compreende a anlise de dados amostrais para
saber se e como duas ou mais variveis esto relacionadas uma com a outra numa
populao.
A correlao mede a fora, ou grau, de relacionamento entre duas variveis; a
regresso d a equao que descreve o relacionamento em termos matemticos.
(1) CORRELAO
Definio: Quando duas variveis esto ligadas por uma relao estatstica, dizemos que
existe correlao entre elas.
Por exemplo:
- A circunferncia C e o raio r esto perfeitamente correlacionados, porque C 2 r.
- As variveis altura e peso de indivduos revelariam alguma correlao.
Diagrama de disperso: O diagrama de disperso um grfico onde pontos no espao
cartesiano XY so usados para representar simultaneamente os valores de duas variveis
quantitativas medidas em um conjunto de dados.

52

Por exemplo:
Um dos objetivos dos pesquisadores neste estudo encontrar uma maneira de conhecer o
peso do urso atravs de uma medida mais fcil de se obter do que a direta (carregar uma
balana para o meio da selva e colocar os ursos em cima dela) como, por exemplo, uma
medida de comprimento (altura, permetro do trax, etc.).
O problema estatstico aqui encontrar uma varivel que tenha uma relao forte com o
peso, de modo que, a partir de seu valor medido, possa ser calculado (estimado) o valor
peso indiretamente, atravs de uma equao matemtica.
O primeiro passo para encontrar esta varivel fazer o diagrama de disperso das
variveis candidatas (eixo horizontal) versus o peso (eixo vertical), usando os pares de
informaes de todos os ursos. Voc pode tentar as variveis: idade, altura, comprimento
da cabea, largura da cabea, permetro do pescoo e permetro do trax.
A Figura mostra a relao entre peso e altura e entre peso e permetro do trax.

Analisando o grfico:
1) Podemos ver que, tanto a altura quanto o permetro do trax so fortemente associados
ao peso do urso, no sentido de que quanto mais alto o urso ou quanto maior a medida de
seu trax, mais pesado ele ser.
2) Note que este crescimento linear para o permetro do trax e no-linear para a altura.
3) Os pontos esto mais dispersos no grfico da altura, a varivel mais adequada para
estimar o peso o permetro do trax.

53

Observao: A correlao entre duas variveis pode ser POSITIVA, NULA ou


NEGATIVA.

Grfico 1

(+)

Grfico 2 (-)

Grfico 3 (nula)
Clculo do Coeficiente de Correlao Linear de Pearson
Definio: Dado n pares de valores (x1, y1), (x2, y2), ..., (xn, yn), o coeficiente entre as
duas variveis X e Y dado pela mdia dos valores dos produtos padronizados das
variveis.

n x i y i x i y i

n x

2
i

x i n y i y i
2

Indica o grau de intensidade entre duas variveis e ainda o sentido dessa correlao
(positivo ou negativo).
S deve ser utilizado com variveis contnuas.
A partir dos valores de r, podemos verificar o tipo da correlao existente entre as
variveis estudadas, conforme tabela seguinte:
Valor de r
0,0
0,0 ----| 0,3
0,3 ----| 0,6
0,6 ----| 0,9
0,9 ----| 0,99
1,0

Correlao
Nula
Fraca
Media
Forte
Fortssima
Perfeita

54

Exemplo: Considerando uma amostra aleatria, formada por dez dos 98 alunos de uma
classe da faculdade A e pelas notas obtidas por eles em Matemtica e Estatstica:

Calcule o coeficiente de correlao e interprete seu valor.

10 x 473 65 x 65
(10 x 481 65 )(10 x 475 65 )
2

4730 4225
(4810 4225)(4750 4225)

505
585 x525

505
0,911
554,18

Concluso: O resultado nos indica uma correlao linear positiva altamente significativa
entre as duas variveis.
Se o relacionamento entre X e Y for consistente e necessitamos fazer uma predio para o
valor de Y, conhecido um valor de X, atravs de uma formula matemtica adequada,
podemos aplicar a chamada ANLISE DE REGRESSO SIMPLES.

55

EXERCCIO DE FIXAO
1) Observou-se que o volume mensal de lixo gerado em uma cidade, em funo do
nmero de dormitrios das residncias, o seguinte (em m3):
No Dormitrios
Volume de lixo

1
2
0,15 0,29

3
0,45

4
0,57

a) Calcular o coeficiente de correlao de Pearson. (0,9986)


2) A funo de demanda de um produto est representada na tabela abaixo:
Preo (R$)
56,00
Demanda (un.) 100

60,00 63,00 68,00 74,00


93
87
81
75

a) Calcular o coeficiente de correlao de Pearson.

(-0,983)

3) Os gastos com propaganda e o respectivo volume de vendas gerado, de um certo


produto, so dados abaixo:
Gastos com propaganda (em
milhares de R$)
Volume de vendas (em milhares de
R$)

20

40

1.110 1.250

a) Calcular o coeficiente de correlao de Pearson.

10

100

70

1.000

1950

1600

(0,9969)

56

(2) REGRESSO
Objetivo: A regresso linear simples constitui uma tentativa de estabelecer uma equao
matemtica linear (linha reta) que descreva o relacionamento entre duas variveis.
Para obter uma reta de regresso, n pares de observaes das variveis so utilizados.
Considerando Y como a varivel dependente ou varivel resposta e, X como a varivel
independente ou preditora, a reta de regresso dada por:
Y = + X + u
o coeficiente linear (intercepto), ou seja, o ponto onde a reta corta o eixo Y;
o coeficiente angular, ou seja, determina a inclinao da reta.

Graficamente:

+ X + u
+ X

X+1

u representa o incremento em Y quando X aumenta em uma unidade;


ESTIMADORES DE E PARA O MODELO DE REGRESSO LINEAR
Os valores de a e b sero determinados, atravs do Mtodo dos Mnimos Quadrados
(MMQ). O objetivo encontrar a e b tal que a soma dos erros quadrticos mdios seja o
menor possvel.

57

O erro determinado por:


ei yi y i

tal que

ei yi (a bxi )

Os valores de a e b so encontrados atravs da seguinte frmula:


n

x y
i 1
n

x
i 1

2
i

nx y
a y bx

nx

importante observar que:


- b mede a variao que ocorre em Y por unidade de variao de X.

- Quando no houver relao entre X e Y teremos Y Y , pois b=0


- Quando as relaes entre X e Y forem proporcionais, a reta passa na origem e

a = 0, logo Y bX
Exemplo:
1) Um laboratrio est interessado em medir o efeito da temperatura sobre a potncia de
um antibitico. Dez amostras de 50 gramas cada foram guardadas a diferentes
temperaturas, e aps 15 dias, mediu-se a potncia. Os resultados esto no quadro abaixo.

Temperatura
Potncia

30
38

36
43

50
32

54
26

60
33

73
19

78
27

82
23

91
14

95
21

r 0,882

Podemos concluir que o grfico se trata de uma correlao retilnea, de modo a permitir o
ajustamento de uma reta, imagem da funo Y = + X + u. (se no houvesse uma
correlao significativa, nossa melhor predio da potncia do antibitico seria
y 27,6 ).

58

Ento, precisamos calcular os valores dos parmetros da equao Y bX que uma

estimativa da verdadeira equao da reta de regresso, onde Y o estimado.


Identificao das variveis:
Varivel dependente: Potncia do antibitico
Varivel independente: Temperatura
Estimadores da reta de regresso:
n

x y
i 1
n

x
i 1

2
i

nx y

nx 2

16.320 (10)(64,9)(27,6) 1592,4

0,35114
4534,9
46.655 10(64,9) 2

(Coef. Linear)
a y bx 27,6 ( 0,35114 ) 64,9 50,389

(Coef. Angular ou Intercepto)

Logo,

Y 50,389 0,35114 X

Interpretao da reta de regresso: cada ponto da reta de regresso fornece uma


estimativa do valor mdio ou esperado de Y correspondente ao valor X escolhido; O valor
b =-0,35114, que mede a declividade da reta, mostra que, dento da escala da amostra de
X entre 30C e 95C, quando X aumenta em , digamos 1C, a potncia estimada do
antibitico diminui em 0,35C. O valor de a 50,389, que o intercepto da reta, indica o
nvel mdio da potncia do antibitico quando a temperatura zero.
Determinar a potncia do antibitico quando a exposio for de 65oC.

Y 50,389 0,35114 (65) 50,389 22,8141 27,5749

Exemplo 2: Um funcionrio de uma pista de corrida local gostaria de desenvolver um


modelo para prever a quantia apostada (em mil dlares) com base na freqncia do
pblico (por 100 apostadores). Aps realizar a reta de regresso, o funcionrio obteve os
resultados abaixo. Escreve a equao da reta e interprete-a:
Intercepto
Coef. Linear

Coeficiente
4,3424
0,0465

59

Resposta:
Y = varivel dependente = quantidade apostada
X = varivel independente = freqncia do pblico
A equao da reta ser:

Y a bX 4,3424 0,0465 X

Assim, o valor apostado quando a freqncia zero (0) de 4,3424 mil dlares.
Alm disso, para cada 100 pessoas a mais na pista o total apostado subir em 0,0465.
Uma importante funo de determinar a reta de regresso para duas variveis a
possibilidade de realizar previses, ou seja, uma vez que obtemos a reta de regresso,
podemos escolher um valor de interesse para a varivel independente (X) e determinar o
valor esperado para a varivel dependente (Y).

60

EXERCCIO DE FIXAO
1) Observou-se que o volume mensal de lixo gerado em uma cidade, em funo do
nmero de dormitrios das residncias, o seguinte (em m3):
No Dormitrios
Volume de lixo

1
2
0,15 0,29

3
0,45

4
0,57

a) Determinar a equao da reta de regresso.


(y = 0,142x + 0,01)
b) Estimar o volume de lixo para uma residncia com 5 dormitrios. (0,11082)
2) A funo de demanda de um produto est representada na tabela abaixo:
Preo (R$)
56,00
Demanda (un.) 100

60,00 63,00 68,00 74,00


93
87
81
75

c) Determinar a equao da reta de regresso.


d) Estimar a demanda se o preo for R$ 80,00.

(y = -1,3831x + 176)
(65,352)

3) Os gastos com propaganda e o respectivo volume de vendas gerado, de um certo


produto, so dados abaixo:
Gastos com propaganda (em
milhares de R$)
Volume de vendas (em milhares de
R$)

20

40

1.110 1.250

10

100

70

1.000

1950

1600

a)
b)

Determinar a equao da reta de regresso.


(v=10,496p+878,175)
Estimar o volume de vendas para um gasto de R$ 150,00 em propaganda.

c)

Caso no se faa nenhum investimento em propaganda, qual o volume de vendas


esperado?
(878,175)

d)

Se a expectativa de vendas for de R$ 1.500,00, quando se deve investir em


propaganda para esse produto?
(59,24)

(2.452,575)

61

r 2 : COEFICIENTE DE DETERMINAO
Uma das formas de determinar se o modelo encontrado satisfatrio para explicar
os dados calculando o COEFICIENTE DE DETERMINAO do modelo. Esse
coeficiente compara a variabilidade do modelo com a variabilidade total dos dados.
CLCULO DO r 2 :
n

r2

( y
i 1
n

(y
i 1

y) 2

y) 2

SQE
SQT

A variabilidade do modelo (variabilidade explicada ou soma dos quadrados


n

explicada) pode ser calculada como:

( y
i 1

y)2 .

A variabilidade total (soma dos quadrados total) pode ser calculada como:
n

(y
i 1

y) 2 .

62

Observao:
Exemplo 1: Calcular e interpretar o coeficiente de determinao R2 para os dados do
primeiro exerccio.
Temperatura
(X)
30
36
50
54
60
73
78
82
91
95

Potncia
(Y)
38
43
32
26
33
19
27
23
14
21

Valores
preditos ( y )
39.86
37.75
32.83
31.43
29.32
24.76
23.00
21.60
18.44
17.03
y

(y
i 1

i 1

( y i y ) 2

108.16
237.16
19.36
2.56
29.16
73.96
0.36
21.16
184.96
43.56

150.21
103.01
27.40
14.67
2.97
8.07
21.13
36.01
83.92
111.63

27,6

y) 2

720,4

y)2

559,02

( y

( yi y ) 2

R2

0,7759

Interpretao: o modelo Y 50,3892 0,3511 X explica 77,59% da variabilidade total


de Y. Em outras palavras, a variabilidade da potncia do antibitico 77,59% explicada
pela sua temperatura de armazenamento.

63

EXERCCIO DE FIXAO
Uma amostra de 5 ratos da raa Wistar foi obtida e suas idades (em dias) e pesos (em
gramas) so apresentados na tabela abaixo:
Idade (dias)
30
34
38
42
46

Peso mdio (gramas)


63,94
74,91
81,65
95,05
105,89

a. Esboce um diagrama de disperso para essas variveis.


b. Calcule o coeficiente de correlao de Pearson.
c. Com base nos itens (a) e (b), voc acha que h relao entre as duas variveis? Que
tipo de relao essa?
d. Deseja-se obter uma reta que explique o peso mdio dos ratos em funo das suas
idades. Qual deve ser a varivel independente e qual deve ser a varivel dependente?
e. Obtenha e interprete a reta de regresso.
f. Calcule o coeficiente de determinao para a reta obtida. Voc acha que o modelo se
ajusta bem aos dados observados? Por qu?
g. Qual o peso mdio, em gramas, para ratos com 32, 40, 43 e 49 dias?

64

Bibliografia
TRIOLA, Mrio F., Introduo ESTATSTICA - 7 Edio Rio de
Janeiro: LTC Livros Tcnicos e Cientficos Editora S.A.
CRESPO, Antnio Arnot, Estatstica Fcil 18 Edio So Paulo,
2002.

65

Você também pode gostar