Você está na página 1de 65

1

IFRJ INSTITUTO FEDERAL DE EDUCAO, CINCIA E TECNOLOGIA


PROFESSORA JANAINA PEREIRA
SETEMBRO DE 2009



CAPITULO 1

O que estatstica?

a cincia que fornece mtodos para coleta, organizao, descrio, anlise e
interpretao dos dados e para utilizao dos mesmos na tomada de decises.

A Estatstica trabalha com fenmenos coletivamente tpicos, isto , com fenmenos
ligados a coletividade e que podem ser repetidos.
Fenmenos determinsticos: J se conhece a priori o resultado.
Ex.: Preo total a pagar pela aquisio de uma determinada quantidade de um
produto.
Fenmeno aleatrio: Conhecemos todos os possveis resultados, mas no se sabe
o resultado concreto que ir acontecer.
Ex.: lanamento de um dado honesto.

A estatstica se divide em duas partes:

(1) ESTATSTICA DESCRITIVA: Responsvel pela coleta, organizao e descrio
dos dados observados.

(2) ESTATSTICA INDUTIVA OU INFERENCIAL: Responsvel pela anlise e
interpretao dos dados.

A estatstica trabalha com fenmenos de natureza aleatria, logo o clculo das
probabilidades essencial para o estudo da Estatstica indutiva.

Fases do mtodo estatstico:

- Coleta dos dados: Feito atravs de registros nascimento, casamento, bitos,
importao e exportao de mercadoria, banco de dados de empresas, questionrios,....

- Crtica dos dados: Para verificar possveis erros por parte dos informantes, por
distrao ou m interpretao das perguntas que lhe forem feitas.

- Exposio ou apresentao dos dados: Tabulao e grficos.

- Anlise dos resultados: Concluso sobre o todo (POPULAO) a partir de
informaes fornecidas por parte representativa do todo (AMOSTRA).

POPULAO: o conjunto de indivduos ou objetos que apresentam pelo menos uma
caracterstica comum.

AMOSTRA: um subconjunto finito de uma populao.
2
Exemplo: Digamos que a Secretaria Estadual de Educao queira pesquisar o grau de
satisfao dos alunos no que se refere qualidade da merenda escolar.

Populao: Alunos da rede estadual.
Amostra: Parte do total de alunos que representa o todo (populao).
Varivel em estudo: variveis que possam informar a satisfao dos alunos com a
merenda escolar.

As variveis podem ser QUANTITATIVAS ou QUALITATIVAS.

Qualitativas: quando seus valores so expressos por atributos.

Exemplos: Populao: Candidatos a um exame de vestibular.
Varivel: sexo (masculino ou feminino).

Quantitativa: Quando seus valores so expressos em nmeros. Podem ser subdivididas
em discretas (assumem valores enumerveis, nmeros inteiros no-negativos, contagens)
e contnuas (assumem valores num certo intervalo, medies).

Exemplos: Populao: casais residentes em uma cidade.
Variveis: Nmero de filhos (quantitativa discreta)
Idade (quantitativa continua)
Peso dos alunos (quantitativa contnua)

3
EXERCCIO DE FIXAO

1) O que estatstica?
2) O que populao?
3) o que amostra?
4) A Estatstica se divide em duas partes. Cite e explique cada uma delas.
5) Quais so as fases do mtodo estatstico?
6) Qual a diferena entre varivel qualitativa e quantitativa?
7) Classifique as variveis em qualitativas, quantitativas contnuas ou quantitativas
discreta.
a) Populao: Alunos de uma escola.
Varivel: Cor da pele ___________________________
b) Populao: Casais residentes em um bairro.
Varivel: N de filhos ___________________________

c) Populao: Jogadas de um dado.
Varivel: O ponto obtido em cada jogada______________________
d) Populao: Peas produzidas por certa mquina.
Varivel: Nmero de peas produzidas por hora_________________
e) Populao: Aparelho produzido em uma linha de montagem.
Varivel: N de defeitos por unidade__________________________
f) Populao: Pessoas residentes em uma cidade.
Varivel: Idade ___________________________
g) Populao: Bolsa de valores de So Paulo.
Varivel: N de aes negociadas_________________________
h) Populao: Funcionrios de uma empresa.
Varivel: Salrio ___________________________

i) Populao: Pregos produzidos por uma mquina.
Varivel: Comprimento do prego_________________________
j) Populao: Casais residentes em uma cidade.
Varivel: Sexo dos filhos ___________________________

8) Dizer quais dos seguintes itens representam dados discretos e quais representam dados
contnuos.

a) Altura de precipitao da chuva em centmetros, de uma cidade durante vrios
meses do ano.____________________________
b) Velocidade de um automvel em km/h._________________________
c) Nmero de notas de vinte dlares em circulao nos Estados Unidos, em qualquer
poca._________________________________
d) Valor total das aes vendidas diariamente na Bolsa de
Valores.______________________
e) Nmero de estudantes matriculados em uma universidade, em certo nmero de
anos._____________________________

4
9) Estabelecer quais dos dados seguintes so discretos e quais so contnuos.

a) Temperatura registrada a cada meia hora em um posto de
meteorologia.______________________
b) Vida mdia das vlvulas de televiso produzidas por uma determinada
companhia.___________________________
c) Comprimento de 1000 parafusos produzidos numa fbrica. __________________


GABARITO

7.
a) QUALITATIVA
b) QUANT. DISCRETA
c) QUANT. DISCRETA
d) QUANT. DISCRETA
e) QUANT. DISCRETA
f) QUANT. CONTNUA
g) QUANT. DISCRETA
h) QUANT. DISCRETA
i) QUANT. CONTNUA
j) QUALITATIVA

8.
a) CONTNUA
b) CONTNUA
c) DISCRETA
d) DISCRETA
e) DISCRETA


9.
a) CONTNUA
b) CONTNUA
c) CONTNUA

5
CAPITULO 2

O objetivo da estatstica sintetizar os valores que uma ou mais variveis podem assumir
e isso ela consegue apresentando esses valores em TABELAS E GRFICOS.

TABELAS ESTATSTICAS

- TABELA UM QUADRO QUE RESUME UM CONJ UNTO DE
OBSERVAES


Produo de caf
Brasil - 1978-82
ANOS
PRODUO
(1.000 T)
1978 2.535
1979 2.666
1980 2.122
1981 3.750
1982 2.007
Fonte: IBGE




SRIES ESTATSTICAS

Definio: Srie Estatstica toda tabela que apresenta a distribuio de um conjunto de
dados em funo da poca, do local ou da espcie.

Classificao das Sries Estatsticas:

- SRIE HISTRICA, CRONOLGICA, TEMPORAIS: Descrevem valores
da varivel, em determinado local, discriminados segundo intervalos de tempo.
(OS DADOS VARIAM COM O TEMPO).

PRODUO MEDIA DE SOJA NO
BRASIL - 2005-2006
ANOS
PRODUO (1.000 t)
2005
2006
51.138
52.223
FONTE: IBGE.

TTULO
CABEALHO
COLUNA NUMRICA
RODAP
COLUNA
INDICADORA
LINHAS
CASA OU CLULA
CORPO
6

- SRIES GEOGRFICAS, ESPACIAIS, TERRITORIAIS OU DE
LOCALIZAO: Descrevem valores da varivel, em determinado instante,
discriminados segundo regies. (OS DADOS VARIAM NO LOCAL).

DURAO MDIA
DOS ESTUDOS
SUPERIORES 1994
PASES
NMERO
DE ANOS
Itlia
Alemanha
Frana
Holanda

7,5
7,0
7,0
5,9

FONTE: APA.

- SRIES ESPECFICAS OU CATEGRICAS: Descrevem valores da varivel
em determinado tempo e local, discriminados segundo especificaes e categorias
(OS DADOS VARIAM DE ACORDO COM A ESPCIE OU QUALIDADE
DO FENMENO).













- SRIES CONJUGADAS, TABELAS DE DUPLA ENTRADA: Quando
precisamos apresentar em uma nica tabela a variao de valores de mais de uma
varivel (OS DADOS SO RELATIVOS A 2 OU 3 ASPECTOS
SIMULTANEAMENTE).
REGIES 1991 1992 1993
NORTE 342.938 375.658 403.494
NORDESTE 1.287.813 1.379.101 1.486.649
SUDESTE 6.234.501 6.729.767 7.231.634
SUL 1.497.315 1.608.989 1.746.232
CENTRO-OESTE 713.357 778.925 884.822
Fonte: Revista Veja.
TERMINAIS TELEFNICOS EM SERVIOS POR REGIES
1991 - 1993



GRFICOS ESTATSTICOS

EXPORTAO
BRASILEIRA2005
PRODUTOS
QUANTIDADE
(em bilhes de
toneladas)
Gros
Farelo
leo
20,5
14,2
2,4
FONTE: Companhia Nacional de
Abastecimento (Conab).
7
O grfico estatstico uma forma de apresentar os dados estatsticos, com o objetivo de
mostrar uma impresso mais rpida do fenmeno em estudo, com simplicidade, clareza e
veracidade.

- Ttulos completos e o mais claro possvel;
- Sempre que possvel a escala vertical deve ser escolhida de modo a aparecer na
linha o valor zero;
- A escala horizontal deve ser lida da esquerda para direita e a escala vertical deve
ser lida de baixo para cima.
Tipos mais comuns de grficos:

- Grfico em colunas ou em barras

ANOS QUANTIDADE (1.000 t)
1989 18.196
1990 11.168
1991 10.468
1992 9.241
Fonte: Agropalma.
(GRFICO DE COLUNAS) (GRFICO EM BARRAS)
PRODUO BRASILEIRA DE CARVO MINERAL
BRUTO - 1987 - 1992
PRODUO BRASILEIRA DE CARVO
MINERAL BRUTO - 1989 - 1992
0
5.000
10.000
15.000
20.000
1989 1990 1991 1992
Anos
M
i
l

t
o
n
e
l
a
d
a
s
Fonte: Ministrio da Agricultura.
PRODUO BRASILEIRA DE
CARVO MINERAL BRUTO - 1989 -
1992
0 5.000 10.000 15.000 20.000
1989
1990
1991
1992
A
n
o
s
Mil toneladas
Fonte: Ministrio da Agricultura.



8

- Grfico de linhas ou em curva
ANOS QUANTIDADE (1.000 t)
1987 39
1988 53
1989 69
1990 55
1991 42
1992 38
Fonte: Agropalma.
PRODUO BRASILEIRA DE LEO DE DEND -
1987 - 1992
Produo Brasileira de leo de
Dend - 1987 a 1992
0
20
40
60
80
1987 1988 1989 1990 1991 1992
Anos
M
i
l

t
o
n
e
l
a
d
a
s
Fonte: Agropalma.

- Grfico em setores ou de pizza:














EXERCCIO DE FIXAO
Rebanhos Brasileiros
Brasil - 1988
Espcie Quantidades
(milhes de cabeas)
Bovinos 140
Sunos 32
Ovinos 20
Caprinos 11
Total 203
Fonte: IBGE
REBANHOS BRASILEIROS
BRASIL 1988
Bovinos
Sunos
Ovinos
Caprinos
9

1) Construa as tabelas referentes aos dados pesquisados e classifique-as:

a) Dados referentes produo de borracha natural nos anos de 1991 (29.243 toneladas),
1992 (30.712 toneladas) e 1993 (40.663 toneladas). Fonte IBGE.
b) Dados referentes Avicultura Brasileira no ano de 1992 segundo as seguintes espcies:
galinhas (204.160 cabeas), Galos, frangos, frangas e pintos (435.465 cabeas) e
Codornas (2.488 cabeas). Fonte IBGE.
c) Dados referentes ao total de vacinao contra a Poliomilite no ano de 1993 segundo as
seguintes regies: Norte (211.209), Nordeste (631.040), Sudeste (1.119.708), Sul
(418.785) e Centro-oeste (185.823). Fonte Ministrio da sade.




GABARITO

1.
a) TEMPORAL
b) ESPECFICA
c) GEOGRFICA
10
CAPITULO 3

Aps a coleta de dados relativos a um determinado fenmeno em estudo, que compem
uma amostra, obtemos um conjunto de dados que ser tabulado.

Por exemplo:
TABELA 1: ALTURA DOS ALUNOS





Observe que os dados no esto organizados. Dessa forma ela recebe o nome de DADOS
BRUTOS.

Precisamos organizar os dados atravs de uma ordenao crescente ou decrescente.

TABELA 2: ALTURA DOS ALUNOS






Obteremos uma segunda ordenao que receber o nome de ROL (seqncia ordenada
dos dados brutos).

Dessa forma podemos saber com facilidade qual a menor altura (150) e qual a maior
(173); qual a amplitude de variao (173-150=23cm); qual o ponto mdio (160+161)/2 =
160,5.

Ainda assim, a varivel observada (altura dos alunos) ser mais facilmente estudada
quando dispusermos os valores ordenados em uma coluna e ao lado de cada valor o
nmero de vezes que aparece repetido. Obtemos dessa forma uma tabela que recebe o
nome de DISTRIBUIO DE FREQNCIA.
166 160 161 150 162 160 165 167 164 160
162 161 168 163 156 173 160 155 164 168
155 152 163 160 155 155 169 151 170 164
154 161 156 172 153 157 156 158 158 161
150 154 155 157 160 161 162 164 166 169
151 155 156 158 160 161 162 164 167 170
152 155 156 158 160 161 162 164 168 172
153 155 156 160 160 161 162 164 168 173
11



ALTURA (cm) Frequncia
150 1
151 1
152 1
153 1
154 1
155 4
156 3
157 1
158 2
160 5
161 4
162 2
163 2
164 3
165 1
166 1
167 1
168 2
169 1
170 1
172 1
173 1
Total 40
Fonte: MEC
ALTURA DOS ALUNOS


Outra soluo aceitvel e mais conveniente para diminui o tamanho da tabela quando o
nmero de valores da varivel grande, seria agrup-los em vrios intervalos. Nesse caso
a tabela passa a ser denominada: DISTRIBUIO DE FREQNCIA POR
INTERVALO DE CLASSE.
ALTURA (cm) Frequncia
150 I-- 154 4
154 I-- 158 9
158 I-- 162 11
162 I-- 166 8
166 I-- 170 5
170 I-- 174 3
Total 40
Fonte: MEC
ALTURA DOS ALUNOS


L-se: 4 alunos tm altura entre 150 e 154 anos (exclusive) intervalo fechado
esquerda.






Critrio para calcular o nmero de classes a ser utilizado.
Observao: No obrigatrio! O bom senso tambm funciona.
12

CRITRIO DA RAIZ

Se a seqncia estatstica contm n elementos e se indicarmos por i o nmero de classes a
ser utilizado, ento:

n i = Onde n = nmero total de observaes.

Amplitude do intervalo de classe que chamaremos de h determinada por:
i
AT
h =
,
onde AT a Amplitude Total e n i =

Exemplo:
n = 40
Ento, 40 = i = 6,324, portanto o inteiro mais prximo 6.
Devemos trabalhar com o inteiro mais prximo da raiz de n, o inteiro imediatamente
anterior e o inteiro imediatamente superior.
Logo, as opes para i so: 5, 6 ou 7.
Ento, a amplitude do intervalo de classe (h) determinada por:
4 833 , 3
6
150 - 173 (min) l - (Max) L
= = = = =
i i
AT
h

ELEMENTOS DE UMA DISTRIBUIO DE FREQNCIA.

(1) CLASSE (i): So intervalos de variao da varivel.

Ex.: Intervalo 150 a 154 define a 1 classe (i=1),
i = 1, 2, 3,......, k
i = classe
k = nmero total de classes.

(2) LIMITES DE CLASSE: So os extremos de cada classe.

i
l = Limite inferior
i
L = Limite superior

Ex.: Na primeira classe:
i
l = 150 e
i
L = 154.

13
(3) AMPLITUDE DE UM INTERVALO DE CLASSE (
i
h ): a medida do intervalo
que define a classe. Diferena entre o limite superior e inferior da classe.

Ex.: Na primeira classe:
i
l = 150 e
i
L = 154.

i
h =
i
L
i
l = 154 150 = 4 cm.

(4) AMPLITUDE TOTAL DA DISTRIBUIO (AT): a diferena entre o Limite
superior da ultima classe e o Limite inferior da primeira classe.

AT = L(Max) l(min)

Ex.: 174 150 = 24 cm

Observe que quando as classes possuem o mesmo intervalo vale a relao:

k
h
AT
i
=
24/4 = 6 (6 = Nmero total de classes)

(5) PONTO MDIO DE UMA CLASSE (
i
pm ): o ponto que divide o intervalo de
classe em duas partes iguais.

Ex.: Classe 1: (150 + 154)/2 = 152 cm

TIPOS DE FREQNCIA:

(1) FREQNCIA SIMPLES OU ABSOLUTA (
i
f ): o nmero de observaes
correspondentes a classe ou a um valor.
Exemplo:
ALTURA (cm)
150 I-- 154 4
154 I-- 158 9
158 I-- 162 11
162 I-- 166 8
166 I-- 170 5
170 I-- 174 3
Total 40
Fonte: MEC
ALTURA DOS ALUNOS
i
f

1
f = 4 => freqncia da classe 1 e
2
f = 9 => freqncia da classe 2.
A soma de todas as freqncias ser:

=
=
k
i
i
n f
1
, n = nmero total de observaes.
(2) FREQNCIA ACUMULADA (
i
F ): o total das freqncias de todos os valores
inferiores ao limite superior do intervalo de classe.

=
= + + + =
k
i
i k i
f f f f F
1
2 1
.....


Exemplo:
14
ALTURA (cm)
150 I-- 154 4 4
154 I-- 158 9 13
158 I-- 162 11 24
162 I-- 166 8 32
166 I-- 170 5 37
170 I-- 174 3 40
Total 40
Fonte: MEC
ALTURA DOS ALUNOS
i
f
i
F

=
= + + = = + + =
3
1
3 2 1 3
24 11 9 4
i
i
f f f f F , ou seja, existem 24 alunos com
estatura inferior a 162 cm.

(3) FREQNCIA RELATIVA (
i
fr ): a razes entre a freqncia simples a
freqncia total.

=
=
k
i
i
i
i
f
f
fr
1


Exemplo:
ALTURA (cm)
150 I-- 154 4 4 0,1
154 I-- 158 9 13 0,225
158 I-- 162 11 24 0,275
162 I-- 166 8 32 0,2
166 I-- 170 5 37 0,125
170 I-- 174 3 40 0,075
Total 40 1
Fonte: MEC
ALTURA DOS ALUNOS
i
f
i
F
i
fr

275 , 0
40
11
40
1
3
3
= = =

= i
i
f
f
fr


(4) FREQNCIA ACUMULADA RELATIVA (
i
Fr ): a freqncia acumulada da
classe dividida pela freqncia total da distribuio.

=
=
k
i
i
i
i
f
F
Fr
1

15


ALTURA (cm)
150 I-- 154 4 4 0,1 0,1
154 I-- 158 9 13 0,225 0,325
158 I-- 162 11 24 0,275 0,6
162 I-- 166 8 32 0,2 0,8
166 I-- 170 5 37 0,125 0,925
170 I-- 174 3 40 0,075 1
Total 40 1
Fonte: MEC
ALTURA DOS ALUNOS
i
f
i
F
i
fr
i
Fr



600 , 0
40
24
40
1
3
3
= = =

= i
i
f
F
Fr


REPRESENTAO GRFICA DE UMA DISTRIBUIO DE FREQNCIA.
Histograma

Consiste em um conjunto de retngulos, tantos quantos forem s classes de uma
distribuio.
As classes so as bases dos retngulos (tantas partes quantas forem s classes)
A escala para marcao dos pontos no eixo Y corresponde s freqncias.
Exemplo:


Polgono de freqncias

Freqncia Simples:




Freqncia Acumulada: As bases dos retngulos vo estar centradas nos pontos mdios
das classes.
17

Exemplo:

18
CAPITULO 4

MEDIDAS DE POSIO: MDIA, MODA e MEDIANA;

O estudo sobre a Distribuio de Freqncia permitiu descrever, de um modo geral, os
valores que uma varivel pode assumir. Agora precisamos de um indicativo
generalizado.
O modo mais comum de se obter esse tipo de informao atravs das MEDIDAS DE
POSIO, estatstica que representa posio relativa da distribuio em relao ao eixo
horizontal.
As medidas de posio mais importantes so as MEDIDAS DE TENDNCIA
CENTRAL recebem esse nome pelo fato dos dados observados, em geral, se agruparem
em torno dos valores centrais.

So elas: MDIA ARITMTICA, MODA, MEDIANA, SEPARATRIZES, QUARTIS e
PERCENTIS.

Essas medidas quando bem interpretadas, podem fornecer-nos informaes muito
valiosas com respeito s sries estatsticas, ou seja, com estas medidas tenta-se encontrar
um valor numrico que represente o comportamento tpico da serei em estudo.

(1) MDIA ARITMTICA SIMPLES ( x )

MDIA PARA DADOS NO AGRUPADOS (dados brutos ou rol): Quando
desejamos conhecer a mdia dos dados no agrupados, determinamos a mdia
aritmtica simples.
n
x
x
n
i
i
=
=
1
, onde ( x ) a mdia aritmtica, (
i
x ) os valores da varivel e (n) o nmero
de valores.


Ex.: Produo leiteira diria da vaca A, durante uma semana, foi de 10, 14, 13, 15, 16, 18
e 12 litros. Qual a produo mdia da semana.

litros x 14
7
98
7
12 18 16 15 13 14 10
= =
+ + + + + +
=

MDIA PARA DADOS AGRUPADOS SEM INTERVALO DE CLASSE.

=
=
=
n
i
i
n
i
i i
f
f x
x
1
1
, observe que
i
f a freqncia simples de cada varivel que neste caso
funciona como fator de ponderao (MDIA ARITMTICA PONDERADA).
19
Exemplo:

2 2 4
4 3 12
6 3 18
8 2 16
TOTAL 10 50
i
f
i
X
i i
f X

5
10
50
4
1
4
1
= = =

=
=
i
i
i
i i
f
f x
x

Exerccio: Calcule a Mdia.

Varivel estudada X(idade): 2, 5, 5, 5, 5, 6, 6, 6, 8, 8 Resposta: 5,6

IDADES f
i
f
i
x
i

2
5
6
8
Total


MDIA PARA DADOS AGRUPADOS COM INTERVALO DE CLASSE.

=
=
=
n
i
i
n
i
i i
f
f x
x
1
1
,
(
i
pm ) o ponto mdio de cada intervalo de classe.
(
i
f ) a freqncia simples de cada intervalo de classe.


Exemplo:

Classe
0 l-- 2 2 1 2
2 l-- 4 3 3 9
4 l-- 6 2 5 10
6 l-- 8 1 7 7
8 l--10 2 9 18
10 46
i
f
i i
f pm
i
pm

6 , 4
10
46
5
1
5
1
= = =

=
=
i
i
i
i i
f
f pm
x

20

Exerccio: Resposta: 161 cm

ALTURA (cm)
150 I-- 154 4
154 I-- 158 9
158 I-- 162 11
162 I-- 166 8
166 I-- 170 5
170 I-- 174 3
Total 40
Fonte: MEC
ALTURA DOS ALUNOS
i
f



(2) MODA (Mo)

o valor que ocorre com maior freqncia em uma srie de dados. Quando uma srie
de dados no apresentar moda chamaremos de AMODAL. Dois valores na srie, duas
modas, chamaremos de BIMODAL.

MODA PARA DADOS NO AGRUPADOS (dados brutos ou rol)
Exemplo:



MODA PARA DADOS AGRUPADOS SEM INTERVALO DE CLASSE.

Basta verificar o valor da varivel de maior freqncia.

N de meninos na famlia fi
0 2
1 6
2 10
3 12
4 4
Total 34


Uma vez agrupado os dados basta fixar o valor da varivel de MAIOR freqncia. A
moda nesse caso 3.
21

Exerccio: Qual a moda e o tipo para os dados agrupados em freqncia:




DADOS AGRUPADOS COM INTERVALO DE CLASSE.

A classe que apresentar a maior freqncia denominada CLASSE MODAL que servir
de base para os seguintes clculos:

a) Moda de KING:
* *
h
f f
f
l Mo
pos ant
pos

+
+ =

b) Moda de CZUBER:
*
2 1
1 *
h
D D
D
l Mo
+
+ =

pos
ant
f f
f f
l
Onde
=
=
*
2
*
1
*
*
ant
pos
*
D
D
modal classe da intervalo do amplitude a h
modal classe da simples freqncia a f
modal classe a anterior classe da simples freqncia a f
modal classe a posterior classe da simples freqncia a f
modal classe da inferior limite o
:


Exerccio: Calcule a moda utilizando os dois mtodos

Classe
0 l-- 2 2
2 l-- 4 3
4 l-- 6 10
6 l-- 8 3
8 l--10 2
20
i
f


Resposta.: 50

22
Observao:

1) A moda utilizada quando desejamos obter uma medida rpida e aproximada de
posio ou quando o valor da distribuio deve ser o valor mais tpico da distribuio.

2) A moda uma medida de posio, pois indica a regio das mximas freqncias.


(3) MEDIANA (Md)

o valor que divide o conjunto de dados ordenados em duas metades, com metade dos
valores acima da mediana e a metade dos valores abaixo dela. Quando o nmero de
observaes (n) mpar, a mediana o valor que ocupa a posio central. Quando n for
par, h duas posies centrais no conjunto, ento a mediana a mdia aritmtica dos dois
valores que ocupam as posies centrais.

MEDIANA PARA DADOS AGRUPADOS SEM INTERVALO DE CLASSE.

1) Se n for mpar (n=nmero de observaes), o valor mediano ser o de ordem

|
.
|

\
| +
2
1 n
,
ou seja, o valor do elemento que ocupa est posio ser a mediana.

2) Se n for par, o rol admite dois termos centrais que ocupam as posies. O de ordem

|
.
|

\
|
+ |
.
|

\
|
1
2 2
n
e
n
, ento, a mediana ser a mdia dos valores que ocupam estas posies.

Exemplos:

Exemplo:
1)
N de meninos fi Fi
0 2 2
1 6 8
2 10 18
3 12 30
4 4 34
Total 34
A mediana vai ser a mdia entre o 17 valor e o 18
valor da srie => 2
2
2 2
=
+
= Md meninos.

23
2)

X fi Fi
12 1 1
14 2 3
15 1 4
16 2 6
17 1 7
20 1 8
Total 8

A mediana ser a mdia entre o 4 e o 5 elemento da srie => 5 , 15
2
16 15
=
+
= Md

Exerccios: Calcule a mediana. Resposta: 8



MEDIANA PARA DADOS AGRUPADOS COM INTERVALO DE CLASSE.

*
*
*
2
h
f
F
n
l Md
ant

|
.
|

\
|

+ =
Onde:

mediana a contm que classe de intervalo do amplitude a h
mediana classe da simples freqncia a f
mediana classe anterior classe da acumulada freqncia a F
srie na mediana da posio a
2
mediana classe da inferior limite o
*
*
ant
*
n
l


Exemplo:
idade f
i
F
i

3 |--- 6 2 2
6 |--- 9 5 7
9 |--- 12 7 14
12 |--- 15 3 17
15 |--- 18 2 19
total 19
*
*
*
2
h
f
F
n
l Md
ant

|
.
|

\
|

+ = =
( )
3
7
7 5 , 9
9

+ = =10,1

25

Exerccio: Calcule a mediana para o caso da distribuio de freqncia abaixo:

Salrio f
i
F
i

450 |--- 550 8
550 |--- 650 10
650 |--- 750 11
750 |--- 850 16
850 |--- 950 13
950 |--- 1.050 5
1.050 |-- 1.150 1
total 64


Observao:
No caso de existir uma freqncia acumulada exatamente igual a
2
n
, a Mediana ser o
limite superior da classe correspondente.

Por exemplo:


*
*
*
2
h
f
F
n
l Md
ant

|
.
|

\
|

+ =
=
( )
10
9
4 13
20

+ = =30





Nota:

1) A mediana pode coincidir ou no com um elemento da srie. Vimos que, quando
tivermos um nmero de elementos mpar na srie de dados, h coincidncia.
Quanto o nmero de elementos de uma srie par, na h coincidncia.
2) A mediana depende da posio e no dos valores centrais na srie ordenada.
3) Usamos a mediana quando desejamos obter o ponto que divide a distribuio em
partes iguais e quando h valores extremos afetando de uma maneira acentuada a
mdia.

Classes f
i
F
i

0 |---10 1 1
10 |---20 3 4
20 |---30 9 13
30 |---40 7 20
40 |---50 4 24
50 |---60 2 26
total 26
26
(3) SEPARATRIZES

As separatrizes, como o prprio nome sugere so medidas que separam a srie em partes
iguais.

QUARTIS: So valores de uma srie que a dividem em 4 partes iguais. Assim temos:

1
Q = 1 quartil: Separa a seqncia ordenada deixando 25% dos valores a sua esquerda e
75% dos valores a sua direita.

2
Q = 2 quartil: Separa a seqncia ordenada deixando 50% dos valores a sua esquerda e
50% dos valores a sua direita.

3
Q = 3 quartil: Separa a seqncia ordenada deixando 75% dos valores a sua esquerda e
25% dos valores a sua direita.

Pode-se observar que o 2 quartil e a mediana tem os mesmos valores, pois ambos
dividem uma srie ordenada em duas partes iguais.

!---------!---------!---------!---------!
Q1 Q2 Q3
!-------------------!-------------------!
Md
Clculo do QUARTIL
o mesmo clculo de mediana sendo que
2
n
deve ser substitudo por
4
i
f
k , onde k o
nmero de ordem do quartil.

*
*
*
.
4
f
h F
f k
l Q
ant
i
k
(
(

+ =



Exemplo:

1. Calcule o Q
1
da seqncia X: 2, 5, 8, 5, 5, 10, 1, 12, 12, 11, 13, 15.

Ordenar a srie: X: 1, 2, 5, 5, 5, 8, 10, 11, 13, 15

3
4
12
1
4
= =
i
f
k

Q
1
= 5
27
Calcule o Q
1
e Q
3




ALTURA (cm)
150 I-- 154 4
154 I-- 158 9
158 I-- 162 11
162 I-- 166 8
166 I-- 170 5
170 I-- 174 3
Total 40
Fonte: MEC
ALTURA DOS ALUNOS
i
f

10
4
40
1
4
= =
i
f
k (classe 2) 30
4
40
3
4
= =
i
f
k (classe4)


| |
67 , 156 4
9
. 4 10
154
1
=

+ = Q

| |
165 4
8
. 24 30
162
3
=

+ = Q


Exerccio: Para os dados agrupados em freqncia, encontre o primeiro e segundo quartil.
Resposta: 4 e 6


QUINTIS: Quando dividimos uma srie em 5 partes iguais, cada parte ficar com 20%
dos elementos da srie. Assim temos:

1
K = 1 quintil separa a seqncia ordenada deixando 20% dos valores a sua esquerda e
80% dos valores a sua direita.

2
K
= 2 quintil separa a seqncia ordenada deixando 40% dos valores a sua esquerda
e 60% dos valores a sua direita.

3
K
= 3 quintil separa a seqncia ordenada deixando 60% dos valores a sua esquerda e
40% dos valores a sua direita.

4
K
= 4 quintil separa a seqncia ordenada deixando 80% dos valores a sua esquerda e
20% dos valores a sua direita.

!---------!---------!---------!---------!---------!

1
K
2
K
3
K
4
K
28
Clculo do QUINTIL
o mesmo clculo de mediana sendo que
2
n
deve ser substitudo por
5
i
f
k , onde k o
nmero de ordem do quintil.

*
*
*
.
5
f
h F
f k
l K
ant
i
k
(
(

+ =



Exemplo: Considerando a tabela de distribuio de freqncia por intervalo de classe,
calcule K
2
.


ALTURA (cm)
150 I-- 154 4
154 I-- 158 9
158 I-- 162 11
162 I-- 166 8
166 I-- 170 5
170 I-- 174 3
Total 40
Fonte: MEC
ALTURA DOS ALUNOS
i
f

16
5
40
2
5
= =
i
f
k (classe 3)
| |
159 4
11
. 13 16
158
2
=

+ = k


Exerccio: A distribuio de freqncia abaixo representa o consumo por nota de 54 notas
fiscais emitidas durante um dia em uma loja de departamentos. Calcule o quintil de
ordem 2.








Resposta: 70,71

Consumo por nota (R$) N de notas
0 |---- 50 10
50 |---- 100 28
100 |---- 150 12
150 |---- 200 2
200 |---- 250 1
250 |---- 300 1
Total 54
29

DECIS: Quando dividimos uma srie em 10 partes iguais, cada parte ficar com 10% dos
elementos da srie. Assim temos:

1
D
= 1 decil separa a seqncia ordenada deixando 10% dos valores a sua esquerda e
90% dos valores a sua direita.

2
D
= 2 decil separa a seqncia ordenada deixando 20% dos valores a sua esquerda e
80% dos valores a sua direita.

3
D
= 3 decil separa a seqncia ordenada deixando 30% dos valores a sua esquerda e
70% dos valores a sua direita.
.
.
.
8
D
= 8 decil separa a seqncia ordenada deixando 80% dos valores a sua esquerda e
20% dos valores a sua direita.

9
D
= 9 decil separa a seqncia ordenada deixando 90% dos valores a sua esquerda e
10% dos valores a sua direita.


!---!---!---!---!---!---!---!---!---!---!
D1 D2 D3 D4 D5 D6 D7 D8 D9


Clculo do DECIL
o mesmo clculo de mediana sendo que
2
n
deve ser substitudo por
10
i
f
k , onde k o
nmero de ordem do decil.

*
*
*
.
10
f
h F
f k
l D
ant
i
k
(
(

+ =


Exemplo: Considerando a tabela de distribuio de freqncia por intervalo de classe,
calcule D
3
.

ALTURA (cm)
150 I-- 154 4
154 I-- 158 9
158 I-- 162 11
162 I-- 166 8
166 I-- 170 5
170 I-- 174 3
Total 40
Fonte: MEC
ALTURA DOS ALUNOS
i
f

12
10
40
3
10
= =
i
f
k (classe 2)
| |
55 , 157 555 , 3 154 4
9
. 4 12
154
2
= + =

+ = D

29


Exerccio: Uma empresa de aviao observou em seus registros recentes, o tempo de
mo-de-obra gasto na reviso completa de um motor de jato. O seguinte quadro foi
obtido. Calcule o decil de ordem 3. Resposta: 9,44

Classe Tempo de mo-de-obra (horas) N de motores
1 0I------------4 1
2 4I------------8 5
3 8I-----------12 10
4 12I-----------16 12
5 16I-----------20 4




PERCENTIS ou CENTIL: So valores de uma srie que a dividem em 100 partes
iguais. Cada parte ficar com 1% dos elementos da srie. Assim temos:

1
P
= 1 percentil: separa a seqncia ordenada deixando 1% dos valores a sua esquerda e
99% dos valores a sua direita.

2
P
= 2 percentil: separa a seqncia ordenada deixando 2% dos valores a sua esquerda e
98% dos valores a sua direita.

3
P
= 3 percentil: separa a seqncia ordenada deixando 3% dos valores a sua esquerda e
97% dos valores a sua direita.
.
.
98
P
= 98 percentil: separa a seqncia ordenada deixando 98% dos valores a sua
esquerda e 2% dos valores a sua direita.
99
P
= 99 percentil: separa a seqncia ordenada deixando 99% dos valores a sua
esquerda e 1% dos valores a sua direita.

!---!---!---!---!---!---!---!---!---!---!
P10 P20 P30 P40 P50 P60 P70 P80 P90

Clculo do PERCENTIL
o mesmo clculo de mediana sendo que
2
n
deve ser substitudo por
100
i
f
k , onde k o
nmero de ordem do percentil.

*
*
*
.
100
f
h F
f k
l P
ant
i
k
(
(

+ =


30

Exemplo: Considerando a tabela de distribuio de freqncia por intervalo de classe,
calcule P
8
.


ALTURA (cm)
150 I-- 154 4
154 I-- 158 9
158 I-- 162 11
162 I-- 166 8
166 I-- 170 5
170 I-- 174 3
Total 40
Fonte: MEC
ALTURA DOS ALUNOS
i
f


2 , 3
100
40
8
100
= =
i
f
k (classe 1)
| |
2 , 153 4
4
. 0 2 , 3
150
8
=

+ = P



Podemos notar que os quartis, quintis e decis podem ser expressos em termos dos
precentis.

Q
1
=P25 K
1
=P20 D
1
=P
10

Q
2
=P50 K
2
=P40 D
2
=P
20

Q
3
=P75 K
3
=P60 D
3
=P
30

K
4
=P80 D
4
=P
40

D
5
=P
50

D
6
=P
60

D
7
=P
70

D
8
=P
80

D
9
=P
90


31

CAPITULO 5:

MEDIDAS DE DISPERSO OU VARIABILIDADE

As medidas de disperso ou variabilidade servem para avaliar o quanto os dados so
semelhantes, descreve ento o quanto os dados distam do valor central.

Dessas medidas, estudaremos as seguintes:
- Medidas de variao absoluta: Amplitude total, Varincia e o Desvio Padro.
- Medidas de variao relativa: Coeficiente de Variao.

(1) MEDIDAS DE VARIAO ABSOLUTA

Amplitude Total: a diferena entre o maior e o menor valor observado. Tem o
inconveniente de s levar em conta os dois valores extremos da srie, no levando em
considerao os valores intermedirios. Ela apenas uma indicao aproximada da
disperso ou variabilidade.

AT = L (Max) l (min)

Varincia e Desvio Padro: A varincia e o desvio padro so medidas que levam em
considerao a totalidade dos valores da varivel em estudo, o que faz delas ndices de
variabilidade bastante estveis e, por isso mesmo, os mais geralmente empregados.

Clculo da Varincia (
2
x
o ): A varincia a mdia aritmtica do quadrado dos desvios
(em relao mdia).

) (
ou
) (
1
1
2
2
) (
1
2
2
) (


=
= =

=

=
n
i
i
i
n
i
i
x
n
i
i
x
f
f x x
n
x x
o o

Etapas do clculo da Varincia:

1. - Calcular a mdia aritmtica X
2. - Subtrair a mdia X de cada valor
i
x do conjunto x x
i
, o que chamamos de
desvio;
3. - Elevar cada desvio ao quadrado
2
) ( x x
i

4. - Somar os quadrados dos desvios ( )
2
1

=

n
i
i
x x
5. - Dividir a soma por (n-1) quando se tratar de dados amostrais, ou simplesmente por
n se os dados representam todos os valores de uma populao.


32

Sendo a varincia calculada a partir dos quadrados dos desvios, ela um nmero em
unidade quadrada em relao varivel em questo, o que, sob o ponto de vista prtico,
um inconveniente.
Por isso mesmo, imaginou-se uma nova medida que tem a interpretao prtica,
denominada desvio padro, definida como a raiz quadrada da varincia.
Desvio Padro:
2
) ( x x
o o =

Observao:
(1) O desvio padro sempre ser positivo!
(2) O desvio padro de uma srie indica o quanto os dados esto afastados da mdia e,
que se os dados so iguais, o valor da medida zero.

Exemplo 7: Em uma turma de aluno, verificaram-se atravs da anlise das notas de 15
alunos (amostra), os seguintes desempenhos:
Alunos Conceito na Prova


1 4,3 9,1204
2 4,5 7,9524
3 9 2,8224
4 6 1,7424
5 8 0,4624
6 6,7 0,3844
7 7,5 0,0324
8 10 7,1824
9 7,5 0,0324
10 6,3 1,0404
11 8 0,4624
12 5,5 3,3124
13 9,7 5,6644
14 9,3 3,9204
15 7,5 0,0324
Total 109,8 44,16
Mdia 7,32 3,155 Varincia
Desvio Padro 1,77

( )
2
X Xi
( )
2
n
1 i
X Xi

=

33

Observamos no exemplo, que a mdia das provas, foi estimada em 7,32 com desvio
padro em 1,77. Conclumos que a maioria das notas concentrou-se em 9,09 e 5,55.
Exerccio: Calcular a mdia aritmtica e o desvio padro dos seguintes dados relativos
dosagem de hemoglobina verificada numa amostra de 12 animais bovinos (mg).
15 14 13 11 13 14 13,5 12 16 14,5 12 9
Resp.: Mdia = 13,083mg Varincia = 3,583mg
2
Desvio padro = 1,892mg
(2) MEDIDAS DE VARIAO RELATIVA
O coeficiente de variao:
x
x
x CV
) (
) (
o
= . a razo entre o desvio padro e a mdia
aritmtica da srie dos dados. Pode ser expresso em percentual . Usado
para comparar a variabilidade de diferentes grupos de dados.

Exerccio: Os dados abaixo referem-se as medidas da altura de parafusos e do dimetro
de rolamentos. Determine o coeficiente de variao, para verificar em relao a qual
medida (parafuso ou rolamento) a variabilidade maior, sabendo-se que o desvio padro
dos parafusos de 0,46 cm e dos rolamentos de 0,27 cm?

Parafusos (cm) 10,2 10,6 9,8 10,0 9,8 10,4 9,2
Rolamentos (cm) 2,2 2,5 1,8 1,9 2,0 1,7 1,9

Resposta: CVp = 4,6 e CVr = 13,5. Os rolamentos apresentam maior variabilidade.

34

CAPITLO 6:

EXPERIMENTO ALEATRIO, ESPAO AMOSTRAL, EVENTOS E
PROBABILIDADE.

DEFINIES:
EXPERIMENTO ALEATRIO: So aqueles que, mesmo repetidos vrias vezes sob
condies semelhantes, apresentam resultados imprevisveis.
Ex.: Em uma jogada de futebol, provvel que seu time: perca; que ele ganha; que ele
empate.
ESPAO AMOSTRAL (S): Cada experimento aleatrio corresponde, em geral, a vrios
resultados possveis. O conjunto desses resultados possveis recebe o nome de espao
amostral ou conjunto universo, representado por S.
Exemplo: Lanamento de uma moeda: S = {Ca, Co}
Lanamento de um dado: S={1, 2, 3, 4, 5, 6}
Cada um dos elementos de S que correspondem a um resultado recebe o nome de
PONTO AMOSTRAL, por exemplo, 2 e a S => 2 um ponto amostral de S (no caso do
lanamento do dado).
EVENTOS (A): Chamamos de evento qualquer subconjunto do espao amostral S de um
experimento aleatrio.
Exemplo: Lanamento de um dado:
Espao amostral: S={1, 2, 3, 4, 5, 6}
Eventos:
a) Obter um nmero par na face superior:
A={2, 4, 6} => S A c , logo, A um evento de S.
35

Seja S o seu espao amostral. Se todos os elementos de S tem a mesma chance de
acontecer, ento, chamamos de PROBABILIDADE DE UM EVENTO A, S A c , o
nmero real P(A), tal que:
) (
) (
) (
S n
A n
A P =
, onde n(A) o nmero de elementos de A e n(S) o nmero de elementos
de S.
Exemplos: Considere o lanamento de uma moeda e o evento A obter cara.
S= {Ca, Co} n(S) = 2 A = {Ca} n(A) = 1 P(A) =
2
1

EVENTOS COMPLEMENTARES
Exemplo: Pesquisa afirma que de um grupo de 100 pacientes fumantes aparecem as
seguintes evidncias
1
.
Eventos (evidncias): e
1
= Normal; e
2
= Bronquite; e
3
= Cncer no Pulmo;
e
4
= Tuberculose
Espao Amostral: O= {Normal; Bronquite; Cncer no Pulmo; Tuberculose}

Evidncias Normal Bronquite Cncer no Pulmo Tuberculose
N de Pacientes 25 60 10 5

Se a probabilidade de um paciente apresentar tuberculose de 0,05. Ento se abordarmos
um paciente, ao acaso, qual a probabilidade de que ele tenha tuberculose ausente.
Resoluo:
e
4
: paciente tem tuberculose: 05 , 0
100
5
) (
4
= = e P
Como: 1 ) ( ) (
4 4
= + e P e P Ento, 95 , 0 05 , 0 1 ) ( 1 ) (
4 4
= = = e P e P onde
4
e significa:
paciente tem tuberculose ausente.
Assim, a chance de abordarmos um paciente que tem tuberculose ausente 95%.

1
Considere estas evidncias as mais comuns entre pacientes. Suponha tambm que as evidncias acima
sejam exclusivas.
36

EVENTOS MUTUAMENTE EXCLUSIVOS
Se os mesmos elementos no podem ocorrer simultaneamente.
P(AB) = P(A) + P(B), a probabilidade de que um ou outro se realize igual a soma das
probabilidades.
Exemplo: Considerando os dados do exemplo (1).

Evidncias Normal Bronquite Cncer no Pulmo Tuberculose
N de Pacientes 25 60 10 5

Se abordarmos um paciente, ao acaso, qual a probabilidade de que ele tenha cncer de
pulmo ou tuberculose?
Resoluo: 15 , 0
100
15
100
5
100
10
) ( ) ( ) (
4 3 4 3
= = + = + = e P e P e e P

EVENTOS QUE NO SO MUTUAMENTE EXCLUSIVOS
P(AB) = P(A) + P(B) - P(AB)

De um grupo de 80 pessoas considere:

SITUAO
EMPREGATCIA
SITUAO ESCOLAR
Total
At o Nvel Mdio Nvel Superior
Empregada 10 35 45
Desempregada 15 20 35
Total 25 55 80

A probabilidade de uma pessoa estar desempregada ou ter nvel superior.
Resoluo:
8750 , 0
80
70
80
20
80
55
80
35
) ( ) ( ) ( ) ( = = + = + = S D P S P D P S D P

EVENTOS INDEPENDENTES
Dois eventos so independentes quando a ocorrncia ou a no ocorrncia de um evento
no tem efeito algum na probabilidade de ocorrncia do outro evento. Quando lanamos
dois dados, o resultado obtido em um deles independe do resultado obtido no outro.
P(A e B) = P(AB) = P(A)P(B)
37

Exemplo: Se dois por cento da populao apresenta esquizofrenia. A probabilidade de se
encontrar duas pessoas com esquizofrenia ausente :

Resoluo:
9604 , 0 98 , 0 98 , 0 ) ( ) ( ) ( = = = nia Esquizofre P nia Esquizofre P nia Esquizofre nia Esquizofre P

Ou seja, a chance de ambos apresentarem esquizofrenia de 96,04%.

EVENTOS DEPENDENTES
Quando dois eventos so dependentes, o conceito de probabilidade condicional
empregado para indicar a probabilidade de ocorrncia de um evento relacionado. A
expresso P(B/A) indica a probabilidade de ocorrer o evento B, dado que tenha ocorrido
o evento A. Note que B/A no uma frao.
P(B/A) =
) (
) (
A P
BeA P
=
) (
) (
A P
A B P


Exemplo: Em um grupo de 50 turistas temos as seguintes variveis descritas abaixo:

NACIONALIDADE
SEXO
Total
M F
Brasileiro (B) 20 15 35
Estrangeiro (E) 5 10 15
Total 25 25 50

Calcule as seguintes probabilidades:

a) O turista ser masculino se brasileiro.
= =
35
20
) B / M ( P 0,5714
b) O turista ser masculino se estrangeiro.
= ) / ( E M P (0,3333)
c) O turista ser feminino se brasileiro.
= =
35
15
) B / F ( P 0,4286
d) O turista ser feminino se estrangeiro.
= ) / ( E F P (0,6667)

e) O turista ser brasileiro se masculino.
= =
25
20
) M / B ( P 0,80
f) O turista ser estrangeiro se masculino.
= ) / ( M E P (0,20)
g) O turista ser brasileiro se feminino.
= =
25
15
) F / B ( P 0,60
h) O turista ser estrangeiro se feminino.
= ) / ( F E P (0,40)


38

EXERCCIO DE FIXAO

1) Qual a probabilidade de sair s de ouros quanto retiramos uma carta de um
baralho de 52 cartas?
2) Qual a probabilidade de sair um rei quanto retiramos uma carta de um baralho de
52 cartas?
3) Um lote de 12 peas, 4 so defeituosas. Sendo retirada uma pea, calcule?
a- A probabilidade de essa pea ser defeituosa:
b- A probabilidade de essa pea no ser defeituosa:
4) No lanamento de dois dados, calcule a probabilidade de se obter soma igual a 5.
5) De dois baralhos de 52 cartas retiram-se, simultaneamente, uma carta do primeiro
baralho e uma carta do segundo baralho. Qual a probabilidade de a carta do
primeiro baralho ser um rei e a do segundo baralho ser o 5 de paus?
6) Uma urna A contm: 3 bolas brancas, 4 pretas, 2 verdes; Uma urna B contm: 5
bolas brancas, 2 pretas, 1 verde; Uma urna C contm: 2 bolas brancas, 3 pretas e 4
verdes. Uma bola retirada de cada urna. Qual a probabilidade de as 3 bolas
retiradas da primeira, segunda e terceira urnas serem, respectivamente, branca,
preta e verde?
7) De um baralho de 52 cartas retiram-se, ao acaso, duas cartas sem reposio. Qual
a probabilidade de a primeira carta ser o s de paus e a segunda ser o rei de paus?
8) Qual a probabilidade de sair uma figura quando retiramos uma carta de um
baralho de 52 cartas?
9) Qual a probabilidade de sair uma carta de copas ou de ouros quando retiramos
uma carta de um baralho de 52 cartas?
10) No lanamento de um dado, qual a probabilidade de se obter um nmero no
inferior a 5?

39

GABARITO


1. A = sair s de ouros P(A)=1/52
2. A = sair rei P(A)=4/52
3.
a) A= a pea ser defeituosa P(A)=4/12
b) B=a pea ser perfeita P(B)=8/12

4. A= a soma ser 5 A={(1,4), (2,3), (3,2), (4,1)} P(A) = 4/36
5. A= sair rei
B= sair 5 de paus
P(A E B) = P(A)x P(B) = 4/52 x 1/52 = 4/2704
6.
A= 3 bolas retiradas da primeira, segunda e terceira urnas serem, respectivamente,
branca, preta e verde
P(A)= 3/9 x 2/8 x 4/9 = 24/648

7. C= sair s de paus e reis de paus
P(C1 e C2)= P(C1). P(C2/C1) = 1/52 x 1/51 = 1/2652
8.
Figuras = valete, dama e rei
A= sair uma figura
P(A) = 12/52
9. A= sair copas ou ouros P(A)=13/52 + 13/52 = 26/52

10. A= nmero maior que 5 P(A)=1/6
40

CAPTULO 07

DISTRIBUIO DE PROBABILIDADE

Quando conhecemos todos os valores de uma varivel aleatria juntamente com suas
respectivas probabilidade, temos uma distribuio de probabilidade.


Exemplo: Distribuio de probabilidade no nmero de acidentes areos com a GOL,
dentre sete acidentes.

X p(x)
0 0,210
1 0,367
2 0,275
3 0,115
4 0,029
5 0,004
6 0+
7 0+



A representao grfica de uma DISTRIBUIO DE PROBABILIDADES feita
atravs do HISTOGRAMA DE PROBABILIDADES, semelhantes ao HISTOGRAMA
DE FREQNCIA, sendo que a escala vertical apresenta probabilidades, em lugar das
correspondentes freqncias.

Condies para uma DISTRIBUIO DE PROBABILIDADE:

1) A soma de todas as probabilidades individuais 1: ( ) 1 =

x p

2) Para qualquer evento A implica que p(x) deve estar entre 0 e 1 para qualquer valor de
x: 1 ) ( 0 s s x P

MDIA DE UMA DISTRIBUIO DE PROBABILIDADE
( ) ( )

=
= =
n
i
i i
x p x X E
1

VARINCIA DE UMA DISTRIBUIO DE PROBABILIDADE
( ) ( ) | | ( )

=
= =
n
i
i i
x p X E x X VAR
1
2 2
o

- A probabilidade de 0 acidentes com
a GOL (dentre sete acidentes)
0,210;

- Os valores denotados 0+
representam probabilidades muito
pequenas;


41

EXERCCIO DE FIXAO

1) Determine se dada uma distribuio de probabilidade. Nos casos em que no
descrita uma distribuio de probabilidade, identifique a condio que no satisfeita. E
quando for descrita uma distribuio de probabilidade, determine sua mdia e desvio
padro.
a) Se sua faculdade contrata os 4 prximos funcionrios sem distino de sexo e o
conjunto de candidatos grande, com nmeros iguais de homens e mulheres, a
tabela a seguir d a distribuio de probabilidade do nmero x de mulheres
contratadas.
X p(x)
0 0,0625
1 0,2500
2 0,3750
3 0,2500
4 0,0625
Resposta: 2 e 1

b) Ao avaliar riscos de crdito, Jefferson investiga o nmero de cartes de crdito
que a pessoa tem. Com x sendo o nmero de cartes de crdito que os adultos
possuem a tabela a seguir d a distribuio de probabilidade para um conjunto de
solicitantes.
X p(x)
0 0,26
1 0,16
2 0,12
3 0,09
4 0,07
5 0,09
6 0,07
7 0,14
Resposta: 2,8 e 2,52

2)Seja X uma varivel aleatria discreta assumido valores no conjunto {1, 2, 3} e com
distribuio de probabilidade dada por:

x 1 2 3
P(X=x) 1/3 1/6 1/2


a. Calcule a mdia de X. (resposta: 2,165)
b. Calcule a ( ( ) 2 > x P (resposta: 0,666)
c. Calcule a ( ( ) 2 > x P (resposta: 0,5)

3)O tempo T, em minutos, necessrio para um operrio processar certa pea uma
varivel aleatria com a seguinte distribuio de probabilidade:

T 2 3 4 5 6 7
P(T=t) 0,1 0,1 0,3 0,2 0,2 0,1

Calcule o tempo mdio de processamento. Resposta: 4,6 minutos



42

DISTRIBUIES ESTATSTICAS: DISCRETA E CONTNUA

(1) DISTRIBUIO BINOMIAL (discreta)

Vimos que uma varivel aleatria associa um valor numrico a cada resultado de um
experimento aleatrio e uma distribuio de probabilidade associa uma probabilidade a
cada valor de uma varivel aleatria.
Veremos agora como determinar as probabilidades para uma categoria importante de
distribuio de probabilidades: OS EXPERIMENTOS BINOMIAIS.
Os experimentos binomiais tm a caracterstica de apresentarem exatamente dois
resultados complementares: SUCESSO E FRACASSO.
Exemplo: Em processos industriais: as peas falham ou no falham.
Na medicina: um paciente sobrevive ou morre.
Em propaganda, um consumidor reconhece um produto ou no.

Definio:

Um experimento binomial um experimento que satisfaz as seguintes condies:
1. O experimento deve comportar um nmero fixo de provas (n).
2. As provas devem ser independentes (o resultado de qualquer prova no afeta
as probabilidades das outras provas.)
3. Cada prova deve ter todos os resultados classificados em duas categorias
(sucesso e fracasso).
4. As probabilidades devem permanecer constantes para cada prova.

Quando fazemos um experimento binomial, a distribuio da varivel aleatria x
chamada uma DISTRIBUIO BINOMIAL.
43

Notao:
p => probabilidade de sucesso
q => probabilidade de fracasso
x => denota um nmero especfico de sucessos em n provas, podendo ser qualquer inteiro
entre 0 e n, inclusive.
P(x) => denota a probabilidade de obter exatamente x sucessos em n provas.
Parmetros da Distribuio Binomial: ) , ( ~ p n B X
Clculo da Probabilidade de uma Distribuio Binomial:

( )
x n x n
x
p p x X P

= = ) 1 .( ). (

( )
x n x x n x
x n
x n x n
x
q p
x x n
n
p p C p p x X P

= = = = . .
! )! (
!
) 1 .( . ) 1 .( ). (
,

Para x = 0, 1, 2, .....,n

Mdia de uma Distribuio Binomial: E(x) = np

Varincia da Distribuio Binomial: V(x) = npq

Obs.: lembrando que 0! = 1 (por definio)

Exerccio:

1) Aplicando a frmula da probabilidade binomial, determine a probabilidade de
obter 3 estudantes canhotos em uma turma de 15 estudantes, dado que 10% da
populao so canhotos. Isto determine P(3), se n=15, x=3, p=0,1 e 1=0,9.
Resposta: 0,1285
44


EXERCCIO DE FIXAO


1) Suponha que em um experimento binomial, uma prova se repita n vezes.
Determine a probabilidade de x sucessos, dada a probabilidade p de sucesso em
uma prova: Respostas:
a) n = 3, x= 2, p=0,9 (0,243)
b) n=8, x=7, p=0,99 (0,0745)
c) n=10, x=4, p=0,30 (0,2001)
d) n=6, x=1, p=0,05 (0,2321)

2) Uma firma afirma que 20% de suas pastilhas de chocolate M&M so vermelhas.
Determine a probabilidade de que, em 15 pastilhas M&M escolhidas
aleatoriamente, exatamente 20%, ou seja, 3 pastilhas sejam vermelhas.
Resposta: 0,250
3) Acredita-se que 20% dos moradores das proximidades de uma grande indstria
siderrgica tm alergia aos poluentes lanados ao ar. Admitindo que este
percentual de alrgicos real (correto), calcule a probabilidade de que pelo menos
4 moradores tenham alergia entre 13 selecionados ao acaso.
Resposta: 0,252
4) Trs em cada quatro alunos de uma universidade fizeram cursinho antes de prestar
vestibular. Se 16 alunos so selecionados ao acaso, qual a probabilidade de que:
Respostas
a) Pelo menos 12 tenham feito cursinho? (0,6302)
b) No mximo 13 tenham feito cursinho? (0,8029)
c) Exatamente 12 tenham feito cursinho? (0,2252)



45

46


47


48

49


(2) DISTRIBUIO NORMAL OU GAUSS (contnua)

Se X uma varivel aleatria contnua, ento X assume todos os valores em um intervalo
de nmeros reais (9).

- A distribuio de probabilidade de X descrita por uma curva de densidade, ou funo
de densidade.
( )
2
2
1
.
2
1
|
.
|

\
|

=
o

t o
x
e x f

(Pi): ( 3,14159)

e: ( 2,71828).

- A probabilidade de qualquer evento a rea sob a curva de densidade entre os valores
de X que compe o evento.

- A rea total sob qualquer curva de densidade 1, de modo que a probabilidade de um
evento varia entre 0 e 1.

- Parmetros da Distribuio Normal ) , ( ~
2
o N X

Mdia da Distribuio Normal: E(X) =
Varincia da Distribuio Normal: VAR(X) =
2
o
Algumas propriedades da Distribuio Normal:
P(X=x) = f(X) = 0 (pois no existe a probabilidade no ponto e sim na rea)
f(X) simtrica ao redor da mdia, ou seja, a probabilidade de ocorrer valor
menor do que a mdia igual a probabilidade de ocorrer valor menor do que a
mdia.
A curva normal depende de duas constantes, e o
2
:
- corresponde ao centro da simetria da curva e o2 graficamente, fornece a
distncia do centro da simetria aos pontos onde a curva muda de sentido.


50


Distribuio Normal Padro:

Na prtica desejamos calcular probabilidades para diferentes valores de e . Para isso,
a varivel cuja distribuio ) , ( ~
2
o N X transformada numa forma padronizada
com distribuio ) 1 , 0 ( ~ N X (distribuio normal padro), pois tal distribuio
tabelada. A quantidade dada por:
o

=
X
Z


Exemplo:

1) Se j X a varivel aleatria que representa os dimetros dos parafusos produzidos por
certa mquina. Suponha que essa varivel tenha Distribuio Normal com mdia 2cm e
desvio padro 0,04cm.
a) A probabilidade de um parafuso ter um dimetro com valor entre 2 e 2,05 :
3944 , 0 ) 25 , 1 0 ( )
04 , 0
2 05 , 2
04 , 0
2 2
( ) 05 , 2 2 ( = < < =

<

<

= < < Z P
X
P X P
o



b) P(-1,25<Z<0) =

c) P(0,8<Z<1,23) =

d) P(Z>0,6) =


Obs.: Quando temos uma varivel aleatria com distribuio Normal, nosso principal
interesse obter a probabilidade de essa varivel aleatria assumir um valor em um
determinado intervalo.
51

Tabela: Probabilidades da Distribuio Normal


Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,000000 0,003989 0,007978 0,011966 0,015953 0,019939 0,023922 0,027903 0,031881

0,035856
0,1 0,039828 0,043795 0,047758 0,051717 0,055670 0,059618 0,063559 0,067495 0,071424 0,075345
0,2 0,079260 0,083166 0,087064 0,090954 0,094835 0,098706 0,102568 0,106420 0,110261 0,114092
0,3 0,117911 0,121720 0,125516 0,129300 0,133072 0,136831 0,140576 0,144309 0,148027 0,151732
0,4 0,155422 0,159097 0,162757 0,166402 0,170031 0,173645 0,177242 0,180822 0,184386 0,187933
0,5 0,191462 0,194974 0,198468 0,201944 0,205401 0,208840 0,212260 0,215661 0,219043 0,222405
0,6 0,225747 0,229069 0,232371 0,235653 0,238914 0,242154 0,245373 0,248571 0,251748 0,254903
0,7 0,258036 0,261148 0,264238 0,267305 0,270350 0,273373 0,276373 0,279350 0,282305 0,285236
0,8 0,288145 0,291030 0,293892 0,296731 0,299546 0,302337 0,305105 0,307850 0,310570 0,313267
0,9 0,315940 0,318589 0,321214 0,323814 0,326391 0,328944 0,331472 0,333977 0,336457 0,338913
1,0 0,341345 0,343752 0,346136 0,348495 0,350830 0,353141 0,355428 0,357690 0,359929 0,362143
1,1 0,364334 0,366500 0,368643 0,370762 0,372857 0,374928 0,376976 0,379000 0,381000 0,382977
1,2 0,384930 0,386861 0,388768 0,390651 0,392512 0,394350 0,396165 0,397958 0,399727 0,401475
1,3 0,403200 0,404902 0,406582 0,408241 0,409877 0,411492 0,413085 0,414657 0,416207 0,417736
1,4 0,419243 0,420730 0,422196 0,423641 0,425066 0,426471 0,427855 0,429219 0,430563 0,431888
1,5 0,433193 0,434478 0,435745 0,436992 0,438220 0,439429 0,440620 0,441792 0,442947 0,444083
1,6 0,445201 0,446301 0,447384 0,448449 0,449497 0,450529 0,451543 0,452540 0,453521 0,454486
1,7 0,455435 0,456367 0,457284 0,458185 0,459070 0,459941 0,460796 0,461636 0,462462 0,463273
1,8 0,464070 0,464852 0,465620 0,466375 0,467116 0,467843 0,468557 0,469258 0,469946 0,470621
1,9 0,471283 0,471933 0,472571 0,473197 0,473810 0,474412 0,475002 0,475581 0,476148 0,476705
2,0 0,477250 0,477784 0,478308 0,478822 0,479325 0,479818 0,480301 0,480774 0,481237 0,481691
2,1 0,482136 0,482571 0,482997 0,483414 0,483823 0,484222 0,484614 0,484997 0,485371 0,485738
2,2 0,486097 0,486447 0,486791 0,487126 0,487455 0,487776 0,488089 0,488396 0,488696 0,488989
2,3 0,489276 0,489556 0,489830 0,490097 0,490358 0,490613 0,490863 0,491106 0,491344 0,491576
2,4 0,491802 0,492024 0,492240 0,492451 0,492656 0,492857 0,493053 0,493244 0,493431 0,493613
2,5 0,493790 0,493963 0,494132 0,494297 0,494457 0,494614 0,494766 0,494915 0,495060 0,495201
2,6 0,495339 0,495473 0,495604 0,495731 0,495855 0,495975 0,496093 0,496207 0,496319 0,496427
2,7 0,496533 0,496636 0,496736 0,496833 0,496928 0,497020 0,497110 0,497197 0,497282 0,497365
2,8 0,497445 0,497523 0,497599 0,497673 0,497744 0,497814 0,497882 0,497948 0,498012 0,498074
2,9 0,498134 0,498193 0,498250 0,498305 0,498359 0,498411 0,498462 0,498511 0,498559 0,498605
3,0 0,498650 0,498694 0,498736 0,498777 0,498817 0,498856 0,498893 0,498930 0,498965 0,498999
3,1 0,499032 0,499065 0,499096 0,499126 0,499155 0,499184 0,499211 0,499238 0,499264 0,499289
3,2 0,499313 0,499336 0,499359 0,499381 0,499402 0,499423 0,499443 0,499462 0,499481 0,499499
3,3 0,499517 0,499534 0,499550 0,499566 0,499581 0,499596 0,499610 0,499624 0,499638 0,499651
3,4 0,499663 0,499675 0,499687 0,499698 0,499709 0,499720 0,499730 0,499740 0,499749 0,499758
3,5 0,499767 0,499776 0,499784 0,499792 0,499800 0,499807 0,499815 0,499822 0,499828 0,499835
3,6 0,499841 0,499847 0,499853 0,499858 0,499864 0,499869 0,499874 0,499879 0,499883 0,499888
3,7 0,499892 0,499896 0,499900 0,499904 0,499908 0,499912 0,499915 0,499918 0,499922 0,499925
3,8 0,499928 0,499931 0,499933 0,499936 0,499938 0,499941 0,499943 0,499946 0,499948 0,499950
3,9 0,499952 0,499954 0,499956 0,499958 0,499959 0,499961 0,499963 0,499964 0,499966 0,499967
4,0 0,499968 0,499970 0,499971 0,499972 0,499973 0,499974 0,499975 0,499976 0,499977 0,499978

52


EXERCCIO DE FIXAO

1) Determinar o valor, ou valores, de z em cada um dos casos, nos quais as reas
referem-se s limitadas pela curva normal:
Resposta:
a) a rea entre 0 e z 0,3770 (z= 1,16)
b) a rea a esquerda de z 0,8621 (z=1,09)

2) O peso mdio de 500 estudantes do sexo masculino de uma determinada
universidade 75,5kg e o desvio padro de 7,5 kg. Admitindo-se que os pesos
esto distribudos normalmente, determinar quantos estudantes pesam:
Resposta
a) entre 60 e 77,5kg (P(-2,06<z<0,266)=0,6 => 300 estudantes)
b) mais do que 92,5kg (P(z>2,26)=0,0119 = > 6 estudantes)

3) A mdia dos dimetros internos de uma amostra de 200 arruelas produzidas por
certa mquina 0,502 polegadas e o desvio padro 0,005 polegadas. A
finalidade para a qual essas arruelas so fabricadas permite a tolerncia mxima,
para o dimetro, de 0,496 a 0,508 polegadas; se isso no se verifica, as arruelas
sero consideradas defeituosas. Determinar a porcentagem de arruelas defeituosas
produzidas pela mquina, admitindo-se que os dimetros so distribudos
normalmente. Resposta: 23,02%

4) Se z normalmente distribuda, com mdia zero e varincia 1, determinar:
Resposta:
a) P(z>-1,64) = (0,9495)
b) P(-1,96<z<1,96) = (0,95)
c) P(0<z<1,44) = (0,4251)
d) P(-0,85<z<0) = (0,3023)
e) P(-1,48<z<2,05) = (0,9104)
f) P(0,72<z<1,86) = (0,2044)


53


CAPITULO 8
INTRODUO

A REGRESSO e a CORRELAO so tcnicas utilizadas para estimar uma
relao que possa existir na populao, enquanto as tcnicas anteriormente estudadas
(Medidas de Tendncia Central e de Disperso: Mdia, Desvio Padro, Varincia, etc.)
servem para estimar um nico parmetro populacional.
A anlise de correlao e regresso compreende a anlise de dados amostrais para
saber se e como duas ou mais variveis esto relacionadas uma com a outra numa
populao.
A correlao mede a fora, ou grau, de relacionamento entre duas variveis; a
regresso d a equao que descreve o relacionamento em termos matemticos.

(1) CORRELAO

Definio: Quando duas variveis esto ligadas por uma relao estatstica, dizemos que
existe correlao entre elas.
Por exemplo:
- A circunferncia C e o raio r esto perfeitamente correlacionados, porque
t 2 = C
r.
- As variveis altura e peso de indivduos revelariam alguma correlao.

Diagrama de disperso: O diagrama de disperso um grfico onde pontos no espao
cartesiano XY so usados para representar simultaneamente os valores de duas variveis
quantitativas medidas em um conjunto de dados.
54


Por exemplo:
Um dos objetivos dos pesquisadores neste estudo encontrar uma maneira de conhecer o
peso do urso atravs de uma medida mais fcil de se obter do que a direta (carregar uma
balana para o meio da selva e colocar os ursos em cima dela) como, por exemplo, uma
medida de comprimento (altura, permetro do trax, etc.).

O problema estatstico aqui encontrar uma varivel que tenha uma relao forte com o
peso, de modo que, a partir de seu valor medido, possa ser calculado (estimado) o valor
peso indiretamente, atravs de uma equao matemtica.

O primeiro passo para encontrar esta varivel fazer o diagrama de disperso das
variveis candidatas (eixo horizontal) versus o peso (eixo vertical), usando os pares de
informaes de todos os ursos. Voc pode tentar as variveis: idade, altura, comprimento
da cabea, largura da cabea, permetro do pescoo e permetro do trax.
A Figura mostra a relao entre peso e altura e entre peso e permetro do trax.

Analisando o grfico:
1) Podemos ver que, tanto a altura quanto o permetro do trax so fortemente associados
ao peso do urso, no sentido de que quanto mais alto o urso ou quanto maior a medida de
seu trax, mais pesado ele ser.
2) Note que este crescimento linear para o permetro do trax e no-linear para a altura.
3) Os pontos esto mais dispersos no grfico da altura, a varivel mais adequada para
estimar o peso o permetro do trax.

55

Observao: A correlao entre duas variveis pode ser POSITIVA, NULA ou
NEGATIVA.

-30
-25
-20
-15
-10
-5
0
5
10
0 5 10 15 20 25 30

Grfico 1 (+) Grfico 2 (-)

-10
-5
0
5
10
15
0 5 10 15 20 25 30

Grfico 3 (nula)


Clculo do Coeficiente de Correlao Linear de Pearson

Definio: Dado n pares de valores (x1, y1), (x2, y2), ..., (xn, yn), o coeficiente entre as
duas variveis X e Y dado pela mdia dos valores dos produtos padronizados das
variveis.
( )( )
( ) ( ) ( ) ( )


=
2
2
2
2
i i i i
i i i i
y y n x x n
y x y x n
r


Indica o grau de intensidade entre duas variveis e ainda o sentido dessa correlao
(positivo ou negativo).
S deve ser utilizado com variveis contnuas.
A partir dos valores de r, podemos verificar o tipo da correlao existente entre as
variveis estudadas, conforme tabela seguinte:






-10
-5
0
5
10
15
20
25
30
0 5 10 15 20 25 30
Valor de r Correlao
0,0 Nula
0,0 ----| 0,3 Fraca
0,3 ----| 0,6 Media
0,6 ----| 0,9 Forte
0,9 ----| 0,99 Fortssima
1,0 Perfeita

56


Exemplo: Considerando uma amostra aleatria, formada por dez dos 98 alunos de uma
classe da faculdade A e pelas notas obtidas por eles em Matemtica e Estatstica:

Matemtica (x) Estatstica (y)
1 5,0 6,0
8 8,0 9,0
24 7,0 8,0
38 10,0 10,0
44 6,0 5,0
58 7,0 7,0
59 9,0 8,0
72 3,0 4,0
80 8,0 6,0
92 2,0 2,0
Notas
Alunos

Grfico de disperso
0
2
4
6
8
10
12
0 2 4 6 8 10 12
Matemtica
E
s
t
a
t

s
t
i
c
a

Calcule o coeficiente de correlao e interprete seu valor.

Matemtica (x) Estatstica (y) xy
1 5 6 30 25 36
8 8 9 72 64 81
24 7 8 56 49 64
38 10 10 100 100 100
44 6 5 30 36 25
58 7 7 49 49 49
59 9 8 72 81 64
72 3 4 12 9 16
80 8 6 48 64 36
92 2 2 4 4 4
Total 65 65 473 481 475
Notas
Alunos
2
i
x
2
i
y



911 , 0
18 , 554
505
525 585
505
) 4225 4750 )( 4225 4810 (
4225 4730
) 65 475 10 )( 65 481 10 (
65 65 473 10
2 2
= = =


=


=
x
x x
x x
r

Concluso: O resultado nos indica uma correlao linear positiva altamente significativa
entre as duas variveis.

Se o relacionamento entre X e Y for consistente e necessitamos fazer uma predio para o
valor de Y, conhecido um valor de X, atravs de uma formula matemtica adequada,
podemos aplicar a chamada ANLISE DE REGRESSO SIMPLES.

57



EXERCCIO DE FIXAO

1) Observou-se que o volume mensal de lixo gerado em uma cidade, em funo do
nmero de dormitrios das residncias, o seguinte (em m
3
):

N
o
Dormitrios 1 2 3 4
Volume de lixo 0,15 0,29 0,45 0,57

a) Calcular o coeficiente de correlao de Pearson. (0,9986)

2) A funo de demanda de um produto est representada na tabela abaixo:

Preo (R$) 56,00 60,00 63,00 68,00 74,00
Demanda (un.) 100 93 87 81 75

a) Calcular o coeficiente de correlao de Pearson. (-0,983)

3) Os gastos com propaganda e o respectivo volume de vendas gerado, de um certo
produto, so dados abaixo:


a) Calcular o coeficiente de correlao de Pearson. (0,9969)

Gastos com propaganda (em
milhares de R$)
20 40 10 100 70
Volume de vendas (em milhares de
R$)
1.110 1.250 1.000 1950 1600
58


(2) REGRESSO
Objetivo: A regresso linear simples constitui uma tentativa de estabelecer uma equao
matemtica linear (linha reta) que descreva o relacionamento entre duas variveis.

Para obter uma reta de regresso, n pares de observaes das variveis so utilizados.
Considerando Y como a varivel dependente ou varivel resposta e, X como a varivel
independente ou preditora, a reta de regresso dada por:

Y = o+ |X + u

o o coeficiente linear (intercepto), ou seja, o ponto onde a reta corta o eixo Y;

| o coeficiente angular, ou seja, determina a inclinao da reta.


Graficamente:




u representa o incremento em Y quando X aumenta em uma unidade;

ESTIMADORES DE o E | PARA O MODELO DE REGRESSO LINEAR

Os valores de a e b sero determinados, atravs do Mtodo dos Mnimos Quadrados
(MMQ). O objetivo encontrar a e b tal que a soma dos erros quadrticos mdios seja o
menor possvel.
o+ |X + u
o+ |X
o
|
X X+1
Y
X
59

O erro determinado por:
i i i
y y e =
tal que
) (
i i i
bx a y e + =


Os valores de a e b so encontrados atravs da seguinte frmula:

2
1
2
1

x n x
y x n y x
b
n
i
i
n
i
i i

=
=

x b y a

=


importante observar que:

- b mede a variao que ocorre em Y por unidade de variao de X.
- Quando no houver relao entre X e Y teremos =
.
Y Y , pois b=0
- Quando as relaes entre X e Y forem proporcionais, a reta passa na origem e
a = 0, logo =
.
Y bX

Exemplo:

1) Um laboratrio est interessado em medir o efeito da temperatura sobre a potncia de
um antibitico. Dez amostras de 50 gramas cada foram guardadas a diferentes
temperaturas, e aps 15 dias, mediu-se a potncia. Os resultados esto no quadro abaixo.


Temperatura 30 36 50 54 60 73 78 82 91 95
Potncia 38 43 32 26 33 19 27 23 14 21


0
10
20
30
40
50
0 20 40 60 80 100
Temperatura
P
o
t

n
c
i
a
882 , 0 = r

Podemos concluir que o grfico se trata de uma correlao retilnea, de modo a permitir o
ajustamento de uma reta, imagem da funo Y = o+ |X + u. (se no houvesse uma
correlao significativa, nossa melhor predio da potncia do antibitico seria
6 , 27 = y ).
60


Ento, precisamos calcular os valores dos parmetros da equao X b Y

+ =
.
que uma
estimativa da verdadeira equao da reta de regresso, onde
.
Y o estimado.

Identificao das variveis:

Varivel dependente: Potncia do antibitico
Varivel independente: Temperatura

Estimadores da reta de regresso:

35114 , 0
9 , 4534
4 , 1592
) 9 , 64 ( 10 655 . 46
) 6 , 27 )( 9 , 64 )( 10 ( 320 . 16

2
2
1
2
1
=

=
=
x n x
y x n y x
b
n
i
i
n
i
i i

(Coef. Linear)

389 , 50 9 , 64 ) 35114 , 0 ( 6 , 27

= = = x b y a (Coef. Angular ou Intercepto)



Logo,
X Y 35114 , 0 389 , 50 =
.

Interpretao da reta de regresso: cada ponto da reta de regresso fornece uma
estimativa do valor mdio ou esperado de Y correspondente ao valor X escolhido; O
valor b

=-0,35114, que mede a declividade da reta, mostra que, dento da escala da


amostra de X entre 30C e 95C, quando X aumenta em , digamos 1C, a potncia
estimada do antibitico diminui em 0,35C. O valor de = a 50,389, que o intercepto da
reta, indica o nvel mdio da potncia do antibitico quando a temperatura zero.


Determinar a potncia do antibitico quando a exposio for de 65
o
C.
5749 , 27 8141 , 22 389 , 50 ) 65 ( 35114 , 0 389 , 50 = = =
.
Y


Exemplo 2: Um funcionrio de uma pista de corrida local gostaria de desenvolver um
modelo para prever a quantia apostada (em mil dlares) com base na freqncia do
pblico (por 100 apostadores). Aps realizar a reta de regresso, o funcionrio obteve os
resultados abaixo. Escreve a equao da reta e interprete-a:

Coeficiente
Intercepto 4,3424
Coef. Linear 0,0465

61


Resposta:
Y = varivel dependente = quantidade apostada
X = varivel independente = freqncia do pblico
A equao da reta ser: X X b a Y 0465 , 0 3424 , 4

+ = + =
Assim, o valor apostado quando a freqncia zero (0) de 4,3424 mil dlares.
Alm disso, para cada 100 pessoas a mais na pista o total apostado subir em 0,0465.

Uma importante funo de determinar a reta de regresso para duas variveis a
possibilidade de realizar previses, ou seja, uma vez que obtemos a reta de regresso,
podemos escolher um valor de interesse para a varivel independente (X) e determinar o
valor esperado para a varivel dependente (Y).
62


EXERCCIO DE FIXAO

1) Observou-se que o volume mensal de lixo gerado em uma cidade, em funo do
nmero de dormitrios das residncias, o seguinte (em m
3
):

N
o
Dormitrios 1 2 3 4
Volume de lixo 0,15 0,29 0,45 0,57

a) Determinar a equao da reta de regresso. (y = 0,142x + 0,01)
b) Estimar o volume de lixo para uma residncia com 5 dormitrios. (0,11082)


2) A funo de demanda de um produto est representada na tabela abaixo:

Preo (R$) 56,00 60,00 63,00 68,00 74,00
Demanda (un.) 100 93 87 81 75

c) Determinar a equao da reta de regresso. (y = -1,3831x + 176)
d) Estimar a demanda se o preo for R$ 80,00. (65,352)

3) Os gastos com propaganda e o respectivo volume de vendas gerado, de um certo
produto, so dados abaixo:


a) Determinar a equao da reta de regresso. (v=10,496p+878,175)
b) Estimar o volume de vendas para um gasto de R$ 150,00 em propaganda.
(2.452,575)
c) Caso no se faa nenhum investimento em propaganda, qual o volume de vendas
esperado? (878,175)

d) Se a expectativa de vendas for de R$ 1.500,00, quando se deve investir em
propaganda para esse produto? (59,24)

Gastos com propaganda (em
milhares de R$)
20 40 10 100 70
Volume de vendas (em milhares de
R$)
1.110 1.250 1.000 1950 1600
63


2
r : COEFICIENTE DE DETERMINAO

Uma das formas de determinar se o modelo encontrado satisfatrio para explicar
os dados calculando o COEFICIENTE DE DETERMINAO do modelo. Esse
coeficiente compara a variabilidade do modelo com a variabilidade total dos dados.
CLCULO DO
2
r :

SQT
SQE
y y
y y
r
n
i
i
n
i
i
=

=
=
1
2
1
2
2
) (
) (


A variabilidade do modelo (variabilidade explicada ou soma dos quadrados
explicada) pode ser calculada como:
2
1
) (

=

n
i
i
y y
.
A variabilidade total (soma dos quadrados total) pode ser calculada como:

=

n
i
i
y y
1
2
) (
.
0 X
Y
y
i
y
i
x
X b a Y

+ =
SQT
SQE
SQR
i
y
Mostra a variao total nos
valores de Y observados em
relao a mdia.
Variao devido ao resduo,
pois nem todas s observaes
efetivas de Y ficam sobre a
reta ajustada.
Variao devido regresso.
0 X
Y
y
i
y
i
x
X b a Y

+ =
SQT
SQE
SQR
i
y
Mostra a variao total nos
valores de Y observados em
relao a mdia.
Variao devido ao resduo,
pois nem todas s observaes
efetivas de Y ficam sobre a
reta ajustada.
Variao devido regresso.
64


Observao:

Exemplo 1: Calcular e interpretar o coeficiente de determinao R
2
para os dados do
primeiro exerccio.

Temperatura
(X)
Potncia
(Y)
Valores
preditos ( y )
2
) ( y y
i

2
) ( y y
i

30 38 39.86 108.16 150.21
36 43 37.75 237.16 103.01
50 32 32.83 19.36 27.40
54 26 31.43 2.56 14.67
60 33 29.32 29.16 2.97
73 19 24.76 73.96 8.07
78 27 23.00 0.36 21.13
82 23 21.60 21.16 36.01
91 14 18.44 184.96 83.92
95 21 17.03 43.56 111.63

y 27,6

=

n
i
i
y y
1
2
) ( 720,4

=

n
i
i
y y
1
2
) ( 559,02
R
2
0,7759

Interpretao: o modelo X Y 3511 , 0 3892 , 50

= explica 77,59% da variabilidade total


de Y. Em outras palavras, a variabilidade da potncia do antibitico 77,59% explicada
pela sua temperatura de armazenamento.

65


EXERCCIO DE FIXAO

Uma amostra de 5 ratos da raa Wistar foi obtida e suas idades (em dias) e pesos (em
gramas) so apresentados na tabela abaixo:

Idade (dias) Peso mdio (gramas)
30 63,94
34 74,91
38 81,65
42 95,05
46 105,89

a. Esboce um diagrama de disperso para essas variveis.
b. Calcule o coeficiente de correlao de Pearson.
c. Com base nos itens (a) e (b), voc acha que h relao entre as duas variveis? Que
tipo de relao essa?
d. Deseja-se obter uma reta que explique o peso mdio dos ratos em funo das suas
idades. Qual deve ser a varivel independente e qual deve ser a varivel dependente?
e. Obtenha e interprete a reta de regresso.
f. Calcule o coeficiente de determinao para a reta obtida. Voc acha que o modelo se
ajusta bem aos dados observados? Por qu?
g. Qual o peso mdio, em gramas, para ratos com 32, 40, 43 e 49 dias?

66


Bibliografia

TRIOLA, Mrio F., Introduo ESTATSTICA - 7 Edio Rio de
Janeiro: LTC Livros Tcnicos e Cientficos Editora S.A.

CRESPO, Antnio Arnot, Estatstica Fcil 18 Edio So Paulo,
2002.