Explorar E-books
Categorias
Explorar Audiolivros
Categorias
Explorar Revistas
Categorias
Explorar Documentos
Categorias
=1
Frequncia Relativa ( )
i
f da i-sima classe (ou do i-simo valor)
=
i
f nmero de observaes da i-sima classe (ou do i-simo valor) dividido pelo
tamanho da amostra, isto ,
n
F
f
i
i
=
Observe que a soma de todos os valores de
i
f deve ser igual a 1, ou seja,
1
1
=
=
k
i
i
f . Multiplicando cada
i
f por 100 obtm-se o percentual da classe (ou
valor) correspondente, isto , 100 % =
i i
f f .
Existem outros tipos de frequncias que tambm podem ser calculadas:
Frequncia Simples Acumulada (do tipo abaixo de): frequncia simples acumulada da i-
sima classe ou valor
i i
F F F Fac + + + = L
2 1
Frequncia Relativa Acumulada: frequncia relativa acumulada da i-sima classe ou valor.
i i
f f f fac + + + = L
2 1
.
11
Normas Tcnicas para Apresentao Tabular
De um modo geral tem-se a destacar em uma tabela (disposio escrita que se obtm referindo-se a
uma coleo de dados numricos a uma determinada ordem de classificao) os seguintes elementos
essenciais (obrigatrios) e complementares (no-obrigatrios):
Elementos essenciais:
Ttulo: Indicao que precede a tabela e que contm a designao do fato observado, o local e a
poca em que foi registrado.
Cabealho: Parte superior da tabela que especifica o contedo das colunas.
Coluna Indicadora: Parte da tabela que especifica o contedo das linhas.
Corpo da tabela: Conjunto de colunas e linhas que contm as informaes sobre a varivel em
estudo.
Fonte: Entidade responsvel pela informao.
Elementos complementares:
o Notas: Informaes de natureza geral destinadas a conceituar ou esclarecer o contedo das
tabelas ou a indicar a metodologia adotada no levantamento ou na elaborao dos dados.
o Chamadas: Informaes de natureza especfica sobre determinada parte da tabela, destinada a
conceituar ou a esclarecer dados.
o Sinais Convencionais:Nenhuma casa da tabela deve ficar em branco, apresentando sempre um
smbolo, a saber:
(hfen): quando o valor numrico nulo;
K(reticncia): quando no se dispe de dado;
? (ponto de interrogao): quando h dvidas quanto exatido do valor numrico;
0,0: quando o valor numrico muito pequeno para ser expresso pela unidade utilizada. Se
os valores so expressos em nmeros decimais, acrescenta-se o mesmo nmero de casas
decimais ao valor zero;
x (letra x): quando o dado for omitido a fim de evitar individualizao da informao.
As tabelas apresentadas oficialmente devem atender s normas da ABNT (resoluo 886 de
20/10/60).
Exemplo 1.3 Elabore uma tabela de distribuio de frequncias (dados agrupados em intervalos) da
varivel ALTURA (em cm), dos 46 estudantes de CPE, turma 01 Perodo 07.1, usando-se os dados do
Quadro 1.
Soluo:
Passo 1: Estabelecer o nmero de classes: 7 46 k
Passo 2: Amplitude Total: 30 153 183 = = AT
Passo 3: Amplitude das Classes: 3 , 4
7
30
= =
k
AT
h
Passo 4: Construo da Tabela de Distribuio de Frequncias
Tabela 03 Distribuio de Frequncias das ALTURAS dos 46 Estudantes de CPE, Perodo:
97.1.
ALTURA (X
i
)
N
O
Estudantes
( F
i
)
Percentual
( f
i
%)
153,0 |----- 157,3 4 8,7
157,3 |----- 161,6 8 17,4
161,6 |----- 165,9 7 15,2
165,9 |----- 170,2 10 21,7
170,2 |----- 174,5 3 6,5
174,5 |----- 178,8 6 13,0
178,8 |----- 183,1 8 17,4
Total ou 46 100,0
FONTE: Quadro 1
12
Exemplo 1.4 - Elabore uma tabela de distribuio de frequncias (dados agrupados em intervalos) da
varivel IDADE (em anos) de 33 estudantes de CPE, conforme Dados Brutos abaixo:
A Tabela 5, a seguir, um exemplo de como calcular os outros tipos de frequncias a partir da Tabela 3
Exemplo 1.5
3.3.2 Representao Grfica de Distribuies de Frequncia
O grfico estatstico uma forma de apresentao dos dados estatsticos, cujo objetivo produzir,
no investigador ou no pblico em geral, uma impresso rpida e viva do fenmeno em estudo..
Para tornarmos possvel uma representao grfica, estabelecemos uma correspondncia entre os
termos da srie (Tabela) e determinada figura geomtrica, de tal modo que cada elemento da srie seja
representado por uma figura proporcional.
DADOS BRUTOS ROL DE DADOS ORDENADOS
22 25 23 22 23 26 25 33 23 35 20 21 22 22 22 22 22 22 23 23
27 24 24 22 24 22 24 21 22 28 23 24 24 24 24 24 24 25 25 25
30 25 28 29 24 25 20 27 34 26 25 26 26 27 27 28 28 29 30 30
36 30 22 34 35 36
Soluo:
Passo 1: Estabelecer o nmero de classes: 6 33 k
Passo 2: Amplitude Total: 16 20 36 = = AT
Passo 3: Amplitude das Classes: 7 , 2
6
16
= =
k
AT
h
Passo 4: Construo da Tabela de Distribuio de Frequncias
Tabela 04 - Distribuio de Frequncias das IDADES de 33 Estudantes de CPE, Perodo: 97.1.
IDADE (X
i
) F
i
20,0 |----- 22,7 8
22,7 |----- 25,4 13
25,4 |----- 28,1 6
28,1 |----- 30,8 3
30,8 |----- 33,5 0
33,5 |----- 36,2 3
Total ou 33
FONTE: Quadro 1
Soluo:
Tabela 05 Distribuio de Frequncias das ALTURAS dos 46 Estudantes de CPE, Perodo:
97.1.
ALTURA (X
i
)
Freq. Absoluta
F
i
Freq. Relativa
f
i
Freq. Percentual
f
i
%
Freq. Abs.
Acum.
Fac
i
Freq. Relat.
Acum.
fac
i
Ponto
Mdio
pm
i
153,0 |----- 157,3 4 0,087 8,7 4 0,087 155,15
157,3 |----- 161,6 8 0,174 17,4 12 0,261 159,45
161,6 |----- 165,9 7 0,152 15,2 19 0,413 163,75
165,9 |----- 170,2 10 0,217 21,7 29 0,630 168,05
170,2 |----- 174,5 3 0,065 6,5 32 0,695 172,35
174,5 |----- 178,8 6 0,130 13,0 38 0,825 176,65
178,8 |----- 183,1 8 0,174 17,4 46 1,000 180,95
Total ou 46 1,000 100,0 - - -
FONTE: Quadro 1
13
Requisitos
A representao grfica de um fenmeno deve obedecer aos seguintes requisitos primordiais:
Simplicidade - indispensvel devido necessidade de levar a uma rpida apreenso do
sentido geral do fenmeno apresentado a fim de no nos perdermos na observao de
mincias de importncia secundria;
Clareza - o grfico deve possibilitar uma correta interpretao dos valores representativos do
fenmeno em estudo;
Veracidade - indispensvel qualquer comentrio, posto que, se no representa uma
realidade, perde o grfico sua finalidade.
Os principais tipos de grficos estatsticos para as distribuies de frequncias so os diagramas,
que so grficos geomtricos de, no mximo duas dimenses. Para sua construo, em geral, fazemos uso s
do sistema cartesiano. Dentre os principais tipos de diagramas, destacamos:
Variveis Qualitativas:
Para representarmos as variveis qualitativas graficamente usamos os grficos de Barras, Colunas,
Setores ou Linha.
Grfico em Barras ou Colunas: a representao de uma srie por meio de retngulos,
dispostos horizontalmente (em barras) ou verticalmente (em colunas);
Grfico de Setores: o grfico que representa as partes de um todo, por setores de um
crculo, visando justamente comparar estas partes entre si em relao ao todo.
Grfico de Linha: til na representao de tabelas ou sries que evoluem ao longo do tempo
(sries temporais), possibilitando a identificao de tendncias.
Exemplo 1.6: Construindo um Grfico de Barras
0
5
10
15
20
25
Capital Interior Outra Regio
N
u
m
.
E
s
t
u
d
a
n
t
e
s
Procedncia
Procedncia dos Estudantes de CPE - Per. 97.1
FONTE: Quadro 1
Exemplo 1.7: Construindo um Grfico de Setor
Capital
43%
Interior
35%
Outra Regio
22%
Procedncia dos Estudantes de CPE - Per. 97.1
FONTE: Quadro 1
14
Variveis Quantitativas
Discretas:para representarmos as variveis quantitativas discretas graficamente usamos grficos em
Barras ou Colunas;
Contnuas: para representarmos as variveis quantitativas contnuas graficamente usamos o
Histograma ou o Polgono de Frequncias.
Histograma
a representao grfica de uma distribuio de frequncias de varivel quantitativa contnua
(dados agrupados em intervalos) por meio de retngulos justapostos, centrados nos pontos mdios das
classes e cujas reas so proporcionais s frequncias das classes.
Exemplo 1.8: Construindo um Histograma
0
2
4
6
8
10
12
155.15 159.45 163.75 168.05 172.35 176.65 180.95
F
r
e
q
u
e
n
c
i
a
A
b
s
o
l
u
t
a
Altura (cm)
Distribuio das Alturas dos Estudantes de CPE, Per. 97.1
FONTE: Quadro 1
Polgono de Frequncia
a representao grfica de uma distribuio de frequncias de varivel quantitativa contnua
(dados agrupados em intervalos) por meio de uma linha poligonal fechada ou polgono, cuja rea total
igual do histograma.
Exemplo 1.10: Construindo um Polgono de Frequncias
0
2
4
6
8
10
12
150.85 155.15 159.45 163.75 168.05 172.35 176.65 180.95 185.25
F
r
e
q
u
e
n
c
i
a
A
b
s
o
l
u
t
a
Altura (cm)
Distribuio das Alturas dos Estudantes de CPE, Per. 97.1
FONTE: Quadro 1
15
3.4 Medidas Estatsticas
Vimos anteriormente a sintetizao dos dados sob a forma de tabelas, grficos e distribuies de
frequncias. Aqui, vamos aprender o clculo de medidas que possibilitem representar um conjunto de dados
(valores de uma varivel quantitativa, isto , informaes numricas), relativos observao de determinado
fenmeno de forma reduzida.
Estes ndices estatsticos so as MEDIDAS DE POSIO e, dentre as mais importantes, citamos as
Medidas de Tendncia Central, que recebem tal denominao pelo fato dos dados observados tenderem,
em geral, a se concentrar em torno de valores centrais. Dentre as medidas de tendncia central, destacamos:
Mdia aritmtica ou Mdia;
Moda;
Mediana.
As outras medidas de posio so as SEPARATRIZES, que englobam:
a mediana;
os quartis;
os percentis.
3.4.1 Medidas de Tendncia Central
Mdia Aritmtica (ou simplesmente MDIA)
Notao:
X = a mdia da amostra ou mdia amostral
= a mdia da populao ou mdia populacional
(a) Distribuio de Frequncias por Valor
Sejam
k
x x x , , ,
2 1
K as medidas da varivel de interesse, realizadas para uma amostra de tamanho n
extrada de uma populao. Definimos a mdia da amostra ( ) X como:
=
=
=
k
i
i
k
i
i i
F
F x
X
1
1
ou, simplesmente,
n
F x
X
k
i
i i
=
=
1
onde:
i
x o i-simo valor da varivel de interesse;
i
F a frequncia absoluta do i-simo valor;
n o tamanho da amostra.
Exemplo 1.11: Determinar a mdia do seguinte conjunto (amostra) de valores 11 , 10 , 8 , 7 , 3
Logo, 8 , 7
5
11 10 8 7 3
=
+ + + +
= =
n
X
X
i
Exemplo 1.12: Determinar a mdia do seguinte conjunto (amostra) de valores
2 , 8 , 5 , 2 , 8 , 5 , 2 , 2 , 8 , 3 , 5 , 8 , 2 , 2 , 2 , 5 , 8 , 8 , 3 , 2
Ento: Dados Agrupados sem Intervalos
x
i
i
F
i i
F x
2 8 16
3 2 6
5 4 20
8 6 48
20 90
16
5 , 4
20
90
4
1
4
1
= =
=
=
X
F
F x
X
i
i
i
i i
e 20
4
1
= =
= i
i
F n
(b) Distribuio de Frequncias por Classes
Sejam
k
pm pm pm , , ,
2 1
K os pontos mdios das classes, ocorrendo com frequncias
k
F F F , , ,
2 1
K ,
respectivamente, de modo que
=
=
k
i
i
n F
1
.
Definimos a mdia da amostra ( ) X como:
=
=
=
k
i
i
k
i
i i
F
F pm
X
1
1
ou, simplesmente,
n
F pm
X
k
i
i i
=
=
1
onde:
i
pm o ponto mdio da i-sima classe;
i
F a frequncia absoluta da i-sima classe;
n o tamanho da amostra
Vantagens e Desvantagens da Mdia
uma medida de tendncia central que, por uniformizar os valores de um conjunto de dados, no
representa bem os conjuntos que revelam tendncias extremas. Ou seja, grandemente influenciada pelos
valores extremos (grandes) do conjunto. Alm disso, no pode ser calculada para distribuies de
frequncias com limites indeterminados (indefinidos).
Propriedades:
1. A soma dos desvios tomados em relao mdia nula, isto ,
( )
X X
i
i
n
=
=
1
0.
2. Somando-se ou subtraindo-se uma constante c a todos os valores de uma varivel, a mdia do
conjunto fica aumentada ou diminuda dessa constante, isto , Y X c Y X c
i i
= = .
3. Multiplicando-se ou dividindo-se todos os valores de uma varivel por uma constante c, a mdia
do conjunto fica multiplicada ou dividida por essa constante, isto , c X Y c X Y
i i
= = ou
c
X
Y
c
X
Y
i
i
= = , para 0 c .
Exemplo 1.13: Utilizando os dados apresentados na Tabela 5, determine a ALTURA MDIA dos 33
estudantes de Estatstica Vital - 97.1 turma 06
ALTURA (X
i
)
Freq. Absoluta
F
i
Ponto Mdio
pm
i
i i
F pm
153,0 |----- 157,3 4 155,15 620,60
157,3 |----- 161,6 8 159,45 1275,60
161,6 |----- 165,9 7 163,75 1146,25
165,9 |----- 170,2 10 168,05 1680,50
170,2 |----- 174,5 3 172,35 517,05
174,5 |----- 178,8 6 176,65 1059,90
178,8 |----- 183,1 8 180,95 1447,60
Total ou 46 - 7747,50
Ento: 42 , 168
46
50 , 7747
1
1
= =
=
=
k
i
i
k
i
i i
F
F pm
X cm
17
Moda
Notao: Mo
Dado um conjunto ordenado de valores. A moda (so) o(s) valor(es) que ocorre(m) com maior
frequncia no conjunto de dados, ou seja (so) o(s) valor(es) mais frequente(s) do conjunto de dados.
Exemplo 1.14: Determine a moda dos seguintes conjuntos de dados abaixo
a) 2, 2, 3, 3, 5, 5, 8, 8 No existe moda (ou amodal)
b) 2, 2, 3, 5, 5, 5, 8, 8 5 = Mo
c) 2, 2, 2, 3, 3, 5, 5, 5, 8 2 = Mo e 5 = Mo
Observao:
i) A moda de um conjunto de dados pode no existir (figura 1 (a) )
ii) A moda de um conjunto de dados pode no ser nica (figura 1 (c) )
Figura 1: Caracterizao de Dados quanto moda
Clculo da Moda em uma Distribuio de Frequncias por Classes
Em uma distribuio de frequncias com dados agrupados em classes, denominamos classe modal a
classe que possui a maior frequncia, e, consequentemente, ser esta classe que conter a moda.
Exemplo 1.15: Utilizando os dados apresentados na Tabela 5, apresentamos o clculo determine a ALTURA
MODAL (Moda) para dados agrupados em intervalos, a partir da frmula de Czuber apresentada na Figura
2.
Figura 2: Clculo da moda para dados distribudos em classes
Soluo:
FRMULA de CZUBER (interpretao
geomtrica atravs de Histograma)
mo mo
h L Mo
|
|
\
|
+
+ =
2 1
1
onde:
mo
L : limite inferior da classe modal
mo
h : amplitude da classe modal
anterior al
F F =
mod 1
posterior al
F F =
mod 2
18
A Classe modal ser o intervalo com maior frequencia absoluta (F
i
). Neste caso a classe modal (4
a
) ser
165,9 |----- 170,2 9 , 165 =
mo
L , 3 , 4 =
mo
h , 3 7 10
mod 1
= = =
anterior al
F F e
7 3 10
mod 2
= = =
posterior al
F F .
Da, 19 , 167 3 , 4
7 3
3
9 , 165
2 1
1
= |
\
|
+
+ =
|
|
\
|
+
+ =
mo mo
h L Mo cm.
Vantagens e Desvantagens da Moda
No depende de todos os valores do conjunto de dados, podendo mesmo no se alterar com a
modificao de alguns deles;
No influenciada por valores extremos (grandes) do conjunto de dados
Pode ser calculada para distribuies com limites indeterminados (indefinidos) na maioria dos casos.
Mediana
Notao: Me
Considere um conjunto de dados ordenado constitudo de n valores. A mediana o valor que divide
o conjunto em duas partes iguais (isto , em duas partes de 50% cada).
1 Caso: n mpar
Para a srie de valores ordenados em ordem crescente de grandeza (isto , um rol), a mediana o
valor central, isto ,
Me = elemento que est na posio
2
1 + n
.
2 Caso: n par
Para a srie de valores ordenados em ordem crescente de grandeza (isto , um rol), a mediana a
mdia aritmtica dos valores centrais, isto ,
Me = mdia aritmtica entre os elementos das posies
2
n
e 1
2
+
n
.
3
o
Caso: Clculo da Medida em uma Distribuio de Frequncias por Classes
No caso de dados agrupados, relembramos que uma distribuio de frequncias pode ser
representada por meio de um Histograma. Dizemos ento que a mediana ser o valor de X (abscissa) cuja
ordenada divide a rea total do Histograma em duas partes iguais.
Em uma distribuio de frequncias com dados agrupados em classes, denominamos classe mediana
a classe que contm o elemento que est na posio
2
n
e, consequentemente, ser esta a classe que conter a
mediana.
Figura 3: Clculo da mediana para dados distribudos em classes
me
me
ant
me
h
F
Fac
n
LI Me
|
|
|
|
\
|
+ =
2
onde:
me
LI o limite inferior da classe mediana;
me
F a frequncia absoluta da classe mediana;
ant
Fac a freq. absoluta acumulada da classe anterior
classe mediana;
me
h a amplitude da classe mediana;
n o nmero de observaes.
19
Assim, para dados agrupados em intervalos, a mediana obtida atravs de interpolao de acordo com
a frmula dada na figura 3.
Propriedades da Mediana
1. A mediana no influenciada por valores extremos (grandes) de uma srie ou conjunto de dados;
2. A mediana de uma srie de dados agrupados de classes extremas indefinidas pode ser calculada.
Exemplo 1.16: Determinar a ALTURA MEDIANA dos 46 estudantes da turma de CPE, - Perodo: 97.1,
conforme os dados agrupados na tabela 5.
Classe mediana a classe que contm o elemento que est na posio
2
n
, ou seja, a classe mediana
a classe que contm o elemento que est na 23 posio. Logo, a classe mediana ser a 4: 165,9 |----- 170,2
(Classe mediana: primeira classe que ultrapassar 50% (n/2) ou mais das observaes)
9 , 165 =
me
LI 10 =
me
F 3 , 4 =
me
h
19 =
ant
F
Ento:
62 , 167 72 , 1 9 , 165 3 , 4
10
19
2
46
9 , 165
2
= + =
|
|
|
|
\
|
+ =
|
|
|
|
\
|
+ =
me
me
ant
me
h
f
F
n
LI Me cm.
3.4.2 Medidas de Disperso
No item anterior, aprendemos a calcular e entender convenientemente as medidas de posio
representativas de um determinado conjunto de dados, onde destacamos a mdia, a moda e a mediana.
Sejam quatro conjuntos A, B, C e D com os seguintes valores:
Conjunto A ====> 7, 7, 7, 7, 7
Conjunto B ====> 5, 6, 7, 8, 9
Conjunto C ====> 4, 5, 7, 9, 10
Conjunto D ====> 0, 5, 10, 10, 10
Para representarmos cada conjunto, podemos calcular a sua respectiva mdia aritmtica, encontrando
X X X X A B C D = = = = 7 .
Vemos assim que, apesar de constitudos de valores diferentes, os grupos revelam uma mesma mdia
aritmtica. Observando-os mais detalhadamente, notamos que em cada grupo, isto , conjunto de dados, os
valores se distribuem diferentemente em relao mdia. Necessitamos assim de uma medida estatstica
complementar para melhor caracterizar cada conjunto apresentado.
As medidas estatsticas responsveis pela variao ou disperso dos valores de um conjunto de dados
so as medidas de disperso ou de variabilidade, onde se destacam a amplitude total, a varincia, o desvio
padro e o coeficiente de variao. Em princpio, diremos que entre dois ou mais conjuntos de dados, o mais
disperso (ou menos homogneo ) aquele que tem a maior medida de disperso.
Amplitude Total
Notao: AT
Medida j apresentada na elaborao de uma distribuio de frequncias com dados agrupados em
classes, definida por:
min max
X X AT = ,
onde:
max
X o maior valor do conjunto de dados e
min
X o menor valor do conjunto de dados.
20
Varincia
Notao:
2
S a varincia da amostra ou varincia amostral
2
a varincia da populao ou varincia populacional
A varincia de um conjunto de dados (amostra ou populao ) mede a variabilidade do conjunto em
termos de desvios quadrados em relao mdia aritmtica. uma quantidade sempre no negativa e
expressa em unidades quadradas do conjunto de dados, sendo de difcil interpretao.
Distribuio de Frequncias por valor
Sejam
k
x x x , , ,
2 1
K as medidas da varivel de interesse, realizadas para uma amostra de tamanho n
extrada da populao considerada. Definimos a varincia da amostra ( )
2
S como:
( )
1
1
2
2
=
n
F X x
S
k
i
i i
onde:
i
x o i-simo valor da varivel de interesse;
i
F a frequncia absoluta do i-simo valor;
X a mdia da amostra;
n o tamanho da amostra.
Observao: A equao acima utilizada quando nosso interesse no se restringe descrio dos dados
mas, partindo da amostra, visamos tirar inferncias vlidas para uma respectiva populao.
Distribuio de Frequncias por Classes
Sejam
k
pm pm pm , , ,
2 1
K os pontos mdios das classes, ocorrendo com frequncias
k
F F F , , ,
2 1
K de
modo que
=
=
k
i
i
n F
1
. A varincia da amostra ( )
2
S definida por como:
( )
1
1
2
2
=
n
F X pm
S
k
i
i i
onde:
i
pm o ponto mdio da i-sima classe;
i
F a frequncia absoluta da i-sima classe;
X a mdia da amostra;
n o tamanho da amostra.
Desvio-Padro
Notao: S o desvio-padro da amostra ou desvio-padro amostral
o desvio-padro da populao ou desvio-padro populacional
uma outra medida de disperso mais comumente empregada do que a varincia, por ser expressa
na mesma unidade do conjunto de dados. Mede a "DISPERSO ABSOLUTA" de um conjunto de valores e
obtida a partir da varincia.
Desvio Padro = Varincia (Raiz quadrada da Varincia ).
Assim,
2
S S =
Coeficiente de Variao
uma medida que expressa a variabilidade em termos RELATIVOS, comparando o desvio-padro
com a mdia:
21
% 100 =
X
S
CV , sendo que 0 X .
Note que importante expressar a variabilidade em termos relativos porque, por exemplo, um
desvio-padro igual a 1 pode ser muito pequeno se a magnitude dos dados da ordem de 1.000, mas pode ser
considerado muito elevado se esta magnitude for da ordem de 10.
Observe tambm que o coeficiente de variao adimensional e por este motivo permite a
comparao das variabilidades de diferentes conjuntos de dados.
Comentrios sobre as principais Medidas de Tendncia Central e Disperso
1. O conjunto de todos os possveis elementos de uma determinada pesquisa constitui uma populao
estatstica. Sua mdia a mdia populacional, usualmente representada pela letra grega . Na
grande maioria das situaes prticas, a mdia populacional desconhecida e deve ser estimada a
partir de dados amostrais. Se a amostra for extrada de forma adequada, a mdia amostral X uma
boa estimativa de .
2. Comparando a mdia e a mediana, temos que a mediana pouco sensvel presena de valores
muito altos ou muito baixos na amostra, enquanto a mdia j muito sensvel a esta situao. Para
ilustrar o sentido desta afirmao, vamos considerar os dados abaixo:
5 14 47 61 122 620
A mediana deste conjunto de dados :
54
2
61 47
=
+
= Me
enquanto que a mdia dada por:
8 , 144
6
869
6
620 122 61 47 14 5
= =
+ + + + +
= X .
Observe que a maior observao (620) exerceu uma grande influncia sobre a mdia somente este
dado maior do que a mdia, o que ento no sintetiza de forma adequada as informaes contidas
na massa de dados. Portanto, neste exemplo, a mediana parece ser a melhor medida para indicar a
localizao dos dados.
De modo geral, quando o histograma construdo para os dados da amostra do tipo assimtrico,
devemos preferir a mediana como medida de tendncia central.
3. A amplitude, apesar de ser muito fcil de calcular, tem a desvantagem de levar em considerao
apenas os dois valores extremos (mximo e mnimo) da massa de dados, desprezando os demais.
4. A varincia populacional representada por
2
. Usualmente, a varincia populacional
desconhecida e deve ser estimada a partir dos dados amostrais. Se a amostra foi extrada de forma
adequada, a varincia amostral
2
S uma boa estimativa de
2
.
5. As medidas X ,
2
S e S tomadas na amostra, denominadas ESTATSTICAS, so estimativas dos
PARMETROS POPULACIONAIS ,
2
e (supostos desconhecidos).
Exemplo 1.17: Utilizando os dados apresentados na Tabela 5, determine a VARINCIA, o DESVIO-
PADRO e o COEFICIENTE DE VARIAO DAS ALTURAS dos 46 estudantes de CPE - 97.
ALTURA (X
i
)
Freq. Absoluta
F
i
Ponto Mdio
pm
i
i i
F pm
i i
F pm
2
153,0 |----- 157,3 4 155,15 620,60 96286,09
157,3 |----- 161,6 8 159,45 1275,60 203394,42
161,6 |----- 165,9 7 163,75 1146,25 187698,44
165,9 |----- 170,2 10 168,05 1680,50 282408,03
170,2 |----- 174,5 3 172,35 517,05 89113,57
174,5 |----- 178,8 6 176,65 1059,90 187231,34
178,8 |----- 183,1 8 180,95 1447,60 261943,22
Total ou 46 - 7747,50 1308075,10
22
A expresso
( )
1 1
2
1
1
2
1
2
2
\
|
=
= =
n
n
F pm
F pm
n
F X pm
S
k
i
i i
k
i
i i
k
i
i i
. Assim,
( )
2
2
1
2
1 2
2
cm 35 , 71
45
83 , 3210
1 46
46
5 , 7747
10 , 1308075
1
= =
\
|
=
=
n
n
F pm
F pm
S
k
i
k
i
i i
i i
.
Logo,
cm 44 , 8 cm 35 , 71
2 2
= = = S S e % 01 , 5 % 100
cm 42 , 168
cm 44 , 8
% 100 = = =
X
S
CV
Exemplo 1.18: Uma fbrica classifica operrios de acordo com os graus obtidos em testes de aptido. Os
dados so apresentados na distribuio de frequncia abaixo:
Notas Teste Aptido
(X
i
)
F
i
Fac
i
pm
i
x pm
i
( )
2
x pm
i
( )
i i
F x pm
2
0 |----- 2 6 6 1 -4,172 17,409 104,454
2 |----- 4 10 16 3 -2,172 4,719 47,193
4 |----- 6 23 39 5 -0,172 0,030 0,684
6 |----- 8 11 50 7 1,828 3,340 36,741
8 |---- 10 8 58 9 3,828 16,650 117,203
Total ou 58 - - 40,149 306,276
a) Calcule o grau mdio obtido pelos operrios;
b) O operrio que tirar nota acima de S X 2
___
+ receber um prmio. Um operrio para receber esta
meno dever ter tirado quanto?
c) Com base nos dados da tabela, a partir de que nota temos 50% dos operrios mais aptos.
Soluo:
a) O grau mdio dado por: 172414 , 5
58
300
5
1
___
= = =
=
n
F pm
X
i
i i
b) A varincia para os dados agrupados dada pela frmula:
373 , 5
57
276 , 306
1
) (
5
1
2
__
2
= =
=
n
F X pm
S
i
i i
.
Logo o desvio padro S = 2,318,
Desta forma S X 2
___
+ = 9,808, portanto qualquer operrio com nota maior que 9,808 receber o premio.
c) A nota acima da qual esto 50% dos operrios chamada nota mediana, a qual calculada para dados
agrupados em intervalos por:
13 , 5 13 , 1 4
23
26
4 2
23
) 16
2
58
(
4
)
2
(
= + = |
\
|
+ =
+ =
+ =
Md
Md
ant
Md d
h
F
Fac
n
L M .
23
4. Avaliando o que foi construdo
Nesta unidade aprendemos a explorar dados estatsticos, onde estudamos desde a organizao dos
dados em tabelas e grficos at o clculo de medidas estatsticas importantes que sero utilizadas nas
unidades subseqentes e convidamos vocs a resolverem a lista de exerccio anexa a este material, tentando
descobrir no seu dia a dia a utilidade para o contedo aqui abordado. Este foi o inicio da convivncia com a
Estatstica. Esperamos que tenha sido prazeroso. Procure seus tutores, use e abuse deste material.
24
Unidade II Probabilidade
1. Situando a Temtica
A teoria das probabilidades o fundamento para a inferncia estatstica. O objetivo desta parte que
o aluno compreenda os conceitos mais importantes da probabilidade.
O conceito de probabilidade faz parte do dia-a-dia dos trabalhadores das rea das cincias exatas,
cincias biolgicas, engenharia, etc., uma vez que seu conceito frequentemente usado na comunicao
diria. Por exemplo, podemos dizer que um aluno tem chance de 70% de ser aprovado em uma determinada
disciplina. Um professor est 90% seguro de que um novo mtodo de ensino proporcione uma melhor
compreenso pelos alunos. Um engenheiro de produo afirma que uma nova mquina reduz em 20% o
tempo de produo de um bem. Tal como mostram os exemplos, as pessoas expressam a probabilidade em
porcentagem. Trabalhando com a probabilidade matemtica mais conveniente express-la como frao (as
porcentagens resultam da multiplicao das fraes por 100).
2. Problematizando a Temtica
O conceito de probabilidade fundamental para o estudo de situaes onde os resultados so
variveis, mesmo quando mantidas inalteradas as condies de sua realizao. Por exemplo, jogando-se um
dado, temos seis resultados possveis de cada vez; a observao do sexo dos candidatos inscritos num
concurso pblico conduz a dois resultados possveis - masculino ou feminino. Em ambos os casos, embora
no sejamos capazes de afirmar de antemo que resultado particular ocorrer, temos condies de descrever
o conjunto de todos os resultados possveis do experimento. A sua repetio continuada mostra uma certa
regularidade nos resultados, o que nos permite estudar o experimento, apesar da incerteza nele presente.
3. Conhecendo a Temtica
3.1 Espaos Amostrais e Eventos
Antes de passarmos definio de probabilidade necessrio fixarmos os conceitos de experimento
aleatrio, espao amostral e evento.
Experimento Aleatrio
o processo da coleta dos dados relativo a um fenmeno que acusa variabilidade em seus resultados.
Um experimento caracteriza-se como aleatrio, em funo de poder ser repetido indefinidamente sob
condies, essencialmente inalteradas, e embora no sejamos capazes de afirmar que resultado particular
ocorrer, seremos sempre capazes de descrever o conjunto de todos os possveis resultados do mesmo.
Espao Amostral ( Notao: S ou (mega) )
o conjunto formado por todos os possveis resultados de um experimento aleatrio.
Eventos ( Notao: A, B. C, ... )
qualquer subconjunto do espao amostral.
3.1.1 Operaes entre Eventos
Combinaes de Eventos
Sejam A e B eventos em um mesmo espao amostral. Temos as definidas as seguintes operaes
entre conjuntos:
Evento Unio B A (l-se: A unio B): o evento unio de A e B equivale ocorrncia de A ou
de B ou de ambos. Contm os elementos do espao amostral que esto em A ou em B ou em ambos.
25
Evento Interseo A B (l-se: A interseo B): o evento interseo de A e B equivale
ocorrncia de A e de B, simultaneamente. Contm os elementos do espao amostral que esto em A e em
B.
Evento Complementar A (l-se: A evento complementar de A): o evento complementar de A
equivale no ocorrncia do evento A. Contm os elementos do espao amostral que no esto em A.
Eventos Disjuntos ou Mutuamente Exclusivos: dois eventos A e B dizem-se mutuamente
exclusivos ou mutuamente excludentes quando a ocorrncia de um deles impossibilita a ocorrncia do
outro. Os dois eventos no tm nenhum elemento em comum. Exprime-se isto escrevendo:
A B =
UNIO
INTERSEO
EVENTO COMPLEMENTAR
EVENTOS DISJUNTOS
3.2 O Conceito de Probabilidade
Definio 2.1: Uma funo P : R dita uma probabilidade se satisfaz os seguintes axiomas:
i) ( ) P = 1;
ii) ( ) 0 1 P A ;
iii) Sejam A e B eventos em um mesmo espao amostral. Se A e B forem mutuamente exclusivos,
ento ( ) ( ) ( ) P A B P A P B U = + .
Por enquanto, ainda no sabemos calcular a probabilidade de ocorrncia de um evento A P(A). No
entanto, vamos enunciar algumas propriedades relacionadas a P(A) que decorrem das condies acima e que
no dependem da maneira pela qual calculamos P(A).
3.2.1 Propriedade de Probabilidade
Sejam A e B eventos em um mesmo espao amostral:
1. Se o evento impossvel, ento ( ) P = 0;
2. Se A
C
o evento complementar de A, ento ( ) ( ) A P A P
C
=1 .
3. Se A e B so dois eventos quaisquer, ento ( ) ( ) ( ) ( ) B A P B P A P B A P + = ;
4. Se o evento A B, ento ( ) ( ) P A P B .
26
3.2.2 Probabilidade em Espaos Amostrais Finitos
Seja um espao amostral associado a um experimento aleatrio constitudo de N resultados
igualmente provveis (equiprovveis). Seja A um evento qualquer constitudo de r resultados possveis
( 0 r N ).
A probabilidade de ocorrncia do evento A, denotada P(A), dada por:
( )
N
r A
n
A n
A P = =
=
possveis casos de nmero
a favorveis casos de nmero
) (
) (
Exemplo 2.1: Em uma seleo para uma vaga de engenheiro mecnico de uma grande empresa verificou-se
que dos 100 candidatos 40 tinham experincia anterior e 30 possuam curso de especializao. Vinte dos
candidatos possuam tanto experincia profissional como tambm algum curso de especializao.
Escolhendo um candidato ao acaso, qual a probabilidade de que:
a) Ele tenha experincia ou algum curso de especializao?
b) Ele no tenha experincia anterior nem curso de especializao?
Soluo
Vamos definir os seguintes eventos:
A = {O candidato possui experincia anterior}
B = {O candidato possui especializao}
Dados: p(A) = 0,4, p(B) = 0,3 p(AB) = 0,2 pede-se as seguintes probabilidades:
a) Ele tenha experincia ou algum curso de especializao
p(AB) = p(A) + p(B) p(AB) = 0,4 + 0,3 0,2 = 0,5
b) Ele no tenha experincia anterior nem curso de especializao?
P(A
c
B
c
) = P((AB)
C
) = 1- P(AB) = 1- [P(A) + P(B) P(AB)] =
= 1 [0,4 + 0,3 0,2] = 1 - 0,5 = 0,5.
3.2.3 Probabilidade Condicional e Independncia de Eventos
Dados dois eventos A e B contidos num espao amostral , muitas das vezes, estamos interessados
na ocorrncia de A dado que o evento B tenha ocorrido.
Para dar consistncia ideia de uma probabilidade condicional, suponhamos que uma organizao
de pesquisa junto a consumidores tenha estudado os servios prestados dentro da garantia por 200
comerciantes de pneus em uma grande cidade, obtendo os resultados resumidos na tabela seguinte:
Vendedores de Pneus
Dentro da Garantia
Total
Bom Servio Servio Deficiente
Com marca 64 16 80
Sem marca 42 78 120
Total 106 94 200
Selecionado aleatoriamente um desses vendedores de pneus (isto , cada vendedor tem probabilidade de ser
selecionado), constatamos que as probabilidades de se escolher um vendedor de determinada marca (M), um
vendedor que presta bons servios dentro da garantia (Bs), ou um vendedor de marca determinada e que
presta bons servios dentro da garantia (MBs) so:
32 , 0
200
64
) ( e 53 , 0
200
106
) ( , 40 , 0
200
80
) ( = = = = = = Bs M P Bs P M P
.
Todas essas probabilidades foram calculadas por meio da definio clssica de probabilidade. Como a
segunda dessas probabilidades P(Bs) prxima a 0,50 (50%), vejamos o que acontece se limitamos a escolha
27
a vendedores de uma marca determinada. Isto reduz o espao amostral s 80 escolhas, correspondentes 1
a
linha da tabela. Temos ento, que a probabilidade de se escolher um vendedor que presta bons servios (Bs),
sabendo (ou dado) que a marca de pneu vendido pelo mesmo determinada ser de 80 , 0
80
64
) | ( = = M Bs P ,
tendo-se uma melhora em relao a P(Bs) = 0,53 . Note que a probabilidade condicional que obtivemos aqui,
80 , 0 ) | ( = M Bs P pode escrever-se como:
) (
) (
) | (
200
80
200
64
M P
Bs M P
M Bs P
= =
Generalizando, formulamos a seguinte definio de probabilidade condicional, que se aplica a dois
eventos quaisquer A e B pertencentes a um dado espao amostral :
Probabilidade Condicional
Se P(B) diferente de zero, ento a probabilidade condicional de A relativa a B, isto , a
probabilidade de A dado que B ocorreu denotada por
0 ) ( que desde ,
) (
) (
) | ( >
= B P
B P
B A P
B A P
.
Teorema da Multiplicao
O resultado a seguir, obtido a partir da definio de probabilidade condicional, fornece a
probabilidade da ocorrncia conjunta de dois eventos A e B, isto , a probabilidade P(AB):
) | ( ) ( ) ( ou ) | ( ) ( ) ( B A P B P B A P A B P A P B A P = =
dependendo da ordem de ocorrncia dos eventos.
Independncia de Eventos
Dizemos que dois eventos A e B so independentes, se as probabilidades condicionais P(A | B) =
P(A) e P(B | A) = P(B). Isto equivale, a partir da regra da multiplicao, escrevermos a ocorrncia simultnea
de A e B como sendo:
) ( ) ( ) ( B P A P B A P = .
Exemplo 2.2: Uma caixa contm 4 lmpadas boas e 2 queimadas. Retiram-se, ao acaso, 3 lmpadas sem
reposio. Calcule a probabilidade dessas 3 lmpadas serem boas.
Soluo: Seja A
i
a i-sima lmpada boa, ento:
P(A
1
A
2
A
3
) = P (A
1
) P(A
2
| A
1
) P(A
3
| A
1
A
2
) =
5
1
4
2
5
3
6
4
=
Exemplo 2.3: Sejam A e B dois eventos tais que P(A) = 0,4 e P(AB) = 0,7. Seja P(B) = p. Para que valor
de p, A e B sero mutuamente exclusivos? Para que valor de p A e B sero independentes?
Soluo:
A e B so mutuamente exclusivos se B A = . Logo 0 ) ( = B A P , com isso
) ( ) ( ) ( B P A P B A P + = 0,7 = 0,4 + p p = 0,7 0,4 = 0,3.
Se A e B so independentes p B P A P B A P 4 , 0 ) ( ) ( ) ( = = . Como
) ( ) ( ) ( ) ( B A P B P A P B A P + = temos que: 0,7 = 0,4 + p 0,4p. Logo, p = 0,5.
28
3.2.4 Teorema de Bayes
Sejam B
1
, B
2
, ..., B
k
uma partio do espao amostral , onde B
i
B
j
= i j e
U
k
i
i
B
1 =
= , ou
seja, os eventos eventos B
1
, B
2
, ..., B
k
so mutuamente exclusivos. Seja A um evento qualquer associado a ,
ento:
Figura 4: Visualizao de um problema envolvento Teorema de Bayes
B1
B2
B3
B4
A
S
Exemplo 2.3: Numa certa turma, 1% dos homens e 4% das mulheres tem menos que 1,60m de altura. Alm
disso, 60% dos estudantes so homens. Considere que um estudante, selecionado aleatoriamente, tem menos
que 1,60m de altura. Qual a probabilidade do estudante ser homem?
Soluo: Sejam os eventos:
A = {estudantes com menos de 1,60m de altura};
M = {estudantes do sexo feminino};
H = {estudantes do sexo masculino}.
Note que os eventos M e H so mutuamente excludentes e representam uma partio do espao amostral ,
ou seja, M H = e M H = . Alm disso, sabemos que o evento A ocorreu, visto que dito que o
estudante possui menos que 1,60m de altura.
Assim, pelo Teorema de Bayes:
4. Avaliando o que foi construdo
Nesta unidade aprendemos lidar com um conceito muito importante da estatstica e que est presente
quase diariamente nas nossas vidas, a probabilidade. Aprendemos nesta unidade que uma maneira de
responder a pergunta qual a probabilidade de chover hoje seria observar, em um passado recente de dias, o
nmero de dias que choveu e dividi-lo pelo total de dias. Aprendemos tambm os conceitos de probabilidade
condicional, independncia de eventos e teorema de Bayes. Com isso, estamos nos preparando cada vez
mais para as etapas futuras que so as mais significantes deste curso. Para voc que est conosco, Parabns.
. , , 1 ,
) ( ). | ( ) ( ). | (
) ( ). | (
) (
) (
) | (
1 1
k i
B P B A P B P B A P
B P B A P
A P
A B P
A B P
k k
i i i
i
K
K
=
+ +
=
=
11
3
022 , 0
006 , 0
40 , 0 04 , 0 60 , 0 01 , 0
60 , 0 01 , 0
) ( ). | ( ) ( ). | (
) ( ). | (
) (
) (
) | ( = =
+
=
+
=
=
M P M A P H P H A P
H P H A P
A P
A H P
A H P
29
Unidade III Variveis Aleatrias e Distribuies de Probabilidade
1. Situando a Temtica
Na unidade anterior estudamos alguns fenmenos probabilsticos por meio de espaos amostrais mais
simples. No entanto, em situaes prticas mais gerais, necessrio ampliar esses conceitos para que
tenhamos modelos probabilsticos que atendam as necessidades do problema. A definio do conceito de
varivel aleatria possibilitar uma maior flexibilidade e aplicabilidade dos conceitos de probabilidade em
problemas diversos.
2. Problematizando a Temtica
Ao estudarmos fenmenos aleatrios tais como, a renda de uma populao, o desempenho escolar de
um grupo de alunos, o impacto de uma dieta no peso de animais, etc., desejamos saber como controlar esses
experimentos e tentar extrair concluses sobre as respostas obtidas. Neste caso, usaremos uma ferramenta
valiosa que so as variveis aleatrias.
3. Conhecendo a Temtica
Quando na prtica desejamos investigar algum fenmeno, estamos na realidade interessados em
estudar a distribuio de uma ou mais variveis relacionadas a este. Assim, por exemplo, podemos estar
interessados em estudar a distribuio das notas de estudantes em uma determinada disciplina, do grau de
instruo, da altura, etc.
O que pretendemos, nesta unidade, apresentar alguns modelos tericos de distribuio de
probabilidade, aos quais um experimento aleatrio estudado possa ser adaptado, o que permitir a soluo de
um grande nmero de problemas prticos.
3.1. O Conceito de Varivel Aleatria e Variveis Aleatrias Discretas
Definio 3.1: Seja E um experimento e um espao amostral associado a E. Um funo X, que associe a
cada elemento um nmero real, X(), denominada varivel aleatria.
Observao:
1. Cada elemento de corresponder a exatamente um valor;
2. Diferentes valores , podem levar a um mesmo valor de X;
3. Nenhum elemento poder ficar sem valor de X.
Definio 3.2: Seja E um experimento e seu espao amostral. Seja X uma varivel aleatria definida em
e seja R
x
seu contradomnio. Seja B um evento definido em relao a R
x
, isto , B R
x
. Ento, define-se o
evento A como
) ( } ) ( | {
1
B X B X A
= = .
Assim, o evento A ser constitudo por todos os resultados em para os quais X() B.
Exemplo 3.1: Suponha 2 moedas lanadas e observada a sequncia de caras e coroas obtidas. Considere o
espao amostral associado a este experimento:
30
= {(Ca,Co), (Ca,Ca), (Co,Ca), (Co,Co)}
Agora, defina uma varivel aleatria X = nmero de caras obtidas no lanamento de 2 moedas. Assim, temos
que X = {0, 1, 2}, visto que X(Co,Co) = 0; X(Ca,Co) = X(Co,Ca) = 1 e X(Ca,Ca) = 2.
Variveis Aleatrias Discretas
Denomina-se X uma varivel aleatria discreta se o nmero de valores possveis de X for um conjunto de
pontos finito ou infinito enumervel. Digamos R
X
= {x
1
, x
2
, . . . , x
n
, . . . }.
Definio 3.2: (Funo de Probabilidade) - Seja X uma varivel aleatria discreta. A cada possvel
resultado x
i
de X est associado um nmero p
i
= P(X = x
i
), denominado probabilidade da varivel aleatria
X assumir o valor x
i
, satisfazendo as seguintes condies:
a) 0
i
p para todo x
i
R
X
b) 1 ... ...
2 1
= + + + + =
n i
p p p p (a soma das probabilidades igual a 1).
Definio 3.3: (Funo de Distribuio de Probabilidade) - Dada uma varivel aleatria discreta X,
definimos F(x) a funo de distribuio acumulada ou, simplesmente, funo de distribuio (f.d) de X,
dada por:
=
= = =
n
i
i i i i
x X P x F x X P x F
1
) ( ) ( ) ( ) (
Exemplo 3.2: Considerando o exemplo 3.1, denote a funo de probabilidade e a funo de distribuio da
varivel aleatria X.
Soluo:
Seja X = nmero de caras obtidas no lanamento de 2 moedas, temos que a varivel aleatria X assume os
seguintes valores, X = {0, 1, 2}.
Temos que,
P(Co,Co) = P(X = 0) = ;
P(Ca,Co) = P(Co,Ca) = P(X = 1) = ;
P(Ca,Ca) = P(X = 2) = .
Denotamos a funo de probabilidade de X por
x
i
0 1 2
P(X = x
i
) 1/4 1/2 1/4
Por conseguinte, a funo de distribuio acumulada de X dada por
x
i
0 1 2
F(x
i
) = P(X x
i
) 1/4 3/4 1
Exemplo 3.3: Um par de dados lanado. Seja X a varivel aleatria que associa a cada ponto (d
1
, d
2
) de
a soma desses nmeros, isto , X(d
1
, d
2
) = d
1
+ d
2
. Determine a funo de probabilidade de X.
Soluo:
O espao amostral formado de 36 pares ordenados, representando as possibilidades no lanamentos de
dois dados = {(1,1), (1,2), ..., (5,6), (6,6)}.
Ento, a varivel aleatria X = d
1
+ d
2
assume os seguintes valores X = {2, 3, 4, ..., 12}. Por conseguinte, a
funo de probabilidade de X obtida, calculando-se:
P (X = 2) = P(d
1
=1,d
2
=1) = 1/6 1/6 = 1/36
P (X = 3) = P(d
1
=1,d
2
=2) + P(d
1
=2,d
2
=1) = 1/36 + 1/36 = 2/36
31
..
P (X = 12) = P(d
1
=6,d
2
=6) = 1/36
Logo, a funo de probabilidade de X ser representada por
x
i
2 3 4 5 6 7 8 9 10 11 12
P(X = x
i
) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36
3.2. Variveis Aleatrias Contnuas
Uma varivel aleatria dita contnua se o seu contradomnio for um intervalo ou uma unio de sub-
intervalos.
Definio 3.4: Uma varivel aleatria X contnua se existir uma funo f, denominada funo densidade
de probabilidade (fdp) de X, que satisfaa as seguintes condies:
1.
X
R x x f , 0 ) ( ;
2. 1 ) ( =
+
dx x f ;
3. Sejam a e b quaisquer no intervalo + < < < b a , temos que
dx x f b X a P
b
a
= ) ( ) (
.
Observaes
) ( b X a P representa a rea sob a curva da funo densidade de probabilidade f(x).
Para qualquer valor especfico de X, digamos x
0
, P(X = x
0
) = 0, pois 0 ) ( ) (
0
0
0
= = =
dx x f x X P
x
x
.
Como a probabilidade de X assumir valores em pontos isolados nula, temos que
) ( ) ( ) ( ) ( b X a P b X a P b X a P b X a P < < = < = < = .
Definio 3.5: A definio de funo de distribuio para o caso contnuo dada por
dx x f x X P x F
x
= = ) ( ) ( ) ( .
Observao: Seja F(x) a funo de distribuio acumulada de uma varivel aleatria contnua X, com fdp
f(x). Ento, ) (
) (
) (
'
x F
dx
x dF
x f = = , para todo x no qual F(x) seja derivvel.
Exemplo 3.4: Suponha que X uma varivel aleatria contnua com a seguinte fdp:
< <
=
contrario caso , 0
1 0 , 2
) (
x x
x f .
a) Mostre que f(x) uma fdp;
b) Calcule P(X );
c) Calcule P(X | 1/3 X 2/3)
Soluo:
a) Para que f(x) seja uma fdp basta verificar que
1 2 ) (
1
0
2
1
0
= = =
+
x dx x dx x f
.
b) .
4
1
2 ) ( ) 2 / 1 (
2 / 1
0
2
2 / 1
0
2 / 1
= = = =
x dx x dx x f X P
c) Aplicando diretamente o conceito de probabilidade condicional, teremos
32
.
12
5
3 / 1
36 / 5
2
2
) 3 / 2 3 / 1 (
) 2 / 1 3 / 1 (
) 3 / 2 3 / 1 | 2 / 1 (
3 / 2
3 / 1
2 / 1
3 / 1
= = =
=
xdx
xdx
X P
X P
X X P
Exemplo 3.5: Seja a varivel aleatria X com f(x) definida no exemplo 3.4, calcule sua funo de
distribuio acumulada.
Soluo:
< =
<
= =
1 , 1
1 0 , ) (
0 , 0
) ( ) (
0
2
x
x x ds s f
x
ds s f x F
x x
3.3 Valor Esperado e Varincia de uma Varivel Aleatria
Nos modelos probabilsticos que temos considerado, parmetros podem ser empregados para caracterizar
sua distribuio de probabilidade. Dada uma distribuio de probabilidade, possvel associar certos
parmetros, os quais fornecem informaes valiosas sobre tal distribuio.
Um dos parmetros mais importantes o valor esperado (esperana ou mdia) de uma varivel aleatria
X, denotado por E(X) ou .
Definio 3.6: (Valor Esperado ou Mdia): Seja X uma varivel aleatria discreta com possveis valores
x
1
, x
2
, . . . ,x
n
, ... . Seja p(x
i
) = P (X = x
i
), i = 1, 2, ..., n, ... Ento, o valor esperado ou mdia da varivel
aleatria X definido por:
) ( ) (
1
i
i
i
x p x X E = =
=
,
se a srie ) (
1
i
i
i
x p x
=
convergir, ou seja, <
=
) (
1
i
i
i
x p x .
Seja X uma varivel aleatria contnua com fdp f(x). O valor esperado de X ser definido por
+
= = dx x xf X E ) ( ) ( .
Observao: E(X) mede o valor mdio de X, sendo expressa na mesma unidade de X.
Exemplo 3.6: Considere a varivel aleatria definida no exemplo 3.2. Obtemos a E(X) por
1
4
1
2
2
1
1
4
1
0 ) ( ) (
3
1
= |
\
|
+ |
\
|
+ |
\
|
= =
=
i
i
i
x p x X E
Isto representa que, ao lanarmos a moeda 2 vezes esperamos que, em mdia, em um dos lanamentos
aparea Cara.
Exemplo 3.7: Considere a varivel aleatria contnua definida no exemplo 3.4. Obtemos a E(X) por
= = =
1
0
2
1
0
3
2
2 ) 2 ( ) ( dx x dx x x X E
Um outro parmetro importante que caracteriza uma varivel aleatria a varincia, denotada V(X)
ou
2
. A varincia de uma varivel aleatria uma medida que d a idia de disperso dos valores da
varivel, em relao ao seu valor esperado (mdia).
Definio 3.7: (Varincia): Seja uma varivel aleatria X (discreta ou contnua) sua varincia, denotada
V(X) ou
2
, definida por:
33
[ ]
2 2
) ( ) ( = = X E X V ,
onde = E(X) a mdia de X.
Observaes:
V(X) 0 e mede a variabilidade ou disperso de X em torno da sua mdia ;
V(X) expressa em unidades quadradas (o que torna difcil a sua interpretao);
O Desvio Padro ) ( X V
X
= mede a disperso absoluta de X, sendo expressa na mesma unidade da
varivel aleatria X.
A definio de varincia de uma varivel aleatria (v.a.) X, pode ser re-escrita por
[ ]
2 2 2
) ( ) ( ) ( X E X E X V = = ,
onde: ) ( ) (
1
2 2
i
i
x p x X E
i
=
= .
Propriedades Importantes do Valor Esperado
Sejam X uma v.a. e c = constante, ento:
1. O valor esperado (mdia) de uma constante a prpria constante:
E(c) = c
2. Multiplicando-se uma constante por uma varivel aleatria X, sua mdia fica multiplicada por esta
constante:
E(c.X) = c. E(X)
3. Somando ou subtraindo uma constante de uma varivel aleatria X, sua mdia fica somada ou
subtrada desta constante:
E(X c) = E(X) c
4. Sejam X e Y duas variveis aleatrias, o valor esperado da soma/subtrao de variveis aleatrias
equivale a soma/subtrao dos valores esperados de X e Y:
E(X Y) = E(X) E(Y)
5. Sejam X e Y duas variveis aleatrias independentes, temos que
E(X.Y) = E(X).E(Y).
Propriedades Importantes da Varincia
Sejam X uma v.a. e c = constante, ento:
1. A varincia de uma constante zero:
V(c) = 0
2. Multiplicando-se uma constante por uma varivel aleatria X, sua varincia fica multiplicada pelo
quadrado da constante:
V(c.X) = c
2
. V(X)
3. Sejam X e Y duas variveis aleatrias independentes, a varincia da soma/subtrao de variveis
aleatrias equivale a soma das varincias de X e Y:
V(X Y) = V(X) + V(Y)
Exemplo 3.8: Encontre a varincia da varivel aleatria X, denotada por
< <
=
c c
b x a
a b
x f
. , 0
,
1
) (
34
Temos que, [ ]
2 2
) ( ) ( ) ( X E X E X V = . Assim,
2
) (
) ( 2
) )( (
) ( 2
) (
2
1 1
) (
2 2 2
b a
a b
b a b a
a b
a b x
a b
dx
a b
x X E
b
a
b
a
+
=
+
=
Alm disso,
3
) 2 (
) ( 3
) 2 )( (
) ( 3
) ( 1
) (
2 2 2 2 3 3
2 2
ab a b
a b
ab a b a b
a b
a b
dx
a b
x X E
b
a
+ +
=
+ +
=
Logo,
[ ]
12
) (
4
) (
3
) 2 (
) ( ) ( ) (
2 2 2 2
2 2
a b b a ab a b
X E X E X Var
=
+
+ +
= =
3.4. Experimentos Binomiais e a Distribuio Binomial
Dentre as funes de probabilidade, apresentaremos inicialmente uma distribuio discreta de grande
importncia, denominada Distribuio Binomial. Em seguida, faremos estudo de uma distribuio contnua
de grande utilizao na teoria da probabilidade, chamada a Distribuio Normal.
Para utilizar a teoria das probabilidades no estudo de um fenmeno concreto, devemos encontrar um
modelo probabilstico adequado a tal fenmeno. Endentemos por modelo probabilstico para uma v.a. X,
uma forma especfica de funo de distribuio de probabilidade que reflita o comportamento de X. As
propriedades bsicas de um modelo probabilstico devem ser:
Adequao: O modelo deve refletir adequadamente o mecanismo aleatrio que ocasiona variao
nas observaes;
Simplicidade: Utilizao, sempre que possvel, de hipteses simplificadoras, de modo que o modelo
se preste anlise estatstica, sem sacrifcio de adequao;
Parcimnia de Parmetros: Um nmero excessivo de parmetros prejudicaria a anlise estatstica.
Entre 2 modelos que constituam aproximao adequada de um fenmeno, devemos preferir aquele
que apresente o menor nmero de parmetros.
Distribuio de Bernoulli
Suponha que realizamos um experimento E, cujo resultado pode ser observado e classificado
como sucesso ou fracasso, caso o evento que nos interessa ocorra ou no, respectivamente. Associe
p, a probabilidade de sucesso, ao evento que nos interessa e 1 p = q, a probabilidade de fracasso.
Definimos, ento, a seguinte varivel aleatria discreta:
=
sucesso ocorrer se , 1
fracasso ocorrer se , 0
X .
A distribuio de probabilidade de X definida por:
x
i
0 1
P(X = x
i
) 1 p p
Verifica-se facilmente que E(X) = p e V(X) = p(1 p), que so as principais caractersticas da v.a.
X.
Experimentos Binomiais
Um experimento binomial apresenta quatro propriedades:
1. O experimento consiste em uma sequncia de n ensaios idnticos e independentes;
2. Dois resultados so possveis em cada ensaio. Um denominado de sucesso e o outro de fracasso;
35
3. A probabilidade de um sucesso denotada por p, e no se modifica de ensaio para ensaio. (O mesmo se
aplica probabilidade de fracasso q = 1 p );
4. Os ensaios so independentes;
5. Defina uma varivel aleatria Y como sendo o nmero de sucessos nos n ensaios.
Definio 3.8: Dizemos que uma varivel aleatria discreta Y = X
1
+ X
2
+ ... + X
n
, onde cada X
i
um ensaio
de Bernoulli, apresenta distribuio binomial com n provas (ensaios ou tentativas) e probabilidade p de
sucesso, sendo sua funo de probabilidade definida por:
n k p p
k
n
k X P
k n k
K , 1 , 0 , ) 1 ( ) ( =
|
|
\
|
= =
,
pois, para X = k teremos observado k sucessos, cada um com probabilidade p e consequentemente (n-k)
fracassos, cada um com probabilidade q = 1 p.
Notao: ) , ( ~ p n B X , equivalente a dizer que X tem distribuio Binomial com parmetros n e p.
Propriedades
E(X) = np
V(X) = npq
Exemplo 3.9: Dois times de futebol, A e B, jogam entre si 6 vezes. Suponha que as probabilidades de A
ganhar, perder ou empatar sejam as mesmas e permaneam constantes durante as 6 partidas. Encontre a
probabilidade do time A ganhar 4 vezes e calcule a esperana e a varincia.
Soluo
Seja X = {nmero de vezes que o time A ganha}
Note que p = 1/3 (vencer) e que q = 2/3 (perder ou empatar). Alm disso, n = 6.
Logo, 08 , 0
243
20
) 3 / 2 ( ) 3 / 1 ( 15 ) 3 / 1 1 ( ) 3 / 1 (
4
6
) 4 (
2 4 4 6 4
= =
|
|
\
|
= =
X P .
Temos tambm que a esperana (mdia) de vitrias ser 2
3
1
6 ) ( = = = np X E e a
varincia
3
4
3
2
3
1
6 ) ( = = = npq X V .
3.5. Distribuio Normal
A distribuio normal a mais importante das distribuies contnuas de probabilidade. Conhecida
por alguns leitores como a curva em forma de sino, tem sua origem associada aos erros de mensurao.
sabido que, quando se efetuam repetidas mensuraes de determinada grandeza com um aparelho
equilibrado, no se chega ao resultado todas as vezes. Obtm-se, ao contrrio, um conjunto de valores que
oscilam, de modo aproximadamente simtrico, em torno do verdadeiro valor. Construindo um histograma
desses valores e o correspondente polgono de frequncias, obtm-se uma poligonal aproximadamente
simtrica. A distribuio normal desempenha, no obstante, um papel preponderante na estatstica e os
processos de inferncia, nela baseados, tm larga aplicao. Muitas das variveis quantitativas analisadas em
pesquisas nas diversas reas de estudo correspondem ou se aproximam da distribuio normal.
Uma distribuio normal caracteriza-se por uma funo real f(x) denominada de funo densidade de
probabilidade (f.d.p) da v.a X, dado pelo modelo probabilstico abaixo e grfico correspondente:
. 0 , - , x - ,
2
) (
exp
2
1
) (
2
2
2
2
> + < < + < <
)
`
x
x f
36
Propriedades da Curva Normal
1. unimodal, isto , f(x) tem um ponto de mximo cuja abscissa x = . Esse ponto, situado no meio
da distribuio, aquele em que coincidem os valores da mdia, moda e mediana;
2. f(x) simtrica em relao mdia ;
3. f(x) tem dois pontos de inflexo, cujas abscissas so x = e x = + ;
4. O desvio-padro dado por ( a raiz quadrada positiva da varincia
2
);
5. A rea total sob a curva normal e acima do eixo horizontal equivale a 1 (o eixo das abscissas o eixo
dos valores de v.a. X;
6. f(x) tem uma assntota. A partir do topo, a curva cai gradativamente at formar as caudas que se
estendem indefinidamente, aproximando-se cada vez mais da linha base sem, entretanto, jamais toc-la.
7. Fixando-se a mdia, verifica-se que o achatamento da curva est diretamente ligado ao valor do desvio
padro , ou seja, quanto maior for o desvio padro mais achatada a curva, como pode ser vista na
figura abaixo.
Notao: X N ( ,
2
), ou seja, X tem distribuio normal com mdia e varincia
2
. Ou ainda, X
N ( , ) , isto , X tem distribuio normal com mdia e desvio padro .
Distribuio Normal Padro
O clculo direto de probabilidades envolvendo a distribuio normal no um processo elementar.
Notemos, entretanto, que a funo de densidade normal depende de dois parmetros, e , de modo que se
tabelssemos as probabilidades diretamente a partir dessa funo, seriam necessrias tabelas de dupla entrada
para cada valor particular =
0
e =
0
, complicando consideravelmente o problema. Recorre-se, por
isso, a uma mudana de varivel, transformando a v.a. X na v.a. Z assim definida:
Z
X
=
Esta nova varivel chama-se varivel normal padronizada, ou reduzida, sendo sua mdia igual a
zero ( = 0) e o seu desvio padro igual um ( = 1).
37
0
) (
) ( =
= |
\
|
=
X E X
E Z E
1
0 ) (
) (
2
2
2
= =
= |
\
|
=
X V X
V Z V
A curva normal padro conserva as mesmas propriedades listadas anteriormente. Mediante tal
transformao, basta construirmos uma nica tabela, a da normal reduzida e, atravs dela, obtermos as
probabilidades associadas a todas as distribuies N (, ).
A utilidade notvel da tabulao pela varivel normal padronizada devida ao fato de que, se X
tiver qualquer distribuio normal N(, ), a tabela da distribuio N(0; 1) pode ser empregada para calcular
probabilidades associadas a X, simplesmente aplicando a transformada para a varivel Z.
Consequentemente, temos que
|
\
|
|
\
|
= |
\
|
a b b
Z
a
P b X a P ) ( ,
onde (z) = P (Z z), a funo de distribuio acumulada de N(0; 1).
Exemplo 3.9: Os salrios mdios dirio dos operrios de uma indstria so distribudos segundo uma
distribuio normal com mdia de R$ 50,00 e desvio padro de R$ 4,00. Encontre a probabilidade de um
operrio ter um salrio dirio abaixo de R$ 52,00.
Soluo
Seja X = o salrio dirio do operrios, estamos interessados em encontrar P (X < 52). Assim,
) 50 , 0 ( ) 50 , 0 (
4
50 52 52
) 52 ( = < = |
\
|
< = |
\
|
< = < Z P Z P Z P X P
.
Atravs da tabela da distribuio normal padro, obtemos a probabilidade de interesse 6915 , 0 ) 50 , 0 ( = .
Logo, pode-se afirmar que a probabilidade de um operrio apresentar um salrio inferior a R$ 52,00 de
69,15%.
Exerccios
3.1 Cinco por cento dos motoristas de nibus da cidade HH so mulheres. Suponha que 20 motoristas de
nibus so selecionados aleatoriamente para serem entrevistados sobre as condies de trabalho. Qual a
Dica
Trs importantes informaes que iro facilitar o clculo de probabilidades envolvendo a
distribuio normal padro, a partir da tabela que voc baixou na plataforma MOODLE: (i) a
tabela que voc est utilizando apresenta as probabilidades de P(Z z
0
) = F(z
0
), ou seja, a funo
de distribuio acumulada. No entanto, esta tabela considera apenas valores positivos para Z. (ii) a
rea total sob a curva equivale a 1. Logo, a metade da curva representa probabilidade igual a 0,5;
(iii) a curva da normal simtrica. Essa propriedade ser bastante til no clculo de
probabilidades onde os valores de Z so negativos, ou seja, P(X x
0
) = 1 P(X + x
0
);.
Acesse a plataforma MOODLE e faa o download da tabela da distribuio normal
padronizada.
38
probabilidade de que nenhum motorista selecionado seja mulher? Qual a probabilidade de que pelo menos 3
motoristas selecionados sejam mulheres?
3.2 O departamento de Recursos Humanos da empresa FF recebe 25 currculos para diversos cargos, e espera
que a probabilidade de no ocorrer candidatos experientes no grupo seja de 80%. Determine a probabilidade
de no mximo 8 currculos recebidos apresentarem candidatos experientes.
3.3 Uma confeco de roupa masculina suspeita que 35% de sua produo apresenta algum defeito. Se tal
suspeita correta, determine a probabilidade de que, numa amostra de seis peas, sejam encontradas: duas
peas defeituosas; no mnimo trs peas defeituosas; menos que trs peas defeituosas.
3.4 A probabilidade de um atirador acertar o alvo 2/3. Se ele atirar 5 vezes, qual a probabilidade de acertar
exatamente 2 tiros ?
3.5 Suponhamos que a presso sangnea sistlica normal de indivduos com idade entre 15 e 25 anos uma
varivel aleatria com distribuio normal de mdia 120mmHg e desvio padro 8mmHg. Nestas condies,
calcule a probabilidade de um indivduo dessa faixa etria, com presso sangnea sistlica normal
apresentar presso:
a) Inferior a 120mmHg; (R: 0,5)
b) Entre 100 e 110mmHg; (R: 0,0994)
c) Acima de 106mmHg; (R: 0,9599)
d) Abaixo de 136mmHg; (R: 0,9772)
e) Para os 20% dos indivduos que tm as maiores presses sangneas sistlicas, determinar a menor
presso sangnea sistlica. (R: 126,72 mmHg)
f) Para os 18% dos indivduos que tm as menores presso sangneas sistlicas, determinar a maior
presso sangnea sistlica. (R: 112,64 mmHg)
3.6 Acredita-se que as vendas aproximadas do creme dental MM sejam normalmente distribudas, com uma
mdia de 20.000 tubos por semana e um desvio padro de 3.000 tubos por semana. Calcule a probabilidade
de que mais de 22.000 tubos sejam vendidos em qualquer dada semana;
3.7- Os mergulhadores que so membros do Sindicato dos Mergulhadores Profissionais ganham em mdia
U$ 17 por mergulho de alta profundidade. Considere que os dados disponveis indicam que o pagamento seja
distribudo normalmente com desvio padro de U$ 2,25.
a) Qual a probabilidade de que os salrios estejam entre U$15,00 e U$20,00 por mergulho;
b) Qual a probabilidade de que os salrios sejam menores que U$12,00 por mergulho;
4. Avaliando o que foi construdo
Nesta unidade aprendemos o conceito de funo de distribuio de probabilidade, o conceito
de varivel aleatria, alm dos conceitos de esperana e varincia de variveis aleatrias.
Conhecemos tambm duas distribuies importantssimas na estatstica que so as distribuies
Binomial e Normal. Particularmente, a distribuio normal ser uma ferramenta essencial nas
unidades seguintes. Faa todos os exerccios propostos, pois eles sero de grande valia.
Aguardo voc no MOODLE!
39
Unidade IV Teoria Elementar da Amostragem
1. Situando a Temtica
Amostragem uma rea da Estatstica que estuda tcnicas de planejamento de pesquisa para
possibilitar inferncias sobre uma populao a partir do estudo de uma pequena parte de seus componentes,
uma amostra.
2. Problematizando a Temtica
Ao fazermos uma jarra de suco e adicionamos acar desejamos saber se a quantidade de acar foi
satisfatria. Para isto, no precisamos tomar toda a jarra de suco, uma colher basta. Da mesma forma, ao
estudarmos um fenmeno probabilstico em uma populao no precisamos investigar toda a populao, e
sim uma amostra dela. No entanto, algumas questes podem surgir: como obter essa amostra? qual deve ser
o tamanho dessa amostra? Esta unidade tem como objetivo responder esta e mais algumas questes
correlatas.
3. Desenvolvendo a Temtica
3.1 Conceitos Bsicos
Muitas vezes faz-se necessria a coleta de dados diretamente na origem. Entretanto, quando
impossvel se observar toda a populao recorremos s tcnicas de amostragem, onde nos limitamos a uma
amostra da populao em estudo. Basicamente, nosso objetivo coletar uma pequena frao da populao de
modo que as informaes observadas na amostra possam ser generalizadas para a populao. Para que esta
generalizao seja possvel, os integrantes da amostra devem ser escolhidos adequadamente.
Antes de aprofundarmos nosso discurso, vamos definir alguns termos necessrios:
Populao Objeto: a populao de interesse sobre a qual desejamos obter informaes (ex.: peas
produzidas em uma fbrica);
Populao de Estudo: o conjunto de indivduos de interesse especfico (ex.: peas que
permanecem em estoque);
Caracterstica Populacional: Aspectos da populao que interessam serem medidos ou observados
(ex.: dimetro da pea)
Unidade Amostral: Definida de acordo com o interesse do estudo, podendo ser uma pea, um
indivduo, uma fazenda, etc. Tal escolha deve ser feita no incio do estudo;
Estrutura Amostral ou Amostra: o conjunto de unidades amostrais (ex.: o conjunto das peas
selecionadas).
importante ressaltar que existem dois tipos de amostragem, a saber:
Amostragem Probabilstica: o procedimento atravs do qual existe uma probabilidade conhecida
e diferente de zero (p) para cada elemento da populao ser escolhido para constituir a amostra;
Amostragem No-Probabilstica: Quando, no processo de seleo, no existe nenhum mecanismo
probabilstico para selecionar os indivduos da populao para constituir a amostra.
De acordo com a definio de amostragem probabilstica, existe a suposio de um sorteio com regras bem
determinadas, cuja realizao s ser possvel se a populao for finita e totalmente acessvel. Esse tipo de
amostragem a melhor garantia para se obter uma representatividade da populao pela amostra. Os
principais planos de amostragem probabilstica so:
1. Amostragem Aleatria (ou Casual) Simples: Neste tipo de plano, supe-se que todos os elementos
da populao tem igual probabilidade de pertencer amostra, ou alternativamente, se todas as
possveis amostras, de mesmo tamanho, tm a mesma probabilidade de serem selecionadas.
Normalmente, consideramos esse tipo de plano amostral quando a populao homognea. Esse
processo de amostragem pode ser feito com ou sem reposio do elemento amostrado. Uma tcnica
que garante esta igual probabilidade a seleo aleatria de elementos, por exemplo, atravs de
sorteio.
40
2. Amostragem Sistemtica: Inicia com uma escolha aleatria de um elemento da populao e, a
partir deste, usa-se um sistema de seleo para compor o restante da amostra. Por exemplo, numa
listagem de elementos da populao, sorteamos um entre os dez primeiros da lista o 5
o
elemento. A
partir do elemento sorteado, selecionamos um a cada quinze elementos (o 20
o
, o 35
o
e assim por
diante). Este mtodo de amostragem pode ser utilizado quando se quer planejar um perodo de tempo
para execuo da coleta de dados ou quando se deseja cobrir um determinado perodo de tempo com
a amostra estudada. Tambm consideramos esse tipo de plano amostral quando a populao
homognea.
3. Amostragem Estratificada: Na amostragem estratificada a populao dividida em grupos
internamente homogneos (estratos) e em seguida selecionada uma amostra aleatria de cada
estrato. Este tipo de amostragem usado quando o evento estudado numa populao tem
caractersticas distintas para diferentes categorias que dividem esta populao, ou seja, dentro de
cada estrato os elementos so bastantes semelhantes entre si e, entre os estratos eles so
heterogneos. Assim, a estratificao apropriada para agrupar os elementos por sexo, faixa etria,
religio, escolaridade ou em populaes heterogneas como rendas, produes agrcolas, produes
industriais, etc.
4. Amostragem por Conglomerados: A populao dividida em pequenas subpopulaes, com
elementos internamente heterogneos, chamadas conglomerados (clusters). Seleciona-se uma
amostra aleatria simples desses conglomerados, e deles selecionam-se aleatoriamente os elementos
que iro compor a amostra. Assim, numa pesquisa scio econmica pode-se dividir a cidade em
bairros (conglomerados), em seguida obter uma amostra aleatria de bairros e, ento efetuar o
levantamento estatstico nas residncias dos bairros selecionados. Observe que, no caso da
estratificao, indivduos sero selecionados em cada estrato, enquanto no caso da diviso da
populao em conglomerados, selecionamos apenas parte dos conglomerados.
5. Amostragem por Estgios Mltiplos: Esta estratgia de amostragem pode ser vista como uma
combinao de dois ou mais planos amostrais. Considere por exemplo uma populao estratificada
onde o nmero de estratos muito grande. Ao invs de obter uma amostra aleatria de cada estrato,
o que poderia ser invivel devido quantidade de estratos, o pesquisador poderia optar por
selecionar aleatoriamente alguns estratos e em seguida selecionar uma amostra de cada estrato
selecionado. Neste caso, teramos uma amostragem em dois estgios usando, nas duas vezes, a
amostragem aleatria simples, sendo que no primeiro estgio as unidades amostrais so os estratos e
no segundo so as componentes da populao.
importante ressaltar que certos cuidados dever ser tomados no processo de obteno de uma
amostra, ou seja, no processo de amostragem, pois muitas vezes erros grosseiros e concluses falsas
ocorrem devido a falhas nesse processo.
3.2 Distribuio Amostral da Mdia e da Proporo
Na Inferncia Estatstica, o principal problema fazer uma afirmao sobre um parmetro
populacional (mdia, proporo, varincia, etc.) baseado em informaes coletadas de uma amostra, atravs
de um Estimador (mdia amostral, varincia amostral, etc.). No entanto, a validade de nossa afirmao seria
melhor compreendida se soubssemos o comportamento do Estimador ao retirarmos todas as amostras
possveis de tamanho n de uma populao de tamanho N. Em outras palavras, estamos interessados em
conhecer a distribuio amostral de um Estimador.
3.2.1 Distribuio da Mdia Amostral
A distribuio amostral da mdia X uma distribuio que mostra as probabilidades de obter os
possveis valores das mdias amostrais. Vamos supor uma populao {1, 3, 5} com N=3 elementos e a
varivel aleatria X assumido o valor do elemento na populao, com a seguinte distribuio de
probabilidade:
x
i
1 3 5
P(X = x
i
) 1/3 1/3 1/3
Observe que a distribuio acima tem mdia (valor esperado) e varincia dados por:
E(X) = =
1 3 5
3
+ +
=3 e V(X) =
2
=
( ) ( ) (5 ) 1 3 3 3 3
3
2 2 2
+ +
=
8
3
.
41
Se retirarmos todas as amostras aleatrias de tamanho n = 2, com reposio, dessa populao
obtemos um total de N
n
= 3
2
= 9 amostras com os seguintes resultados:
(1,1) (1,3) (1,5) (3,1) (3,3) (3,5) (5,1) (5,3) (5,5).
Considerando essas 9 possibilidades igualmente provveis, podemos construir a distribuio amostral da
mdia para uma amostra de tamanho 2. Para tanto, basta calcular a mdia de cada uma dessas amostras
obtendo os seguintes valores x
i
: 1, 2, 3, 2, 3, 4, 3, 4, 5, respectivamente. Note que, a partir das mdias
amostrais obtidas nas 9 amostras possveis, possvel obtermos a seguinte distribuio amostral para X :
i
x
1 2 3 4 5
) (
i
x X P =
1/9 2/9 3/9 2/9 1/9
Ainda com respeito distribuio amostral de X , acima apresentada, observa-se que:
a sua mdia (valor esperado) igual mdia da populao, ou seja, E( X ) =
X
=
= = = |
\
|
+ |
\
|
+ |
\
|
+ |
\
|
+ |
\
|
= 3
9
27
9
1
5
9
2
4
9
3
3
9
2
2
9
1
1 ;
a sua varincia igual varincia da populao dividida pelo tamanho da amostra. Temos que:
[ ]
2
2
) ( ) ( ) ( X E X E X V = .
Logo,
9
93
9
1
5
9
2
4
9
3
3
9
2
2
9
1
1 ) (
2 2 2 2 2 2
= |
\
|
+ |
\
|
+ |
\
|
+ |
\
|
+ |
\
|
= X E .
Assim, [ ]
n
X E X E X V
2
2
2
2
2
3
8
3
4
9
12
9
81 93
9
9
93
3
9
93
) ( ) ( ) (
= = = =
= = = = . Tais relaes
entre e
X
, e
2
e
2
X
, observadas no exemplo acima, podem ser generalizadas.
Usando a teoria das probabilidades possvel mostrar que os seguintes resultados gerais so vlidos
com relao distribuio amostral da mdia. Seja X uma varivel aleatria com valor esperado E(X) = e
varincia V(X) =
2
finita, isto , 0<
2
<. Seja X a mdia desta varivel aleatria, obtida de amostra
aleatria de tamanho n, selecionada com reposio. Ento, temos que:
E( X ) = =
X
;
V( X ) =
2
X
=
n
2
.
Alm disso, tem-se o resultado conhecido como Teorema Central do Limite: Seja X uma varivel aleatria
com valor esperado E(X) = e varincia V(X) =
2
. Para n suficientemente grande,
=
=
n
i
i
X
n
X
1
1
apresenta, aproximadamente, uma distribuio normal com mdia e varincia
n
2
, Logo,
|
|
\
|
n
N X
2
,
e
( ) 1 , 0 N
n
X
Z
|
\
|
=
.
A distribuio da varivel padronizada Z conhecida por Distribuio Normal Padro.
Observaes
1) O desvio padro de X , denotado por
n
X
N
n N
n
.
Assim temos que
= =
|
|
|
|
\
|
\
|
= ) 5 , 2 0 , 3 (
10
800 825
10
800 770
) 825 770 ( Z P
n
X
P X P
9925 , 0 0013 , 0 9938 , 0 ) 5 , 2 ( ) 0 , 3 ( = = Z P Z P .
Se considerarmos um grande nmero de amostras, cada uma com 64 turistas, em aproximadamente 99,25%
delas o gasto mdio estaria entre US$770,00 e US$825,00.
3.2.2 Distribuio Amostral da Proporo
Se o parmetro de interesse p representa uma proporo (ou percentagem) de elementos com certa
caracterstica (atributo) na populao, ento chamamos a estatstica correspondente na amostra de proporo
amostral, denotando-a por
n
x
p = , onde x = n
o
de elementos da amostra que possuem a caracterstica de interesse.
Pode-se mostrar que, sob certas condies, e se n suficientemente grande, a distribuio da
proporo amostral p aproximadamente Normal, com mdia E( p ) = p e varincia V( p ) =
p q
n
.
, onde
q = 1 p. Dessa forma, temos que
|
\
|
n
q p
p N p
.
, e
( ) 1 , 0
.
N
n
q p
p p
Z
=
.
No caso de uma populao finita de tamanho N e uma amostra sem reposio, recomenda-se o uso do fator
de correo populacional no clculo da varincia de p , sendo expressa por:
V( p ) =
1
.
N
n N
n
q p
.
43
Exemplo 4.2 Suponha que de um grande lote de produo, 10% dos itens produzidos apresentam algum tipo
de defeito. Em uma amostra aleatria de tamanho 60, obtida do lote para inspeo de qualidade, calcule a
probabilidade de ter mais de 15% dos itens defeituosos.
Soluo:
0985 , 0 9015 , 0 1 ) 29 , 1 (
60
9 , 0 1 , 0
10 , 0 15 , 0
.
) 15 , 0 ( = = > =
|
|
|
|
|
\
|
>
= > Z P
n
q p
p p
P p P
.
Se considerarmos um grande nmero de amostras, cada uma contendo 60 itens, em aproximadamente 9,85%
das amostras a proporo de itens defeituosos seria superior a 15%.
Exerccios
4.1 Admita que a aceitao de um grande lote de peas ocorra apenas se o comprimento mdio de 10
peas, retiradas aleatoriamente do lote, estiver entre 5 cm e 10 cm. Sabe-se que o comprimento das peas
uma varivel aleatria com distribuio Normal com mdia = 7,5cm e varincia
2
= 20 cm
2
. Calcule a
probabilidade do lote ser aceito. (R.: 0,9232)
4.2 Seja X
1
, X
2
, ... , X
n
uma amostra aleatria de tamanho n obtida de X ~ N(
,
2
). Qual a
probabilidade da mdia amostral, X , estar compreendida em cada um dos intervalos seguintes?
a)
X
;
b)
2
X
;
c)
3
X
;
onde
X
=
n
=
=
n
i
i
x
n
X
1
1
, onde x
1
, x
2
, ... , x
n
so n valores amostrais,
um estimador que representa a mdia populacional (parmetro).
Estimativa - um valor particular do estimador para uma dada amostra coletada. Assim, por
exemplo, para uma dada amostram, kg X 9 , 3 = pode ser uma estimativa para o verdadeiro peso
mdio, desconhecido, de recm-nascidos do sexo feminino em certa localidade.
Estimao por ponto ou Estimao Pontual chamamos de estimao pontual quando, a partir de
uma amostra, um nico valor usado para estimar um parmetro desconhecido. Um estimador
pontual para um parmetro populacional , geralmente representado por
. Assim, X , S
2
, S e p
so estimadores pontuais para os parmetros ,
2
, e p respectivamente, isto , = X ,
2
=S
2
,
=S e
n
x
p p = = , onde x = n
o
de elementos da amostra que possuem certa caracterstica de
interesse.
46
Quando achamos uma estimativa pontual, ela raramente coincide com o valor real do parmetro.
Uma desvantagem do uso de estimadores pontuais que, se nenhuma informao adicional for dada, no h
maneira de decidir o quo boa a estimativa, pois no temos nenhuma ideia da sua preciso. Um
procedimento mais desejvel para estimao , ento, calcular um intervalo que tenh uma probabilidade
pr-estabelecida de conter o parmetro desconhecido.
A Estimao por intervalo ou Intervalos de Confiana um mtodo de estimao onde, a partir de
uma amostra aleatria, determinamos um intervalo [T
1
, T
2
] que contm o verdadeiro parmetro com uma
probabilidade conhecida 1 - , chamada de Grau ou Nvel de Confiana, onde (alfa) a probabilidade
do intervalo no conter o verdadeiro valor do parmetro desconhecido. Assim, se amostras aleatrias, do
mesmo tamanho, so obtidas repetidamente da mesma populao, uma certa percentagem de intervalos
(nvel de confiana) incluir o parmetro populacional desconhecido. Alm disso, veremos que a partir das
estimativas intervalares possvel inferir sobre o quo confiveis so realmente as estimativas pontuais
obtidas.
3.2 Intervalos de Confiana para Mdia Populacional
Um intervalo de confiana para uma mdia especifica um intervalo de valores dentro do qual o
parmetro populacional desconhecido, neste caso a mdia, pode estar. Estes intervalos podem ser usados, por
exemplo, por um fabricante que deseja estimar sua produo mdia diria ou um pesquisador que deseja
estimar o tempo de resposta mdia, por paciente, a uma nova droga.
De modo geral, estamos interessados em encontrar um intervalo na forma
] [ ] ; [
0 0 2 0 1
= + = = X X T X T ,
onde
0
representa a semiamplitude do intervalo de confiana, sendo chamado de Erro de Preciso em
relao a . Portanto, o objetivo encontrar
0
, tal que
= < 1 ) | (|
0
X P ,
que equivalente a
= + < < 1 ) (
0 0
X P .
Note que essa afirmao probabilstica pode ser reescrita por
= + < < 1 ) (
0 0
X X P .
Em breve, entenderemos a necessidade destas duas ltimas afirmaes probabilsticas.
3.2.1. Intervalos de Confiana para Mdia Populacional Caso 1:
2
conhecida
Suponha que temos uma amostra aleatria de tamanho n, X
1
, X
2
, ... , X
n
, de uma populao cuja
distribuio normal com mdia e varincia
2
. Ento
=
=
n
i
i
x
n
X
1
1
apresenta distribuio
|
|
\
|
n
N X
2
,
e
( ) 1 , 0 N
n
X
Z
|
\
|
=
.
Sejam 1- um nvel de confiana qualquer, 0 < 1- < 1. Temos que,
= + < < 1 ) (
0 0
X P
=
+
< <
1 )
/ /
(
0 0
n
Z
n
P
= < <
1 )
/ /
(
0 0
n
Z
n
P
= + < < 1 ) (
2 / 2 /
z Z z P
onde:
n
z
n
z
/
e
/
0
2 /
0
2 /
= .
f(z)
z
/2
/2
/2
-z
/2
47
Logo,
n
z
2 / 0
= .
Assim, note que a partir da expresso acima podemos tambm estimar, por exemplo, o tamanho da amostra
(n) quando
0
, z e so conhecidos
2
0
2 /
|
|
\
|
=
z n .
Como, = + < < = + < < 1 ) ( 1 ) (
0 0 0 0
X X P X P , temos que
= + < < 1 ) (
2 / 2 /
n
z X
n
z X P
.
Em outras palavras, isso significa que a probabilidade de que o verdadeiro valor de pertena ao
intervalo
] ; [
2 / 2 /
n
z X
n
z X
+
igual a 1-.
Exemplo 5.1: Para estimar gasto mdio semanal no supermercado A, coletou-se uma amostra aleatria de
16 consumidores, obtendo-se um gasto mdio amostral de X = US$30,00. Supondo uma distribuio
normal para a populao, com desvio padro = US$2,60, obtido de outros estudos similares, calcule um
intervalo de 95% de confiana para estimar o gasto mdio semanal populacional no supermercado A.
Soluo: Temos: = 2,6; n = 16 e X = 30. Para = 5% z
/2
= ) (
2 /
z Z P = 1,96. Logo, o intervalo de
confiana ser, ento expresso por: IC(,95%) =
16
6 , 2
96 , 1 30 = 30 1,27 ou [28,73; 31,27].
Observao.: No IC(,95%) = [30 1,27], o valor 1,27 a estimativa do erro para a estimativa. Em outras
palavras, h 95% de probabilidade da estimativa no diferir do verdadeiro valor da mdia () por mais de
1,27.
Dica: Abaixo, seguem os valores mais usados de z
/2
tal que ) 2 / ( 1 ) (
2 /
= z Z P :
1% 5% 10%
z
/2
2,57 1,96 1,64
3.2.2 Intervalos de Confiana para Mdia Populacional Caso 2:
2
NO conhecida
Quando a varincia populacional desconhecida, adota-se como estimador de
2
a varincia
amostral S
2
, expressa por
1
) (
1
2
2
=
n
x x
S
n
i
i
.
Agora, a estatstica
) 1 (
~
/
=
n
t
n S
X
T
,
ter distribuio t-Student com n-1 graus de liberdade, e no mais a distribuio normal padro. No
entanto, podemos re-escrever a estatstica T como funo da distribuio normal padro (Z), da seguinte
forma:
48
S
Z
S
n
X
n
S
X
T
=
.
Logo,
S
t z
S
z t
n n ) 2 / , 1 ( 2 / 2 / ) 2 / , 1 (
= =
.
Substituindo
S
t z
n ) 2 / , 1 ( 2 /
= no intervalo de confiana do caso 1 teremos, quando a varincia
populacional
2
desconhecida, o intervalo de confiana que contm o verdadeiro valor da mdia
populacional com probabilidade 1-, expresso por
] ; [
) 2 / , 1 ( ) 2 / , 1 (
n
S
t X
n
S
t X
n n
+
.
Logo,
n
S
t
n ) 2 / , 1 ( 0
= .
Assim, a partir da expresso acima podemos tambm estimar, por exemplo, o tamanho da amostra (n)
quando
0
, z e S so conhecidos.
Exemplo 5.2: Um fiscal de produtos alimentcios seleciona uma amostra aleatria de 16 pacotes de lanche
marca M nas prateleiras de um supermercado. Pesa o contedo de cada pacote, encontrando um peso
mdio X = 170g e um desvio padro S = 5g. O peso lquido indicado em cada pacote 180g. Verifique se
um intervalo com 90% de confiana para o peso mdio lquido verdadeiro abrange o peso lquido
especificado na embalagem. Suponha distribuio normal para a populao.
Soluo: Dados: n = 16, X = 170g e S = 5g. Para = 10% e n = 16 =
2 / , 1 n
t
t
n1 2 ,
= t
15;0,05
=1,753,
obtido da tabela da distribuio t-Student, pois a informao que dispomos no problema diz respeito ao
desvio padro amostral.
Logo, o intervalo de confiana para o peso mdio populacional ser denotado por: IC(,90%) =
16
5
753 , 1 170
= [170 2,19] ou [167,81; 172,19]. Note que o IC no abrange o peso lquido indicado na
embalagem de 180g.
Exemplo 5.3: Em uma amostra de n = 9 testes de consumo, um motor experimental percorreu,
respectivamente, 16, 14, 17, 15, 15, 14, 18, 17 e 18 km com l litro de gasolina (sob condies especficas).
Supondo distribuio normal para a populao, construa um intervalo de 99% de confiana para a distncia
mdia verdadeira do novo motor, com 1 litro de gasolina.
Soluo: Seja X = quilmetros percorridos com 1 litro de gasolina. Temos que n = 9, X = 16km/l e S =
1,581 km/l. Para = 1% e n = 9
t
n1 2 ,
= t
8; 0,005
= 3,355, obtido da tabela da distribuio t-Student.
Logo, o intervalo de confiana ser denotado por: IC(,99%) =
9
581 , 1
355 , 3 16
= [16 1,77] ou [14,23;
17,77] km/l de gasolina.
Assim, podemos afirmar que com 99% de confiana, o intervalo [14,23 km/l; 17,77km/l] contm o
verdadeiro valor para a distncia percorrida pelo novo motor (em quilmetros) com um litro de gasolina.
49
Exemplo 5.4: Se um pesquisador sabe que uma populao tem distribuio normal com desvio padro =
12. Considerando um nvel de confiana de 95%, encontre o tamanho de amostra necessrio para que a
mdia amostral no se afaste em mais de 2 unidades do verdadeiro valor da mdia populacional.
Soluo: Em nosso problema, observamos que o desvio padro populacional conhecido. Neste caso,
usamos a seguinte expresso para o clculo do tamanho de amostra
2
0
2 /
|
|
\
|
=
z n .
Temos que = 12,
0
= 2 e que = 5% z
/2
= 1,96. Dessa forma,
. 139
2
12
96 , 1
2
2
0
2 /
|
\
|
=
|
|
\
|
=
z n
3.2.3 Intervalos de Confiana para uma Proporo Populacional p
Estes intervalos podem ser usados para, por exemplo, informar sobre a proporo de alunos evadidos
na UFPB, a proporo de itens defeituosos em uma linha de produo ou a proporo de uma populao que
imune a certa enfermidade.
Seja X a varivel aleatria representando o n
o
de sucessos em n repeties independentes de um
experimento com dois possveis resultados (sucesso e fracasso), onde P(sucesso) = p e a P(fracasso) = q =1 -
p, constantes. Ento X B(n,p), onde
X
= E(X) = np e
2
= Var(X) = np(1-p). Para p no muito prximo
de 0 ou 1 e se n suficientemente grande (um critrio usado na prtica, usar a aproximao quando np e
n(1-p) forem maiores do que 5) temos, segundo o Teorema Central do Limite, que
( ) ) 1 ( , ~ p np np N X .
Logo,
|
\
|
=
n
p p
p N
n
x
p
) 1 (
, ~
, visto que
p np
n n
X
E p E = = |
\
|
=
1
) (
e
n
p p
p np
n n
X
Var p Var
) 1 (
) 1 (
1
) (
2
= = |
\
|
=
. Assim, ( ) 1 , 0
) 1 (
N
n
p p
p p
Z
= .
O intervalo que estamos procurando, da forma ] [
0
p , ser obtido por um caminho semelhante
ao adotado no caso da mdia populacional chegando-se, facilmente, a
n
p p
z
) 1 (
2 / 0
.
Note que a partir da expresso acima tambm podemos o tamanho da amostra (n) quando
0
, z e p so
conhecidos.
No entanto, na prtica p desconhecido, sendo substitudo pela proporo amostral p . Tal
substituio encontra justificativa no fato de que se n suficientemente grande para garantir a aproximao
para Normal, a estimativa deve ser razoavelmente prxima do valor real do parmetro. Assim, o intervalo de
confiana para p, ao nvel de confiana 1-, dado por
]
) 1 (
;
) 1 (
[
2 / 2 /
n
p p
z p
n
p p
z p
+
Exemplo 5.5: Para se avaliar a taxa de desemprego em uma cidade, coletou-se uma amostra aleatria de
1000 habitantes em idade de trabalho e observou-se que 87 eram desempregados. Estimar a percentagem de
desempregados em toda a cidade (populao) atravs de um intervalo de 95% de confiana.
50
Soluo: Temos que n = 1000 e que a proporo amostral de desempregados
087 , 0
1000
87
= = p
. Logo, $ q =
1 p = 0,913. Para = 5% Z
/2
= 1,96.
O intervalo de confiana ser, ento:
IC(p,95%) = [0,087 1,96x
0 087 0 913
1000
, , x
] = [0,087 0,0175] ou [ 0,0695; 0,1045] ou, ainda, [6,95%;
10,45%].
Exemplo 5.6: Numa pesquisa de mercado, 57 das 150 pessoas entrevistadas preliminarmente afirmaram que
seriam compradoras de certo produto a ser lanado. Essa amostra suficiente para estimar a proporo real
de futuros compradores, com um erro de 4% e confiana de 95%?
Soluo:
38 , 0
150
57
= = p
e $ q = 1 p = 0,62;
0
= 0,04; Z
/2
= 1,96.
Logo,
566 ) 62 , 0 ( 38 , 0
04 , 0
96 , 1
) 1 (
2 2
0
2 /
|
\
|
=
|
|
\
|
= p p
z
n
.
Como apenas 150 pessoas foram entrevistadas preliminarmente, a amostra no foi suficiente. Sendo
necessrio entrevistar mais 566 - 150 = 416 pessoas.
3.3. Testes de Hipteses
Na estimao de parmetros, foram apresentados procedimentos que permitem definir estimadores
pontuais ou por intervalos de parmetros populacionais. Um outro procedimento de inferncia estatstica o
Teste de Hiptese - tem como objetivo principal verificar, a partir de informaes contidas em uma amostra
aleatria, se hipteses a respeito de parmetros populacionais so ou no verdadeiras. Assim podemos estar
interessados em: verificar uma especificao de qualidade de um produto, testar uma experincia de sucesso
no passado, avaliar uma teoria ou decidir sobre suposies resultantes das observaes. Logo, atravs dos
testes de hipteses podem-se eliminar, tanto quanto possvel, falsas concluses cientficas.
3.3.1. Conceitos Fundamentais
O Teste de Hiptese se baseia numa situao experimental (amostra) e consiste na comparao de
duas hipteses chamadas Hiptese Nula e Hiptese Alternativa.
Hiptese Nula (H
0
) - uma afirmao sobre o parmetro, supostamente verdadeira, que vai ser posta
prova e na qual o teste montado. Em geral, formula-se H
0
com o objetivo de rejeit-la, isto , formulamos
H
0
contrria ao que suspeitamos que seja verdade. Por exemplo, se um cientista acha que uma nova droga
eficaz para certo tipo de paciente, ento, por contradio, formulamos a hiptese H
0
de que a nova droga no
eficaz. Portanto, para provar que o cientista est certo, H
0
teria de ser rejeitada. Dessa forma, podemos
pensar que o que estamos interessados deve ser alocado em H
1
(Hiptese Alternativa).
Uma possvel representao : H
0
: =
0
, onde qualquer parmetro.
Hiptese Alternativa (H
1
) - Hiptese que vai ser comparada hiptese nula, isto , uma afirmao
sobre o parmetro que afirma A hiptese nula H
0
falsa.
Se usamos H
0
: =
0
para representar a hiptese nula, ento podemos usar as seguintes
representaes para as possveis hipteses alternativas:
H
1
:
0
;
H
1
: <
0
;
H
1
: >
0
51
3.3.2 Definio da Regra de Deciso, Erros e Nvel de Significncia
Quando testamos hiptese estatsticas, qualquer que seja a deciso tomada, estamos sujeitos a
cometer dois possveis tipos de erros:
Erro do Tipo I: quando se rejeita a hiptese nula H
0
e a mesma verdadeira. Denotamos por a
probabilidade de cometer este erro, isto , = P(erro tipo I) = P(rejeitar H
0
| H
0
verdadeira). O
erro tipo I () tambm conhecido como nvel de significncia de um teste de hipteses.
Erro do Tipo II: no se rejeita a hiptese nula H
0
, quando a mesma falsa. Denotamos por a
probabilidade de cometer este erro, isto , = P(erro tipo II) = P(no rejeitar H
0
| H
0
falsa).
O quadro abaixo resume as possibilidades das decises envolvidas em um teste de hiptese, com as
probabilidades de ocorrncias dos erros tipo I () e II ().
Quadro 1: Avaliao das Decises em um Teste de Hipteses
Deciso
Situao Real
H
0
Verdadeira H
0
Falsa
No Rejeitar H
0
Deciso Correta Erro do Tipo II ()
Rejeitar H
0
Erro do Tipo I () Deciso Correta
Devido as dificuldades de se conseguir minimizar os dois tipos de erros ao mesmo tempo, em geral,
nos preocupamos mais na possibilidade de rejeitar uma hiptese sendo ela verdadeira. Dessa forma, teremos
uma maior ateno no controle do erro do tipo I. Por exemplo, se definimos as hipteses
H
0
: uma nova droga no eficaz para certos pacientes;
H
1
: uma nova droga eficaz para certos pacientes.
A aceitao de H
0
, sendo esta hiptese falsa, possibilita a busca de outros meios de tratamentos, enquanto
que a rejeio de H
0
, sendo esta verdadeira, exclui a possibilidade de se prosseguir com outras opes para os
pacientes. Logo, desejvel exercer um controle sobre e mant-lo pequeno. Dessa forma, os testes de
hiptese podem ser montados de maneira que, fixado o erro do tipo I, o erro do tipo II seja minimizado
aumentando-se o tamanho da amostra.
Observao: O significado de usado nos Testes de Hipteses totalmente diferente de seu significado na
Estimao por Intervalos. Nos Testes de Hiptese, representa a probabilidade de rejeitar uma hiptese nula
suposta verdadeira, enquanto que na Estimao por Intervalos representa a probabilidade de que os limites
de confiana construdos no contenham o verdadeiro valor do parmetro.
Estatstica do Teste
A deciso de rejeitar ou no a hiptese nula (H
0
) baseada nos dados amostrais, que so usados para
calcular o valor da Estatstica de Teste e que servir de referncia para a tomada da deciso. Para isso,
divide-se a curva da distribuio amostral da estatstica em duas regies, uma chamada Regio Crtica (ou
Regio de Rejeio de H
0
), e a outra Regio de No Rejeio de H
0
. Temos, ento, a seguinte Regra de
Deciso do teste: se o valor calculado da estatstica do teste pertencer regio crtica, rejeita-se H
0
em
favor da hiptese alternativa; caso contrrio, H
0
no ser rejeitada em relao hiptese alternativa.
Outras definies importantes, necessrias na formulao de um problema de Testes de Hipteses so:
Regio Crtica do Teste - a regio de rejeio de H
0
, isto , o conjunto de valores de uma
estatstica que determina a rejeio de H
0
. Rejeitamos a hiptese nula se a estatstica de teste est
na regio crtica, porque isto indica uma discrepncia significativa entre a hiptese nula e os
dados amostrais.
Valor Crtico do Teste: o valor, ou valores, que separa(m) a regio crtica (que levam a
estatstica do teste a rejeitar a hiptese nula) da regio de no rejeio de H
0
.
Dependendo da hiptese alternativa, temos os seguintes tipos de Testes de Hipteses:
52
Teste Unilateral: quando a regio crtica do teste localizada completamente em uma das
extremidades da curva da distribuio amostral da estatstica do teste.
o Teste Unilateral Esquerda: a regio crtica (sombreada) localiza-se no extremo
esquerdo da distribuio.
Hipteses: H
0
: =
0
vs H
1
: <
0
o Teste Unilateral Direita: a regio crtica (sombreada) localiza-se no extremo direito da
distribuio.
Hipteses: H
0
: =
0
vs H
1
: >
Teste Bilateral: a regio crtica (sombreada) localiza-se nas duas extremidades da distribuio.
Hipteses: H
0
: =
0
vs H
1
:
0
A escolha entre usar um teste unilateral e um teste bilateral determinada pelos objetivos do problema, no
qual se deseja verificar uma afirmao a cerca do parmetro populacional.
3.3.3 Fases na Realizao de um Teste de Hipteses
1 - Formular as hipteses nula (H
0
) e alternativa (H
1
);
2 - Decidir qual estatstica de teste ser usada para julgar a hiptese nula;
3 - Fixar o nvel de significncia ;
4 - Determinar a regio crtica;
5 - Usar os valores amostrais para calcular o valor da estatstica citada na fase 2;
6 - Se o valor citado na fase anterior pertencer regio crtica, rejeitar H
0
. Caso
contrrio, no rejeitar H
0
.
3.3.4. Teste de Hipteses para a Mdia Populacional Caso 1:
2
conhecida
O primeiro passo num Teste de Hipteses consiste em formular a hiptese a ser testada. No quadro 1,
podemos observar que para cada possvel hiptese existe uma regio crtica e regra de deciso associada. No
caso do teste de hipteses para mdia populacional, supondo a varincia populacional conhecida, utilizamos
a seguinte estatstica do teste:
n
X
0
=
C
Z .
Note que a estatstica calculada com base nas informaes contidas na amostra.
O prximo passo consiste em fixar o nvel de significncia do teste (). A seguir, apresentamos os valores
mais usados para Z
e Z
/2
.
1% 5% 10%
Z
H
0
: =
0
(**)
H
1
: >
0
Z
c
Z
(*) Por simplicidade, excluiu-se a possibilidade
0
na hiptese nula H
0
, com base no conhecimento de que tal fato
levaria mesma deciso que a aceitao simples de H
0
: =
0
.
(**) Por simplicidade, excluiu-se a possibilidade
0
na hiptese nula H
0
, com base no conhecimento de que tal fato
levaria mesma deciso que a aceitao simples de H
0
: =
0
.
Exemplo 5.7: O gerente de uma indstria de carnes enlatadas tem estabelecido a seguinte especificao: um
novilho com 12 meses de vida resulta numa mdia de 250kg de carne. A experincia passada indica que,
mesmo com uma mudana na mdia, o desvio padro permanece ligeiramente constante, em = 18kg. Para
determinar se a especificao est sendo observada, o gerente seleciona uma amostra aleatria com 100
novilhos e obteve uma mdia X =253kg de carne. Realize um teste de hiptese para verificar se houve
mudana na especificao, a um nvel de significncia de 5%.
Soluo:
H
0
: = 250kg
H
1
: 250kg (a especificao no est sendo observada)
Temos que = 18kg; n = 100, X = 253kg e = 5%.
Dessa forma, a estatstica do teste Z
c
=
253 250
18
100
=
n
x x
S
n
i
i
.
Dessa forma, a estatstica do teste para mdia populacional quando
2
desconhecida ser expressa por
n S
X
0
=
C
T ,
que segue uma distribuio t-Student com n-1 graus de liberdade.
O prximo passo consiste em fixar o nvel de significncia do teste (). A seguir, apresentamos as
regies crticas e regras de deciso para as respectivas hipteses.
Quadro 3: Resumo das Hipteses, Regies Crticas e Regras de Deciso para a Mdia Populacional,
considerando
2
desconhecido.
Hiptese Regio Crtica
(sombreada)
Regra de Deciso
(Rejeitar H
0
)
H
0
: =
0
H
1
:
0
T
c
-t
(n-1,/2)
ou
T
c
t
(n-1,/2)
H
0
: =
0
(*)
H
1
: <
0
T
c
-t
(n-1,)
H
0
: =
0
(**)
H
1
: >
0
T
c
t
(n-1,)
(*) Por simplicidade, excluiu-se a possibilidade
0
na hiptese nula H
0
, com base no conhecimento de que tal fato
levaria mesma deciso que a aceitao simples de H
0
: =
0
.
(**) Por simplicidade, excluiu-se a possibilidade
0
na hiptese nula H
0
, com base no conhecimento de que tal fato
levaria mesma deciso que a aceitao simples de H
0
: =
0
.
Exemplo 5.8: O tempo mdio necessrio para completar uma tarefa era de 15 minutos. Obtm-se uma
amostra aleatria de nove indivduos e, durante o perodo de teste, seus tempos (X) para concluir a tarefa
foram 11, 12, 15, 10, 12, 14, 15, 13 e 15. Assumindo que estes dados vm de uma distribuio normal, teste
a hiptese de que houve alterao no tempo mdio para completar a tarefa. Use um nvel de 5% de
significncia.
Soluo:
H
0
: = 15min
H
1
: 15min (houve alterao no tempo mdio)
Com base nas informaes amostrais, temos que n = 9; X = 13min e S = 1,871 min.
55
Dessa forma, a estatstica do teste ser T
c
=
13 15
1871
9
,
= 3,207. Como o teste bilateral , o valor crtico ao
nvel = 5%, sendo n = 9, ser t
n-1;/2
= t
8;0,025
= 2,306 (obtido da tabela da distribuio t-Student).
Deciso: Como T
c
< t
n-1;/2
, existem evidncias para rejeitar H
0
. Logo, com base nos dados amostrais e com
5% de significncia podemos rejeitar a hiptese H
0
, ou seja, existem evidncias para afirmar que os
indivduos apresentaram um tempo mdio para executar a tarefa diferente do que era observado
anteriormente.
3.3.6. Teste de Hipteses para a uma Proporo Populacional p
Ao se fazer inferncias sobre uma proporo populacional, p, tomamos nossas com base nas
evidncias sobre seu valor amostral, p , de elementos com a caracterstica de interesse.
Pelo Teorema Central do Limite, sabe-se que, para n suficientemente grande, a proporo amostral,
n
x
p = segue, aproximadamente, uma distribuio
|
\
|
n
p p
p N p
) 1 (
, ~
.
Dessa forma, sob a hiptese H
0
: p = p
0
, a estatstica do teste para a proporo populacional p ser
expressa por
( ) 1 , 0 ~
) 1 (
0 0
0
N
n
p p
p p
Z
C
=
,
que segue uma distribuio normal padro.
Aps fixar o nvel de significncia do teste (), apresentamos a seguir as regies crticas e regras de deciso
para as respectivas hipteses.
Quadro 3: Resumo das Hipteses, Regies Crticas e Regras de Deciso para a Proporo
Populacional p.
Hiptese Regio Crtica
(sombreada)
Regra de Deciso
(Rejeitar H
0
)
H
0
: p = p
0
H
1
: p p
0
Z
c
-Z
/2
ou Z
c
Z
/2
H
0
: p = p
0
(*)
H
1
: p < p
0
Z
c
-Z
H
0
: p = p
0
(**)
H
1
: p > p
0
Z
c
Z
(*) Por simplicidade, excluiu-se a possibilidade p p
0
na hiptese nula H
0
, com base no conhecimento de que tal fato
levaria mesma deciso que a aceitao simples de H
0
: p = p
0
.
56
(**) Por simplicidade, excluiu-se a possibilidade p p
0
na hiptese nula H
0
, com base no conhecimento de que tal fato
levaria mesma deciso que a aceitao simples de H
0
: p = p
0
.
Exemplo 5.9: Afirma-se que em um alqueire de mas, 10% esto estragadas. De uma amostra aleatria de
150 mas examinadas, 30 estavam estragadas. O que voc conclui sobre a proporo de mas estragadas
em um alqueire a um nvel de 5% de significncia?
Soluo:
H
0
: p = 0,1
H
1
: p 0,1
Com base nas informaes amostrais, temos que n = 150 e p = 30/150 = 0,2.
Dessa forma, a estatstica do teste ser Z
C
=
0 2 0 1
0 1 0 9
150
, ,
( , ).( , )
= 1,64.
Deciso: Como Z
C
> Z
d
i
a
d
e
n
o
t
a
s
n
a
g
r
a
d
u
a
o
4,00
3,75
3,50
3,00
2,75
2,50
2,25
2,00
1,50
1,75
3,25
300 350 400 450 500 550 600 650 700 750 800
Nota no vestibular
58
Correlao
Uma medida do grau e do sinal da correlao linear entre duas variveis (X,Y) dado pelo
Coeficiente de Correlao Linear de Pearson, definido por:
Y X
S S
Y X Cov
r
) , (
= ,
onde S
X
e S
Y
representam o desvio padro amostral das variveis X e Y, respectivamente, e Cov(X,Y) a
covarincia entre elas, definida por:
1
) )( (
) , (
1
=
n
y y x x
Y X Cov
i
n
i
i
.
Portanto, aps alguma lgebra, possvel denotar o coeficiente de correlao linear pela expresso
abaixo:
Propriedades do Coeficiente de Correlao Linear
o Este coeficiente adimensional, logo no afetado pelas unidades de medidas das variveis X e Y;
o O sinal positivo indica que as variveis so diretamente proporcionais, enquanto que o sinal
negativo indica que a relao entre as variveis inversamente proporcional;
o O valor de r estar sempre no intervalo de -1 a 1. Teremos r = +1 se os pontos estiverem
exatamente sobre uma reta ascendente (correlao positiva perfeita). Por outro lado, teremos r = -1
se os pontos estiverem sobre uma reta descendente (correlao negativa perfeita)
0 1 -1
ausncia
Sent ido: negativa negat iva negati va posi tiva posi tiva posit iva
Fora: forte moderada fraca fraca moderada forte
Teste de Hipteses para o Coeficiente de Correlao Linear
Como o valor de r calculado com base nos n elementos de uma amostra, este representa uma
estimativa do verdadeiro valor para o coeficiente de correlao populacional (). Logo, faz-se necessrio
alguma ferramenta de inferncia estatstica que permita saber se o valor de r, combinado com o respectivo
tamanho de amostra n, a um dado nvel de significncia , suficiente para afirmarmos que existe uma
correlao linear entre duas variveis.
Dessa forma, sob a hiptese H
0
: = 0, a estatstica do teste para correlao linear populacional ser
expressa por
2 / ), 2 (
2
~
1
2
=
n C
t
r
n
r T ,
que segue uma distribuio t-Student com n-2 graus de liberdade.
Aps fixar o nvel de significncia do teste (), apresentamos a seguir a regio crtica e a regra de deciso
para o teste bilateral.
2
1 1
2
2
1 1
2
1 1 1
|
\
|
|
\
|
=
= = = =
= = =
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i i
y y n x x n
y x y x n
r
59
Quadro 4: Hipteses, Regio Crtica e Regra de Deciso para a Correlao Linear Populacional
Hiptese Regio Crtica
(sombreada)
Regra de Deciso
(Rejeitar H
0
)
H
0
: = 0
H
1
: 0
T
c
-t
(n-2,/2)
ou
T
c
t
(n-2,/2)
Exemplo 6.1: A tabela abaixo apresenta os preos mdios das aes e ttulos divulgados pela Bolsa de Nova
York entre 1950 e 1959. Calcule o coeficiente de correlao de Pearson, interprete o resultado e verifique sua
significncia a nvel de 5%.
Ano Aes (X) Ttulos (Y)
1950 35,22 102,43
1951 39,87 100,43
1952 41,85 97,43
1953 43,23 97,81
1954 40,06 98,32
1955 53,29 100,07
1956 54,14 97,08
1957 49,12 91,59
1958 40,71 94,85
1959 55,15 94,65
Total () 452,64 974,66
Soluo:
Para o clculo do coeficiente de correlao r, necessitamos de alguns clculos preliminares a partir da tabela
acima:
Ano Aes (x) Ttulos (y) xy x
2
y
2
1950 35,22 102,43 3607,58 1240,45 10491,90
1951 39,87 100,43 4004,14 1589,62 10086,18
1952 41,85 97,43 4077,45 1751,42 9492,60
1953 43,23 97,81 4228,33 1868,83 9566,80
1954 40,06 98,32 3938,70 1604,80 9666,82
1955 53,29 100,07 5332,73 2839,82 10014,00
1956 54,14 97,08 5255,91 2931,14 9424,53
1957 49,12 91,59 4498,90 2412,77 8388,73
1958 40,71 94,85 3861,34 1657,30 8996,52
1959 55,15 94,65 5219,95 3041,52 8958,62
Total () 452,64 974,66 44025,03 20937,69 95086,72
Logo, temos que
( ) ( )
4561 , 0
66 , 974 ) 72 , 95086 ( 9 64 , 452 ) 69 , 20937 ( 9
) 66 , 974 64 , 452 ( ) 03 , 44025 ( 9
2 2 2
1 1
2
2
1 1
2
1 1 1
=
=
|
\
|
|
\
|
=
= = = =
= = =
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i i
y y n x x n
y x y x n
r
60
Conclumos que existe uma correlao negativa entre os preos mdios das aes e de ttulos, ou seja, existe
uma tendncia de baixa nos preos das aes quando se verifica alta nos preos dos ttulos e vice-versa,
embora tal relao no seja acentuada.
Para testar a significncia da correlao, devemos realizar um teste de hipteses para correlao
populacional. As hipteses H
0
e H
1
so definidas por:
H
0
: =
0
H
1
:
0
Com base nas informaes amostrais, temos que n = 9 e r = -0,4561. Dessa forma, a estatstica do teste ser
4496 , 1
1
2
2
=
=
r
n
r T
C
. De acordo com a hipteses H
1
, temos que o teste ser bilateral e, portanto, o
valor crtico ao nvel = 5% ser t
(n-2,/2)
= t
(7,0.025)
= 2,37.
Deciso: Como t
(n-2,/2)
< T
C
< t
(n-2,/2)
No existem evidncias para rejeitar H
0
. Logo, com base nos
dados amostrais e ao nvel de 5% de significncia, no podemos afirmar que exista uma correlao entre os
preos mdios das aes e dos ttulos entre 1950 e 1959.
3.2. Regresso
Quando analisamos dados que sugerem a existncia de uma relao funcional entre duas variveis,
surge ento o problema de se determinar uma funo matemtica que exprima esse relacionamento, ou seja,
uma equao de regresso.
Portanto, ao imaginar uma relao funcional entre duas variveis, digamos X e Y, estamos
interessados numa funo que explique grande parte da variao de Y por X. Entretanto, uma parcela da
variabilidade de Y no explicada por X ser atribuda ao acaso, ou seja, ao erro aleatrio.
Admitimos que a varivel X seja coletada sem erro, isto , X no ser aleatrio. Enquanto que a
varivel Y apresenta uma variao na qual, acreditamos, que possa ser explicada por X. Essa situao admite
a formulao do problema de modo que uma varivel Y, chamada de varivel resposta ou dependente, seja
apresentada em funo de uma varivel X, denominada de varivel explicativa ou independente.
Formalmente, a anlise de regresso parte de um conjunto de observaes pareadas (x
1
, y
1
), (x
2
, y
2
),
..., (x
n
, y
n
), relativas s variveis X e Y e considera que podemos escrever a relao entre as duas variveis,
da seguinte maneira:
y
i
= + x
i
+
i
,
onde:
o y
i
a varivel resposta associada i-sima observao de Y;
o x
i
a i-sima observao do valor fixado para a varivel independente (e no aleatria) X;
o
i
o erro aleatrio para a i-sima observao, isto , o efeito de fatores que esto afetando a
observao de Y de forma aleatria. Por suposio, consideramos que
i
~ N(0,
2
);
o e so parmetros que precisam ser estimados.
Estimando os Parmetros do Modelo
O nosso objetivo ser estimar valores para e atravs dos dados fornecidos pela amostra. Alm
disso, queremos encontrar a reta que passe o mais prximo possvel dos pontos observados segundo um
critrio pr-estabelecido.
61
O mtodo de mnimos quadrados usado para estimar os parmetros do modelo ( e ), segundo um
critrio, e consiste em fazer com que a soma dos erros quadrticos seja menor possvel, ou seja, este mtodo
consiste em obter os valores de e que minimizam a expresso:
= = = ). , ( ) x (y
2
i i
2
i
f SQE .
Aplicando-se derivadas parciais em relao a e na expresso acima e igualando-se a zero,vamos
encontrar as seguintes estimativas para e , as quais chamaremos de a e b, respectivamente:
( )
=
2
i
2
i
i i i i
x x n
y x y x n
b
n
x y
i i
=
b
a .
A chamada equao (reta) de regresso dada por
x y b a + = ,
e para cada valor x
i
(i = 1, ..., n) temos, pela equao de regresso, o valor predito:
i i
x y b a + = .
A diferena entre os valores observados e os preditos ser chamada de resduo do modelo de regresso,
sendo denotado por:
i i i
y y = e .
O resduo relativo i-sima observao (e
i
) pode ser considerado uma estimativa do erro aleatrio (
i
), como
ilustrado abaixo.
62
O Coeficiente de Determinao (R
2
)
O coeficiente de determinao uma medida descritiva da proporo da variao de Y
que est sendo explicada pela varivel X, segundo o modelo de regresso especificado. Ele
expresso pela seguinte razo:
( )
( ) total variao
modelo pelo explicada variao
y y
y y
R
2
i
2
i 2
=
,
onde
n
y
i
= y .
Teste de Hipteses para o Coeficiente
Note que o coeficiente representa a inclinao da reta de regresso. Dessa forma, um teste de
hipteses sobre este parmetro pode ser usado como uma maneira de verificar se a equao de regresso
ajustada com base em dados amostrais estatisticamente significante. Para tanto, vamos definir as hipteses
nula e alternativa por:
H
0
: = 0
H
1
: 0.
A estatstica do teste para o coeficiente angular ser expressa por
2 / ), 2 (
~
| |
=
n
b
C
t
S
b
T ,
onde:
=
=
=
n
i
i
n
i
i i
b
x x n
y y
S
1
2
1
2
2
) ( ) 2 (
) (
e T
C
segue uma distribuio t-Student com n-2 graus de liberdade.
Aps fixar o nvel de significncia do teste (), apresentamos a seguir a regio crtica e a regra de deciso
para o teste bilateral.
Quadro 5: Hipteses, Regio Crtica e Regra de Deciso para a Correlao Linear Populacional
Hiptese Regio Crtica
(sombreada)
Regra de Deciso
(Rejeitar H
0
)
H
0
: = 0
H
1
: 0
T
c
-t
(n-2,/2)
ou
T
c
t
(n-2,/2)
63
Exemplo 6.2: A tabela abaixo apresenta os respectivos pesos X e Y de uma amostra de 12 pais e de seus
filhos mais velhos. Determine a reta de regresso e realize um teste de hipteses ao nvel de 5% de
significncia para o coeficiente angular
Peso Pais (X) Peso Filho (Y)
65 68
63 66
67 68
64 65
68 69
62 66
70 68
66 65
68 71
67 67
69 68
71 70
= 800 = 811
Soluo:
Para o clculo dos coeficientes de um modelo de regresso, necessitamos de alguns clculos preliminares a
partir da tabela acima:
Peso Pais (X) Peso Filho (Y) xy x
2
65 68 4420 4225
63 66 4158 3969
67 68 4556 4489
64 65 4160 4096
68 69 4692 4624
62 66 4092 3844
70 68 4760 4900
66 65 4290 4356
68 71 4828 4624
67 67 4489 4489
69 68 4692 4761
71 70 4970 5041
= 800 = 811 54107 53418
Obtemos os as estimativas dos parmetros do modelo de regresso linear atravs dos coeficientes
( )
4764 , 0
) 800 ( ) 53418 ( 2 1
) 811 800 ( ) 54107 ( 2 1
x x n
y x y x n
2 2
i
2
i
i i i i
=
=
b e
82 , 35
12
800 ) 4767 , 0 ( 811
n
x y
i i
=
=
b
a .
Assim, a equao de regresso que relaciona os pesos dos pais e de seus filhos, pode ser denotada por
x y 4764 , 0 82 , 35 + = .
A estatstica do teste para o coeficiente angular ser expressa por
b
C
S
b
T
| |
=
,
64
onde:
=
=
=
n
i
i
n
i
i i
b
x x n
y y
S
1
2
1
2
2
) ( ) 2 (
) (
. Assim, temos que
[ ]
027934 , 0
) 7 . 66 70 ( ) 7 . 66 65 ( ) 2 12 (
) 6 . 69 70 ( ) 8 . 66 68 (
) ( ) 2 (
) (
2 2
2 2
1
2
1
2
2
=
+ +
+ +
=
=
=
L
L
n
i
i
n
i
i i
b
x x n
y y
S
.
Dessa forma, a estatstica do teste ser
85 , 2
027934 , 0
| 4764 , 0 |
= =
C
T
. De acordo com a hipteses H
1
, temos que o
teste ser bilateral e, portanto, o valor crtico ao nvel = 5% ser t
(n-2,/2)
= t
(10,0.025)
= 2,23.
Deciso: Como T
C
> t
(n-2,/2)
Existem evidncias para rejeitar H
0
. Logo, com base nos dados amostrais
e ao nvel de 5% de significncia, podemos afirmar que existe uma relao funcional entre os pesos dos pais
e de seus filhos mais velhos.
Por ltimo, o coeficiente de correlao mltiplo pode ser calculado a partir dos dados observados (y) e de
seus respectivos valores preditos ( y ). A tabela abaixo apesenta os clculos necessrios para obter o R
2
.
Peso Pais (X) Peso Filho (Y) y
2
) ( y y
2
) ( y y
65 68 66,8 0,64 0,17
63 66 65,8 3,06 2,51
67 68 67,7 0,02 0,17
64 65 66,3 1,62 6,67
68 69 68,2 0,40 2,01
62 66 65,4 4,96 2,51
70 68 69,2 2.51 0,17
66 65 67,3 0,10 6,67
68 71 68,2 0.40 11,67
67 67 67,7 0,02 0,34
69 68 68,7 1,23 0,17
71 70 69,6 4,25 5,84
= 800 = 811 - 19,22 38,92
Logo, temos que
( )
( )
% 38 , 49 4938 , 0
38,92
19,22
y y
y y
R
2
i
2
i 2
= = =
.
Isso significa que apenas 49,38% da variao dos pesos dos filhos pode ser explicada pela variao de peso
nos pais.
4. Avaliando o que foi construdo
Ao final desta unidade aprendemos dois importantes conceitos dentro da Estatstica: correlao e
regresso. Ambos os mtodos podem ser aplicadas no processo de tomada de deciso em inmeros
problemas reais. Pratique tais conceitos resolvendo os exerccios propostos no MOODLE. Espero que essa
viagem pelos Mtodos Estatsticos tenha sido bem explorada.
65
5. Referncias Bibliogrficas
FONSECA, J.S., MARTINS, G.A. & TOLEDO, G.L., Estatstica Aplicada, So Paulo, Editora Atlas, 2
ed., 1985.
TRIOLA, M.F, Introduo Estatstica, Livros Tcnicos e Cientficos, 7 ed,, Rio de Janeiro, 1999.
COSTA NETO, P.L., Estatstica, Edgard Blucher, So Paulo, 1977.
MEYER, P.L., Probabilidade: Aplicaes Estatstica, Livros Tcnicos e Cientficos, Editora AS, Rio de
Janeiro, 1983.