Você está na página 1de 123

Estatstica Basica

Prof
a
. Daniela Paula
Instituto de Matem atica -UFRRJ
2012
Contents
1 Introducao 1
2 Analise explorat oria de dados - Resumo de Dados 2
2.1 Tipos de variaveis . . . . . . . . . . . . . . . . . . . . . . . . . 2
2.2 Distribuic ao de frequencias . . . . . . . . . . . . . . . . . . . . 3
2.3 Gr acos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.4 Medidas resumo - Medidas de posi cao central . . . . . . . . . 9
2.5 Media geometrica e Media harmonica . . . . . . . . . . . . . . 11
2.6 Medidas de dispers ao . . . . . . . . . . . . . . . . . . . . . . . 15
2.7 Quantis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.8 Box-plot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.9 Exerccios - lista 01 . . . . . . . . . . . . . . . . . . . . . . . . 22
2.10 Exerccios - lista 02 . . . . . . . . . . . . . . . . . . . . . . . . 23
2.11 Exerccios - lista 03 . . . . . . . . . . . . . . . . . . . . . . . . 25
3 Analise bidimensional 27
3.1 Associac ao entre variaveis qualitativas . . . . . . . . . . . . . 28
3.2 Associac ao entre variaveis quantitativas . . . . . . . . . . . . . 32
3.3 Exerccios - lista 04 . . . . . . . . . . . . . . . . . . . . . . . . 36
3.4 Exerccios - lista de revis ao . . . . . . . . . . . . . . . . . . . . 39
4 Probabilidade 43
4.1 Modelo probabilstico . . . . . . . . . . . . . . . . . . . . . . . 43
4.2 Probabilidade condicional e independencia . . . . . . . . . . . 46
4.3 Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . 52
4.4 Exerccios - lista 05 . . . . . . . . . . . . . . . . . . . . . . . . 54
5 Variaveis aleat orias discretas 59
5.1 Func ao de Probabilidade . . . . . . . . . . . . . . . . . . . . . 59
5.2 Func ao de distribuic ao acumulada . . . . . . . . . . . . . . . . 61
5.3 Valor esperado e vari ancia . . . . . . . . . . . . . . . . . . . . 64
5.4 Modelo uniforme discreto . . . . . . . . . . . . . . . . . . . . . 66
5.5 Modelo Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . 68
5.6 Modelo Binomial . . . . . . . . . . . . . . . . . . . . . . . . . 69
5.7 Modelo Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . 72
5.8 Exerccios - lista 06 . . . . . . . . . . . . . . . . . . . . . . . . 74
i
6 Variaveis aleat orias contnuas 78
6.1 Func ao de densidade de probabilidade . . . . . . . . . . . . . . 79
6.2 Func ao de distribuic ao acumulada . . . . . . . . . . . . . . . . 81
6.3 Media e variancia para vari aveis aleatorias contnuas . . . . . 84
6.4 Modelo uniforme contnuo . . . . . . . . . . . . . . . . . . . . 86
6.5 Modelo exponencial . . . . . . . . . . . . . . . . . . . . . . . . 88
6.6 Modelo Normal . . . . . . . . . . . . . . . . . . . . . . . . . . 90
6.7 Exerccios - lista 07 . . . . . . . . . . . . . . . . . . . . . . . . 95
7 Inferencia estatstica 98
7.1 Popula cao e amostra . . . . . . . . . . . . . . . . . . . . . . . 98
7.2 Par ametros e estimadores . . . . . . . . . . . . . . . . . . . . 99
7.3 Distribuic oes amostrais . . . . . . . . . . . . . . . . . . . . . . 101
7.4 Estimac ao por intervalo . . . . . . . . . . . . . . . . . . . . . 104
7.5 Intervalo de conanca para para amostras grandes . . . . . . 107
7.6 Teste de hip otese para media com vari ancia conhecida . . . 108
7.7 Exerccios - lista 08 . . . . . . . . . . . . . . . . . . . . . . . . 117
ii
1 INTRODUC

AO 1
1 Introducao
Em alguma fase do seu trabalho, o pesquisador se depara com um conjunto
de dados relevante ao seu objeto de estudo. Atraves desses dados ele buscar a
extrair informac oes a m de tomar decis oes relativas ao seu cotidiano.
Essa realidade, aparentemente distante de nos, esta presente em grande
parte das ciencias. Nas ciencias agr arias por exemplo, o engenheiro deve
trabalhar os dados do solo, rendimento e fertiliza cao para tomar decis oes a
respeito do melhoramento do solo e da produc ao. Nas ciencias econ omicas,
o administrador muitas vezes se depara com series de dados com atraves
das quais deve decidir sobre investimentos, taxas etc. Alem das areas citadas
acima, existem muitas outras aplicac oes da estatstica, podemos citar apenas
a ttulo de exemplica cao as ciencias biol ogicas e de sa ude, geograa, qumica,
matem atica etc. Por isso, o domnio da estatstica se torna essencial quando
devemos trabalhar com um grande volume de dados independentemente da
area em estudo.
Neste curso, vamos inicialmente aprender a trabalhar com os dados, ex-
trair medidas importantes e representac oes gr acas que nos ajudar ao a in-
terpretar e resumir o conjunto de informac oes. Na segunda etapa, iremos es-
tudar modelos probabilsticos para caracterizar os dados. O objetivo ent ao,
e construir modelos para os dados em quest ao e, dessa forma, extrair in-
formac oes e prever comportamentos futuros sem a necessidade de observar
novos conjuntos de dados. Na etapa nal do curso, veremos brevemente como
vericar a adequac ao dos modelos propostos ` a realidade.
2 AN

ALISE EXPLORAT

ORIA DE DADOS - RESUMO DE DADOS 2


2 Analise explorat oria de dados - Resumo de
Dados
2.1 Tipos de variaveis
Para introduzir as formas de resumir os dados falaremos um pouco sobre
como classicar os dados.
Suponha que estejamos realizando uma pesquisa e que desejamos investi-
gar sal ario, nvel de instruc ao, idade e classe social de um grupo de pessoas.
Algumas dessas caractersticas, que chamaremos de vari aveis, apresen-
tam como possveis resultados atributos ou qualidades. Outras, tem como
resultados quantidades, n umeros. As primeiras sao chamadas vari aveis qual-
itativas e as segundas variaveis quantitativas.
Qualitativas- Tem como possveis resultados qualidades ou atributos.
Quantitativas- Tem como possveis resultados quantidades ou n umeros.
Podemos subdividir as qualitativas em nominais e ordinais. J a as quan-
titativas s ao subdivididas em discretas e contnuas.
Qualitativas
_

_
Nominal Nao existe nenhuma ordenacao
nas realizacoes.
Exemplo : sexo, local de nascimento.
Ordinal Existe uma ordem em seus resultados.
Exemplo : classe social, nivel de instrucao.
Quantitativas
_

_
Discretas V alores formam um conjunto finito
ou enumeravel de valores. Resultam de uma contagem.
Exemplo : idade, numero de filhos.
Continuas V alores pertencem a um intervalo
de numeros reais. Resultam frequentemente de
uma mensuracao.
Exemplo : estatura, peso.
Para cada tipo de vari avel existem tecnicas apropriadas para resumir
informac oes. Em algumas situa coes podemos atribuir valores `as qualidades
de uma variavel qualitativa e proceder a an alise como se quantitativa fosse.
Podemos citar como exemplo a variavel que descreve o resultado obtido em
um lancamento de uma moeda, ao atribuir 0 a cara e 1 a coroa podemos
analisar a vari avel como quantitativa. Veremos outros exemplos mais adiante.
2 AN

ALISE EXPLORAT

ORIA DE DADOS - RESUMO DE DADOS 3


2.2 Distribuicao de frequencias
Quando estudamos uma vari avel podemos investigar seu comportamento
estudando a ocorrencia de suas realizac oes, isso se torna mais f acil atraves da
organizac ao e resumo dos dados em uma tabela que chamaremos de tabela
de distribui cao de frequencias. Daremos aqui dois exemplos de tabelas de
frequencias, para os outros tipos de vari aveis a construc ao e an aloga.
Exemplo 1: Variavel qualitativa ordinal.
Suponha que realizamos uma pesquisa com 36 funcion arios de um setor A
de uma fabrica e estamos interessados no nvel de escolaridade. Observamos
3 nveis de escolaridade com as frequencias descritas na tabela a seguir.
Setor A
Denominamos frequencia ni, frequencia absoluta. A propor cao , chamamos
de frequencia relativa, ela e obtida fazendo f
i
=
n
i
total
. Atraves da frequencia
relativa podemos comparar resultados de duas pesquisas distintas. Por ex-
emplo, se zermos a mesma pesquisa com 2000 funcion arios de um outro
setor B da f abrica e desejarmos comparar em qual dos setores existem mais
funcion arios com nvel superior podemos usar a frequencia relativa.
Setor B
2 AN

ALISE EXPLORAT

ORIA DE DADOS - RESUMO DE DADOS 4


Neste caso podemos perceber que o setor A tem percentualmente mais
empregados com nvel superior que o setor B.
Exemplo 2: Variavel quantitativa contnua.
Nesse caso precisamos dividir os dados em classes para construir a tabela
de distribuic ao de frequencias. Suponha que desejamos construir uma tabela
de distribuic ao de frequencias para os sal arios dos empregados do setor A.
Para isso, entrevistamos os 36 empregados e obtivemos os seguintes dados:
4; 4,2; 7,5; 4,1; 7,3; 6,6; 5,7; 5,1; 6,2; 7,7
8,1; 9,2; 9,5; 11,1; 9,3; 9,6; 8,7; 10,1; 11,2; 10,7; 9,3; 10,4
12,1; 13,2; 14,5; 15,6; 12,1; 12,2; 13,5; 14,6
19,1; 18,2; 17,5; 16,6; 19,8; 20,3
Como estamos trabalhando com uma variavel contnua (sal ario), vamos
dividir os dados em classes. Suponha que desejamos construir uma tabela
com 5 classes de amplitudes iguais. Uma possvel tabela e a seguinte:
2 AN

ALISE EXPLORAT

ORIA DE DADOS - RESUMO DE DADOS 5


2.3 Gracos
Atraves da representa cao graca tambem podemos resumir informa coes
sobre a variabilidade dos dados.
Gracos para variaveis qualitativas
Existem v arios tipos de gr acos usados para representar as vari aveis quali-
tativas, vamos apresentar dois deles: gr acos em barras/ colunas e em setores.
Exemplo 3: Vamos voltar ao exemplo 1. Grau de instruc ao.
gr aco em colunas
gr aco em setores
Gracos para variaveis quantitativas
Para as variaveis quantitativas podemos considerar uma variedade maior
de representa coes gr acas. Alem dos gr acos usados para as variaveis quali-
tativas, temos tambem o gr aco de dispers ao unidimensional para as vari aveis
discretas. Vamos ver um exemplo e em seguida faremos os gracos possveis.
2 AN

ALISE EXPLORAT

ORIA DE DADOS - RESUMO DE DADOS 6


Exemplo 4: Suponha que zemos uma pesquisa com 20 pessoas e esta-
mos interessados no n umero de lhos.
gr aco em barras/colunas
gr acos de dispersao
Construir gr acos para as vari aveis quantitativas contnuas requer algu-
mas adaptac oes. Para utilizarmos os mesmos tipos de gr acos usados no caso
2 AN

ALISE EXPLORAT

ORIA DE DADOS - RESUMO DE DADOS 7


de vari aveis discretas a primeira ideia que surge e aproximar uma vari avel
aleat oria contnua por uma discreta sem perder muita informacao. Isso pode
ser feito aproximando-se os valores de uma classe pelo ponto medio dessa
classe.
Exemplo 5: Voltando ao exemplo 2, na gura 3 temos a tabela para a
vari avel sal ario que est a dividida em classes. Discretizando a vari avel pode-
mos contruir o gr aco em barras, em setores ou o diagrama de dispersao.
Em seguida temos o graco em barras para a vari avel salario.
Com o artifcio utilizado acima perdemos muita informac ao. Uma alter-
nativa utilizada nesses casos e o gr aco connhecido como histograma. No
eixos das abscissas representamos as classes e, no eixo das ordenadas pode-
mos representar a frequencia absoluta ni, a relativa ou a densidade de
frequencia.
Ramo-e-folhas
Tanto o histograma como o gr aco em barras d ao uma ideia da forma
da distribuic ao dos dados. Um procedimento alternativo para resumir um
conjunto de dados e dar uma ideia de sua distribuicao e utilizar o diagrama
de ramo-e-folhas. Uma vantagem desse diagrama sobre o histograma e que
ele tem uma perda menor de informa cao. N ao ha uma regra xa determi-
nante para a construc ao de um diagrama ramo-e-folhas, geralmente s ao feitas
2 AN

ALISE EXPLORAT

ORIA DE DADOS - RESUMO DE DADOS 8


adaptac oes para cada conjunto de dados. A ideia basica por tr as da estru-
tura e, em linhas gerais, a seguinte: cada n umero, dentre os que comp oem
o conjunto de dados a serem organizados, e considerado em relac ao a seus
algarismos, como sendo constitudo por duas partes. Estas sao separadas
por uma linha vertical (tracada justamente para estabelecer essa separac ao),
de modo que os algarismos registrados `a esquerda da linha sao chamados de
ramo, os da direita, denominam-se folha. Para entender melhor vamos ver
os seguintes exemplos.
Exemplo 6: Os dados abaixo referem-se ao comprimento em centmetros
de 20 pecas de alumnio:
53 70 84 69 77 87 53 82 67 54
70 71 95 51 74 55 63 85 53 64
Se considerarmos como ramo as dezenas e como folha a unidade, o dia-
grama de ramo-e-folhas ca da seguinte forma:
Exemplo 7: Suponha que entrevistamos 10 pessoas em um departamento
e estamos interessados no sal ario desses empregados. Obtivemos os seguintes
dados:
4,0; 4,56; 5,2; 6,6; 6,8; 7,14; 8,2; 9,13; 10,53; 11,5.
Nesse caso, como existem dados com um e duas casas decimais podemos
arredondar os dados ou colocar como folha as duas casas decimais de cada
n umero, se optarmos por arredondar vamos obter o seguinte diagrama de
ramo-e-folhas:
2 AN

ALISE EXPLORAT

ORIA DE DADOS - RESUMO DE DADOS 9


2.4 Medidas resumo - Medidas de posicao central
Vimos que podemos resumir a informac ao atraves de tabelas e gracos que
fornecem muitas informac oes sobre o comportamento dos dados. Podemos
resumir os dados usando um ou alguns valores para representar a serie toda.
S ao eles:
Moda- Realizac ao mais frequente do conjunto de dados. Em alguns
casos pode nao haver moda, dizemos entao que a distribuic ao e amodal, ou
haver mais de uma moda, nesses casos dizemos tratar-se de uma distribui cao
bimodal, trimodal etc.
Exemplo 8: Para a tabela da variavel n umero de lhos do exemplo 4,
temos moda igual a 2.
Mediana-

E a realizac ao que ocupa a posicao central da serie de ob-
serva coes, quando ordenadas em ordem crescente.
Exemplo 9: Para os dados 3,7,5,8,8 a mediana ser a 7.
Para 3,7,5,8,8,9 a mediana ser a 7,5.
Media aritmetica-

E a soma das observac oes dividida n umero de ob-
serva coes no conjunto.
Exemplo 10: Para os dados acima 3,7,5,8,8, a media sera 6,2.
Observacao 1: Para identicar a moda precisamos apenas da frequencia
absoluta, j a para identicar a mediana precisamos de alguma ordenac ao entre
dos dados e, nalmente, para calcular a media, precisamos que a vari avel seja
2 AN

ALISE EXPLORAT

ORIA DE DADOS - RESUMO DE DADOS 10


quantitativa.
Observacao 2: Para as vari aveis qualitativas nominais podemos apenas
identicar a moda. Para as qualitativas ordinais podemos identicar a moda
e a mediana. A media s o pode ser calculada para as variaveis quantitativas.
Resumindo:
moda- Pode ser identicada para todos os tipos de vari aveis.
mediana- Pode ser identicada para todas exceto qualitativas nominais.
media- Somente para as vari aveis quantitativas.
Exemplo 11: Vamos voltar ao exemplo da vari avel n umero de lhos do
exemplo 4.
Nesse caso temos moda 2, mediana
valor
10
+valor
11
2
= 2 e media
0.4+1.5+2.7+3.3+5.1
20
=
33
20
= 1, 65. Podemos perceber que as tres medidas tem valores proximos e
representam de maneira semelhante as observacoes.
F ormula geral para a media
Se x
1
, x
2
, x
3
, ..., x
n
s ao n valores assumidos pela vari avel x, dizemos que
x e a media aritmetica dos n valores assumidos pela vari avel x.
x =

n
i
x
i
n
.
Agora se tivermos n observac oes para a variavel x das quais n
1
s ao iguais
a x
1
, n
2
s ao iguais a x
2
, n
3
s ao iguais a x
3
ate n
k
s ao iguais a x
k
de tal forma
que n
1
+...n
k
= n, podemos simplicar a f ormula anterior por:
x =

k
i
n
i
.x
i
n
.
Podemos tambem substituir a frequencia relativa f
i
=
n
i
n
na formula an-
terior:
x =

k
i
f
i
.x
i
.
F ormula geral para a mediana
Consideremos as n observac oes x
1
, x
2
, x
3
, ..., x
n
ordenadas em ordem cres-
cente. Denotemos a menor observa cao por x
(1)
, a segunda por x
(2)
e assim
por diante ate n-esima x
(n)
:
2 AN

ALISE EXPLORAT

ORIA DE DADOS - RESUMO DE DADOS 11


x
(1)
x
(2)
x
(3)
... x
(n)
.
As observac oes ordenadas como acima sao chamadas estatsticas de or-
dem. A mediana e entao denida por:
med(x) =
_
x
(
n+1
2
)
Se n e impar.
x
(
n
2
)
+x
(
n+1
2
)
2
Se n e par.
Exemplo 12: C alculo das medidas de posicao para variaveis contnuas.
Vamos retornar a terceira tabela da vari avel salario.
Como a vari avel sal ario e uma vari avel contnua uma aproximac ao que
pode ser feita e considerar todos os valores dentro de uma classe iguais ao
ponto medio da classe, essa aproximac ao e chamada de discretizacao. Pode-
mos discretizar para encontrar os valores aproximados de media, mediana e
moda. Dessa forma, para a vari avel sal ario S temos:
moda(S) 10
mediana(S)
S
(18)
+S
(19)
2
=
10+10
2
= 10
media (S)
6.10+10.12+14.8+18.5+22.1
36
= 11, 22
2.5 Media geometrica e Media harmonica
Media harmonica
A media harm onica e utilizada quando estamos tratando observac oes de
grandezas inversamente proporcionais como velocidade e tempo. Por exem-
plo suponha que temos v arios valores de velocidade e, para cada valor temos a
dist ancia que percorremos desenvolvendo tal velocidade. A frequencia agora
2 AN

ALISE EXPLORAT

ORIA DE DADOS - RESUMO DE DADOS 12


e dada em termos de outra variavel, a distancia. Como podemos calcular a
velocidade media ent ao? Para que que mais claro que tipo de media deve-
mos usar em cada caso vejamos alguns exemplos:
Exemplo 13: Se a metade da dist ancia de um percurso percorremos
com a velocidade de 60 km/h e a outra metade com velocidade 40 km/h.
Qual e a velocidade media? isto e, com qual velocidade podemos percorrer
todo trajeto de modo a gastar o mesmo tempo?
Na primeira metade gastamos o tempo de t
1
=
d
60
, na segunda metade
o tempo de t
2
=
d
40
ent ao nesse caso a velocidade media para percorrer
todo o percurso de modo a gastar o mesmo tempo e:
v
media
=
2d
d
60
+
d
40
= 48.
Nesse caso, se us assemos a velocidade de 50 km/h para percorrer todo o
percurso gastaramos o tempo
d
25
<
d
24
. Portanto n ao podemos usar a media
aritmetica, devemos usar a media harmonica. A velocidade media calculada
acima podia ter sido encontrada usando a f ormula da media harm onica dada
a seguir.
Denicao:
A media harm onica de n valores reais x
1
, x
2
, x
3
, ..., x
n
e dada por:
m
h
=
n
1
x
1
+
1
x
2
+...+
1
x
n
Exemplo 14: Custo medio de ac oes.
Suponha que compramos ac oes por 3 meses com um montante sempre de
1000 reais. No primeiro mes compramos ac oes no valor de 8 reais, no segundo
mes no valor de 9 e, no terceiro de 10. Qual o custo medio das ac oes?
Sabendo que a rela cao entre custo e montante e dada por custo =
montante
num.acoes
e que nesse caso temos os valores de custo e, associados a eles, o montante
empregado, qual media devemos usar? aritmetica ou harm onica? Para re-
sponder devemos olhar a vari avel n ao citada no problema, o n umero de a coes.
Essa vari avel esta se relacionando com o custo de maneira inversamente pro-
porcional ( veja a formula), da mesma maneira, tnhamos no exemplo anterior
a velocidade e o tempo. Portanto, devemos usar a media harm onica.
m
h
=
3000
1000
8
+
1000
9
+
1000
10
= 8, 92
Repare que se tivessemos comprado 1000 ac oes no valor de 8, 1000 no valor
2 AN

ALISE EXPLORAT

ORIA DE DADOS - RESUMO DE DADOS 13


de 9 e 1000 no valor de 10. Para saber o custo medio das a coes usaramos a
media aritmetica:
m
ari
=
1000.8+1000.9+1000.10
3000
= 9
2 AN

ALISE EXPLORAT

ORIA DE DADOS - RESUMO DE DADOS 14


Media geometrica
Usamos a media geometrica quando os dados estao relacionados de maneira
multiplicativa e o objetivo e conhecer uma taxa media de crescimento ou de-
crescimento dos dados.
Denicao:
A media geometrica de n valores reais x
1
, x
2
, x
3
, ..., x
n
e dada por:
m
g
=
n

x
1
.x
2
.x
3
...x
n
Exemplo 15: Se um investimento rende 10 por cento no primeiro ano e
20 por cento no segundo ano a juros compostos, qual e o rendimento medio
do investimento?
Se comecarmos com um montante X ao nal do primeiro ano teremos
1,1X e ao nal do segundo ano teremos 1,2.(1,1X)=1,32X.
Queremos encontrar uma taxa media, isto e, uma unica taxa que aplicada
durante dois anos a juros compostos retornar a 1,32X.
Podemos pensar que uma possvel candidata a taxa media seria 15 por
cento, mas quando aplicamos o montante de X a essa taxa em dois anos
teremos (1, 15)
2
X=1,3225X que representa um pouco a mais do que obtemos
quando aplicamos a 10 por cento no primeiro ano e 20 por cento no segundo.
Como encontrar ent ao a taxa media? A resposta vem atraves do fator.
A cada taxa podemos associar um fator multiplicativo, por exemplo, para a
taxa de 10 por cento, multiplicamos o valor inicial por 1,1. Para essa taxa
temos portanto, um fator de 1,1. Para a taxa de 20 por cento, um fator
de 1,2. Para a taxa de 25 por cento, um fator de 1,25. Ent ao o problema
de encontrar a taxa unica e equivalente ao problema de encontrar um fator
multiplicativo unico.
Para o exemplo acima temos que encontrar um fator multiplicativo unico
f, tal que f
2
X = 1, 32X ou seja f e a media geometrica dos fatores 1,1 e 1,2.
f =

1, 32 =

1, 1.1, 2 = 1, 148
Logo, podemos concluir que a media e de 14,8 por cento. Se tivessemos
aplicado um montante durante um periodo maior, e dispusessemos de v arias
taxas, para encontrar a taxa media deveramos proceder da mesma forma:
encontrar um unico fator igual ` a media geometrica de todos os fatores.
De forma geral, a media aritimetica e sempre maior ou igual aos outros
tipos de media. Temos a seguinte relacao entre as medias:
2 AN

ALISE EXPLORAT

ORIA DE DADOS - RESUMO DE DADOS 15


m
g
m
h
m
a
2.6 Medidas de dispersao
O resumo de um conjunto de dados por uma unica medida de posic ao cen-
tral ignora toda a informa cao sobre a variabilidade dos dados. Por exemplo,
suponha que desejamos analisar o comprimento de pecas produzidas por 3
diferentes tipos de m aquinas. Selecionamos entao grupos de pecas prove-
nientes de cada m aquina e registramos os comprimentos em cm:
m aquina A- 3,4,5,6,7
m aquina B- 3,5,5,7
m aquina C- 5,5,5,5,5,5
Podemos perceber que as medias dos comprimentos e igual para os 3
grupos. Nesse caso, perdemos a informa cao sobre a variabilidade dos dados
se considerarmos apenas a media como medida representativa dos dados.
Num primeiro momento, podemos pensar que uma boa medida para a
variabilidade dos dados nos grupos e a soma das diferencas entre os dados e
a media. Por exemplo, para a m aquina A teramos

5
i=1
x
i
x, mas podemos
observar que a soma dos desvios com relac ao `a media e sempre igual a zero.

5
i=1
x
i
x =

5
i=1
x
i

5
i=1
x =

5
i=1
x
i
5 x =

5
i=1
x
i

5
i=1
x
i
= 0
Uma maneira de contornar esse problema e considerar as duas medidas
seguintes:
2 AN

ALISE EXPLORAT

ORIA DE DADOS - RESUMO DE DADOS 16

5
i=1
| x
i
x |

5
i=1
(x
i
x)
2
Chamamos ent ao

n
i=1
|x
i
x|
n
- desvio medio absoluto - dm(x).

n
i=1
(x
i
x)
2
n
- vari ancia - var(x).
Para a maquina A temos:
dm(x) =

5
i=1
|x
i
x|
5
=
|35|+|45|+|55|+|65|+|75|
5
=
6
5
= 1, 2.
var(x) =

5
i=1
(x
i
x)
2
5
= 2
Para a maquina B temos:
dm(x) =

4
i=1
|x
i
x|
4
=
|35|+|35|+|55|+|57|
4
= 1.
var(x) =

4
i=1
(x
i
x)
2
4
= 2
Podemos concluir entao que segundo o desvio medio a m aquina B e mais
homogenea que m aquina A e que ambas s ao igualmente homogeneas segundo
a vari ancia.
Sendo a vari ancia uma medida de dimens ao igual ao quadrado da di-
mens ao dos dados, no caso cm
2
, a interpretacao da variancia como medida
de variac ao dos dados pode gerar alguns problemas. Costumamos usar ent ao
o desvio padr ao que e denido como raiz quadrada da variancia.
dp(x) =
_
var(x)
Para o grupo A e o B temos dp(x) =

2.
Ambas as medidas de dispersao (desvio medio e desvio padrao) indicam
em media qual o erro que cometemos ao substituirmos cada observac ao
pela media.
No caso em que observamos n
1
vezes o valor x
1
, n
2
vezes o valor x
2
e
assim sucessivamente, ate n
k
vezes o valor x
k
, temos:
dm(x) =

k
i=1
n
i
|x
i
x|
n
=

k
i=1
f
i
| x
i
x |
var(x) =

k
i=1
n
i
(x
i
x)
2
n
=

k
i=1
f
i
(x
i
x)
2
dp(x) =
_
var(x)
2 AN

ALISE EXPLORAT

ORIA DE DADOS - RESUMO DE DADOS 17


O calculo aproximado das medidas de dispersao no caso das variaveis
contnuas agrupadas em classes pode ser feito de modo analogo ` aquele usado
para encontrar a media.
Exerccio: Calcule o desvio medio, vari ancia e desvio padr ao para as
vari aveis n umero de lhos e sal ario dos exemplos anteriores.
Coeciente de variacao
Coeciente de variac ao e uma medida que nos permite comparar a dis-
persao em amostras diferentes. O desvio padr ao e uma medida de dispers ao
com relacao ` a media, como duas amostras podem ter medias diferentes n ao
conseguiremos, nesses casos, comparar a dispers ao dos dados usando o desvio
padr ao. Para isso usamos o coeciente de varia cao:
cv =
dp(x)
x
Exemplo:
Considere uma amostra com media 40 e desvio padr ao 4 e outra com
media 5 e desvio padrao 4. Qual das amostras e a mais homogenea? De
acordo com o coeciente de varia cao temos na amostra 1, cv= 4/40=0,1 e na
amostra 2, cv=4/5=0,8. Portanto a amostra 2 tem maior grau de dispers ao
dos dados.
2.7 Quantis
A media aritmetica pode muitas vezes n ao ser uma medida adequada pois:
a) Pode ser afetada por valores extremos.
b) Nao d a ideia da distribuic ao e dispers ao dos dados.
Exemplo 16: Para os dados 1,2,5,7,100 a media aritmetica vale 115/5
= 23, um valor muito distante da maioria dos dados. A media portanto nao
e uma boa medida de representac ao para esses valores.
A mediana, igual a 5, representa melhor os dados nesse caso. Outra me-
dida de posic ao muito utilizada e o quantil.
Denicao:
Chamamos quantil de ordem p ou p-quantil onde p e uma proporcao,
0 < p < 1, ao valor q(p) tal que 100.p por cento da amostra seja menor que
q(p).
2 AN

ALISE EXPLORAT

ORIA DE DADOS - RESUMO DE DADOS 18


Essa denic ao parece um pouco complicada a primeira vista, vamos ver
um exemplo.
Exemplo 17: Para a amostra 1,2,3,5,7,8,10, desejamos saber o valor de
q(0,5) e q(0,25).
Qual e o valor de q(0,5)? q(0,5) e o valor tal que 100.0,5=50 por cento
da amostra esteja abaixo dele. Portanto q(0,5)= mediana.
Primeiramente devemos ordenar os dados e encontrar as estatsticas de
ordem, nesse caso os dados j a estao ordenados:
x
(1)
= 1; x
(2)
= 2; x
(3)
= 3...x
(7)
= 10
Como temos 7 dados na amostra q(0,25) e o valor que deixa 25 por cento
dos dados abaixo dele. Como 0,25.7=1,75 n ao e inteiro calculamos um valor
aproximado para q(0,25). Fazemos q(0, 25) =x
(2)
. Para q(0,5), fazemos
7.0,5=3,5. Como 3,5 n ao e inteiro aproximamos o quantil para a estatstica
de ordem subsequente que no caso e x
(4)
. O mesmo procedimento feito an-
teriormente para encontrar a mediana.
Como calcular os quantis?
N ao existe apenas uma maneira de obter os quantis, geralmente obtemos
valores aproximados que representam a divis ao da amostra. Segue abaixo
uma das maneiras para descobrir os quantis.
Dada uma amostra com n observac oes ordenadas de maneira crescente,
uma das formas para se obter o quantil de ordem p e a seguinte:
1) Se n.p e um n umero inteiro ent ao q(p) =
x
(n,p)
+x
(n,p+1)
2
.
2) Se n.p n ao e um n umero inteiro entao q(p) = x(| n.p | +1)
Percentil, decil e quartil
Os percentis s ao construdos atraves da divisao da amostra em cem partes
iguais. O primeiro percentil deixa 1 por cento dos dados abaixo dele, o se-
gundo 2 por cento e assim sucessivamente ate o 99

percentil, que deixa 99


por cento dos dados abaixo dele. Ao dividirmos a amostra em 10 partes iguais
podemos calcular os decis. O primeiro decil deixa 10 por cento dos dados
abaixo dele, o segundo deixa 20 por cento dos dados abaixo e nalmente o
nonagesimo decil deixa 90 por cento dos dados abaixo dele. Os quartis s ao
obtidos dividindo a amostra em 4 partes iguais. O primeiro quartil deixa
25 por cento dos dados abaixo dele, o segundo quartil e a mediana e o ter-
2 AN

ALISE EXPLORAT

ORIA DE DADOS - RESUMO DE DADOS 19


ceiro deixa 75 por cento dos dados abaixo dele. Podemos perceber a seguinte
equivalencia entre os percentis, quartis e decis:
q(0,1)- 1

decil, 10

percentil.
q(0,25)- 1

quartil, 25

percentil.
q(0,5)- 5

decil, 2

quartil, 50

percentil.
q(0,75)- 3

quartil, 75

percentil.
q(0,95)- 95

percentil.
Exemplo 18: Suponha que entrevistamos 10 pessoas e perguntamos o
peso da cada uma delas. As respostas foram as seguintes:
45; 54; 48; 51; 63; 50; 74; 83; 91; 105.
Qual e o peso maximo que uma pessoa pode ter para estar entre as 25
por cento mais magras e qual e peso mnimo para estar entre as 25 por cento
mais gordas?
O que queremos saber e quem s ao q(0,25) e q(0,75).
Primeiramente devemos ordenar os dados.
45; 48; 50; 51; 54; 63; 74; 83; 91; 105.
o quantil q(0,25) e o valor que deixa 25 por cento dos dados abaixo que
nesse caso e o valor que ocupa a terceira posic ao. Ent ao q(0,25)=50. q(0,75)
e o valor que deixa 75 por cento dos dados abaixo, aquele que ocupa a oitava
posic ao, portanto q(0,75)=83.
2.8 Box-plot
O box-plot nos d a uma ideia da dispers ao de uma amostra e da existencia
de dados distoantes do conjunto. Ele e construido da seguinte maneira:
1) Calculamos os valores dos quartis, q(0,25), q(0,5) e q(0,75) que ser ao
respectivamente a base, a linha media e o topo da caixa.
2) Calculamos a diferenca d
q
= q(0, 75) q(0, 25).
3) Calculamos 3/2.d
q
, esse valor nos ajudara a construir os limites superior
e inferior do gr aco. Os valores da amostra nao contidos nesse intervalo
devem ser representados como pontos isolados e por isso sao denominados
outliers.
O box-plot e um graco muito util quando queremos investigar a simetria,
valores atpicos e a dispers ao em um conjunto de valores. A representa cao
gr aca e a seguinte:
2 AN

ALISE EXPLORAT

ORIA DE DADOS - RESUMO DE DADOS 20


Assimetria dos dados se reete em assimetria na caixa e ou nos limites
inferiores e superiores e valores atpicos se reetem em outliers. Vamos ver
um exemplo para que que mais claro o processo de construc ao.
Exemplo 19: Suponha que realizamos uma pesquisa com 15 pessoas e
estamos interessados na vari avel n umero de lhos. Obtivemos os seguintes
resultados 2 pessoas n ao tem lhos, 5 tem 1 lho, 4 tem 2 lhos, 3 tem 3
lhos e nalmente 1 pessoa tem 5 lhos. Construa o box-plot para a variavel
n umero de lhos. Primeiramente vamos calcular os quartis:
Primeiro quartil- 0,25.15= 3,75 que nao e inteiro portanto q(0,25)=x(4)=1.
Segundo quartil- 0,5.15= 7,5 que nao e inteiro portanto q(0,5)=x(8)=2.
Terceiro quartil- 0,75.15= 11,25 que n ao e inteiro portanto q(0,75)=x(12)=3.
Temos o seguinte box-plot:
Como o menor valor observado foi 0 e o maior foi 5 os limites inferior
e superior devem ser 0 e 5 respectivamente. Deixar o limite inferior como
-2 e o superior como 6 signicaria dizer que existem valores entre -2 e 0
e tambem entre 5 e 6, o que n ao e verdade. Portanto devemos calcular
os limites inferiores e superiores como anteriormente e depois olhar para os
2 AN

ALISE EXPLORAT

ORIA DE DADOS - RESUMO DE DADOS 21


dados para saber quem e o menor e o maior valor observado. O boxplot
ent ao, ca melhor representado da seguinte maneira:
2 AN

ALISE EXPLORAT

ORIA DE DADOS - RESUMO DE DADOS 22


2.9 Exerccios - lista 01
Questao 1
Suponha que realizamos uma pesquisa com 80 pessoas cuja vari avel de
interesse era a idade. Suponha tambem que foram encontrados os seguintes
valores: 21; 35; 49 e 16 anos, com frequencias respectivamente iguais a 10;
0,3; 0,2. Encontre a frequencia absoluta de 16 anos. Construa a tabela de
frequencias, o gr aco em barras e em setores.
Questao 2
Os juros recebidos por um grupo de 12 ac oes em um perodo de dois meses
foram:
3,67; 1,28; 3,96; 2,93; 7,77; 2,78;
1,82; 8,14; 6,54; 2,82; 4,65; 5,54.
Construa a tabela de frequencias para esses dados dividindo-os em 4
classes de amplitudes iguais a 2. Construa tambem o histograma para as
frequencias relativas.
Questao 3
Suponha que desejamos estudar o n umero de erros de impressao de um
livro. Para isso escolhemos uma amostra com 50 p aginas e vericamos que
das 50 paginas analisadas, 25 nao apresentavam erros, 20 apresentavam 1
erro, 3 possuiam 2 erros e nalmente duas p aginas apresentavam uma 3 e
outra 4 erros.
a) Calcule o n umero medio de erros por pagina e n umero mediano.
b) Qual e o desvio padr ao?
c) Faca um graco em barras para a distribuic ao.
d) Se o livro tem 500 p aginas qual e o n umero total de erros esperado no
livro?
2 AN

ALISE EXPLORAT

ORIA DE DADOS - RESUMO DE DADOS 23


2.10 Exerccios - lista 02
Questao 1
Suponha que observamos os valores de 20, 50, 60, 40 e 20 para uma
vari avel X.
a) Calcule a media harm onica de X.
b) Se os valores acima fossem medidas, em km/h, da velocidade de um
autom ovel observadas em distancias iguais a 2km, qual a rela cao da
velocidade media com a resposta obtida no item anterior?
c) Se os valores se referissem ` a velocidade do mesmo automovel medidas
em intervalos iguais `a meia hora qual a relac ao da velocidade media com
o valor obtido em b)?
Questao 2
O que acontece com a media, a mediana e a vari ancia quando:
a) Somamos um valor xo a cada observacao? (Por exemplo, se somar-
mos 10?)
b) E quando multiplicamos cada observacao por um valor xo?
Questao 3
Um objeto e construdo com 300g de cobre, 150g de prata e 100g de
bronze. Sabendo que a densidade media e dada por d
med
=
massa
volume
e as
densidades do cobre, da prata e do bronze sao respectivamente 1, 5g/cm
3
,
1, 2g/cm
3
e 2g/cm
3
. Encontre a densidade media do objeto.
Questao 4
Realizando um experimento qumico repetidamente em baixas temperat-
uras, obtivemos os seguintes rendimentos em porcentagem: 1; 2; 5; 3 e 1.
Ao aumentar a temperatura, aumentamos o rendimento da reac ao para 40.
Qual o rendimento medio da rea cao?
Questao 5
O departamento pessoal de uma empresa fez um levantamento dos salarios
de seus funcionarios e os dividiu em quatro classes. A primeira classe con-
tinha todos os sal arios menores do que dois e a frequencia observada foi 30.
A segunda classe, os sal arios maiores ou iguais a 2 e menores que 4 com
frequencia 48. A terceira classe, os salarios maiores ou iguais a 4 e menores
que 6 com frequencia 24. A quarta classe, os sal arios maiores ou iguais a 6 e
menores que 10 com frequencia 18.
2 AN

ALISE EXPLORAT

ORIA DE DADOS - RESUMO DE DADOS 24


a)Construa o histograma.
b) Calcule a media, a variancia e o desvio padrao.
c) Calcule o primeiro quartil, a mediana, o terceiro quartil e construa
o box-plot.
2 AN

ALISE EXPLORAT

ORIA DE DADOS - RESUMO DE DADOS 25


2.11 Exerccios - lista 03
Questao 1
Suponha que entrevistamos 20 pessoas e estamos interessados em estudar
o comportamento da vari avel peso nesse grupo. Os dados observados foram
os seguintes:
53 ; 70,2; 84,3; 69,5; 77,8; 87,5; 53,4; 82,5; 67,3; 54,1
70,5; 71,4; 95,4; 51,1; 74,4; 55,7; 48,2; 45,7; 43,2; 50,7
a) Faca o diagrama ramo-e-folhas.
b) Encontre os quartis e faca o box-plot.
c) Divida os dados em 6 classes de amplitude igual a 10. Construa a
tabela de frequencias e o histograma. Existe alguma semelhanca com
o diagrama ramo-e-folhas?
d) Encontre a moda, media, mediana e desvio padrao para a tabela do
item anterior.
Questao 2
O departamento de atendimento ao consumidor de uma concession aria
de veculos recebe ligac oes de reclama coes de clientes. Foram anotados os
n umeros de reclamac oes em 20 dias:
3; 4; 5; 4; 4; 5; 6; 9; 4; 4;
5; 6; 4; 3; 6; 7; 4; 5; 5; 7.
a) Construa a tabela de frequencias e o gr aco em barras.
b) Qual o n umero medio e o n umero mediano de reclamacoes por dia?
c) Em 1 mes qual o n umero total de reclama coes esperado?
d) Se cada telefonema acarreta novos servicos que custam 50 reais para
a concession aria, qual e a despesa media por dia da concessionaria
oriunda do atendimento ao consumidor?
Questao 3
O tempo em horas para um determinado medicamento fazer efeito foi
investigado em um grupo de 20 pessoas e obteve-se os seguintes tempos:
1; 2; 1; 2; 1; 2; 3; 1; 2; 2 3; 3; 2; 2; 1; 1; 4; 2; 1; 4
a) Construa a tabela de frequencias para a vari avel.
2 AN

ALISE EXPLORAT

ORIA DE DADOS - RESUMO DE DADOS 26


b) Calcule a media e a vari ancia.
c) Quando o medicamento demora mais de 3 horas para agir, dizemos
que o paciente e insensvel ao tratamento. Se isso ocorre em 25 por
cento dos casos ou mais ent ao os pacientes devem trocar de medicac ao.
Os pacientes acima devem ou n ao trocar de medicacao?
Questao 4
Realizando um cultivo de laranjas inicialmente com 100 mudas, um agricul-
tor percebeu que apos a primeira colheita o rendimento da produc ao aumen-
tava consideravelmente com relac ao a colheita anterior. As taxas de aumento
de produc ao nas 5 colheitas que se seguiram foram de: 10; 15; 10; 5 e 20 por
cento respectivamente. Qual a taxa media de aumento de produc ao?
Questao 5
Alguns cientistas sociais acreditam que a opiniao sobre o aborto inde-
pende da situac ao familiar. Foi feita uma pesquisa com 200 pessoas:
a) Qual estado civil apresenta mais pessoas favor aveis ao aborto?
b) Construa as tabelas de frequencias marginais.
c) Escolhendo uma pessoa ao acaso, qual e a probabilidade de ser casada
ou favor avel ao aborto?
d) Construa a tabela de frequencias com rela cao ao total geral.
e) De acordo com o criterio de frequencias as variaveis sao ou n ao
independentes?
3 AN

ALISE BIDIMENSIONAL 27
3 Analise bidimensional
Vimos ate agora como organizar e resumir informac oes pertinentes a uma
vari avel. Agora vamos aprender a analisar o comportamento de duas vari aveis
com o objetivo de investigar a rela cao entre elas. Podemos ter:
a) Duas variaveis qualitativas.
b) Duas variaveis quantitativas.
c) Uma variavel qualitativa e outra quantitativa.
As tecnicas para se investigar a relac ao entre as vari aveis pode ser difer-
ente para cada caso. De uma maneira geral, medimos a relac ao entre duas
vari aveis atraves dos coecientes de associa cao, eles expressam se as vari aveis
s ao ou n ao dependentes. Para as variaveis qualitativas temos a medida qui-
quadrado X
2
e para as quantitativas temos o coeciente de correla cao.
Duas variaveis qualitativas
Suponha que queremos comparar as variaveis grau de instrucao e regiao de
procedencia e investigar se existe alguma relacao entre elas. Para isso zemos
uma pesquisa com 36 pessoas e montamos a seguinte tabela conjunta:
Atraves dessa tabela podemos recuperar as tabelas de frequencia para
a regiao de procedencia e grau de instruc ao que chamaremos de tabelas de
frequencia marginais.
3 AN

ALISE BIDIMENSIONAL 28
Para duas variaveis podemos tambem construir a tabela de frequencias
relativas. Diferentemente do caso unidimensional podemos considerar a frequencia
relativa:
a) Ao total de cada linha.
b) Ao total de cada coluna.
c) Ao total geral.
No caso do exemplo anterior podemos obter a seguinte tabela de frequencia
relativa ao total de cada coluna:
E com rela cao ao total geral temos:
A tabela com relac ao ao total de cada linha e construda de maneira
an aloga ` a tabela com relac ao ao total de cada coluna.
Agora vamos aprender como investigar a relac ao entre duas variaveis
atraves das tabelas de frequencias.
3.1 Associacao entre variaveis qualitativas
Um dos objetivos de construir uma distribuic aao conjunta de duas vari aveis
e conhecer o grau de dependencia entre elas. No caso de duas vari aveis qual-
itativas vejamos como podemos estudar a dependencia atraves da tabela de
frequencias. Primeiramente um exemplo em que as variaveis parecem nao
estar associadas.
3 AN

ALISE BIDIMENSIONAL 29
Exemplo 1: Suponha que entrevistamos 200 alunos dos cursos de econo-
mia e administrac ao e queremos investigar se existe alguma relac ao entre o
sexo e o curso.
Com as frequencias absolutas ca difcil tirar alguma conclus ao. Vamos
construir a tabela para a frequencia relativa ao total de cada coluna.
Nessa tabela vemos que 60 por cento dos alunos fazem economia e 40
por cento fazem administrac ao. Nao havendo dependencia entre as vari aveis,
esperaramos essa mesma proporc ao para cada sexo. Como as propor coes
s ao proximas para ambos os sexos: 61 e 58 por cento para economia e 39 e
42 por cento para administrac ao as vari aveis sexo e curso parecem nao estar
associadas. Agora vamos ver um exemplo em que as vari aveis parecem estar
associadas.
Exemplo 2: Suponha agora que entrevistamos 200 alunos dos cursos de
fsica e ciencias sociais e, queremos identicar se h a relac ao entre sexo e o
curso.
3 AN

ALISE BIDIMENSIONAL 30
Nesse caso parece haver associac ao j a que as porcentagens dos alunos de
fsica e de ciencias sociais para o sexo feminino e masculino s ao distantes.
Veremos agora como podemos medir essa dependencia.
Medida de dependencia qui-quadrado
Retomemos o exemplo anterior. Na pesquisa observamos as seguintes
frequencias:
Se as vari aveis fossem independentes, os valores esperados para as frequencias
masculino e feminino seriam:
Nesse caso a tabela dos desvios com a diferenca entre os valores observados
de frequencia e os esperados caria:
3 AN

ALISE BIDIMENSIONAL 31
A medida qui-quadrado X
2
mede o quanto as vari aveis est ao longe da
independencia e leva em conta esses desvios entre a tabela das frequencias
observadas e a tabela que esperaramos encontrar se as vari aveis fossem in-
dependentes.
A medida qui-quadrado X
2
e ent ao denida por:
X
2
=

(o
i
e
i
)
2
e
i
onde o
i
s ao os valores observados de frequencia e e
i
s ao os esperados.
Logo abaixo daremos a f ormula da medida X
2
explicitando como obter e
i
sem a necessidade de construir outra tabela de valores esperados.
Se a hipotese de n ao associac ao for verdadeira entao as frequencias obser-
vadas estar ao muito proximas das frequencias esperadas portanto, a dist ancia
entre as tabelas deve ser pequena o que implica um valor de X
2
pr oximo de
zero, um valor muito grande de X
2
indica associacao entre as vari aveis.
Vamos calcular ent ao a medida X
2
para o exemplo acima:
X
2
=
(16)
2
84
+
(16)
2
56
+
(16)
2
56
+
(16)
2
36
+
(16)
2
24
= 3, 05+4, 51+7, 02+10, 54 = 25
Como encontramos um valor grande para X
2
, as vari aveis parecem estar
associadas.
Notacao geral Para obter a medida X
2
para as tabelas de dupla entrada
n ao precisamos construir uma nova tabela de valores esperados e uma outra
tabela de desvios. Podemos fazer o seguinte:
Para X e Y, duas vari aveis assumindo os valores A
1
, A
2
, ...A
r
e B
1
, B
2
, ..., B
s
respectivamente. Suponhamos que elas possuam a seguinte tabela de frequencias
conjunta:
3 AN

ALISE BIDIMENSIONAL 32
Ent ao a medida X
2
e dada por:
X
2
=

r
i=1

s
j=1
(n
ij
n
ij
)
2
n
ij

onde n
ij
e a frequencia esperada se as vari aveis fossem independentes e,
e dada por n
ij
=
n
i.
.n
.j
n
..
.
3.2 Associacao entre variaveis quantitativas
Quando as vari aveis s ao quantitativas, para idencar a existencia de asso-
ciac ao entre as vari aveis podemos usar uma medida denominada coeciente
de correlac ao linear que mede o quanto a relac ao entre as vari aveis esta
pr oxima de uma relac ao linear e um recurso gr aco chamado diagrama de
dispersao. Vamos comecar pelo gr aco de dispers ao.
Graco de dispersao
Para construir o gr aco de dispers ao para duas vari aveis X e Y quanti-
tativas plotamos os valores (X,Y) obtidos num sistema de eixos coordenados.
Vamos ver um exemplo:
Exemplo 3: Suponha que entrevistamos 7 agentes imobili arios e quer-
emos investigar se existe relac ao entre os anos de servi co e o n umero de
clientes.
3 AN

ALISE BIDIMENSIONAL 33
O graco de dispersao ca entao:
Pelo gr aco de dispers ao podemos perceber que as vari aveis perecem estar
associadas. Quanto maior o tempo de servico maior parece ser o n umero de
clientes. Vamos ver agora um graco de dispersao em que os dados parecem
n ao estar associados:
Exemplo 4: Suponha que zemos uma pesquisa da popula cao rural e
urbana nos ultimos anos. O gr aco de dispers ao abaixo indica que as variaveis
n ao est ao relacionadas.
No primeiro exemplo, podemos perceber que e razo avel aproximar os
dados por uma linha reta que seja a mais pr oxima possvel dos dados e
que atraves dela podemos identicar a rela cao existente entre os dados. A
equac ao dessa reta que minimiza o erro, isto e a distancia entre os dados e a
reta, estabelece um modelo que chamamos de modelo de regress ao linear. Por
hora, s o investigaremos se a rela cao existente entre os dados e uma relac ao
pr oxima da linear e, quem nos dir a isso ser a o coeciente de correlac ao linear.
Coeciente de correlacao linear

E uma medida do grau de associa cao linear entre duas vari aveis quan-
titativas.
3 AN

ALISE BIDIMENSIONAL 34
Denicao:
Dados n pares com os valores observados para as variaveis X e Y quantita-
tivas: (x
1
, y
1
), (x
2
, y
2
), ..., (x
n
, y
n
) denimos o coeciente de correlac ao linear
entre X e Y por:
corr(X, Y ) =
1
n

n
i=1
(x
i
x)(y
i
y)
dp(x)dp(y)
A parcela

n
i=1
(x
i
x)(y
i
y)
n
e denominada covariancia.
Outra f ormula equivalente para calcular o coeciente de correlac ao e a
seguinte:
corr(X, Y ) =

n
i=1
(x
i
y
i
n x y)

x
2
i
n x
2
)(

y
2
i
n y
2
)
Podemos perceber que 1 corr(X, Y ) 1. O calculo do coeciente de
correlac ao e muito custoso analiticamente, muitas vezes e conveniente utilizar
programas estatsticos como o R.
Para valores positivos do coeciente de correlac ao, a nuvem de pontos
do graco de dispersao segue uma tendencia de crescimento, quanto mais
pr oximo de 1 o valor est a, mais alinhados os pontos est ao. Por exemplo:
Para valores negativos do coeciente de correla cao, a nuvem de pontos
segue uma tendencia de decrescimento, aqui tambem quanto mais pr oximo
de -1 o valor est a, mais alinhados os pontos est ao. Por exemplo:
3 AN

ALISE BIDIMENSIONAL 35
E nalmente, para valores de correlac ao pr oximos a zero, n ao ha uma
tendencia de crescimento/decrescimento linear clara para os pontos, como
abaixo podemos observar:
Vamos agora encontrar o coeciente de correlac ao linear para o exemplo
3 e vericar que o valor esta pr oximo de 1, que vai ao encontro do que
observamos no graco de dispersao.
Temos n=7, para X temos dp(X)= 1.98 e para Y temos dp(Y)= 7.48,
ent ao o coeciente de correlac ao entre as variaveis X e Y e 0.81, um valor
pr oximo de 1 , como esperavamos quando observamos o gr aco de dispers ao.
3 AN

ALISE BIDIMENSIONAL 36
3.3 Exerccios - lista 04
Questao 1
Suponha que realizamos uma pesquisa com 100 funcion arios de uma
empresa. Nessa pesquisa est avamos interessados nas vari aveis regi ao de
procedencia e nvel de escolaridade. Para a regi ao de procedencia observamos
os valores capital, interior e outra. Para o nvel de escolaridade observamos os
valores fundamental, medio e superior. Com os dados montamos a seguinte
tabela de frequencias absolutas:
a) Construa a tabela de frequencias relativas com relac ao ao total geral.
b) Construa a tabela de frequencias marginais para cada uma das
vari aveis.
c) Qual a porcentagem dos funcionarios que possuem nvel medio?
d) Qual a porcentagem dos funcionarios que sao da capital?
e) Escolhendo um funcion ario ao acaso qual ser a provavelmente seu
grau de instru cao? E a sua regi ao de procedencia?
f) As vari aveis parecem dependentes? Porque?
Questao 2
Uma companhia de seguros analisou a frequencia com que 2000 segurados
usaram o hospital, dentre eles 1000 homens e 1000 mulheres. Os resultados
foram:
3 AN

ALISE BIDIMENSIONAL 37
a) Calcule a propor cao de homens dentre os indivduos que utilizaram
o hospital.
b) Calcule a proporcao de homens dentre os indivduos que n ao uti-
lizaram o hospital.
c) Baseado nos c alculos das frequencias e do coeciente X
2
voce diria
que o uso do hospital independe do sexo do segurado?
Questao 3
Lancam-se simultaneamente uma moeda de um real e uma de 25 centavos.
Em cada tentativa anotou-se o resultado cujos dados estao resumidos na
tabela abaixo:
a) Esses dados sugerem que os resultados das moedas de um real e os
da moeda de 25 centavos estao associados?
b) Denindo as vari aveis X
1
e X
2
tais que X
1
= 0 quando ocorre cara
e X
1
= 1 quando ocorre coroa na moeda de um real. Analogamente
X
2
= 0 quando ocorre cara e X
2
= 1 quando ocorre coroa na moeda
de 25 centavos. Calcule a correlac ao entre X
1
e X
2
. Essa medida est a
de acordo com o que voce respondeu anteriormente?
Questao 4

E esperado que a massa muscular de uma pessoa diminua com a idade.


Para estudar essa rela cao, uma nutricionista selecionou 8 mulheres, com idade
entre 40 e 79 anos, e observou em cada uma delas a idade (X) e a massa
muscular (Y).
3 AN

ALISE BIDIMENSIONAL 38
Construa o graco de dispersao e calcule o coeciente de correla cao. A
hip otese da nutricionista se conrma com os dados?
3 AN

ALISE BIDIMENSIONAL 39
3.4 Exerccios - lista de revisao
Questao 1
Numa pesquisa realizada com 100 famlias foram observadas 17 famlias
sem lhos, 20 com 1 lho, 28 com 2 lhos, 19 com 3 lhos, 7 com 4 lhos e
9 com 5 lhos.
a) Calcule o n umero medio, o n umero mediano de lhos e o desvio
padr ao.
b) Se selecionarmos 1 dessas famlias qual ser a provavelmente seu n umero
de lhos?
c) Faca o graco em barras e o graco em setores.
Questao 2
Foram investigadas idades de 10 alunos do curso de pos-graduacao em
agronomia:
22, 23, 22, 21, 22, 23, 21, 22 , 35, 40.
a) Calcule a media e a mediana das idades.
b) Qual e a melhor medida para representar os dados.
c) Faca o box-plot e observe os valores extremos. A distribuic ao parece
simetrica?
Questao 3
Em uma empresa A a media dos salarios e 10.000 e o terceiro quartil e
5.000. Se voce foi contratado e o seu sal ario foi escolhido aleatoriamente e
mais provavel que voce ganhe mais ou menos que 5.000? Em outra empresa
B a media de salerios e 7.000 e a vari ancia e praticamente zero. Em qual das
empresas voce preferiria trabalhar?
Questao 4
Os dados abaixo referem-se ao salario (em sal arios mnimos) de 20 fun-
cion arios administrativos em uma ind ustria.
10.1, 7.3, 8.5, 5.0, 4.2, 3.1, 2.2, 9.0, 9.4, 6.1,
3.3, 10.7, 1.5, 8.2, 10, 4.7, 3.5, 6.5, 8.9, 6.1
a) Construa uma tabela de frequencias agrupando os dados em inter-
valos de amplitude 2 a partir de 1.
b) Calcule a media, a mediana e o desvio padr ao usando a tabela con-
struida em a).
3 AN

ALISE BIDIMENSIONAL 40
c) Se classicarmos os funcionarios com salarios abaixo de 5 como fun-
cion arios de baixa renda. Entre 5 e 7 como de renda media. Maior que
7 como renda alta. Construa uma tabela de frequencias para o perl
de renda.
d) Escolhendo um funcion ario, qual e a probabilidade de ele ser de
renda media? Qual ser a provavelmente o seu perl de renda?
Questao 5
Dois medicamentos para cicatriza cao est ao sendo testados em um ex-
perimento feito para estudar o tempo (em dias) necessario para o completo
fechamento de cortes. Uma amostra com 30 cobaias foi analisada, sendo
metade tratada com o medicamento A e a outra metade com o B, e forneceu
os seguintes valores:
A - 15, 17, 16, 15, 17, 14, 17, 16, 16, 17, 15, 18, 14, 17, 15
B - 14, 15, 16, 17, 18, 18, 17, 15, 16, 14, 18, 18, 16, 15, 14
a) Construa uma tabela de frequencias para o tempo do medicamento
A e outra para o B.
b) Para o medicamento A qual a porcentagem das observa coes estao
abaixo dos 16 dias? E para o B?
c) Os medicamentos precem ter o mesmo efeito?
Questao 6
Suponha que o pas A receba de volta uma parte de seu territorio T,
que por certo tempo esteve sob a administrac ao do pas B, devido a um
tratado entre A e B. A populacao de A, antes de receber T, era 1,2 bilh ao
de habitantes, e a de T era 6 milhoes de habitantes. Se as medias de idade
das populac oes A e T, antes de se reunirem, eram, respectivamente, 30 anos
e 25 anos. Qual e a media de idade apos a reuni ao?
Questao 7
Numa classe com vinte alunos, as notas do exame nal podiam variar
de 0 a 100 e a nota mnima para aprovacao era 70. Realizado o exame,
vericou-se que 8 alunos foram reprovados. A media aritmetica das notas
desses oito alunos foi 65, enquanto que a media dos aprovados foi 77. Ap os a
divulgac ao dos resultados, o professor vericou que uma questao havia sido
mal formulada e decidiu atribuir 5 pontos a mais para todos os alunos. Com
essa decisao, a media dos aprovados passou a ser 80 e a dos reprovados 68,8.
a) Calcule a media aritmetica das notas da classe toda antes da atribuic ao
dos cinco pontos extras.
3 AN

ALISE BIDIMENSIONAL 41
b) Com a atribuicao dos cinco pontos extras, quantos alunos, inicial-
mente reprovados, atingiram nota para a aprovac ao?
Questao 8
Suponha que a relacao entre o tempo necess ario para animais adquirirem
um certo peso e a quantidade de animais no rebanho pode ser descrita por:
peso =
racao(kg)
animais
A pesagem dos animais e feita semanalmente e o acompanhamento foi
feito durante 3 semanas.
a) Na primeira semana utilizamos 500kg para alimentar o rebanho e,
nesse perodo houve um ganho medio de 2kg. Na segunda semana
foram utilizados 1000kg e houve um ganho medio de 2,5kg. Na terceira
semana utilizamos 200kg e o ganho medio foi de 3kg. Qual o ganho
medio de peso nessas 3 semanas?
b) Se alimentamos 100 animais durante a primeira semana, 150 du-
rante a segunda e 500 durante a terceira e os ganhos de peso foram
respectivamente 2, 1.5 e 2.5. Qual e o ganho medio de peso durante
essas 3 semanas?
Questao 9
Suponha que aplicamos um capital durante 6 meses e as taxas de retorno
foram de 10,15,30,40,60,50 por cento respectivamente. Suponha tambem que
decidimos continuar com o investimento se a taxa media de retorno for de pelo
menos 34 por cento. Qual e a decis ao a juros simples? E a juros compostos?
Questao 10
Foram entrevistados 200 alunos de tres cursos, obtendo a seguinte tabela:
a) Qual e a porcentagem de alunos do curso de fsica? Existem mais
homens ou mulheres no curso de fsica?
b) Qual e a porcentagem de mulheres no curso de matematica?
3 AN

ALISE BIDIMENSIONAL 42
c) Escolhendo um aluno ao acaso e, sabendo que o escolhido e mulher
qual e a probabilidade de ela ser do curso de qumica?
d) Qual o curso tem um n umero maior de homens fsica ou matem atica?
e) De acordo com o coeciente X
2
e com a tabela de frequencias, essas
vari aveis s ao independentes?
Questao 11
Um ge ologo esta procurando identicar a rela cao existente entre a pre-
senca de magnesio e a existencia de calcicac ao de um determinado tipo em
um solo. Para isso, ele coletou uma amostra de solo com 5 observa coes e an-
otou a quantidade de magnesio encontrada (X) e o correspondente n umero
de calcicac oes (Y).
Faca o gr aco de dispers ao para as vari aveis e calcule o coeciente de
correlac ao. Qual e a conclusao do ge ologo?
4 PROBABILIDADE 43
4 Probabilidade
Ate agora, analisamos um conjunto de dados atraves de tecnicas gr acas
e medidas de posic ao ou dispersao.
A distribui cao de frequencias foi um instrumento importante para avaliar-
mos o comportamento da variavel que estudamos, seus valores e suas variac oes
observadas na amostra.
As frequencias relativas estudadas ate ent ao, s ao estimativas das proba-
bilidades de ocorrencia dos valores da variavel de interesse.
Fazendo suposic oes adequadas e sem observarmos amostras, podemos
criar um modelo te orico que reproduza a distribuic ao de frequencias obser-
vadas na populacao. Esses modelos s ao chamados modelos probabilsticos.
Uma outra interpretac ao para o conceito de probabilidade, um pouco
diferente da interpretac ao frequentista que estamos acostumados ate agora e
a interpretac ao cl assica. Nesse caso, quando cada um dos resultados (eventos
elementares) tem igual chance de ocorrer denimos a probabilidade de um
evento A ocorrer como a razao entre o n umero de resultados favoraveis ao
evento A e o n umero de resultados possveis.
4.1 Modelo probabilstico
Um modelo probabilstico e constitudo por:
1)- Um espaco amostral que consiste em todos os resultados possveis
para o experimento.
= {w
1
, w
2
, w
3
, ..., w
n
, ...}
O espaco amostral pode ser nito ou innito. Qualquer subconjunto de
e denominado evento. O evento w
i
e chamado evento elementar.
2)- Uma probabilidade P(.), denida para cada evento elementar w
i
em
, de tal forma que seja possvel encontrar a probabilidade P(A) para qual-
quer evento A em .
Exemplo 1: Modelo probabilstico para o lan camento de um dado.
= {1, 2, 3, 4, 5, 6}
onde P(w
i
) =
1
6
, para todo w
i
.
Para o evento A: observar face mpar, temos A={1, 3, 5} e P(A)=1/2.
Exemplo 2: Modelo probabilstico para o lan camento de um dado e uma
moeda.
4 PROBABILIDADE 44
= {(c, 1), (c, 2), (c, 3), (c, 4), (c, 5), (c, 6), (k, 1), (k, 2), (k, 3), (k, 4), (k, 5), (k, 6)}
onde P(w
i
) =
1
12
, para todo w
i
.
Para o evento B: observar face par e cara, temos B={(c, 2), (c, 4), (c, 6)}
e P(B)=1/4.
Axiomas de probabilidade
A funcao de probabilidade do modelo probabilstico deve satisfazer:
(1) P() = 1
(2) 0 P(A) 1, para todo evento A .
(3) P(E
1
E
2
) = P(E
1
) + P(E
2
) para E
1
, E
2
, eventos disjuntos,
isto e E
1
E
2
= .
A partir dos axiomas anteriores podemos denir algumas propriedades
para a fun cao de probabilidade:
(1) P(A B) = P(A) + P(B) P(A B), para todo A, B .
Dem:
P(A B) = P(A B) + P(A B) + P(B A)
= P(A) P(A B) + P(A B) + P(B) P(A B)
= P(A) + P(B) P(A B)
(2) P(A
c
) = 1 P(A).
Dem:
P() = 1 = P(A A
c
) = 1 = P(A) + P(A
c
) = 1.
(3) P() = 0.
Dem : Em sala.
(4) P(

n
i=1
E
i
) =

n
i=1
P(E
i
) . Para toda colecao de eventos {E
1
, E
2
, ..., E
n
}
disjuntos dois a dois isto e E
i
E
j
= , para todo i = j.
Obs: Os eventos satisfazem ` as mesmas propriedades para as opera coes
entre conjuntos:
4 PROBABILIDADE 45
a) (A B)
c
= A
c
B
c
b) (A B)
c
= A
c
B
c
c) A =
d) A = A
e)
c
=
f) A A
c
=
g) A A
c
=
h) A = A, A =
Exemplo 3: Ao se retirar uma carta do baralho (com 52 cartas) qual e
a probabilidade de se obter uma carta vermelha ou um ` as?
evento A: carta e `as.
evento B: carta e vermelha.
P(AB) = P(B) +P(A) P(AB) = 26/52 +4/52 2/52 = 28/52 =
7/13.
Exemplo 4: Lancando uma moeda e um dado, qual e a probabilidade
de nao se observar o n umero 1?
evento A: foi observada a face 1.
A = {(c, 1), (k, 1)}
queremos P(A
c
) = 1 P(A) = 1 2/12 = 5/6.
Exerccio: Suponha que entrevistamos 100 alunos e perguntamos em
quais materias eles estavam inscritos. Obtivemos os seguintes valores:
47 alunos inscritos em matematica.
31 alunos inscritos em fsica.
11 alunos inscritos em estatstica.
20 alunos inscritos em matematica e fsica.
7 alunos inscritos em matematica e estatstica.
6 alunos inscritos em fsica e estatstica.
5 alunos inscritos em matematica, fsica e estatstica.
a) Selecionando um aluno ao acaso, qual e a probabilidade de ele estar
inscrito somente em matem atica?
b) Qual e a probabilidade de ele estar inscrito em matematica ou fsica?
c) Qual e a probabilidade de ele estar inscrito em pelo menos 1 materia?
4 PROBABILIDADE 46
Metodos de contagem
Quando estamos trabalhando com um espaco amostral nito e equiprov avel
= {w
1
, w
2
, w
3
, ..., w
n
} isto e, quando todos os eventos elementares w
i
tem
igual probabilidade 1/n de ocorrer, podemos utilizar tecnicas de an alise com-
binat oria para calcular de uma maneira mais simples a probabilidade de um
evento A ocorrer.
P(A) =
A

onde A e o n umero de resultados favor aveis e e o n umero de resulta-


dos possveis.
Exemplo 5: Suponha que num lote com 20 pecas existam 5 defeituosas.
Escolhendo 4 pe cas do lote, qual e a probabilidade de 2 pe cas serem defeitu-
osas e 2 perfeitas?
A: Escolher 2 pecas defeituosas e 2 perfeitas.
A = C
5
2
.C
15
2
(n umero de casos favor aveis).
= C
20
4
(n umero de casos possveis).
Logo, P(A) =
A

=
C
5
2
.C
15
2
C
20
4
=
5.4
2!
15.14
2!
20.19.18.17
4!
= 0, 2167
Exerccio: Lancando-se 2 dados, qual e a probabilidade de todos os
n umeros aparecerem 2 vezes?
Exerccio: Em um grupo de 5 medicos e 5 enfermeiras, devemos formar
uma equipe com 2 medicos e 2 enfermeiras. Qual e a probabilidade do medico
Jose e a enfermeira Maria fazerem parte da mesma equipe?
Exerccio: Um baralho contem 52 cartas das quais 4 s ao ases. Se 4
jogadores recebem 13 cartas cada um qual e a probabilidade de cada jogador
receber 1 ` as?
4.2 Probabilidade condicional e independencia
Denicao : Para dois eventos A e B com P(B) > 0, a probabilidade
condicional de A dado B e dada por:
4 PROBABILIDADE 47
P(A|B) =
P(AB)
P(B)
Exemplo 6: Dois dados sao lancados e foi observada a soma das faces
mpar. Qual e a probabilidade de que a soma seja menor do que 8?
B: Sair soma mpar.
B = {3, 5, 7, 9, 11}
A: Soma menor que 8.
A = {2, 3, 4, 5, 6, 7}
P(A|B) =
P(AB)
P(B)
A B = {3, 5, 7} =
_
_
_
Soma 3 (1, 2); (2, 1)
Soma 5 (1, 4); (4, 1); (2, 3); (3, 2)
Soma 7 (1, 6); (6, 1); (2, 5); (5, 2); (3, 4); (4, 3)
ent ao P(A B) =
12
36
.
B = {3, 5, 7, 9, 11} =
_

_
Soma 3 (1, 2); (2, 1)
Soma 5 (1, 4); (4, 1); (2, 3); (3, 2)
Soma 7 (1, 6); (6, 1); (2, 5); (5, 2); (3, 4); (4, 3)
Soma 9 (3, 6); (6, 3); (4, 5); (5, 4)
Soma 11 (5, 6); (6, 5)
ent ao P(B) =
18
36
Logo P(A|B) =
12
36
18
36
=
12
18
=
2
3
Regra da multiplicacao
Dada a deni cao de probabilidade condicional, podemos escrever:
P(A B) = P(A|B)P(B)
Essa regra em geral, vale para mais eventos:
P(A B C) = P(C|A B)P(B|A)P(A)
P(A
1
A
2
A
3
... A
n
) = P(A
n
|A
1
... A
n1
)P(A
n1
|A
1
...
A
n2
)...P(A
1
)
Exemplo 7:
Em um lote com 100 l ampadas 20 s ao defeituosas. Selecionando 2 l ampadas
ao acaso e sem reposicao, qual e a probabilidade:
a) De serem ambas defeituosas?
4 PROBABILIDADE 48
b) Da segunda l ampada ser defeituosa?
a) Sejam os eventos A: 1
o
peca e defeituosa. B: 2
o
peca e defeituosa.
P(A B) = P(B|A).P(A) =
20
100
.
19
99
=
38
99
b) P(B) = P(B A) + P(B A
c
) = P(B|A)P(A) + P(B|A
c
)P(A
c
) =
20
100
.
19
99
+
20
99
.
80
100
= 0, 2
c) Selecionando tres lampadas ao acaso, qual e a probabilidade de reti-
rarmos a 1
o
l ampada defeituosa, a 2
o
e a 3
o
perfeitas?
Para o evento C: 3
o
peca e defeituosa.
Queremos P(A B
c
C
c
) = P(C
c
|A B
c
)P(B
c
|A)P(A) =
79
98
80
99
20
100
Denicao (Particao):
Dizemos que os eventos A
1
, A
2
, A
3
, ..., A
n
formam uma parti cao para
se:
(i) = A
1
A
2
A
3
... A
n
(ii) A
i
A
j
= , i = j, i, j {1, 2, ..., n}
Teorema: Lei da probabilidade total
Seja B um evento e {A
1
, A
2
, A
3
, ..., A
n
} uma partic ao do espaco amostral
, ent ao:
P(B) =
n
i=1
P(B|A
i
)P(A
i
)
Demonstrac ao:
P(B) = P(B ) = P(B (A
1
, A
2
, A
3
, ..., A
n
))
= P((B A
1
) (B A
2
) ... (B A
n
))
= P(B A
1
) + P(B A
2
) + ... +P(B A
n
)
= P(B|A
1
)P(A
1
) + P(B|A
2
)P(A
2
) + ... +P(B|A
n
)P(A
n
)
=
n

i=1
P(B|A
i
)P(A
i
)
4 PROBABILIDADE 49
Podemos vericar na gura abaixo como interpretar a lei da probabilidade
total.
Quando o evento B pode ser formado pela uni ao de varias partes sem in-
tersec ao (eventos disjuntos) e, sabemos calcular a probabilidade de cada uma
dessas partes, podemos calcular a probabilidade total do evento B ocorrer
atraves da soma das probabilidades de todas as partes que unidas formam o
evento B.
4 PROBABILIDADE 50
Exemplo 8:
Em uma f abrica, duas maquinas A e B operam em dias alternados. A
m aquina A opera em 20 por cento dos dias e a probabilidade de produzir um
item defeituoso e 0,3, j a para a m aquina B essa probabilidade e de 0,1. Se-
lecionando dois equipamentos produzidos em um dia, qual e a probabilidade
de serem ambos defeituosos?
Pela lei da probabilidade total temos:
C: Selecionar 2 equipamentos defeituosos
A : M aquina A ativa.
B : M aquina B ativa.
P(C) = P(C|A)P(A)+P(C|B)P(B) = (0, 3)
2
.0, 2+(0, 1)
2
.0, 8= 0,018+0,008=0,026.
Independencia
Dizemos que dois eventos A e B , sao independentes se
P(A B) = P(A).P(B)
Exemplo 9:
Uma urna contem 2 bolas brancas e 3 vermelhas. Suponha que sejam
retiradas 2 bolas sem reposi cao.
Nesse caso, para o evento A: retirar uma bola branca na segunda extrac ao
temos
A = {(v, b), (b, b)}
e para o evento C: retirar uma bola branca na 1
o
extrac ao temos
A = {(b, v), (b, b)}
Os eventos A e C s ao independentes? Para responder, vamos descrever o
espaco amostral e as probabilidades.
Resultados Probabilidade
(b,b) 2/5.1/4=2/20
(b,v) 2/5.3/4=6/20
(v,b) 3/5.2/4=6/20
(v,v) 3/5.2/4=6/20
ent ao P(A) = P(b, b) +P(v, b) = 2/20 +6/20 = 2/5, P(C) = P(b, b) +
P(b, v) = 2/20+6/20 = 2/5 e P(AC) = P(b, b) = 2/20 = P(A).P(C) =
4/25.
4 PROBABILIDADE 51
Logo os eventos A e C n ao sao independentes.
Se tivessemos retirado duas bolas com reposi cao teramos
Resultados Probabilidade
(b,b) 2/5.2/5=4/25
(b,v) 2/5.3/5=6/25
(v,b) 3/5.2/5=6/25
(v,v) 3/5.3/5=6/25
P(C) = P(b, b) + P(b, v) = 4/25 + 6/25 = 10/25, P(A) = P(b, b) +
P(v, b) = 4/25 + 6/25 = 10/25
ent ao
P(A C) = P(b, b) = 4/25 = P(A).P(C) = 10/25.2/5 = 4/25
Logo, nesse caso os eventos A e C sao independentes.
Exemplo 10:
Lancando um dado e uma moeda, os eventos: obter cara e obter um
n umero menor que 3 s ao independentes?
A: obter cara.
B: obter um n umero menor que 3.
A={(c, 1), (c, 2), (c, 3), (c, 4), (c, 5), (c, 6)}
B={(c, 1), (k, 1), (c, 2), (k, 2)}
P(A B) = 2/12, P(A) = 6/12 e P(B) = 4/12
Como P(A B) = 2/12 = P(A).P(B) = 1/6, temos que os eventos A e
B sao independentes.
Obs: Se os eventos A e B s ao independentes ent ao A
c
e B
c
tambem s ao
independentes.
P(A
c
B
c
) = P((A B)
c
) = 1 P(A B)
= 1 [P(A) + P(B) P(A B)]
= 1 P(A) P(B) + P(A)P(B)
= 1 P(A) P(B)[1 P(A)]
= [1 P(A)][1 P(B)]
= P(A
c
)P(B
c
)
Exemplo 11:
4 PROBABILIDADE 52
Se uma maquina A e uma m aquina B operam de maneira independente
e a probabilidade da maquina A falhar e de 0,4 e para a m aquina B essa
probabilidade e de 0,1. Qual e a probabilidade de ambas funcionarem corre-
tamente?
resp: 0,6.0,9=0,54.
4.3 Teorema de Bayes
Exemplo 12:
Se temos duas urnas, a urna 1 com 2 bolas brancas e 1 vermelha e a urna
2 com 1 bola branca e 1 vermelha. Se selecionamos uma bola vermelha, qual
e a probabilidade de ela ter vindo da urna 1?
C: A urna 1 e selecionada.
V: Uma bola vermelha e selecionada.
Queremos saber P(C|V ), mas sabemos calcular P(V |C). Como podemos
usar essa informa cao?
Podemos usar o fato de P(C|V ) =
P(CV )
P(V )
=
P(V |C)P(C)
P(V )
e alem disso, pelo
teorema da probabilidade total sabemos que
P(V ) = P(V |C)P(C) + P(V |C
c
)P(C
c
)
ent ao P(C|V ) =
P(V |C)P(C)
P(V |C)P(C)+P(V |C
c
)P(C
c
)
=
2
3
1
2
2
3
1
2
+
1
2
1
2
=
4
7
.
Podemos generalizar a f ormula acima da seguinte maneira:
Para {A
1
, A
2
, ..., A
n
} uma partic ao de , considere B um evento qualquer
em . Suponhamos conhecidas P(B|A
i
) e P(A
i
) ent ao temos:
Teorema de Bayes
A probabilidade de ocorrencia do evento A
i
dada a ocorrencia do evento
B e:
P(A
i
|B) =
P(B|A
i
)P(A
i
)

n
i=1
P(B|A
i
)P(A
i
)
4 PROBABILIDADE 53
Podemos pensar em {A
1
, A
2
, ..., A
n
} como um conjunto de hipoteses.
Dado que B ocorreu, a probabilidade inicial de A
i
, P(A
i
) e modicada para
se obter P(A
i
|B).
Chamamos P(A
i
)- Probabilidade a priori.
P(A
i
|B)- Probabilidade a posteriori.
Para se obter P(A
i
|B) multiplicamos P(A
i
) por:
P(B|A
i
)

n
i=1
P(B|A
i
)P(A
i
)
Exemplo 12:
Supondo que um teste para uma certa doenca pode resultar em positivo
ou negativo e que a probabilidade do teste dar positivo, dado que a pessoa
est a doente e 0,9 e, de dar negativo dado que a pessoa n ao esta doente e 0,9.
Sabendo ainda que a incidencia da doen ca na populacao e de 1/100, se um
individuo desta popula cao faz o teste e resulta positivo, qual e a probabili-
dade de realmente ele estar doente?
A: teste resultou positivo
B: individuo est a doente
P(B|A) =
P(A|B)P(B)
P(A|B)P(B)+P(A|B
c
)P(B
c
)
=
0,9.0,01
0,9.0,01+0,1.0,99
= 0, 08
Antes de fazer o teste o indivduo tinha uma chance de 1 por cento de ter
a doen ca, como o teste deu positivo, temos um aumento na probabilidade,
que passou para 8 por cento.
4 PROBABILIDADE 54
4.4 Exerccios - lista 05
Probabilidade e suas propriedades
Questao 1 Dena um modelo probabilstico para os experimentos abaixo
(espaco amostral e probabilidades para cada elemento do espaco amostral):
a) Um dado e lan cado duas vezes e a ocorrencia de face par ou mpar
e observada.
b) Dois dados s ao lancados simultaneamente e a soma e observada.
c) Uma urna contem 10 bolas azuis e 10 vermelhas, 4 bolas sao sele-
cionadas ao acaso e com reposicao e as cores sao anotadas.
d) Idem ao anterior mas sem reposic ao.
Questao 2
Para o exerccio anterior, de a probabilidade para os seguintes eventos:
a) Observar pelo menos 1 face mpar em 1a).
b) Observar soma m ultipla de 3 em 1b).
c) Observar primeira e segunda bolas azuis e terceira e quartas vermel-
has em 1c).
d) Observar duas bolas azuis e duas vermelhas em 1c).
e) Observar primeira e segunda bolas azuis e terceira e quata vermelhas
em 1d).
f) Observar duas bolas azuis e duas vermelhas em 1d).
Questao 3
Uma universidade tem 10 mil alunos dos quais 4 mil s ao considerados
esportistas. Temos ainda que 500 alunos sao do curso de biologia diurno,
700 da biologia noturno, 100 s ao esportistas e da biologia diurno e 200 sao
esportistas e da biologia noturno. Um aluno e escolhido ao acaso e pergunta-
se a probabilidade de:
a) Ser esportista.
b) Ser esportista e aluno da biologia noturno.
c) Nao ser da biologia.
4 PROBABILIDADE 55
d) Ser esportista ou aluno da biologia.
e) Nao ser esportista nem aluno da biologia.
Questao 4
Sejam A e B dois eventos em um dado espaco amostral, tais que P(A)=0,2,
P(B)=p, P(AUB)=0,5 e P(A

B)=0,1. Determine o valor de p.


Questao 5
Uma f abrica produz molas de tamanhos 1,2,3,4,5 e 6 cm. Sabendo que
a probabilidade de a mola resistir a uma for ca empregada e proporcional ao
comprimento e a constante de proporcionalidade e a mesma para cada mola,
qual e a probabilidade da mola de 2cm resistir `a forca?
Questao 6
Uma moeda e viciada de modo que a probabilidade de sair cara e 4 vezes
a probabilidade de sair coroa. Para 2 lan camentos dessa moeda determinar:
a) O espa co amostral.
b) A probabilidade de sair somente uma cara.
c) A probabilidade de sair pelo menos uma cara.
d) A probabilidade de dois resultados iguais.
Questao 7
Sorteamos ao acaso, com reposic ao, 2 n umeros dentre 4 dos quais dois
s ao positivos, dois sao negativos e nenhum deles e zero. Determine a proba-
bilidade de:
a) Um deles ser negativo.
b) O quociente ser negativo.
c) Os dois n umeros terem o mesmo sinal.
Questao 8
Pecas produzidas por uma maquina s ao classicadas como defeituosas, re-
cuper aveis ou perfeitas com probabilidade de 0.1,0.2 e 0.7, respectivamente.
De um grande lote dessas pecas foram sorteamdas duas delas e sua classi-
cac ao e observada. Determine a probabilidade de:
a) Duas serem defeituosas.
b) Pelo menos uma ser perfeita.
4 PROBABILIDADE 56
c) Uma ser recuperavel e uma ser perfeita.
Probabilidade condicional
Questao 9
Dois arm arios guardam as bolas de voleibol e basquete. O armario 1 tem
3 bolas de voleibol e 1 de basquete, enquanto o armario 2 tem 3 de voleibol
e 2 de basquete. Escolhendo-se ao acasoum arm ario e, em seguida, uma de
suas bolas, calcule a probabilidade dela ser:
a) De voleibol, sabendo-se que o arm ario 1 foi escolhido.
b) De basquete, sabendo-se que o arm ario 2 foi escolhido.
c) De basquete.
Questao 10
Duas caixas contem l apis e canetas, a primeira contem 60 l apis e 40
canetas, a segunda contem 10 l apis e 20 canetas. Suponha que uma caixa e
selecionada e um objeto e escolhido, qual e a probabilidade de escolher uma
caneta?
Questao 11
Tres diferentes maquinas s ao utilizadas para produzir uma peca. Sabendo
que a m aquina 1 produz 20 por cento das pe cas das quais 1 por cento sao
defeituosas. A m aquina 2 produz 30 por cento das pe cas das quais 2 por cento
s ao defeituosas e, a m aquina 3 produz 50 por cento das pecas das quais 3 por
cento s ao defeituosas. Selecionando 1 item ao acaso, qual e a probabilidade
de ele ser defeituoso? Se selecionarmos 2 itens, qual e a probabilidade dos
dois serem defeituosos?
Questao 12
Dois dados equilibrados s ao lan cados, calcule a probabilidade de:
a) Obter o par (3,4), sabendo-se que ocorreu face mpar no primeiro
dado.
b) Ocorrer face mpar no segundo dado sabendo-se que ocorreu face
par no primeiro dado.
Questao 13
Uma companhia que fura pocos artesianos trabalha em uma regi ao escol-
hendo alet oriamente o ponto de furo e n ao encontrando agua sorteia outro
local para a perfurac ao e assim por diante ate no maximo 3 tentativas. Ad-
mitindo que a probabilidade de encontrar agua em uma perfura cao e 0.7,
calcule a probabilidade de:
4 PROBABILIDADE 57
a) Encontrar agua no segundo furo.
b) Encontrar agua no terceiro furo.
c) Encontrar agua.
Questao 14
Suponha que existam duas pastas de dente no mercado: A e B. Suponha
que para cada escolha depois da primeira, a probabilidade que ele escolha a
mesma pasta e 1/3 e que ele mude de pasta e 2/3. Se e igualmente provavel
ele escolher a pasta 1 ou 2 na primeira escolha, qual e a probabilidade que a
primeira e a segunda sejam do tipo A e as terceiras e quarta do tipo B?
Independencia entre eventos
Questao 15
Dois estudantes A e B esao matriculados em um certo curso. Se o estu-
dante A frequenta 80 por cento das aulas, e o estudante B 60 por cento e as
ausencias s ao independentes, qual e a probabilidade de:
a) Ao menos 1 dos estudantes esteja presente na aula um certo dia?
b) Dado que ao menos 1 dos estudantes esteja presente na aula um
certo dia qual e a probabilidade que A esteja presente nesse dia?
Questao 16
Suponha que a probabilidade de uma partcula emitida por um material
radioativo atingir um campo e 0,01. Se 10 partculas sao emitidas qual e a
probabilidade de apenas 1 delas atingir o campo?
Questao 17
Dois garotos lancam uma bola de basquete. Suponha que a probabilidade
do menino A acertar a cesta e 1/3 e para o menino B essa probabilidade e
1/4. Suponha tambem que o menino A inicia os lancamentos e os dois v ao se
alternando. Qual e a probabilidade de o primeiro acerto ocorres no terceiro
lancamento do menino A?
Questao 18
Se tres dados sao lancados, qual e a probabilidade que os 3 n umeros sejam
os mesmos?
Teorema de Bayes
Questao 19
Numa certa regi ao, a probabilidade de chuva em um dia de primavera e
0,1. Um meteorologista acerta sua previs ao em 80 por cento dos dias que
chove e 90 por cento dos dias em que nao chove.
a) Qual e a probabilidade de um meteorologista acertar sua previsao?
4 PROBABILIDADE 58
b) Se houver acerto na previs ao, qual e a probabilidade de ter sido um
dia de chuva?
Questao 20
Uma caixa contem 3 cartas, uma e vermelha em ambos os lados, outra
e verde em ambos os lados e, a terceira e verde de um lado e vermelha de
outro. Uma carta e selecionada e um de seus lados e observado. Se esse lado
e verde, qual e a probabilidade que o outro lado seja tambem verde?
Questao 21
Acredita-se que numa certa populac ao 20 por cento de seus habitantes sao
considerados alergicos. Sendo alergico, a probabilidade de sofrer um tipo de
reac ao a um certo antibiotico e 0,5. Para os nao alergicos essa probabilidade
e 0,05. Uma pessoa e dessa populac ao teve rea cao ao ingerir o antibi otico.
a) Qual e a probabilidade de ele ser do grupo alergico?
b) E do grupo n ao alergico?
Questao 22
Uma caixa contem 2 moedas, uma tem cara em ambos os lados e a outra
e honesta. Uma moeda e selecionada e lancada, se obtivemos cara qual e a
probabilidade que a moeda seja honesta?
5 VARI

AVEIS ALEAT

ORIAS DISCRETAS 59
5 Variaveis aleatorias discretas
Ate agora, estudamos alguns modelos probabilsticos por meio de espacos
amostrais bem simples e obtivemos algumas propriedades da func ao de prob-
abilidade.
Para situacoes mais gerais, precisamos de modelos que possam representar
os tipos de vari aveis que estudamos, qualitativas e quantitativas.
Para as vari aveis qualitativas as noc oes de probabilidade associadas a
eventos denidas anteriormente adaptam-se muito bem. J a para as variaveis
quantitativas discretas e contnuas precisamos de alguns artifcios matem aticos.
Os modelos probabilsticos para as variaveis quantitativas sao muito im-
portantes para inferencia estatstica e a partir deles podemos extrair con-
clus oes sobre a populacao.
Variaveis aleat orias
Uma quantidade X associada a cada possvel resultado do espaco amostral
e denominada variavel aleatoria discreta se assume valores num conjunto
enumer avel (nito ou innito) com certa probabilidade. Por outro lado, ser a
denominada variavel aleatoria contnua se o conjunto de valores assumido e
qualquer intervalo de n umeros reais, que sao conjuntos nao enumer aveis.
Como ja vimos anteriormente, existem vari aveis que s ao naturalmente
denidas como discretas ou contnuas. Por exemplo, o n umero de lhos e
discreta e o tempo de reac ao a um certo medicamento e contnua.
De forma geral, as denic oes de vari aveis quantitativas discretas e contnuas
feitas anteriormente no capitulo 1 permanecem, e a palavra aleat oria e intro-
duzida para indicar que a cada valor ou intervalo possvel atribumos uma
probabilidade de ocorrencia.
No caso discreto, a atribuic ao e similar ` a tabela de frequencia relativa. Ja
no caso contnuo vamos utilizar uma generalizac ao do conceito de histograma.
Variaveis aleat orias discretas
Seja X uma vari avel aleatoria discreta e x
1
, x
2
, x
3
, ... seus valores possveis.
A fun cao que atribui a cada valor possvel de X uma probabilidade e chamada
func ao de probabilidade.
5.1 Funcao de Probabilidade
Para uma vari avel aleat oria discreta X assumindo valores x
1
, x
2
, x
3
, ... den-
imos a fun cao de probabilidade de X por:
5 VARI

AVEIS ALEAT

ORIAS DISCRETAS 60
P(X = x
i
) = p(x
i
) para todo i {1, 2, 3, ...}
que satisfaz
_
(i) 0 p(x
i
) 1
(ii)

i=0
p(x
i
) = 1
Na maioria dos casos que estudaremos, X ter a apenas um n umero nito
de valores possveis e assim, a vericac ao de que a soma das probabilidades
e igual a 1 e feita atraves de uma soma nita.
As vari aveis discretas sao completamente caracterizadas pelas func oes de
probabilidade.
Exemplo 1:
Uma assistente social constatou, analisando as famlias de um bairro, que
20 por cento nao tinham lhos, 30 por cento tinham 1 lho, 35 por cento
dois lhos a os restantes se dividiam igualmente entre tres, quatro e cinco l-
hos. Construa uma func ao de probabilidade para a variavel n umero de lhos.
Como X e uma variavel aleat oria discreta e os possveis valores para
X s ao 0,1,2,3,4,e 5 e P(X=0)=0.2, P(X=1)=0.3, P(X=2)=0.35 temos pela
propriedade da funcao de probabilidade:
p(0)+p(1)+p(2)+p(3)+p(4)+p(5)=1 entao
0.2+0.3+0.35+p(3)+p(4)+p(5)=1 logo
p(3)+p(4)+p(5)=0.15 como p(3)=p(4)=p(5)
temos p(3)=p(4)=p(5)=0.05.
Ent ao a func ao de probabilidade para X e:
Exemplo 2:
Considere o experimento em que cada vez que uma moeda e lancada ob-
servamos se e cara ou coroa. Construa a func ao de probabilidade para a
vari avel n umero de caras obtido em dois lancamentos.
Se denotarmos por X: o n umero de caras em dois lan camentos. X e uma
vari avel aleat oria discreta com possveis valores 0 ,1 e 2.
5 VARI

AVEIS ALEAT

ORIAS DISCRETAS 61
Para determinar a probabilidade de cada um dos valores, assumimos que
a moeda e honesta isto e, p(cara)=p(coroa)=1/2. Alem disso assumimos
tmbem que os lan camentos s ao independentes isto e a ocorrencia de uma
face no 1
o
lancamento n ao interfere no 2
o
lancamento.
Como = {(c, c), (c, k), (k, c), (k, k)} e cada elemento de tem proba-
bilidade 1/4, temos:
P(X=0)=P(k,k)=1/4
P(X=1)=P(c,k)+P(k,c)=2/4=1/2
P(X=2)=P(c,c)=1/4
A funcao de probabilidade e dada por:
Exemplo 3:
Um dado equilibrado e lancado. Construa a funcao de probabilidade para
a vari avel face observada.
Para X: face observada em um lancamento de um dado, temos:
5.2 Funcao de distribuicao acumulada
Em v arias situacoes e util calcular a probabilidade acumulada ate um certo
valor. Para isso, usamos a funcao de distribui cao acumulada de probabili-
dade.
Funcao de distribuicao acumulada
A funcao de distribui cao acumulada para uma vari avel discreta Xe denida
para qualquer n umero real x pela seguinte funcao:
5 VARI

AVEIS ALEAT

ORIAS DISCRETAS 62
F(x) = P(X x)
Exemplo 4:
Lancamento de duas moedas, observando-se o n umero de caras, construa
F(x) e o gr aco de F(x).
Como vimos anteriormente, X e uma vari avel aleat oria discreta com
func ao de probabilidade dada por:
e o gr aco para essa func ao de probabilidade
ent ao a func ao de distribui cao acumulada e dada por:
F(x) =
_

_
0, x < 0
P(X 0) = 1/4, 0 x < 1
P(X 1) = 3/4, 1 x < 2
P(X 2) = 1, x 2
e o gr aco para essa func ao de distribuic ao
5 VARI

AVEIS ALEAT

ORIAS DISCRETAS 63
Exemplo 5:
Para o lancamento de um dado, denimos a variavel X: face observada
no lan camento. Para essa vari avel, vimos que a fun cao de probabilidade e
dada por:
e o gr aco
A funcao de distribuic ao para X
F(x) =
_

_
0, x < 1
1/6, 1 x < 2
2/6, 2 x < 3
3/6, 3 x < 4
4/6, 4 x < 5
5/6, 5 x < 6
1, x 6
e o gr aco
5 VARI

AVEIS ALEAT

ORIAS DISCRETAS 64
Exemplo 6:
Uma vari avel aleatoria X tem a seguinte func ao de distribuic ao:
F(x) =
_

_
0, x < 10
0, 2, 10 x < 12
0, 5, 12 x < 13
0, 9, 13 x < 25
1, x 25
Determine:
a) A fun cao de probilidade de x.
b)P(X 12)
c)P(X < 12)
d)P(12 X 20)
e) P(X 18)
a)
b)P(X 12) = 0, 5
c)P(X < 12) = 0, 2
d)P(12 X 20) = 0, 7
e) P(X 18) = 0, 1
5.3 Valor esperado e variancia
O valor medio de uma variavel aleatoria discreta e tambem denominado
esperanca ou valor esperado e e denido por:
5 VARI

AVEIS ALEAT

ORIAS DISCRETAS 65
Denicao: Dada X uma variavel aleat oria discreta assumindo os val-
ores x
1
, x
2
, ..., x
n
, chamamos de valor medio de X ou esperanca matem atica
o valor:
E(X) =

n
i=1
x
i
p(x
i
)
Essa formula para a media n ao e nova para nos. Anteriormente, cal-
cul avamos a media atraves da formula E(X) =

n
i=1
x
i
f
i
, com a frequencia
relativa no lugar da probabilidade. Podemos denir entao maneiras semel-
hantes para calcular variancia e desvio padrao para as variaveis discretas.
Denicao: Dada X uma variavel aleat oria discreta assumindo os valores
x
1
, x
2
, ..., x
n
, chamamos vari ancia de X o valor:
var(X) =

n
i=1
(x
i
E(X))
2
p(x
i
)
Como denimos anteriormente, o desvio padr ao e dado por:
dp(X) =
_
var(X).
Exemplo 7:
Para X a variavel aleat oria que descreve o n umero de caras obtidas em
dois lancamentos temos:
E(X) =

3
i=1
x
i
p(x
i
) = 1.1/2 + 0.1/4 + 2.1/4 = 1
var(X) =

3
i=1
(x
i
E(X))
2
p(x
i
) = (1 1)
2
.1/2 + (0
1)
2
.1/4 + (2 1)
2
.1/4 = 0 + 1/4 + 1/4 = 1/2
dp(X) =
_
1/2
Exemplo 8:
Para X a vari avel aleat oria que descreve a face obtida em um lancamento
de um dado, vamos calcular a E(X) e a var(X).
E(X) =

6
i=1
x
i
p(x
i
) = 1.1/6 + 2.1/6 + 3.1/6 + 4.1/6 +
5.1/6 + 6.1/6 = 7/2
var(X) =

6
i=1
(x
i
E(X))
2
p(x
i
) = (5/2)
2
.1/6+(3/2)
2
.1/6+
(1/2)
2
.1/6 + (5/2)
2
.1/6 + (3/2)
2
.1/6 + (1/2)
2
.1/6 = 35/12
5 VARI

AVEIS ALEAT

ORIAS DISCRETAS 66
dp(X) =
_
35/12
Propriedades da esperanca e variancia
1) E(aX) = aE(X)
2) E(X +c) = E(X) + c
3) var(aX) = a
2
var(X)
4) var(X +c) = var(X)
5) var(X) = E(X
2
) [E(X)]
2
Vale ressaltar que para uma vari avel aleat oria discreta X com func ao de
probabilidade p(x
i
), se quisermos a esperanca da variavel Z = h(X) fazemos
E(Z) = E(h(x)) =

n
i=1
h(x
i
)p(x
i
).
Exemplo 9:
Para X a vari avel aleat oria que descreve a face obtida em um lancamento
de um dado, poderamos ter calculado a var(X) atraves da f ormula E(X
2
)
[E(X)]
2
.
E(X
2
) = 1.1/6 + 4.1/6 + 9.1/6 + 16.1/6 + 25.1/6 + 36.1/6 = 7/2
Portanto E(X
2
) [E(X)]
2
= 91/6 49/4 = 35/12.
Alguns tipos de variaveis aparecem com mais frequencia e por isso re-
querem um estudo mais aprofundado. Vamos ver agora os principais modelos
de vari aveis aleatorias discretas.
Alguns modelos para variaveis aleatorias discretas
5.4 Modelo uniforme discreto
Seja X uma vari avel aleatoria discreta cujos possveis valores sao represen-
tados por x
1
, x
2
, ..., x
k
. Dizemos que X segue o modelo uniforme discreto
com par ametro k, se atribui a mesma probabilidade 1/k a cada um de seus
k valores. Isto e, se sua func ao de probabilidade e dada por:
P(X = x
i
) =
1
k
para todo i=1,2,3,...,k.
Obs: No modelo uniforme a probabilidade esta uniformemente distribuida
entre os valores que a vari avel assume.
5 VARI

AVEIS ALEAT

ORIAS DISCRETAS 67
Exemplo 10:
Uma rifa tem 10 bilhetes numerados de 1 a 10. Supondo que todos os
bilhetes tem iguais probabilidades de serem sorteados, denimos X: n umero
do bilhete sorteado. Um modelo para X e o modelo uniforme com k=10. A
func ao de probabilidade se X e:
Funcao de distribuicao acumulada de uma variavel aleatoria
uniforme
Como a func ao de probabilidade e dada por P(x
i
) = 1/k para todo
i=1,2,...,k temos que a func ao de distribuic ao e dada por:
F(x) =

x
i
x
1/k
Esperanca e variancia
Se X segue o modelo uniforme com parametro k ent ao:
E(X) =

k
i=1
x
i
.1/k
var(X) = E(X
2
)[E(X)]
2
= (

k
i=1
x
2
i
).1/k(

k
i=1
x
i
)
2
.1/k
2
Exemplo 11:
Usando o exemplo anterior temos a seguinte fun cao de distribuicao:
F(x) =

xk
1/10 =
_

_
0, x < 1
1/10, 1 x < 2
2/10, 2 x < 3
3/10, 3 x < 4
4/10, 4 x < 5
.
.
.
1, x 10
5 VARI

AVEIS ALEAT

ORIAS DISCRETAS 68
A esperan ca e vari ancia de X s ao dadas por:
E(X) =

10
i=1
x
i
.1/10 = 55/10 = 5, 5
var(X) = E(X
2
) [E(X)]
2
= (

10
i=1
x
2
i
).1/10 (5, 5)
2
=
38, 5 30, 25 = 8, 25
5.5 Modelo Bernoulli
Quando em um experimento temos resultados do tipo sucesso ou fracasso,
defeituoso ou n ao defeituoso, resultados que chamamos de dicotomicos, isto
e, quando estamos observando se uma determinada caracterstica foi ou n ao
observada no experimento, podemos usar o modelo Bernoulli. Por exemplo:
. Lancamento de uma moeda, observamos a ocorrencia de cara.
. Selecionamos uma peca de um lote com pe cas defeituosas e perfeitas e
observamos se a peca e perfeita.
. Um dado e lan cado e observamos se saiu face 5.
. Uma pessoa e selecionada de um grupo com 100 pessoas saud avei e
doentes e e observado se a pessoa est a saudavel.
A esses experimentos damos o nome de ensaios de Bernoulli.
Modelo Bernoulli
Dizemos que uma vari avel X segue o modelo Bernoulli com par ametro p,
se assume apenas os valores 0 ou 1 (associados respectivamente ` a ocorrencia
de sucesso ou fracasso) e sua func ao de probabilidade e dada por:
P(X=1) = p
P(X=0) = 1-p
ou de modo resumido
5 VARI

AVEIS ALEAT

ORIAS DISCRETAS 69
P(X = x) = p
x
(1 p)
1x
x=0,1.
Notacao : X Bernoulli(p), onde p e o parametro, que e a probabili-
dade de sucesso.
Se X Bernoulli(p) ent ao:
E(X) =

x=0,1
x.p(x) = 0(1 p) + 1.p = p
var(X) = E(X
2
) [E(X)]
2
= 0
2
(1 p) + 1
2
p p
2
= p(1 p)
A funcao de distribuic ao e dada por:
F(x) =
_
_
_
0, x < 0
1 p, 0 x < 1
1, x 1
Exemplo 12:
Lancando uma moeda, observamos a ocorrencia de cara. Denindo sucesso
como a ocorrencia de cara e fracasso como a ocorrencia de coroa temos:
X =
_
0, se cara
1, se coroa
ent ao P(X = x) = p
x
(1 p)
1x
com p = 1/2 temos
P(x) =
_
1/2, x = 0
1/2, x = 1
5.6 Modelo Binomial
Agora imaginamos que repetimos um ensaio de Bernoulli n vezes de maneira
independente ent ao a vari avel aleat oria X que conta o n umero de sucessos
nesses n ensaios Bernoulli e uma vari avel aleat oria que segue o modelo Bino-
mial. Antes de denir a funcao de probabilidade para o modelo, vamos ver
um exemplo:
Exemplo 13:
Sabe-se que a eciencia de uma vacina e de 80 por cento. Se um grupo
de 3 indivduos e sorteado dentre a popula cao vacinada, qual e a func ao de
probabilidade da vari avel que descreve o n umero de indivduos imunizados
neste grupo?
Se a imuniza cao em cada um dos indivduos e independente dos outros
indivduos da populacao, ent ao para cada um dos 3 indivduos escolhidos
5 VARI

AVEIS ALEAT

ORIAS DISCRETAS 70
temos a probabilidade de 0,8 de estar imunizado e 0,2 de n ao estar imunizado.
Para cada indivduo temos um ensaio Bernoulli com parametro 0,8.
Para X a vari avel que descreve o n umero de indivduos imunizados temos
os valores possveis:
X=0,1,2,3.
A probabilidade de X=0, 1,2 ou 3 e igual a probabilidade de selecionar
0,1,2 ou 3 indivduos imunizados.
As selecoes possveis s ao:
selecao X P(X=k)
III 3 0, 8
3
IINI 2 0, 8
2
.0, 2
INII 2 0, 8
2
.0, 2
ININI 1 0, 8.0, 2
2
NIII 2 0, 8
2
.0, 2
NIINI 1 0, 8.0, 2
2
NINII 1 0, 8.0, 2
2
NININI 0 0, 2
3
Ent ao a func ao de probabilidade e dada por:
Podemos resumir a func ao de probabilidade para X por:
P(X = k) = C
3
k
(0, 8)
k
(0, 2)
3k
k = 0, 1, 2, 3
Denicao do modelo Binomial
5 VARI

AVEIS ALEAT

ORIAS DISCRETAS 71
Considere a repetic ao de n ensaios Bernoulli, independentes e todos com
a mesma probabilidade de sucesso p. A vari avel aleat oria que conta o n umero
total de sucessos segue o modelo binomial com par ametros n e p e, sua func ao
de probabilidade e dada por:
P(X = k) = C
n
k
p
k
(1 p)
nk
k = 0, 1, 2, ..., n.
j a que C
n
k
e o n umero de sequencias diferentes com k sucessos e n-k fra-
cassos e p
k
(1 p)
nk
e a probabilidade de cada sequencia.
Notac ao: X B(n, p)
O nome da distribuic ao e derivado da expansao binomial:
(a +b)
n
=

n
k=0
C
n
k
a
k
b
nk
Representando X = X
1
+ X
2
+ X
3
+ ... + X
n
onde X
i
representa cada
ensaio Bernoulli e X a vari avel aleatoria Binomial. Podemos vericar que:
E(X) = E(X
1
) + E(X
2
) + E(X
3
) + ... +E(X
n
) = np
var(X) = var(X
1
) + var(X
2
) + var(X
3
) + ... +var(X
n
) = np(1 p)
Exemplo 14:
A taxa de imunizac ao de uma vacina e de 80 por cento. Se um grupo de
20 pessoas foram vacinadas. Queremos saber qual e o n umero esperado de
pessoas imunizadas.
Se denirmos X = n umero de pessoas imunizadas no grupo. Temos que X
segue o modelo binomial com par ametros 20 e 0,8. Portanto E(X)=20.0,8=16.
Exemplo 15:
Suponha que selecionamos uma amostra com 10 pe cas de um lote em que
a probabilidade de cada peca ser defeituosa e de 0,2. Dena um modelo para
o n umero de pe cas defeituosas na amostra e de o n umero esperado de pe cas
defeituosas.
O modelo para X=n umero de pecas defeituosas na amostra e X B(10, 0.2).
A funcao de probabilidade para X:
P(X = k) = C
10
k
(0.2)
k
(0.8)
10k
, k = 0, 1, 2, 3, ..., 10
E(X)=n.p=10.0,2=2.
5 VARI

AVEIS ALEAT

ORIAS DISCRETAS 72
5.7 Modelo Poisson
Dizemos que uma vari avel aleat oria X tem distribuicao Poisson com par ametro
, > 0 se sua func ao de probabilidade for a seguinte:
P(X = k) =
_
e

k
k!
, k = 0, 1, 2, ...
0, caso contrario
Notac ao:X Poisson()
Podemos calcular E(X) e var(X).
E(X) =

k=0
kP(X = k) =

k=1
ke

k
k!
=

k=1
ke

k1
(k1)!
=

y=0
ke

y
y!
=

Para calcular var(X) vamos primeiramente calcular primeiramente


E(X(X 1)) =

k=2
k(k1)e

k
k!
=

k=2
e

k
(k2)!
=
2

y=0
e

y
y!
=
2
Portanto E(X
2
) E(X) =
2
E(X
2
) =
2
+
var(X) = E(X
2
) (E(X))
2
=
2
+
2
=
Exemplo 16:
O n umero de mensagens recebidas por minuto por um provedor em horario
comercial foi modelado por uma vari avel Poisson com taxa 15. De a func ao
de probabilidade e o n umero esperado de mensagens recebidas.
P(X = k) =
_
e
15
15
k
k!
, k = 0, 1, 2, 3, ...
0, caso contrario
E(X) = 15
O modelo Poisson e muito utilizado quando desejamos contar o n umero
de eventos de certo tipo que ocorrem num determinado intervalo de tempo.
Por exemplo:
1) O n umero de chamadas telefonicas recebidas em 5 minutos.
2) O n umero de falhas em um computador em 1 dia.
3) O n umero de relat orios de acidentes em 1 dia de trabalho.
Exemplo 17:
Se o n umero de chamadas telef onicas recebidas por uma central telef onica
pode ser modelada por uma variavel aleat oria Poisson com media 5, qual e
5 VARI

AVEIS ALEAT

ORIAS DISCRETAS 73
a probabilidade de que a central n ao receba ligacoes em 1 minuto?
P(N = 0) =
5
0
e
5
0!
= e
5
Qual e a media (n umero esperado de ligac oes recebidas) em 4 minutos?
Qual e a probabilidade de a central nao receber ligacoes em 4 minutos?
Para Y; N umero de ligacoes recebidas em 4 minutos temos:
E(Y ) = 20
P(Y = 0) =
20
0
e
20
0!
= e
20
5 VARI

AVEIS ALEAT

ORIAS DISCRETAS 74
5.8 Exerccios - lista 06
Questao 1
Para uma determinada moeda, a probabilidade de se obter cara e tres
vezes maior que a de se obter coroa. Lan camos essa moeda 3 vezes e o
n umero de caras e observado. Para X, a vari avel aleat oria que descreve o
n umero de caras, estabele ca a fun cao de probabilidade e de distribuic ao e
construa os gr acos correspondentes.
Questao 2
Extramos duas bolas sem reposicao de uma urna contendo duas bolas
brancas e tres vermelhas. Denimos X, a variavel aleat oria que descreve o
n umero de bolas vermelhas obtidas nas duas extrac oes. Construa a func ao
de probabilidade e de distribuic ao para X e os respectivos gracos.
Questao 3
Para a vari avel aleatoria X com a func ao de probabilidade abaixo.
a) Calcule P(X=-2).
b) Para a vari avel Y = X
2
encontre a func ao de probabilidade e a
func ao de distribui cao de Y.
Questao 4
Encontre a media e vari ancia para as variaveis das quest oes 1 e 2 acima.
Questao 5
Suponha que uma variavel aleat oria tem a seguinte func ao de probabili-
dade:
5 VARI

AVEIS ALEAT

ORIAS DISCRETAS 75
Encontre a esperanca e a vari ancia de X.
Questao 6
A funcao de distribuic ao para uma vari avel aleatoria X e dada por:
a) Qual e a funcao de probabilidade de X?
b) Calcule P(5 X < 15).
b) Calcule P(X > 10).
Questao 7
Um caminho para se chegar a uma festa pode ser dividido em tres etapas.
Se n ao houver enganos o trajeto e feito em 1 hora. Se enganos acontecem
na primeira etapa demoramos 10 minutos a mais para chegar `a festa. Para a
segunda etapa o acrescimo e de 20 minutos e para a terceira e de 30 minutos.
Admita que a probabilidade de se cometer engano na primeira etapa e 0,1.
Na segunda etapa e 0,2 e, na terceira etapa e 0,3. Admita tambem que os
enganos podem acontecer em uma etapa ou mais. Determine:
a) A fun cao de probabilidade para o tempo de atraso.
b) O tempo medio de atraso.
b) A probabilidade do atraso ser de ate 40 minutos.
Questao 8
Seja X uma vari avel seguindo o modelo uniforme discreto com valores no
conjunto {1, 2, 3, ..., 10}. Determine:
a) P(X 7).
b) P(X < 2 ou X 8).
b) P(X > 3 e X < 6).
5 VARI

AVEIS ALEAT

ORIAS DISCRETAS 76
d) P(X 9 | X 6).
Questao 9
Um fabricante de pecas de autom oveis garante que uma caixa de suas
pecas conter a no m aximo duas pecas defeitusos. Se o processo de fabricacao
produz 5 por cento das pe cas defeituosas e, se cada caixa contem 18 pecas,
qual e a probabilidade de que a uma caixa satisfaca a garantia?
Questao 10
Um curso de treinamento aumenta a produtividade em 80 por cento dos
casos. Para um grupo de 10 funcion arios que participaram desse curso en-
contre a probabilidade:
a) De sete funcionerios aumentarem a produtividade.
b) Pelo menos dois funcion arios terem aumentado a produtividade.
c) Qual e a media do n umero de funcion arios que aumentam a produ-
tividade?
Questao 11
Uma vari avel aleat oria Y segue o modelo Poisson com parametro = 2.
Calcule:
a) P(Y=1).
b) P(Y<2).
b) P(Y>0).
Questao 12
Numa central telefonica, o n umero de chamadas chega segundo uma dis-
tribuic ao Poisson com media de 8 chamadas por minuto. Calcule a probabil-
idade de a central:
a) Nao receber ligacoes em 1 minuto.
b) Nao receber ligacoes em 5 minutos.
c) Receber no maximo 2 chamadas em 5 minutos.
d) Qual o n umero medio de chamadas recebidas em 15 minutos.
Questao 13
A chegada de avioes a um aeroporto se da segundo um modelo poisson
com taxa 1 por minuto.
5 VARI

AVEIS ALEAT

ORIAS DISCRETAS 77
a) Determine a probabilidade de chegarem 3 avioes em um minuto.
b) Se o aeroporto pode atender 2 avi oes por minuto, qual e a probabil-
idade de haver avioes sem atendimento imediato?
c) As previsoes para os proximos anos indicam que o trafego deve dobrar
nesse aeroporto, enquanto que a capacidade de atendimento pode ser
ampliada em no maximo 50 por cento. Como car a a probabilidade de
espera por atendimento?
6 VARI

AVEIS ALEAT

ORIAS CONT

INUAS 78
6 Variaveis aleatorias contnuas
Agora iremos estudar modelos probabilsticos para variaveis aleat orias
contnuas ou seja vari aveis para as quais os valores possveis pertencem a um
intervalo de n umeros reais. Por exemplo, renda, salario, tempo de durac ao
de um experimento, area atingida por uma praga agrcola, sao quantidades
que podem ser modeladas por vari aveis aleatorias contnuas.
De forma semelhante ` aquela desenvolvida para variaveis aleatorias disc-
retas precisamos estabelecer probabilidades para as vari aveis contnuas. No
entanto, agora as vari aveis podem assumir um n umero innito de valores
diferentes.
Vamos ver um exemplo de como podemos atribuir probabilidades para
uma vari avel contnua.
Exemplo 1:
Suponha que em uma determinada regi ao, e conhecida a existencia de um
grande lencol de agua no subsolo. No entanto, sua profundidade e descon-
hecida sabendo-se apenas que se situa entre 20 e 100 metros.
Denotando por X a profundidade em que o lencol est a situado, temos
que X pode ser qualquer n umero entre 20 e 100. Assim consideramos que
todos os pontos entre 20 e 100 s ao igualmente prov aveis, mas se utilizarmos
a mesma ideia das vari aveis discretas de atribuir a cada valor possvel uma
probabilidade teremos uma diculdade extra pois existem innitos valores
possveis. Desta forma, se a cada um dos valores possveis atribuirmos uma
probabilidade, a soma das probabilidades ser a innita e n ao 1, como deve
satisfazer a fun cao de probabilidade.
Em situac oes como essas, n ao e de interesse considerar apenas 1 valor para
a variavel aleat oria mas, intervalos de valores na atribuicao de probabilidades.
Nesse caso, sabemos que o espaco amostral corresponde ao intervalo
[20,100] e as profundidades sao igualmente prov aveis.
Suponha que dividimos o intervalo em 8 partes de comprimento 10 ent ao,
e razoavel atribuir a cada uma dessas partes uma probabilidade de 1/8 ja
que devemos distribuir a probabilidade 1 da mesma maneira para cada um
dos intervalos.
Se dividirmos o intervalo em 80 partes de comprimento igual a 1 entao
devemos atribuir a cada uma dessas partes uma probabilidade de 1/80. Dessa
maneira podemos atribuir probabilidades `a qualquer subconjunto de [20,100].
Assim como a densidade de massa nos diz como distribuir massa em cada
unidade do volume considerado, a densidade de probabilidade nos diz como
e possvel distribuir o total de probabilidade 1, em cada unidade do intervalo
6 VARI

AVEIS ALEAT

ORIAS CONT

INUAS 79
considerado como espaco amostral.
No exemplo acima, a densidade de probabilidade e 1/80. Podemos cal-
cular por exemplo, a probabilidade de encontrar agua entre 20 e 40 metros
multiplicando 20 por 1/80, analogamente entre 35 e 50 metros temos a prob-
abilidade de 15/80. De forma geral, podemos calcular a probabilidade de
encontrar agua em qualquer trecho atraves da area sobre a de densidade:
Agora podemos caracterizar a atribuic ao de probabilidades no caso contnuo.
Ela sera denida pela area abaixo de uma fun cao positiva denominada func ao
de densidade de probabilidade. A funcao de densidade em si n ao e uma prob-
abilidade mas nos auxilia no calculo das probabilidades.
Para a vari avel do exemplo anterior, X representando a profundidade do
lencol de agua, temos a seguinte func ao de densidade de probabilidade:
f(x) =
_
1/80, 20 X 100
0, caso contrario
Dessa forma podemos calcular a probabilidade do lencol estar localizado
em um dado intervalo de profundidade. Por exemplo P(25 X 30) =
5/80.
6.1 Funcao de densidade de probabilidade
Podemos formalizar as ideias anteriores atraves da seguinte denicao:
Denicao: func ao de densidade de probabilidade
Dizemos que f(x) e uma func ao de densidade de densidade de probabili-
dade para uma variavel aleat oria X contnua se satisfaz:
(i) f(x) 0 para x (, )
(ii) A area denida por f(x) e igual a 1.
Podemos caracterizar a condi cao (ii) por
_

f(x)dx = 1.
6 VARI

AVEIS ALEAT

ORIAS CONT

INUAS 80
Da mesma forma, para calcular probabilidades temos para a b:
P(a X B) =
_
b
a
f(x)dx
A integral acima indica a area sob a funcao de densidade f(x) no intervalo
[a,b]. Pela forma como atribumos as probabilidades temos P(X = k) = 0 j a
que temos area zero sobre qualquer valor individual de X, portanto, a prob-
abilidade de ocorrencia de um valor
Exemplo 2:
Se uma reac ao qumica tem o tempo T modelado por uma func ao contnua
com func ao de densidade:
f(t) =
_
2t, 0 t 1
0, caso contrario
Calcule a P(0 T 1/2)
P(0 T 1/2) =
_
1/2
0
2tdt = t
2
|
1/2
0
= 1/4.
Exemplo 3:
A area atingida por uma praga e uma vari avel aleat oria contnua com
func ao de densidade de probabilidade dada por:
f(x) =
_
_
_
1/4, 0 x < 2
1/8, 2 x 6
0, caso contrario
Determine:
6 VARI

AVEIS ALEAT

ORIAS CONT

INUAS 81
a) P(X > 3)
b) P(1 < X 4)
c) P(X < 3|X > 1)
a) P(X > 3) =
_
6
3
1/8dx = 3/8
b) P(1 < X 4) =
_
2
1
1/4dx +
_
4
2
1/8dx = 1/4 + 2/8 = 1/2
c) P(X < 3|X > 1) =
P(1X<3)
P(X1)
=

2
1
1/4dx+

3
2
1/8dx

2
1
1/4dx+

6
2
1/8dx
=
3/8
6/8
= 1/2
Exemplo 4:
Determine c tal que f(x) seja uma func ao de densidade:
f(x) =
_

_
0, x < 0
cx, 0 x < 1/2
c(1 x), 1/2 x < 1
0, x 1
Para que f(x) seja uma funcao de densidade devemos ter:
(i) f(x) 0
(ii)
_

f(x)dx = 1
Para c 0 (i) vale.
Para que (ii) aconteca devemos ter:
_
1/2
0
cxdx +
_
1
1/2
c(1 x)dx = 1
c
x
2
2
|
1/2
0
+c[x
x
2
2
] |
1
1/2
= 1 c/8 + c/8 = 1 c = 4
6.2 Funcao de distribuicao acumulada
Dada uma variavel aleat oria X com func ao de densidade de probabi lidade
f(x), podemos denir a func ao de distribuic ao F(x) de maneira an aloga a que
zemos para as variaveis discretas:
F(x) =
_
x

f(t)dt, < x <


Portanto, F(x) =
_
x

f(t)dt, para todo x real.


6 VARI

AVEIS ALEAT

ORIAS CONT

INUAS 82
Exemplo 5:
Para a vari avel com func ao de densidade estudada no exemplo 2,
f(t) =
_
2t, 0 t 1
0, caso contrario
temos a seguinte fun cao de distribuicao
F(t) =
_
_
_
0, t < 0
_
t
0
2xdx, 0 t 1
_
1
0
2xdx +
_
t
0
0dx, t > 1
ent ao
F(t) =
_
_
_
0, t < 0
t
2
, 0 t 1
1, t > 1
Exemplo 6:
Para a funcao de densidade denida no exemplo 3:
f(x) =
_
_
_
1/4, 0 x < 2
1/8, 2 x 6
0, caso contrario
temos a seguinte fun cao de distribuicao:
F(x) =
_

_
0, x < 0
_
x
0
1/4dt = x/4, 0 x < 2
_
2
0
1/4dt +
_
x
0
1/8dt = 1/4 + x/8, 2 x 6
1, x 6
6 VARI

AVEIS ALEAT

ORIAS CONT

INUAS 83
Propriedades da funcao acumulada
(i) 0 F(x) 1
(ii) lim
x
F(x) = 0
(iii) lim
x
F(x) = 1
Proposicao: Para os valores de x para os quais F(x) e derivavel temos:
F

(x) =
dF(x)
dx
= f(x)
Exemplo 7:
Suponha que X seja uma vari avel aleatoria contnua com a seguin te
func ao de distribui cao acumulada:
F(x) =
_
0, x < 0
1 e
x
, se x 0
Construa a fun cao de densidade para a vari avel X.
De acordo com a proposicao acima temos:
f(x) =
_
0, x < 0
e
x
, se x > 0
Exemplo 8:
Seja X uma variavel aleat oria contnua com func ao de distribuic ao dada
por:
6 VARI

AVEIS ALEAT

ORIAS CONT

INUAS 84
F(x) =
_

_
0, x < 0
x
2
, 0 x < 1/2
3x/2 1/2, 1/2 x < 1
1, se x 1
Construa a fun cao de densidade.
Temos
f(x) =
_
2x, 0 x < 1/2
3/2, 1/2 x 10, caso contrario
6.3 Media e variancia para variaveis aleatorias contnuas
Quando X era uma vari avel aleatoria discreta, calcul avamos
E(X) =

n
i=1
x
i
p(x
i
).
Agora, para X uma vari avel contnua vamos usar uma generalizac ao desta
denic ao.
Suponha que X seja uma vari avel contnua denida no intervalo [a,b]
como na gura abaixo. Vamos discretizar a variavel X e calcular a esperanca
atraves de um processo de limite.
6 VARI

AVEIS ALEAT

ORIAS CONT

INUAS 85
Denotemos por Y uma vari avel aleat oria discreta que assume os valores x
1
,
x
2
,..., x
n
com probabilidades aproximadamente hf(x
1
), hf(x
2
),..., hf(x
n
).
Pela denic ao de esperanca de vari avel discreta temos:
E(Y ) =

n
i=1
x
i
hf(x
i
)
que sera uma aproximac ao para a esperanca de X. Para melhorar essa
aproxima cao, aumentamos o n umero de parcelas diminuindo a amplitude h.
No limite teremos:
E(x) = lim
n
E(Y ) = lim
n

n
i=1
x
i
f(x
i
)h =
_
b
a
xf(x)dx.
Notac ao: E(X) = =
_

xf(x)dx
Variancia
Para X uma vari avel aleat oria contnua com densidade de probabilidade
f(x), a variancia e denida por:

2
=
_

(x )
2
f(x)dx
Como no caso discreto, a variancia e a medida de dispers ao mais utilizada
na pr atica. Aqui tambem podemos utilizar a expressao que utilizamos com
as vari aveis discretas:

2
= E(X
2
)
2
onde E(X
2
) =
_

x
2
f(x)dx.
O desvio padr ao tambeme calculado da mesma forma dp(X) =
_
var(X) =
.
Exemplo 9:
Vamos calcular a esperanca e variancia para a variavel X dada no exemplo
2.
A funcao de densidade de X era:
f(x) =
_
2x, 0 x < 1
0, caso contrario
Portanto a esperanca e dada por E(X) =
_
1
0
x2xdx =
2x
3
3
|
1
0
= 2/3.
E a vari ancia var(X) = E(X
2
) E(X)
2
= E(X
2
) 4/9 mas E(X
2
) =
_
1
0
x
2
2xdx =
2x
4
4
|
1
0
= 2/4
ent ao
6 VARI

AVEIS ALEAT

ORIAS CONT

INUAS 86
var(X) = 1/2 4/9 = 1/18 e dp(X) =
_
1/18.
Exemplo 10:
No exemplo 3, a variavel X contnua tinha a seguinte funcao de densidade:
f(x) =
_
_
_
1/4, 0 x < 2
1/8, 2 x 6
0, caso contrario
A esperan ca e dada por:
E(X) =
_
2
0
x1/4dx +
_
6
2
x1/8dx =
x
3
12
|
2
0
+
x
3
24
|
6
2
=
8
12
+
208
24
=
224
24
E a vari ancia e o desvio padr ao var(X) = E(X
2
) E(X)
2
= 224/24
25/4 = 74/24, dp(X) =
_
37/12.
Alguns modelos para variaveis aleatorias contnuas
Alguns exemplos de vari aveis aleat orias contnuas est ao relacionados ` a
algum processo de mensurac ao, por exemplo: peso, altura, tempo de vida de
uma lampada, erros de medidas em experimentos.
Em muitos casos podemos usar modelos especcos para modelar as vari aveis
em estudo. Agora vamos estudar os modelos mais frequentes para as variaveis
aleat orias contnuas. Para cada um deles, estaremos interessados em determi-
nar a fun cao de densidade, a func ao de distribuicao, a esperan ca e a vari ancia.
6.4 Modelo uniforme contnuo
O modelo uniforme e o modelo mais simples para as vari aveis contnuas, ele
e uma generalizacao do modelo uniforme que estuda mos para variaveis disc-
retas.
Denicao:
Uma variavel aleat oria X segue o modelo uniforme contnuo no intervalo
[a,b] se sua func ao de densidade de probabilidade e dada por:
f(x) =
_
1/(b a), a x b
0, caso contrario
Notac ao: X U[a, b]. N ao ha restri coes para a, b R exceto o fato de
a < b.
6 VARI

AVEIS ALEAT

ORIAS CONT

INUAS 87
O modelo uniforme pressup oe que a probabilidade da vari avel pertencer
a intervalos de mesmo comprimento e igual.
O valor esperado e a vari ancia s ao dados por:
E(X) =
_

xf(x)dx =
_
b
a
x
1
(ba)
dx =
1
(ba)
_
b
a
xdx =
1
(ba)
x
2
2
|
b
a
=
b
2
a
2
2(ba)
=
b+a
2
var(X) = E(X
2
) E(X)
2
= E(X
2
) (
b+a
2
)
2
Vamos calcular E(X
2
).
E(X
2
) =
_
b
a
x
2 1
(ba)
dx =
x
3
3(ba)
|
b
a
=
b
3
a
3
3(ba)
=
(ba)(b
2
+ab+a
2
)
3(ba)
=
b
2
+ab+a
2
3
Portanto, var(X) =
b
2
+ab+a
2
3

(b
2
+2ab+a
2
)
4
=
4b
2
+4ab+4a
2
12

(3b
2
+6ab+3a
2
)
12
=
(b
2
2ab+a
2
)
12
=
(ba)
2
12
.
A funcao de distribuic ao e dada por:
F(x) = P(X x) =
_
x

f(x)dx =
_
_
_
0, x < a
(x a)/(b a), a x < b
1, x b
Exemplo 1:
Suponha que estamos interessados em inspecionar a resistencia de um
tubo de PVC `a pressao de `agua. O tubo tem 6 metros e a probabilidade
de ocorrer vazamento em um determinado ponto e a mesma para todos os
pontos do tubo. Fixemos uma extremidade do tubo e denotemos por X a
dist ancia do primeiro furo `a essa extremidade. Entao X pode ser modelada
por uma uniforme no intervalo [0,6].
6 VARI

AVEIS ALEAT

ORIAS CONT

INUAS 88
X U[0, 6]
f(x) =
_
1/6, 0 x 6
0, caso contrario
A distancia esperada para a ocorrencia do primeiro furo e E(X) =
(b+a)
2
=
6/2 = 3.
e a variancia e var(X) =
(ba)
2
12
=
36
12
= 3
A funcao de distribuic ao e dada por:
F(x) =
_
_
_
0, x < 0
x/6, 0 x < 6
1, x 6
Podemos atraves da funcao de distribuic ao, calcular a probabilidade do
furo acontecer a uma dist ancia menor que dois metros ou maior que 4 metros.
Queremos P(X < 2 X > 4) = P(X < 2) + P(X > 4) = P(X <
2) + (1 P(X 4)) = 1/3 + 1 2/3 = 2/3.
6.5 Modelo exponencial
Uma vari avel aleat oria contnua, assumindo valores n ao negativos segue o
modelo exponencial com par ametro > 0 se sua densidade e dada por:
f(x) =
_
e
x
, x 0
0, caso contrario
Notac ao: X exp()
6 VARI

AVEIS ALEAT

ORIAS CONT

INUAS 89
A funcao de distribuic ao para X e dada por:
F(x) =
_
0, x < 0
_
x
0
e
t
dt = e
t
|
x
0
= (1 e
x
), x 0
A esperanca e a vari ancia sao calculadas atraves de uma tecnica de inte-
grac ao conhacida como integra cao por partes e resultam em:
E(X) =
1

var(X) =
1

2
O modelo exponencial e muito utilizado em experimentos nos quais o ob-
jetivo e calcular a vida util de equipamentos, tempos de falha, tempos de
sobrevivencia etc.
Exemplo 2:
Uma ind ustria fabrica lampadas que cam em operac ao continuamente e
oferece a seus clientes a garantia de reposic ao se elas durarem menos que 50
horas. Sabendo que a vida util dessas lampadas e modelada por uma expo-
nencial com parametro (1/8000). Determine a probabilidade de um l ampada
ser trocada e o tempo esperado de dura cao de uma l ampada.
Se X exp(1/8000) ent ao sua func ao de densidade a dada por:
f(x) =
_
1/8000e
x/8000
, x 0
0, caso contrario
Para uma lampada ser trocada ele deve durar menos de 50 horas. Ent ao
a probabilidade de haver troca e:
P(X < 50) =
_
50
0
1/8000e
x/8000
dx = e
x/8000
|
50
0
= 1 e
5/800
=
1 e
1/160
E o tempo esperado de durac ao e:
E(X) = 8000 horas.
6 VARI

AVEIS ALEAT

ORIAS CONT

INUAS 90
Uma propriedade importante da exponencial e a falta de mem oria. Isso
quer dizer que se quisermos calcular a probabilidade de uma l ampada durar
um tempo maior ou igual a 7 horas sabendo que ela durou pelo menos 5 horas
podemos calcular a probabilidade da lampada durar pelo menos 2 horas. Isso
equivale a fazer uma translac ao no tempo e assumir que a origem do tempo
e 5. Vamos fazer as contas e vericar que P(X 2) = P(X 7 | X 5).
P(X 2) =
_

2
1/8000e
x/8000
dx = e
x/8000
|

2
= e
2/8000
P(X 7 | X 5) =
P(X7X5)
P(X5)
=

7
1/8000e
x/8000
dx

5
1/8000e
x/8000
dx
=
e
7/8000
e
5/8000
=
e
2/8000
De uma forma geral se X exp() temos:
P(X t + s | X s) =
P(Xt+sXs)
P(Xs)
=

t+s
e

dx

s
e

dx
=
e
(t+s)
e
s
= e
t
=
P(X t)
Podemos fazer a seguinte interpreta cao para a falta de memoria:
Supondo que X representa o tempo de vida (em anos) de um equipamento
e X exp(), a probabilidade do equipamento durar pelo menos t+s anos
sabendo que ele ja durou s anos e igual a probabi lidade de um equipamento
novo durar pelo menos t anos. Isso signica que podemos esquecer a idade
do equipamento, o que importa para o c alculo das probabilidades s ao quantos
anos queremos que ele dure.
6.6 Modelo Normal
Dizemos que uma vari avel aleat oria contnua X segue o modelo normal com
par ametros e
2
se sua fun cao de densidade e dada por:
f(x) =
1

2
2
e
(x)
2
2
2
, < x <
Notac ao: X N(,
2
)
6 VARI

AVEIS ALEAT

ORIAS CONT

INUAS 91
Podemos observar as seguintes propriedades:
(i) f(x) e simetrica com relac ao a .
(ii) f(x) 0 quando x
+

.
(iii) O valor m aximo de f(x) ocorre para x = .
Quando = 0 e
2
= 1, dizemos que X e normal padr ao. Os parametros
e
2
descrevem o perl da curva da normal, e o ponto de simetria e
2
nos diz o quanto achatada e a curva, um valor maior de
2
nos da uma curva
mais achatada, com caudas mais grossas.
Atraves de algumas manipulac oes utilizando a tecnica de integra cao con-
hecida por integral por partes, podemos calcular a esperan ca e a vari ancia
de uma vari avel aleatoria com X distribuic ao normal com par ametros e
2
:
E(X) =
var(X) =
2
Para construir a funcao de distribuicao e calcular as probabilidades pre-
cisamos calcular integrais:
P(a X b) =
_
b
a
1

2
2
e
(x)
2
2
2
dx
Mas a integral acima nao pode ser calculada analiticamente, apenas por
metodos numericos, por essa raz ao, as probabilidades da normal sao calcu-
ladas atraves de uma tabela. Para evitar a construc ao de v arias tabelas, uma
para cada valor de e
2
, utilizamos uma transformac ao que sempre nos leva
ao c alculo de probabilidades em uma normal com = 0 e
2
= 1. A esse
procedimento damos o nome de padronizac ao.
Vamos descrever esse procedimento:
Considere X N(,
2
), denimos uma nova vari avel Z =
X

, vamos
vericar que Z N(0, 1).
E(Z) = E(
x

) = E(
x

) =
1

E(X)

= 0
var(Z) = var(
x

) = var(
x

) =
1

2
var(X) =

2

2
= 1
Alem disso, podemos vericar que essa transformacao n ao afeta a nor-
malidade. Dessa forma:
Z N(0, 1)
6 VARI

AVEIS ALEAT

ORIAS CONT

INUAS 92
Dizemos que Z tem distribuic ao normal padr ao e podemos calcular
P(Z z) = (z) atraves da tabela. Ent ao, para uma vari avel X N(,
2
),
podemos calcular probabi lidades P(a X b) fazendo uma transformac ao
X Z para usar a tabela da normal padr ao. O procedimento e o seguinte:
P(a X b) = P(
a

) = P(
a

Z
b

)
Exemplo 3:
Calcule P(2 < X < 5) para X N(2, 9).
Se X N(2, 9) devemos padronizar X para calcular a probabilidade de-
sejada atraves da tabela da normal padr ao.
P(2 < X < 5) = P(
22
3
<
X2
3
<
52
3
) = P(0 < Z < 1) = 0, 84130, 5 =
0, 3413
Atraves da padronizac ao transformamos a variavel X na variavel Z nor-
mal padr ao. Ao fazer isso identicamos o intervalo correspon dente ao (2,5)
na normal padr ao, isto e, calcular a probabilidade de X pertencer ao inter-
valo (2,5) onde X N(2, 9) e equivalente a calcular a probabilidade de Z
pertencer ao intervalo (0,1), onde Z N(0, 1).
Vamos calcular P(0 X < 2).
P(0 X < 2) = P(
02
3

X2
3
<
22
3
) = P(
2
3
Z < 0) = P(0 Z <
2
3
) = 0, 7486 0, 5 = 0, 2486
Podemos ainda calcular a probabilidade em intervalos com extremos neg-
ativos na normal padr ao utilizando os correspondentes intervalos da parte
positiva, pela simetria da distribuicao normal. Segue da simetria da normal
padr ao que a probabilidade de ocorrer valores acima ou abaixo de zero e 0,5.
Um outro recurso importante no uso da tabela e a utilizacao do comple-
mentar.
Para X denida no exemplo acima vamos calcular P(X > 3).
6 VARI

AVEIS ALEAT

ORIAS CONT

INUAS 93
P(X > 3) = P(
X2
3
>
32
3
) = P(Z >
1
3
) = 1 P(Z
1
3
) = 1 0, 6293 =
0, 3707
A tabela da normal padr ao pode tambem ser utilizada no sentido inverso,
isto e, podemos dar uma probabilidade e descobrir qual o valor que a origi-
nou. Por exemplo, para Z N(0, 1), desejamos saber qual e o valor c tal que:
P(0 < Z < c) = 0, 4
Procurando na tabela, vemos que o valor que mais se aproxima de c e
1,28.
Um outro exemplo neste sentido:
Suponha que desejamos descobrir o valor de d tal que P(Z > d) = 0, 8
Primeiramente vericamos que d tem que ser negativo pois a probabili-
dade deixada a direita de d e maior que 1/2. Pela simetria da normal, basta
encontrar k tal que P(0 < Z < k) = 0, 3 e fazer d=-k.
Pela tabela k=0,84. Portanto d=-0,84.
Exemplo 4:
Doentes sofrendo uma certa molestia sao submetidos a um tratamento
e o tempo de cura e uma vari avel aleat oria normal com media 15 e desvio
padr ao 2 (em dias). Determine:
a) Qual a proporcao desses pacientes que demora mais de 17 dias para
se curar?
b) Qual e a probabilidade de que um paciente escolhido ao acaso apre-
sente o tempo de cura inferio a 2 semanas?
c) Qual e o tempo de cura necessario para recuperar 25 por cento dos
pacientes?
d) Se 100 pacientes forem escolhidos ao acaso, qual seria o n umero
esperado de doentes curados em menos de 11 dias?
a) Pelas informac oes do problema temos X N(15, 4). Queremos P(X >
17).
P(X > 17) = P(
X15
2
>
1715
2
) = P(Z > 1) = 1 P(Z 1) =
1 0, 8413 = 0, 1587
b) P(X < 14) = P(
X15
2
<
1415
2
) = P(Z <
1
2
) = P(Z >
1
2
) =
1 P(Z
1
2
) = 1 0, 6915 = 0, 3085
6 VARI

AVEIS ALEAT

ORIAS CONT

INUAS 94
c) Essa pergunta pode ser reescrita como:
Qual e o tempo mnimo necess ario para que a probabilidade de uma
pessoa se curar seja de 25 por cento?
Assim a proporc ao para o grupo de pacientes pode ser interpretada como
a probabilidade para um unico paciente genericamente escolhido. Precisamos
ent ao obter t tal que P(X < t) = 0, 25.
P(X < t) = 0, 25 P(
X15
2
< t 152) = 0, 25 P(Z <
t15
2
) = 0, 25
Pela tabela temos
t15
2
= 0, 67 entao t = 13, 66. Aproximadamente 14
dias.
d) Obteremos a probabilidade de um paciente generico ser curado em
menos de 11 dias. Essa probabilidade pode ser interpretada como a proporc ao
de pacientes que se curaram em menos de 11 dias. Essa probabilidade pode
ser interpretada como a proporc ao de pacientes que se curaram em menos de
11 dias.
P(X < 11) = P(
X15
2
< 11 152) = P(Z <
4
2
) = P(Z < 2) = 0, 0227
Ent ao, a proporc ao de pessoas curadas nesse grupo de 100 pessoas e
0,0227. Portanto
0, 0227 =
N
100
N = 2, 27. Aproximadamente 2 pacientes.
Uma propriedade muito importante do modelo normal, que nao demostraremos
aqui e que qualquer combinac ao linear de vari aveis normais independentes
ter a distribuicao normal. Em outras palavras, se X
1
, X
2
, ..., X
n
s ao variaveis
aleat orias normais independetes tais que X
i
N(
i
,
2
i
), a variavel aleat oria
denida por W =

n
i=1

i
X
i
ter a distribui cao normal com media e vari ancia
dadas por:
E(W) = E(

n
i=1

i
X
i
) =

n
i=1

i
E(X
i
) =

n
i=1

i
V ar(W) = V ar(

n
i=1

i
X
i
) =

n
i=1

2
i
V ar(X
i
) =

n
i=1

2
i

2
i
logo, Z N(

n
i=1

i
,

n
i=1

2
i

2
i
).
Este fato sera muito utilizado em testes de hip oteses, juntamente com o
teorema central do limite e os modelos X
2
e t-student.
6 VARI

AVEIS ALEAT

ORIAS CONT

INUAS 95
6.7 Exerccios - lista 07
Questao 1
O tempo em minutos de digita cao de um texto pode ser considerado uma
vari avel aleat oria contnua com a seguinte fun cao de densidade:
f(x) = 1/4, se 0 x < 2
1/8, se 2 x < 6
0, caso contrario
Determine:
a) P(X>3).
b) P(1<X4).
c) A fun cao de distribuicao de probabilidade para a vari avel x.
d) Um n umero b tal que P(X> b)=0,6.
e) O valor esperado e a variancia de X.
Questao 2
A quantia gasta anualmente em milh oes de reais na manutenc ao do asfalto
em uma cidade e representada pela vari avel Y com densidade dada por:
f(y) = 8y/9 4/9, se 0, 5 y < 2
0, caso contrario
Obtenha:
a) P(Y<0,8).
b) P(Y> 1, 5 | Y 1).
c) O valor esperado e a variancia de Y.
Questao 3
O graco abaixo representa a funcao de densidade de uma vari avel aleatoria
X.
6 VARI

AVEIS ALEAT

ORIAS CONT

INUAS 96
a) Obtenha o valor a.
b) Determine P(X> 0 | X < 3).
c) Construa a func ao de distribui cao de X.
Questao 4
A demanda di aria de arroz num supermecado, em centenas de quilos, e
uma vari avel aleatoria com func ao de densidade dada por:
f(x) = 2x/3, se 0 x < 1
1 x/3, se 1 x < 3
0, caso contrario
a) Qual e a probabilidade de se vender mais de 150 Kg em um dia
escolhido ao acaso?
b) Construa a func ao de distribui cao de probabilidade para x.
c) Em 30 dias quanto o supermercado espera vender?
d) Qual e a quantidade de arroz que deve ser deixada estocada para
que nao falte arroz em 95 por cento dos dias?
Questao 5
O tempo necess ario para um medicamento contra dor fazer efeito foi
modelado de acordo com a densidade uniforme no intervalo de 5 a 15 min-
utos tendo por base experimentos em animais. Um paciente que esteja
sofrendo dor recebe o remedio e, supondo valido o modelo mencionado acima,
pergunta-se:
a) Qual e a probabilidade de a dor cessar em ate 10 minutos?
b) E de Demorar pelo menos 12 minutos?
c) Qual o tempo esperado para o medicamento fazer efeito?
Questao 6
Uma viga de ferro e soldada em toda a sua extensao. Falhas na soldagem
podem ocorrer com probabilidade 0,1 ou n ao ocorrer com probabilidade 0,9.
Se a falha ocorre ent ao o ponto em que ocorre e modelada por uma variavel
uniforme contnua. Se a viga tem 6 metros de extens ao, determine a proba-
bilidade:
a) Sabendo-se que uma falha ocorreu, ela ser distante das extremidades
de no m aximo 1 metro.
6 VARI

AVEIS ALEAT

ORIAS CONT

INUAS 97
b) Ocorrer uma falha de solda nos dois metros centrais da viga.
Questao 7
O tempo em minutos de utilizacao de um caixa eletr onico por clientes de
um certo banco, foi modelado por uma vari avel T com densidade exponencial
com parametro 3. Determine:
a) P(T < 1).
b) P(T > 1 | T 2).
b) Um n umero a tal que P(T < a)=0,4.
Questao 8
O tempo necessario para eliminar o perigo de contaminac ao de certo pes-
ticida ap os aplicac ao em um pomar e uma vari avel aleat oria exponencial de
par ametro 2 (em meses). Tendo em vista esse comportamento as autoridades
sanit arias recomendam que o consumo das frutas seja evitado algum tempo
ap os a pulverizac ao. Calcule a probabilidade de a fruta estar ainda contami-
nada 1 mes ap os a pulveriza cao. Qual e a probabilidade de a fruta poder ser
consumida com seguranca 2 meses apos a pulverizac ao?
Questao 9
Uma clnica de emagrecimento recebe adultos com pesos seguindo uma
distribuic ao Normal com media 130 Kg e desvio padr ao 20 Kg. Para deter-
minar um tratamento adequado os 25 por cento pacientes de menor peso s ao
classicados como de baixo risco enquanto os 25 por cento de maior peso
s ao classicados como de alto risco. Determine os valores que delimitam as
classicac oes de baixo e alto risco.
Questao 10
Um teste de aptidao feito por pilotos de aeronaves em treinamento requer
que uma serie de testes. O tempo necess ario para completar os testes segue
uma distribuic ao normal com media 90 e desvio padr ao 20 minutos.
a) Qual e a probabilidade de o candidato ser aprovado se para passar no
teste ele deve complet a-lo em menos de 80 minutos. Se 60 candidatos
fazem o teste, quantos candidatos sao esperados passar no teste.
b) Se os 5 por cento melhores candidatos ser ao alocados para aeronaves
maiores, qual deve ser o tempodo candidato para obter essa posic ao.
7 INFER

ENCIA ESTAT

ISTICA 98
7 Inferencia estatstica
A inferencia estatstica baseia-se no processo de a partir de uma amostra,
obter informac oes a respeito de toda populacao.

E a amostra que contem os
elementos que podem ser observados e e onde podemos medir as quantidades
de interesse. A inferencia trata de dois problemas b asicos que abordaremos
ao longo deste captulo: estimac ao e testes de hip oteses.
Primeiramente, vamos estudar como podemos estimar os par ametros de-
sconhecidos da populac ao atraves dos valores obtidos na amostra. Em seguida,
vamos estudar como esses estimadores se comportam e quais ser ao suas dis-
tribuic oes amostrais. Finalmente falaremos um pouco sobre estimacao por
intervalo e testes de hip oteses para a media populacional com base na dis-
tribuic ao amostral da media.
7.1 Populacao e amostra
Aprendemos anteriormente sobre alguns modelos probabilsticos que nos
auxiliam no estudo e caracterizac ao de determinados experimentos e fenomenos
de interesse.
Na pr atica, o pesquisador frequentemente tem alguma ideia sobre a forma
da distribuic ao que pode ser utilizada para modelar o fen omeno mas n ao tem
os valores exatos dos par ametros que a especicam.
Por exemplo, suponha que desejamos criar um modelo para as alturas
dos alunos de uma universidade. Se atraves das informac oes sobre os dados,
gr acos, histogramas, box-plot, for razoavel supor que a distribuic ao pode
ser representada por um modelo normal, precisaramos ent ao conhecer os
par ametros (media e variancia) para determinar o modelo.
Se pudessemos medir a altura de todos os alunos, poderamos obter a
distribuic ao exata. Na pr atica, e invi avel obter a informac ao de toda a pop-
ulac ao, geralmente coletamos dados de uma amostra (subconjunto da pop-
ulac ao) e atraves dessa amostra estimamos os par ametros de interesse, que
neste caso s ao media e vari ancia.
A primeira quest ao que surge e como podemos selecionar um subconjunto
de uma populac ao, isto e, como podemos selecionar uma amostra que possa
representar, de maneira mais verossmel possvel, a populacao.
A segunda questao e como podemos utilizar a informac ao obtida na
amostra para encontrar valores para a media e vari acia do modelo.
Vamos responder a primeira questao e, na proxima secao, falaremos um
pouco sobre estima cao.
Existem varias maneiras de obter uma amostra para estimar os parametros,
uma delas e a amostragem aleat oria simples.
7 INFER

ENCIA ESTAT

ISTICA 99
A amostragem aleat oria simples consiste em um sorteio de uma determi-
nada quantidade de elementos da populac ao. Por exemplo, se a populac ao e
constituida de N elementos e desejamos obter uma amostra com n elementos
n N sorteamos n elementos dentre os N da populac ao. Quando a pop-
ulac ao e muito grande geralmente usamos softwares para gerar a amostra.
Este processo e um dos mais simples para se obter uma amostra, alem dele
existem muitas outras maneiras de selecionar uma amostra mas n ao falare-
mos aqui.
7.2 Parametros e estimadores
As quantidades da populac ao sobre as quais temos interesse e, que em geral
s ao desconhecidas, sao denominadas parametros. Representamos usualmente
por letras gregas como , , entre outras.
Os estimadores s ao funcoes da amostra coletada que nos fornecem in-
formac oes sobre os valores dos par ametros que estamos interessados em de-
scobrir para especicar o modelo.
Na maioria dos casos estaremos interessados em estimar a media e a
vari ancia da populac ao, par ametros e
2
respectivamente. Para isso, us-
aremos a informa cao obtida na amostra para construir os estimadores para
os parametros. Vamos voltar ` a questao deixada na se cao anterior.
Exemplo 1:
Suponha que estamos interessados em criar um modelo para a altura de
jovens em uma universidade para isso, coletamos uma amostra com 10 jovens.
Admitindo que o modelo normal seja proposto, os parametros de interesse
para nos s ao a media e a vari ancia.
Se conhecemos apenas parte da populacao, a amostra X
1
, X
2
, ..., X
10
,
como podemos usar essa informac ao para estimar a media e a variancia da
populac ao, e
2
?
Precisamos de func oes de X
1
, X
2
, ..., X
10
que nos digam algo sobre e
2
,
isto e precisamos de estimadores.
Para estimar a media podemos usar qualquer func ao dos dados. Por
exemplo, podemos dizer que um estimador para e = X
1
ou =
X
1
+X
2
2
,
ou qualquer outra func ao. A mais utilizada e a media da amostra:
=

n
i=1
X
i
n
= x
Para a vari ancia, o estimador mais utilizado e a variancia amostral:
7 INFER

ENCIA ESTAT

ISTICA 100

2
=

n
i=1
(x
i
x)
2
n1
Geralmente usamos = x e

2
=

n
i=1
(x
i
x)
2
n1
porque eles s ao estimadores
que possuem boas propriedades como veremos mais adiante.
Ent ao se tivessemos os 10 valores seguintes de alturas na amostra:
1.6, 1.7, 1.75, 1.8, 1.9, 1.58, 1.6, 1.68, 1.84, 1.72
poderamos dizer que um estimador para e
=

10
i=1
x
i
10
= 1.717
e para
2
:

2
=

10
i=1
(x
i
x)
2
9
= 0.0116
e usar esses valores como parametros do modelo normal.
Mas podemos nos perguntar: E se selecionarmos outra amostra, os val-
ores dos estimadores provavelmente serao diferentes, ser a que esses valores
escolhidos como parametros sao con aveis?
Para testar os valores escolhidos como par ametros usamos os testes de
hip oteses que falaremos mais adiante.
Exemplo 2: Suponha que entrevistamos 400 pessoas em varias capitais
para saber sobre o apoio a um projeto governamental de reforma agraria.
A nossa amostra consiste em 400 respostas (sim ou nao). Se estamos
interessados em medir o apoio ao projeto, ent ao queremos saber qual a prob-
abilidade de uma pessoa ser favoravel.
Um modelo razo avel a ser utilizado neste caso e o modelo bernoulli. A
amostra pode ser pensada como um vetor de vari aveis X
1
, X
2
, ..., X
400
, cada
uma delas assumindo o valor 1 para sucesso (resposta sim) e 0 para fracasso
(resposta nao).
Ent ao estamos interessados no par ametro p do modelo, probabilidade de
uma pessoa ser favor avel ao projeto ou probabilidade de sucesso. Um esti-
mador razo avel para p e a proporc ao de pessoas favoraveis que encontramos
na amostra. Assim, um estimador para p e:
p =
numero de entrevistados favoraveis
400
=

400
i=1
X
i
400
Podemos resumir o que estudamos ate agora da seguinte forma:
7 INFER

ENCIA ESTAT

ISTICA 101
Para uma amostra de tamanho n representada pelas vari aveis aleat orias
(X
1
, X
2
, ..., X
n
) denote os parametros media, vari ancia e proporcao da pop-
ulac ao da qual foi extrada a amostra por ,
2
e p respectivamente. Os
estimadores mais utilizados para esses par ametros s ao as correspondentes
media, variancia e propor cao calculadas na amostra. Representamos por ,

2
e p.
Exemplo 3: Suponha que para uma amostra de 10 jovens obtivemos os
seguintes nveis de colesterol:
180, 190, 170, 180, 170, 160, 170, 180, 190, 170
E que a partir desses dados queremos estimar o nvel medio de colesterol
na populacao jovem.
Como nao temos acesso `a populacao jovem toda, vamos estimar a media
pela media observada na amostra.
=

X = 176
Ent ao o nvel de colesterol estimado para a popula cao jovem com base
nessa amostra e 176.
Se quisessemos estimar a proporc ao de jovens na popula cao com taxa de
colesterol acima de 180 usaramos a proporc ao observada na amostra.
p =
2
10
= 0, 2
7.3 Distribuic oes amostrais
Vimos que estimadores sao func oes de vari aveis aleat orias e portanto s ao
tambem vari aveis aleatorias. Agora vamos estudar a distribuicao de prob-
abilidades de alguns estimadores mais utilizados, particularmente, estamos
interessados na distribuicao de

X porque atraves dessa distribuic ao poder-
emos construir intervalos de conanca e testes de hipoteses para a media
populacional .
Exemplo 4: Suponha que uma vari avel X pode assumir dois valores -1
e 1 com iguais probabilidades. Para uma amostra de tamanho 2 determine
a func ao de probabilidade de

X.
Como

X =
X
1
+X
2
2
temos
7 INFER

ENCIA ESTAT

ISTICA 102
(X
1
, X
2
)

X prob
(-1,-1) -1 1/4
(-1,1) 0 1/4
(1,-1) 0 1/4
(1,1) 1 1/4
Portanto temos a seguinte fun cao de probabilidade para

X:
Nem sempre e f acil encontrar a distribui cao de estimadores. Por exemplo,
se X fosse uma vari avel contnua uniforme entre -1 e 1, teramos X
1
e X
2
tambem com distribui cao uniforme em [-1,1] mas, a natureza contnua das
vari aveis n ao nos possibilitaria enumerar todas as amostras possveis como
zemos no exemplo anterior. Como fazer ent ao para encontrar a distribui cao
de

X nesse caso? Vamos estudar mais a frente o teorema central do limite
que nos ajudara a estudar o comportamento de

X para uma amostra muito
grande, independente da natureza de

X.
Antes de falar do teorema central do limite, vamos ver um exemplo de
distribuic ao de

X quando as variaveis na amostra tem distribuicao normal.
Exemplo 5: Consideremos a variavel X que descreve o peso em criancas
de um determinado colegio. Suponha que X tem distribuic ao normal com
media 32 e vari ancia 36. Selecionamos um grupo com 100 crian cas de maneira
independente e queremos saber a probabilidade do peso medio no grupo ser
maior que 33 kg.
Queremos saber P(

X > 33). Para calcular essa probabilidade, precisamos
saber qual e a distribuic ao de

X. Vimos no captulo anterior que qualquer
combina cao linear de normais tambem segue o modelo normal.
Como

X =

100
i=1
X
i
100
,

X tambem segue o modelo normal, resta descobrir a
media e a vari ancia.
E(

X) = E(

100
i=1
X
i
100
) =
1
100
E(

100
i=1
X
i
) =
1
100
[E(X
1
) + E(X
2
) + ... +
E(X
100
)] =
1
100
[100.32] = 32
7 INFER

ENCIA ESTAT

ISTICA 103
var(

X) = var(

100
i=1
X
i
100
) =
1
(100)
2
var(

100
i=1
X
i
) =
1
(100)
2
[var(X
1
)+var(X
2
)+
... +var(X
100
)] =
1
(100)
2
[100.36] =
36
100
Ent ao

X N(32,
36
100
). Agora podemos calcular P(

X > 33) = P(

X32
6/10
>
3332
6/10
) 0.0475.
De uma forma geral para uma popula cao normal com media e vari ancia

2
, se selecionarmos uma amostra de tamanho n, (X
1
, ..., X
n
),

X ter a dis-
tribuic ao normal com media e vari ancia

2
n
.
Discutimos acima dois exemplos muito particulares de amostras retiradas
de uma populac ao com distribui coes de probabilidades bem conhecidas e por
isso, construmos de maneira bem simples a distribuic ao de

X. Na pr atica,
n ao temos informac oes sobre a distribuic ao das vari aveis que constituem a
amostra e trabalhamos com amostras muito grandes o que diculta a con-
struc ao da distribui cao de

X.
Felizmente, satisfeitas certas condic oes, podemos demonstrar que para
uma amostra sufucientemente grande, a distribuic ao da media amostral pode
ser aproximada por uma distribuicao normal. Esse e um dos teoremas mais
importantes da probabilidade, denominado teorema central do limite.
Teorema central do limite
Para uma amostra aleat oria simples (X
1
, X
2
, ..., X
n
) de tamanho n re-
tirada de uma populac ao com media e vari ancia
2
nita temos:

n
Z quando n
onde Z N(0, 1).
O TCL nos diz que para n sucientemente grande a distribui cao amostral
da media aproxima-se de uma distribuic ao normal com media igual a media
da populac ao e vari ancia igual a vari ancia da populac ao dividida por n. Re-
pare que a distribuic ao da populac ao nao e especicada.
A velocidade de convergencia depende da populac ao da qual a amostra
foi retirada, para populac oes com distribuic ao simetrica a convergencia e
mais rapida, ou seja precisamos de uma amostra menor para garantir uma
boa aproximac ao pela distribuic ao normal. Estudos envolvendo simulac oes
mostram que para n ao redor de 30 a aproximac ao pode ser considerada boa
para aplicac oes pr aticas.
7 INFER

ENCIA ESTAT

ISTICA 104
Exemplo 6: Suponha que a aceitac ao em um lote de 10000 sacos de
ac ucar ocorre apenas se o peso medio de uma amostra aleatoria com 100
sacos retirados do lote estiver entre 498 e 502 gramas. Sabe-se que o peso
dos sacos e uma variavel aleatoria com media 500 e vari ancia 100. Qual e a
probabilidade de aceitarmos o lote?
Se denirmos X
i
como o peso do i-esimo saco retirado do lote para
i=1,2,...,100. temos pelo TCL que a media dos pesos da amostra repre-
sentada por

X ter a distribuic ao aproximadamente normal com media 500 e
desvio padrao 1. Logo a probabilidade de aceitarmos o lote e:
P(498

X 502) = P(
498500
1


X500
1

502500
1
) = P(2 Z 2)
0, 95
Portanto, dicilmente o lote seria rejeitado.
Exemplo 7: Suponha que a proporc ao de pecas fora de especicac ao
em um lote e de 40 por cento. Tomada uma amostra de tamanho 30, qual e
a proba bilidade de que a proporc ao das pe cas defeituosas seja menor que 0,5?
Queremos calcular P( p < 0, 5). Sabemos que a proporc ao de pe cas de-
feituosas pode ser vista como a media amostral se considerarmos a populac ao
modelada por uma bernoulli com probabilidade de sucesso 0,4.
Para a amostra X
1
, ..., X
30
tal que X
i
bernoulli(0, 4) temos pelo TCL
que p =

X ter a distribuicao aproximadamente normal com media 0,4 e
vari ancia (0, 4.0, 6)/30 = 0, 24/30 = 0, 008.
Portanto P( p < 0, 5) = P(
p0,4

0,008
<
0,50,4

0,008
) = P(Z < 1, 12) 0, 868.
7.4 Estimacao por intervalo
Estudamos ate agora alguns estimadores pontuais para a media, variancia e
proporc ao populacionais. Como falamos anteriormente, quando selecionamos
uma amostra e a partir dela um estimador para o parametro populacional
n ao temos a dimensao do erro que estamos cometendo quando dizemos que
o valor calculado na amostra pode ser extrapolado para toda a populac ao.
O intervalo de conan ca e os testes de hip oteses nos dizem um pouco sobre
a dimensao desse erro.
7 INFER

ENCIA ESTAT

ISTICA 105
Vamos construir agora intervalos de conanca para a media populacional
que fornecerao estimativas pontuais e informac oes sobre a varia cao do par ametro.
Os intervalos de conanca sao construdos atraves da distribuic ao amostral
do estimador.
Vamos come car com uma populac ao normal com media desconhecida
e vari ancia
2
conhecida, depois contruremos intervalos para para pop-
ulac oes com distribui coes desconhecidas usando o TCL.
No exemplo 5 vimos que para uma amostra aleatoria de tamanho n,
(X
1
, ..., X
n
), retirada de uma populac ao normal com media e vari ancia

2
,

X tem distribuic ao normal com media e vari ancia

2
n
.
Suponha que ap os selecionarmos a amostra, queremos obter um intervalo
que contenha o par ametro com uma probabilidade .
Ent ao queremos encontrar a e b tais que P(a b) = . Como

X
tem distribuic ao normal com media e vari ancia

2
n
.
Z =

X

n
N(0, 1)
Ent ao xando uma probabilidade 0 < < 1, podemos encontrar um
valor z
/2
na tabela tal que:
= P(| Z | z
/2
) = P(z
/2
Z z
/2
)
Gracamente, queremos encontrar z
/2
tal que:
Dividimos por 2 pois os intervalos simetricos s ao os intervalos de menor
comprimento, assim nos da maior precis ao para o par ametro . Poderamos
ter dividido de maneira diferente encontrando outros intervalos, mas os com-
primentos seriam maiores.
O valor z
/2
pode ser obtido na tabela da normal padr ao da seguinte
maneira: primeiro localizamos a probabilidade /2 no corpo da tabela e
depois identicamos z
/2
nas margens correspondentes.
7 INFER

ENCIA ESTAT

ISTICA 106
Conhecendo z
/2
podemos encontrar a e b:
= P(| Z | z
/2
) = P(z
/2
Z z
/2
) = P(z
/2


X

n
z
/2
) =
P(

X z
/2

n


X +z
/2

n
)
Ent ao a =

X z
/2

n
e b =

X +z
/2

n
.
Assim o intervalo de conan ca para com probabilidade e:
IC(, ) = [

X z
/2

n
;

X + z
/2

n
]
Dizemos entao que a probabilidade do intervalo conter o valor verdadeiro
de e .
A amplitude do intervalo e dada pela diferen ca entre os extremos do
intervalo, 2z
/2

n
, e e uma medida da precisao da estima cao. O erro ao
estimar com

X, E =|

X | e no maximo z
/2

n
com probabilidade .
Podemos observar tambem que para mesmos tamanho de amostra e valor
de quanto maior a conan ca, maior sera o tamanho do intervalo e portanto
menor ser a sua precis ao. Podemos construir intervalos mais precisos para
um determinado nvel de conanca escolhendo amostras maiores.
Exemplo 8: Suponha que estamos testando a energia de impacto de ma-
teriais metalicos a uma determinada temperatura. Dez medidas de energia
de impacto em Joules foram coletadas:
64.1, 64.7, 64.5, 64.6, 64.5, 64.3, 64.6, 64.8, 64.2, 64.3
Assumindo que a energia de impacto tem distribui cao normal com desvio
padr ao 1. Construa um intervalo de conanca 95 por cento para .
7 INFER

ENCIA ESTAT

ISTICA 107
Pela tabela da normal vemos que z
0.475
= 1.96, alem disso,

X = 64.46. O
IC 95 por cento para e dado por:
IC(, 0.95) = [

X z
0.475

n
;

X + z
0.475

n
] = [64.46 1.96
1

10
; 64.46 +
1.96
1

10
] = [63.84; 65.08]
Ent ao temos 95 por cento de conan ca para o intervalo [63.84; 65.08] con-
ter o verdadeiro valor de .
7.5 Intervalo de conanca para para amostras grandes
A aplicac ao do teorema central do limite permite a obten cao de intervalos
de conanca para mesmo quando a distribuic ao das variaveis aleat orias
que constituem a amostra nao e dada por um modelo Normal. Neste caso,
o intervalo de conanca ter a um coeciente de conanca aproximadamente
igual a , e a aproximac ao ser a tanto melhor quanto maior for a amostra.
Vimos anteriormente que para n=30 a aproximac ao pela normal pode ser
considerada boa.
Exemplo 9: Um provedor de acesso a internet est a monitorando a du-
ranc ao do tempo das conexao de seus clientes. Suponha que a distribuicao
dos tempos de durac ao e desconhecida, assim como a media, sendo con-
hecido apenas o desvio padr ao

50 minutos. Uma amostra com duracao de


500 conex oes foi observada e o valor medio foi calculado, resultando em 25
minutos. Construa um IC 92 por cento para a media.
Apesar de n ao sabermos se a distribuic ao da durac ao dos tempos e nor-
mal, podemos usar o TCL pois a amostra e grande. Neste sentido, um IC 92
por cento para a media ser a dado por:
IC(, 0.92) = [

Xz
0.46

n
;

X+z
0.46

n
] = [251.75
50

100
; 25+1.75
50

100
] =
[24.45; 25.55]
Ent ao, esse intervalo contem a media com probabilidade 92 por cento.
Vimos acima que para n 30 podemos construir um IC para a media de
uma populac ao com variancia
2
conhecida, mesmo quando desconhecemos
a distribuic ao usando a aproximac ao pela normal dada pelo TCL.
Alem disso, quando a vari ancia da populac ao e desconhecida e n e grande,
7 INFER

ENCIA ESTAT

ISTICA 108
podemos ainda construir IC para a media trocando por S, o desvio padr ao
amostral. O IC ca da seguinte maneira:
IC(, ) = [

X z
/2
S

n
;

X + z
/2
S

n
]
Para usar esse resultado e aconselhavel ter n 40. O TCL gealmente
vale para n 30 mas um tamanho maior de amostra e aconselhavel porque
tracando por S estamos adicionando mais variabilidade.
7.6 Teste de hip otese para media com variancia con-
hecida
Vamos estudar agora um dos principais topicos de inferencia estatstica
conhecido como teste de hip oteses.
Feita determinada armac ao sobre uma populac ao (usualmente sobre um
par ametro desta), desejamos saber se os resultados provenientes de uma
amostra contrariam ou n ao tal armacao.
O objetivo do teste estatstico de hipoteses e fornecer uma metodologia
que nos permita vericar se os dados amostrais trazem evidencias que ap oiam
ou nao uma hipotese (estatstica) formulada.
O procedimento b asico de um teste de hip oteses sobre um parametro de
uma populac ao e supor verdadeira a hip otese em quest ao e vericar se a
amostra observada e verossmil nessas condi coes.
Vamos comecar com um exemplo para mostrar a utilidade e os tipos de
quest oes que um teste de hip oteses procura responder.
Suponha que para pessoas sadias o nvel de uma substancia no sangue
e modelado por uma distribuic ao normal com media 14 uni/ml e desvio
padr ao 6 uni/ml. Pessoas sofrendo uma determinada doen ca tem a concen-
trac ao dessa substancia alterada com a media aumentando para 18 uni/ml.
Admitimos que a distribuic ao normal com desvio padrao 6 uni/ml ainda
modela bem o comportamento da subst ancia em pessoas com a doenca.
Suponha que desejamos testar se um tratamento para essa doenca e ecaz.
Para isso, selecionamos um grupo de 30 pessoas que receberam esse trama-
mento. O nvel da subst ancia para cada uma dessas pessoas e denotado por
X
1
, X
2
, ..., X
30
baseado no valor medio observado no grupo,

X decidiremos
se o tratamento e ecaz ou nao. Se o valor da media encontrado for pr oximo
de 18, teremos evidencias de que o tratamento n ao e ecaz. Por outro lado,
se esse valor for pr oximo de 14 ent ao seri amos levados a acreditar na ecacia
do tratamento. O qu ao proximo o valor deve estar para decidirmos de-
pende da variabilidade da popula cao. O teste de hip oteses respondera a essa
7 INFER

ENCIA ESTAT

ISTICA 109
e outras perguntas.
Principais Conceitos
A construc ao de um teste de hipoteses inicia-se com a determinac ao de
duas hip oteses, as quais chamaremos de hip otese nula (denotada por H
0
) e
hip otese alternativa (denotada por H
1
).
A hip otese nula e a hipotese que estamos colocando ` a prova. Portanto,
o teste nos far a vericar, atraves da amostra obtida, se rejeitamos H
0
ou
n ao rejeitamos H
0
, isto e, vericar se os resultados provenientes da amostra
contrariam ou nao a hip otese nula. A hip otese alternativa contempla todos
os valores que s ao considerados aceitaveis caso rejeitemos H
0
.
Exemplo 10: Queremos testar a media de horas de sono dos alunos da
UFRRJ. Acredita-se que , a media de horas de sono de todos os alunos, gire
em torno de 6 horas. Com base em uma amostra de 49 alunos, obtivemos
media amostral X = 5,6 horas (ou seja, 5 horas e 36 minutos). Portanto,
sejam as hip oteses
H
0
: = 6,
H
1
: = 6.
Neste caso, X = 5, 6 e o que chamaremos de estatstica de teste, isto e, o
valor que o estimador para o parametro de interesse (neste caso, ) assume.
Para decidir se n ao rejeitamos H
0
ou rejeitamos H
0
, precisamos denir a
chamada regiao crtica (ou regiao de rejeicao), que denotaremos por RC, de
forma que:
Se X RC, entao optaremos por rejeitar H
0
; e
se X / RC, optaremos por nao rejeitar H
0
.
Isto e o que chamamos de uma regra de decisao. Por exemplo, se deter-
min assemos RC = (; 5, 5) (6, 5 ; ), entao essa amostra nos levaria a
n ao rejeitar H
0
: = 6. Ja se determin assemos RC = (; 5, 8)(6, 2 ; ),
ent ao essa amostra nos levaria a rejeitar H
0
: = 6.
Mas como determinar a regi ao crtica de maneira mais coer-
ente, isto e, nao tao arbitraria?
Primeiramente note que, em uma regra de decisao, podemos tanto fazer
uma escolha certa como uma escolha errada. Quanto `as escolhas erradas,
7 INFER

ENCIA ESTAT

ISTICA 110
podemos: (i) decidir rejeitar H
0
quando H
0
e, na realidade, verdadeira; ou
(ii) decidir n ao rejeitar H
0
quando H
0
e, na realidade, falsa. Tecnicamente,
estes erros s ao chamados respectivamente de erro de tipo I e erro de tipo II.
O ideal seria ent ao determinar uma regra de decisao que minimizasse a
probabilidade de ambos os erros. Entretanto, o que fazemos em geral (e o que
faremos neste curso!) e xar um valor para = P(cometer erro do tipo I), e
obter a regiao de rejeic ao (RC) baseada neste valor. Chamaremos de nvel
de signicancia do teste.
OBS.: Chamamos de = 1 o nvel de conanca do teste, cuja in-
terpretac ao e a mesma de nvel de conanca para intervalos de conanca.
Como ja estamos acostumados a trabalhar com , vamos continuar trabal-
hando com ele ao inves de trabalhar com , pois uma vez xado um valor
para , ent ao tambem estara xado. A regi ao crtica e construda de forma
que, para X distribudo conforme H
0
,
P(X RC) = 1 (ou, equivalentemente, P(X RC) = ),
P(X / RC) = (ou, equivalentemente, P(X / RC) = 1 ).
Passos para a Construcao de um Teste de Hip oteses
Passo 1: Fixar qual a hipotese H
0
a ser testada e qual a hip otese alternativa
H
1
.
Passo 2: Decidir qual estimador (estatstica de teste) ser a usado para testar
H
0
.
Passo 3: Fixar o valor de e, da, construir a regiao crtica conforme vimos
acima.
Passo 4: Usar as observac oes da amostra para calcular o valor da estatstica
de teste na amostra.
Passo 5: Se o valor que a estatstica de teste assume nao pertencer a
regi ao crtica, nao rejeitar H
0
; caso contrario, rejeitar H
0
.
Teste de Hip oteses (bilateral) para a media populacional
quando a variancia populacional
2
e conhecida
7 INFER

ENCIA ESTAT

ISTICA 111
Usado quando queremos testar se a media populacional e igual a um
valor
0
contra ser diferente de
0
.
Passo 1:
H
0
: =
0
,
H
1
: =
0
.
Passo 2: Estatstica de teste: X
Passo 3: xado RC =
_
;
0
z1+
2

n
_

0
+ z1+
2

n
;
_
Passo 4: Obter x, isto e, a media na amostra.
Passo 5: Se x / RC, nao rejeite H
0
; se x RC, rejeite H
0
.
Exemplo 11: Queremos testar (ao nvel = 0, 95 de conanca) a
armac ao de que a media de horas de sono dos alunos da UFRRJ e 6 horas,
onde sabemos que
2
= 1. De uma amostra de 49 alunos, obtivemos media
amostral X = 5,6 horas. Portanto,
Passo 1:
H
0
: = 6,
H
1
: = 6.
Passo 2: Estatstica de teste: X
Passo 3: = 0, 95 RC =
_
; 6 1, 96

49
_

_
6 + 1, 96

49
;
_
=
(; 5, 72] [6, 28 ; )
Passo 4: x = 5, 6 (este problema j a nos d a o valor de X na amostra).
Passo 5: x = 5, 6 (; 5, 72] [6, 28 ; ) rejeito H
0
.
Conclusao: Ao nvel de 95% de conanca, a amostra obtida fornece evidencias
para rejeitarmos a hip otese de que a media de sono dos alunos da UFRRJ e
de 6 horas.
7 INFER

ENCIA ESTAT

ISTICA 112
EXERC

ICIO: Se coletassemos uma nova amostra (tambem de 49 alunos)


que retornasse X = 5,8 horas, qual seria a decis ao do teste acima ainda ao
nvel de 95% de conanca? E ao nvel 99% de conanca?
Teste de Hip oteses (unilateral `a direita) para a media pop-
ulacional quando a variancia populacional
2
e conhecida
Usado quando queremos testar se a media populacional e igual a um
valor
0
contra ser maior que
0
.
Passo 1:
H
0
: =
0
,
H
1
: >
0
.
Passo 2: Estatstica de teste: X
Passo 3: xado RC =
_

0
+z

n
;
_
Passo 4: Obter x, isto e, a media na amostra.
Passo 5: Se x / RC, nao rejeite H
0
; se x RC, rejeite H
0
.
7 INFER

ENCIA ESTAT

ISTICA 113
Exemplo 12: Queremos testar (ao nvel = 0, 95 de conanca) se os
alunos da UFRRJ tem dormido mais de 6 horas, onde sabemos que
2
= 1.
De uma amostra de 25 alunos, obtivemos media amostral X = 6,2 horas.
Portanto,
Passo 1:
H
0
: = 6,
H
1
: > 6.
Passo 2: Estatstica de teste: X
Passo 3: = 0, 95 RC =
_
6 + 1, 65

25
, ;
_
= [6, 33 ; )
Passo 4: x = 6, 2 (este problema j a nos d a o valor de X na amostra).
Passo 5: x = 6, 2 / [6, 33 ; ) n ao rejeito H
0
.
Conclusao: Ao nvel de 95% de conan ca, a amostra obtida n ao fornece
evidencias sucientes para rejeitarmos a hipotese de que a media de sono dos
alunos da UFRRJ e de 6 horas.
EXERC

ICIO: Se coletassemos uma nova amostra (tambem de 25 alunos)


que retornasse X = 6,4 horas, qual seria a decis ao do teste acima ainda ao
7 INFER

ENCIA ESTAT

ISTICA 114
nvel de 95% de conanca? E ao nvel 99% de conanca?
Teste de Hipoteses (unilateral `a esquerda) para a media pop-
ulacional quando a variancia populacional
2
e conhecida
Usado quando queremos testar se a media populacional e igual a um
valor
0
contra ser menor que
0
.
Passo 1:
H
0
: =
0
,
H
1
: <
0
.
Passo 2: Estatstica de teste: X
Passo 3: xado RC =
_
;
0
z

n
_
Passo 4: Obter x, isto e, a media na amostra.
Passo 5: Se x / RC, nao rejeite H
0
; se x RC, rejeite H
0
.
7 INFER

ENCIA ESTAT

ISTICA 115
Exemplo 13: Queremos testar (ao nvel = 0, 95 de conanca) se os
alunos da UFRRJ tem dormido menos de 6 horas, onde sabemos que
2
= 1.
De uma (outra!) amostra de 25 alunos, obtivemos media amostral X = 5,5
horas. Portanto,
Passo 1:
H
0
: = 6,
H
1
: < 6.
Passo 2: Estatstica de teste: X
Passo 3: = 0, 95 RC =
_
; 6 1, 65

25
_
= (; 5, 67]
Passo 4: x = 5, 5 (este problema j a nos d a o valor de X na amostra).
Passo 5: x = 5, 5 (; 5, 67] rejeito H
0
.
Conclusao: Ao nvel de 95% de conanca, a amostra obtida fornece evidencias
para rejeitarmos a hip otese de que a media de sono dos alunos da UFRRJ e
de 6 horas.
EXERC

ICIO: Se coletassemos uma nova amostra (tambem de 25 alunos)


que retornasse X = 5,8 horas, qual seria a decis ao do teste acima ainda ao
7 INFER

ENCIA ESTAT

ISTICA 116
nvel de 95% de conanca? E ao nvel 99% de conanca?
7 INFER

ENCIA ESTAT

ISTICA 117
OBS: Como zemos anteriormente para os intervalos de conanca, aqui
tambem podemos construir testes de hip oteses para a media quando a variancia
e conhecida mesmo que distribuic ao n ao seja normal. Para isso, tambem pre-
cisamos que n 30 para usar o TCL. Quando a vari ancia e desconhecida
precisamos que n 40 para substituir por S. As regi oes crticas sao as
mesmas que as construdas acima, exceto quando desconhecemos e temos
uma amostra sucientemente grande para podermos substituir por seu
estimador S.
7.7 Exerccios - lista 08
Questao 1
Um fabricante deseja estudar a duracao de baterias que sao utilizadas
na fabricacao em relogios de pulso. Uma amostra de v arios lotes fabricados
por uma mesma companhia foi submetida a testes e produziram os seguintes
tempos de durac ao em anos:
2; 2; 3; 1; 4; 5; 3; 4; 5; 6; 5; 3; 4; 3; 4; 2; 4; 3; 5; 2.
Determine os valores dos estimadores para a media e a vari ancia.
Questao 2
Uma amostra com dois elementos de uma vari avel X, que segue o modelo
Bernoulli com probabilidade de sucesso p, e selecionada. Determine a func ao
de probabilidade da media amostral.
Questao 3
O consumo mensal de agua por residencia em um certo bairro e assumido
ter distribuic ao Normal com media 10 e desvio padr ao 2 (em m
3
). Para uma
amostra de 25 residencias, qual e a probabilidade da media amostral n ao se
afastar da verdadeira media por mais de 1 m
3
?
Questao 4
A durac ao de um tonner de uma maquina de fotoc opias pode ser mod-
elado como normal com media 15 e desvio padr ao 2 (em milhres de copias).
Para uma amostra de 12 m aquinas a dura cao do tonner e observada. Qual
e a probabilidade de em media, durar:
a)Menos que 16 mil copias?
b)Mais de 13 mil copias?
c) Entre 13 e 14 mil c opias?
Questao 5
Um fabricante arma que sua vacina contra gripe imuniza em 80 por
cento dos casos. Uma amostra de 25 indivduos que tomaram essa vacina foi
7 INFER

ENCIA ESTAT

ISTICA 118
escolhida e testes foram feitos para vericar a imunizac ao desses indivduos.
Se o fabricante estiver correto, qual e a probabilidade da propor cao dos imu-
nizados na amostra ser inferior `a 0,75? e superior `a 0,85?
Questao 6
Uma amostra em 100 cidades brasileiras indicou que o valor medio da hora
aula para professores de escolas p ublicas e 2,5 reais. Obtenha um intervalo
de conan ca 95 por cento para o valor medio da hora aula baseado no fato
de que o desvio padrao em estudos anteriores foi 1,1.
Questao 7
O tempo de durac ao de um certo tipo de l ampada pode ser modelada por
uma normal com desvio padr ao = 25 horas. Uma amostra com 20 l ampadas
foi selecionada e observamos a media de

X = 1014 horas. Construa um IC
95 % para a media.
Questao 8
Uma ind ustria produz aneis de aco que integram equipamentos automo-
tivos. O di ametro desses aneis e uma vari avel com desvio padr ao = 0, 001.
Uma amostra com 36 aneis e selecionada e o diametro medio encontrado foi

X = 74, 03. Construa os IC 99% e 95 % para a media.


Questao 9
Um agr onomo est a interessado em estimar o nvel de c alcio em uma
planta cao. Para isso, coletou uma amostra com 49 unidades e encontrou
a media de c alcio em mg igual a

X = 68, 3 e o desvio padr ao amostral foi de
S = 5, 87. Construa IC 92% e 99% para a media de calcio da plantac ao.
Questao 10
Considere um experimento qumico cujo rendimento pode ser modelado
por uma normal com desvio padr ao = 3. Esse experimento foi repetido 5
vezes e os rendimentos foram anotados:
91.6, 88.75, 90.8, 89.95, 91.3
Para o nvel de signicancia = 0.05, queremos testar se o rendimento
da reac ao e de 90 %. Qual conclus ao chegamos com a amostra acima?
Questao 11
O tempo para um medicamento fazer efeito pode ser modelado por uma
normal com desvio padr ao = 1.25. Uma amostra aleat oria com 10 tempos
de efeito para 10 pacientes foi coletada e resultou media de

X = 40.5 horas.
Existe evidencia de que o tempo necessario para o medicamento fazer efeito
e maior que 40 horas? (use = 0.05)
Questao 12
Um engenheiro estuda a tens ao suportada por vigas de alumnio. Sabe-
se que a tens ao nas vigas segue um modelo normal com desvio padrao de
7 INFER

ENCIA ESTAT

ISTICA 119
= 60. Uma amostra aleatoria com a tens ao de 12 vigas foi analisada e
resultou em uma tens ao media de

X = 3250. Para = 0.01 aceitaramos ou
rejeitaramos a media de tens ao de 3500?
7 INFER

ENCIA ESTAT

ISTICA 120
Referencias
Bussab, Morettin. Estatstica b asica. Editora Saraiva.
Magalh aes. Nocoes de probabilidade e estatstica.
Montgomery. Applied statistics and probability for engineers
Triola. Estatstica basica

Você também pode gostar