Escolar Documentos
Profissional Documentos
Cultura Documentos
(PROFMAT)
3 Probabilidade 72
3.1 De…nições e Resultados Básicos da Teoria das Probabilidades . . . . . 72
3.1.1 De…nição e Propriedades das Probabilidades . . . . . . . . . . 75
3.1.2 Probabilidade Condicional . . . . . . . . . . . . . . . . . . . . 84
3.1.3 Independência . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
3.2 Lista de Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
3.3 Conceito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
3.4 Função de Distribuição . . . . . . . . . . . . . . . . . . . . . . . . . . 93
3.5 Variáveis Aleatórias Discretas . . . . . . . . . . . . . . . . . . . . . . 95
3.6 Variáveis Aleatórias Contínuas . . . . . . . . . . . . . . . . . . . . . . 96
3.7 Funções de Variáveis Aleatórias . . . . . . . . . . . . . . . . . . . . . 99
3.8 Lista de Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
1
5.4 Distribuições Condicionais e Esperança Condicional . . . . . . . . . . 124
5.5 Covariância . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
5.6 Coe…ciente de Correlação . . . . . . . . . . . . . . . . . . . . . . . . . 128
5.7 Lista de Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
9 Estimação 181
9.1 Propriedades dos Estimadores . . . . . . . . . . . . . . . . . . . . . . 183
9.2 Estimadores de Momentos . . . . . . . . . . . . . . . . . . . . . . . . 185
9.3 Estimadores de Máxima Verossimilhança . . . . . . . . . . . . . . . . 186
9.4 Estimação Intervalar de Parâmetros . . . . . . . . . . . . . . . . . . . 187
9.4.1 Intervalo de Con…ança para a média populacional ( ) quando
a variância populacional ( 2 ) é conhecida . . . . . . . . . . . . 187
9.4.2 Intervalo de Con…ança para a média populacional ( ) quando
a variância populacional ( 2 ) é desconhecida . . . . . . . . . . 189
9.4.3 Intervalo de Con…ança para a proporção populacional (p) . . . 191
9.4.4 Intervalo de con…ança para variância populacional ( 2 ) . . . . 193
9.5 Lista de Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195
2
10.5.3 Testando a Diferença entre duas Médias (com as duas variân-
cias dos dois grupos diferentes) . . . . . . . . . . . . . . . . . 224
10.6 Teste de Hipóteses para a Diferença entre duas Proporções . . . . . . 226
i
Capítulo 1
A Natureza e os Conceitos
Fundamentais da Estatística
substância induz uma certa patologia, ou sobre pesquisas eleitorais, índices de rou-
crucial para todos os estudantes, e talvez aquela que mais atua na formação crítica
do cidadão, pois ela abarca diferentes áreas do conhecimento, tais como: Medic-
1
No entanto, cabe ressaltar que hoje temos dois signi…cados para Estatística, a
letados em pesquisas. Por exemplo, uma média aritmética (que iremos mais tarde
Você deve estar surpreso com o uso da palavra "arte"na de…nição acima, não?
Mas a verdade é que sem julgamento, experiência e até mesmo uma forte intuição
aleatórios.
sob mesmas condições iniciais) aí deverá estar a Estatística para nos auxiliar a dar
matemático, mas quase sempre não foi instruído na sua formação acadêmica do
encia?
ções são verdadeiras ou falsas. Além disso, preocupa-se com a descrição unívoca de
2
A Estatística, por sua vez, lida com proposições que não podemos dizer se são
verdadeiras e tampouco falsas, situando-se numa situação de incerteza, que pode ser
las que nos permitem garantir com 100% de certeza se a mesma é verdadeira ou falsa.
tença falsa, pois 2 é primo e par); “Todos os números primos maiores que 2 são
dade (ou falsidade) não possa ser garantida com 100% de certeza, mas apenas nos
tença “uma moeda que, ao ser lançada 10 vezes, produz 8 caras não é honesta”
é uma sentença estatística, pois podemos apenas medir em que nível de con…abil-
idade tal a…rmativa pode ser considerada como verdadeira. Obviamente teremos
maior con…abilidade na a…rmação de uma sentença do tipo “uma moeda que, ao ser
lançada 50 vezes, produz 48 caras não é honesta”, pois há mais evidências contra a
exemplo esquemático como funciona uma tomada de decisão sob incerteza na Es-
tatística:
cura para dor de cabeça. Para isso, selecionam-se n pessoas para o medicamento
3
A e n pessoas para o medicamento B. Suponha que a média do tempo de cura do
Cenário I: Os dados coletados nos dois grupos quando colocados em seus lugares
Figura 1
Neste cenário os dados coletados dos dois grupos são tão esparsos que se so-
brepõem um ao outro, e um teste estatístico adequado não validaria com alta prob-
Cenário II: Os dados coletados nos dois grupos quando colocados em seus
4
Figura 2
Neste novo cenário os dados coletados dos dois grupos são tão coesos que se
Vemos com esses dois exemplos que uma tomada de decisão estatística deve
variabilidade dos dados para uma plena matematização das incertezas associadas às
a…rmações tecidas.
ABC. Para isso, ele seleciona sete crianças aleatoriamente para responderem ao
teste ABC sem o treinamento (pré-teste). Em seguida elas são estimuladas usando-
novamente ao teste ABC (pós-teste). Ele deseja saber se o treinamento de fato induz
a prontidão na alfabetização.
Observe que esse estudo demanda a ferramenta Estatística, já que cada amostra
5
de sete alunos retirada trará resultados variáveis e desejamos concluir algo sob in-
dos dados coletados para comparar os valores obtidos antes e depois do teste, a …m
deverá portanto analisar dados, conforme tabela e grá…cos abaixo, criados após a
20
16
12
PRE_TEST
0
Case 1 Case 2 Case 3 Case 4 Case 5 Case 6 Case 7 POS_TEST
Pré-Teste x Pós-Teste
6
Fase 3 (Inferência dos Dados): a partir da análise exploratória, o pesquisador
serão testadas à luz de algum teste estatístico apropriado para o caso em estudo.
Claro que o exemplo acima é posto apenas para que possamos entender emblem-
ulação de interesse em estudo e, por algum motivo, não podemos acessá-la integral-
mente para medir uma certa propriedade da mesma. O que fazer então? A ideia
central da Estatística é obter de maneira conscienciosa uma amostra que traga po-
7
a população. Como a amostra é apenas uma parte da população, haverá portanto
variabilidade nos resultados amostrais (cada amostra retirada gerará resultados di-
versos), e, portanto, tais resultados serão aleatórios e devem ser modelados proba-
determinadas coisas sob incerteza. Observe que se pudéssemos acessar toda a pop-
pois acederíamos ao valor exato, e assim não haveria necessidade, no sentido estrito,
do uso da Estatística... É claro que este exemplo supõe uma população …nita. Se
a população fosse in…nita, então por mais razão a Estatística seria a ferramenta
teórica por excelência para o tratamento do problema! Mas estamos nos adiantando
Inferencial.
8
Qual é a nossa população nesse estudo? Todos os brasileiros com carteira
assinada em 2011.
A essa altura você já deve ter intuído que uma das ideias da Estatística é usar a
estatística (ou estimador) para a…rmar com um certo nível de con…abilidade qual o
seja valiosa para a estimação de parâmetros, é necessário que amostra tenha sido
coletada de maneira conscienciosa da população. Embora haja toda uma teoria para
tipos aqui, pois o tratamento dessa teoria está fora dos objetivos desse curso:
selecionado.
igualmente prováveis.
9
Amostra aleatória por conglomerados: A população é dividida em grupos
Mas nossa taxonomia ainda não chegou ao …m... Temos ainda alguns conceitos
a discutir.
arterial antes e depois da medicação, então, temos que cada idoso no estudo é
10
que isso é tão importante? Porque é pela natureza dos dados, ou, como dizemos
em Estatística, pelo nível de mensuração dos dados, que saberemos quais métodos
Uma variável qualitativa é uma variável que não assume valor numérico,
mas é classi…cada em categorias (qualidades).
ser agrupadas em categorias. Alguns exemplos são: sexo, etnia, estado civil, etc.
etc.
ou contínuas.
11
Exemplos de variáveis quantitativas discretas são: número de habitantes por
domicílio, número de anos cursados com aprovação em séries escolares, etc. Já para
componente eletrônico.
idades dos dados (variáveis qualitativas). Não há nenhuma ordem natural nessas
dades dos dados (variáveis qualitativas), mas que podem ser ordenadas, embora não
surações serem numéricas e distâncias entre dois dados podem ser medidas. Entre-
tanto, o zero (0) não é natural, isto é, não indica a ausência do atributo mensurado.
12
Exemplo: temperatura em graus Celsius (0 C não indica a ausência de temper-
atura).
4. Escala Racional (ou das Razões): é a escala mais rica de mensuração, com
aula.
não-aleatório (determinístico).
Exercício 4 Suponha que você tivesse que validar a informação de que a geladeira
você intuitivamente estruturaria as fases do método estatístico para validar (ou não)
essa a…rmação?
Exercício 5 Retire de mídias (jornal, revista, internet, etc) uma matéria que você
utilizaria em sala de aula para ilustrar a presença da Estatística no dia a dia aos
seus alunos.
13
(a) Em São Paulo, a média de gasto semanal de consumo de gasolina numa
amostra de 700 proprietários de carros foi de R$ 150; 00. O governo infere a média
(b) Uma amostra de 150 residentes de Copacabana mostra que 27 destes são
funcionários públicos. Assim 18% desses 150 residentes trabalham para o governo.
(c) A média de idade de uma amostra de 250 habitantes de Santa Cruz foi de 34
anos.
(d) Numa pesquisa feita com 1000 habitantes de Campos (Rio de Janeiro), 456
disseram que já fazem suas compras com sacola ecológica pessoal. A prefeitura con-
com idade acima de 65 anos. Para isso, você como pesquisador decide selecionar
(5) Índice de Massa Corporal (IMC), que é a razão entre peso e altura em metros
elevada ao quadrado.
14
(grande risco).
15
Capítulo 2
A Análise Exploratória de Dados, como o próprio termo indica, é uma fase artesanal
dados coletados de um certo estudo. Assim, é preciso muitas vezes intuição sobre
temente escolhidos para dar voz à informação. (Aqui cabe ressaltar que, da mesma
forma que todo discurso tem uma intenção do falante por trás do que emite, tam-
bém o grá…co terá uma intencionalidade que deve ser observada a priori.) A fase
16
Tabela de Frequência para Variáveis Qualitativas
à mensuração.
de Segurança Pública (ISP) …zeram em 2009 e 2010 uma pesquisa sobre vítimas de
3002 eram do sexo feminino e 1118 eram do sexo masculino ou não identi…cado (o
gênero não consta no registro); já em 2010, de 4589 vítimas registradas, 3751 eram
Vemos que não há muito mais a oferecer como síntese. Poderíamos apenas
acrescentar mais informação, ou então usar a frequência relativa (%), como nos
exemplos abaixo:
17
Tabela de Frequência para Variáveis Quantitativas Discretas
de uma tabela que represente a frequência com que cada valor observado aparece no
sim, poderíamos sintetizar a informação dos dados através da seguinte tabela, con-
importante ter a frequência relativa pois ela é uma espécie de probabilidade empírica
e isso nos ajudará a conceber mais tarde um modelo de probabilidade para a variável
em estudo.
No. de Filhos Frequência Frequência Relativa (%)
5
0 5 20
= 0; 25 = 25%
10
1 10 20
= 0; 50 = 50%
3
2 3 20
= 0; 15 = 15%
1
3 1 20
= 0; 05 = 5%
1
4 1 20
= 0; 05 = 5%
20
Total 20 20
= 1; 00 = 100%
valo da reta real), então devemos resumir a informação através de uma tabela que
represente a frequência com que cada valor observado aparece dentro de um dado
partir de um exemplo:
18
Exemplo 3 Um pesquisador, contratado pela empresa de Telefonia Celular A, de-
seja estudar o tempo (em minutos gastos) por mês pelos seus assinantes. Para isso,
ele seleciona uma amostra aleatória de 30 clientes e obtém os seguintes dados: 102,
124, 108, 86, 103, 82, 71, 104, 112, 118, 87, 95, 103, 116, 85, 122, 87, 100, 105,
97, 107, 67, 78, 125, 109, 99, 105, 99, 101, 92.
pergunta que surge é: quantas classes utilizar? Não há resposta absoluta para essa
questão e em geral é por tentativas que escolhemos a melhor. Claro que um número
pequeno de classes não vai revelar uma boa distribuição dos dados e tampouco um
p
k= n ou então k = 1 + 3; 3 log n
Passo 3) Calcule a amplitude total dos dados (A) (a diferença entre o valor
A = 125 67 = 58.
19
A
Passo 4) Calcule a amplitude das classes (h) onde h := . Assim temos
k
58
h= = 11; 6, que arredondaremos para h = 12.
5
mais baixo que pertence a ela e o limite superior é o mais alto. Use o valor mínimo
Passo 6) De…na as 5 classes (intervalos), a saber: [67; 79), [79; 91), [91; 103),
20
esse rico material em sala de aula, pois os alunos não poderão adquirir um letramento
estatístico adequado sem aprender a interpretá-los. Nossa sugestão é que você, pro-
fessor, peça aos alunos para trazerem recortes de jornais ou revistas com grá…cos
para a sala de aula, e proponha discussões não somente sobre os seus aspectos estru-
construídos em suas escalas para gerar uma interpretação errônea dos dados co-
grá…ca no processo de análise estatística de dados e muita atenção deve ser dada à
Esse tipo de grá…co, também conhecido como grá…co de pizza, é usado quando
21
Embora vários programas de computador, como Excell, fazem os grá…cos
via compasso e esquadro a ser proposta em sala de aula aos alunos, dialogando assim
0 00
0; 729 360 = 262 26 24
ou
0; 729 2 = 4; 58
0 00
0; 812 360 = 292 19 12
ou
0; 812 2 = 5; 10
22
Grá…co em Barras para Variáveis Qualitativas ou Quantitativas Discretas
Esse tipo de grá…co tem uma certa similaridade de intenção com o grá…co em setores,
exceto pelo fato de que não estamos mais interessados em enfatizar a participação
países.
80.000
72.047
Mil 70.000
har
es 60.000 58.247
de
exe 50.000
mp
lar
es 40.000
30.000
30.000 25.467 23.848
18.343
20.000
8.941
10.000 6.551 6.281 5.697
País
Vemos que aqui a intenção não é comparar qual a fatia de participação dos
lugar geométrico de…nido para a variável qualitativa país. Portanto, qualquer ordem
23
Quando a variável é quantitativa discreta, então o lugar geométrico está bem
de…nido e as barras são construídas nesses pontos, com altura igual (ou proporcional)
à frequência observada.
Cabe observar que alguns autores distinguem grá…co em barras (barra horizontal)
de 30 de abril de 2011.
Esse tipo de grá…co é usado sobretudo quando temos observações temporais de uma
24
Evolução do preço do dólar comercial
2.5
2.0
Valor do dólar
1.5
1.0
0.5
0.0
12/98 02/99 04/99 06/99 08/99
Data
A ideia agora é representar uma …gura geométrica compacta para que possamos
Voltemos ao exemplo 3 do tempo (em minutos gastos) por mês pelos assinantes da
25
Classes Frequência
67 ` 79 3
79 ` 91 5
91 ` 103 8
103 ` 115 9
115 ` 127 5
Total 30
Esse grá…co tem a mesma proposta do histograma, isto é, mostrar onde se situam as
tomar as dezenas como os ramos e as unidades com as folhas. Assim os ramos vão
26
Observe que, girando o grá…co acima para a esquerda, temos uma ideia de his-
tograma e de como seria uma função que cobrisse a última folha de cada ramo,
avaliar a relação recíproca entre duas variáveis quantitativas de interesse. Por ex-
emplo, suponha que desejemos saber se há uma relação entre número de faltas em
sala de aula e média …nal das provas numa dada disciplina. Para isso, suponha que
dos alunos.
27
Aluno Faltas Média Final
1 8 78
2 2 92
3 5 90
4 12 58
5 15 43
6 9 74
7 6 81
Assim, cada aluno representa um par ordenado de informação (x; y), onde x
Que parece haver uma relação quase linear entre faltas e média …nal na disciplina, e
que quanto maior o número de faltas mais baixa tende a ser a média …nal e vice-versa.
Esse grá…co é de extrema importância para que possamos medir a correlação linear
28
Com os recursos de que dispõe, construa tabelas e/ou grá…cos que achar conve-
10.498; Ásia: 43.608; África: 30.335; Oceania: 8.923; Antártida: 16.500. (Fonte:
Economática.)
Divisão por empresas: Lacta: 35,4%; Nestlé: 31,6%; Garoto: 22,0%; Neug-
Ano 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001
Produção 196 220 251 294 296 305 329 313 327 327
Consumo 169 199 237 292 305 302 332 295 322 298
(Fonte: Folha de São Paulo, 24 de julho de 2002)
20, 10, 40, 25, 20, 10, 60, 15, 40, 5, 30, 12, 10, 10. Faça um histograma e um
Medidas de Posição (ou de Tendência Central), como o próprio termo indica, visam
a sintetizar o conjunto de dados em geral numa única medida em algum lugar ge-
29
ométrico central. Isso só é possível se nossas observações são de natureza quantita-
cada categoria, mas não podemos operar matematicamente com as categorias em si.
fX1 ; X2 ; X3 ; :::; XN g. Observe que em geral não temos acesso a todos os resultados
Média Aritmética
dados. Por isso ela é conhecida na Estatística como o momento de primeira ordem
30
Exemplo 4 Suponha uma amostra de 5 elementos de uma população cujos resul-
1 + 1 + 4 + 9 + 10
X5 = = 5.
5
cas representado por fx1 ; x2 ; x3 ; :::; xn g com média Xn . Seja k um número real.
por um fator k, a nova média aritmética será dada pela média aritmética anterior
(2) Seja uma amostra de n observações numéricas representada por fx1 ; x2 ; x3 ; :::; xn g
O que o resultado acima nos diz é que ao somarmos nossas observações por um
valor k, então a nova média aritmética será dada pela média aritmética anterior
31
(3) Seja uma amostra n observações numéricas representado por fx1 ; x2 ; x3 ; :::; xn g
é sempre nula. Isso comprova que a média é o ponto de equilíbrio de forças das
observações. De fato
d1 + d2 + ::: + dn = x1 Xn + x2 Xn + ::: + xn Xn
= 0
e assim
d1 + d2 + ::: + dn 0
= = 0.
n n
Com isso devemos ter cautela em sintetizar os dados com a média aritmética,
32
hador mediano. Nesses casos devemos tomar outra medida de posição, que seja
mais estável para dados atípicos, como a mediana, que veremos a seguir.
indicando que o valor xi ocorre fi vezes no conjunto de dados, com f1 +f2 +:::+fn =
A fórmula acima pode ser interpretada como uma média aritmética ponderada
X
n
Xn = xi :pi ,
i=1
cias da classe, a fórmula acima também também expressa a média dos dados, com xi
por
33
A média aritmética baseada nos dados agrupados em classe da tabela acima será
dada por
Obviamente, esse valor não é necessariamente igual à média dos dados toma-
valores sejam próximos e, em situações em que não temos acesso aos dados não agru-
pados, não nos resta outra maneira de resgatar a média dos mesmos, senão através
Mediana
É a medida que ocupa a posição central num conjunto de dados ordenados (se
centrais (se o número de elementos é par). Isto é, se de…nirmos x(k) como a k-ésima
observação ordenada em ordem crescente, isto é, x(1) x(2) x(3) ::: x(n) ,
então
x( n2 ) + x( n+2 )
2
M e = x( n+1 ) (se n é ímpar) ou M e = (se n é par).
2 2
tados são f54; 2; 35; 5; 65; 27; 9; 14; 44; 20g. Então, ordenando os dados em ordem
crescente, temos 2; 5; 9; 14; 20; 27; 35; 44; 54; 65. Como n = 10, temos
x( 10 ) + x( 10+2 ) x(5) + x(6)
2 2
Me = =
2 2
20 + 27
Me = = 23; 5.
2
34
Propriedades da Mediana (1) A mediana divide a distribuição ao meio, indi-
cando que 50% dos valores observados estão abaixo e 50% estão acima deste valor
mediano.
(2) A mediana é uma medida robusta, isto é, se abala pouco para valores ex-
tremo 100, a média passa de 5 a 20; 83, enquanto que a mediana passa de 4 a 6; 5.
a fórmula:
n
2
fac
M e = li + h
fmed
35
a classe da mediana é 91 ` 103, pois esta classe contém os elementos ordenados da
30
2
8
M e = 91 + 12 = 101; 5.
8
Moda
haja observação mais freqüente, ou seja, todos os valores aparecem apenas uma
conjunto unimodal se houver apenas uma moda; bimodal se houver duas modas;
dados coletados.
Vejamos exemplos das quatro situações descritas acima: Sejam as notas da prova
de Matemática dos alunos de quatro turmas diferentes dadas pela tabela a seguir.
média ou à mediana?
uma certa simetria, e há um único valor modal, então as três medidas-resumo são
36
Se, no entanto, a distribuição é altamente assimétrica com valores atípicos e
embora a moda também possa ser usada em certas situações nesse caso.
Se, por outro lado, o histograma da distribuição é do tipo bimodal (ou mesmo
a mediana são boas medidas de representação dos dados, pois estas se situariam
Distribuição Bimodal
Para dados agrupados em classe, existe também uma fórmula para o cálculo do
Retomando o Exemplo 5 anterior, temos que a classe modal é dada por 103 ` 115,
37
e h = 115 103 = 12. Assim a moda será dada por
1
M o = 103 + 12 = 105; 4.
1+4
X Mo = 3 X Me .
que a mediana se situa entre a média e a moda, sendo sua distância à moda o dobro
de sua distância à média (veri…que isso pela relação acima). Sua veri…cação na
prática tende a ser mais perfeita para conjunto maiores de dados, e sendo a moda
Quartis da Distribuição
partes iguais. O primeiro quartil (Q1 ) é o valor da distribuição em que abaixo dele
Sejam x(1) x(2) x(3) ::: x(n) , os dados ordenados em ordem crescente.
38
Lembrando que se as posições dos quartis acima não são valores inteiros, então
devemos fazer uma interpolação dos valores intermediários à posição. Vejamos com
o exemplo anterior.
tados são f54; 2; 35; 5; 65; 27; 9; 14; 44; 20g. Então, ordenando os dados em ordem
crescente, temos 2; 5; 9; 14; 20; 27; 35; 44; 54; 65. Como n = 10, temos
Q1 = x( 11 ) = x(2;75)
4
Com isso, o primeiro quartil se situa entre x(2) e x(3) com uma interpolação de 0; 75
= 5 + 0; 75 (9 5)
Q1 = 8
Q2 = x( 11 ) = x(5;5)
2
Com isso, o segundo quartil se situa entre x(5) e x(6) com uma interpolação de 0; 5
= 20 + 0; 5 (27 20)
Q2 = 23; 5,
Q3 = x( 33 ) = x(8;25)
4
39
Com isso, o terceiro quartil se situa entre x(8) e x(9) com uma interpolação de 0; 25
= 44 + 0; 25 (54 44)
Q3 = 46; 5.
Para valores agrupados em classe, temos a seguinte fórmula para o k-ésimo quartil
(k = 1; 2; 3):
n
k 4
fac
Qk = li + h
fQk
5 anterior, temos que a classe do primeiro quartil é aquela que contém a observação
30
na posição 4
= 7; 5, ou seja, a classe 79 ` 91, pois esta contém as informações
101; 5.
40
Temos uma dupla resposta a esta pergunta: serve para reconhecer os dados
da distribuição (Q1 e Q3 ).
3
Outliers da distribuição são os valores fora do intervalo Q1 2
IQ; Q3 + 32 IQ .
a seguir: 28, 43, 48, 51, 43, 30, 72, 44, 48, 33, 45, 37, 37, 42, 27, 47, 42, 23, 46,
Colocando os dados (n = 27) em ordem temos: 17, 19, 20, 23, 27, 28, 30, 33,
35, 37, 37, 38, 39, 42, 42, 43, 43, 44, 45, 45, 45, 46, 47, 48, 48, 51, 72.
Temos
Q1 = x( 28 ) = x(7) = 30,
4
Q2 = M e = x( 28 ) = x(14) = 42 e
2
Q3 = x( 84 ) = x(21) = 45.
4
Assim
IQ = Q3 Q1 = 45 30 = 15.
41
O intervalo dos valores típicos é dado por
3 3 3 3
Q1 IQ; Q3 + IQ = 30 15; 45 + 15
2 2 2 2
= [7; 5; 67; 5]
Assim vemos que o conjunto de dados possui um único outlier, o de valor 72,
valor esse considerado atípico e passível de uma análise mais minuciosa. Poderíamos
perguntar: Que dia foi esse? Há explicações plausíveis para esse valor à luz de algum
fator?
Há toda uma teoria so…sticada na Estatística para o tratamento dos outliers, mas
está fora de nosso escopo ir a fundo nessas questões, visto que nosso curso é voltado
de cima da distribuição.
grá…co abaixo, referente aos dados sobre vendas tratados no exemplo 8, representa
os quartis (30, 42 e 45) que de…nem a caixa (box) que contém 50% da informação
central dos dados coletados; os valores mínimos e máximos não-atípicos (17 e 51) e
42
Box-Plot
que o primeiro. Portanto, o histograma deve ser mais alto no segundo intervalo que
isso?)
Exercício 12 Dados A = f24; 26; 28; 30; 32; 34; 36g e B = f15; 20; 25; 30; 35; 40; 45g,
determine suas médias aritméticas, suas medianas e suas modas e diga se, com base
Exercício 13 Dado o conjunto A = f85; 82; 97; 88; 89; 97; 89; 93; 88; 97; 96; 97; 98; 93; 97g
campo de uma dada região. Para isto ele seleciona uma amostra aleatória de 10
trabalhadores, obtendo as seguintes idades: 42, 35, 27, 21, 55, 18, 27, 30, 21, 24.
Pede-se:
43
(c) A mediana das idades.
Exercício 15 Dê uma situação prática onde você acha que a mediana é uma medida
uma única medida de posição ou tendência central, qual dentre elas (média, mediana
ou moda) você adotaria nos casos abaixo, justi…cando (em alguns casos mais de uma
escolha é possível):
(d) Se o livro tem 500 páginas, como você estimaria o total de erros esperado no
livro?
44
(e) Quais os quartis das distribuição? Há evidência de dados atípicos (outliers)?
Exercício 19 Uma amostra de idades de 100 indivíduos foi retirada de uma certa
Idades Frequência
20 ` 30 10
30 ` 40 16
40 ` 50 27
50 ` 60 32
60 ` 70 15
valores situados entre dados coletados, as medidas de dispersão buscam avaliar quão
pois podemos ter dois conjuntos de dados com as mesmas medidas de posição, mas
com dispersões diferentes, fazendo com que os valores qualitativos dessas medidas
Há uma piada irônica que diz que o estatístico é o pro…ssional que dirá que
uma pessoa, ao se sentar numa cadeira com duas placas de metal, uma aquecida a
torno da média. Uma cadeira com duas placas de metal, uma aquecida a 35 C e
45
os dois valores de 30 C não são qualitativamente equivalentes. Há portanto que se
Amplitude Total
A Amplitude Total (A) é de…nida como a diferença entre o maior e o menor valor
A = x(n) x(1) .
Como se trata de uma medida bruta (pois só leva em consideração os dois valores
Variância
A variância representa a média das distâncias quadráticas entre cada valor observado
e a média do conjunto dos dados. Vimos anteriormente que a média das distâncias
orientadas entre cada valor observado e a média do conjunto dos dados é sempre
nula. Portanto a média das distâncias orientadas nada nos informa sobre a dispersão
dos dados. A ideia portanto é elevar ao quadrado as distâncias, pois nesse caso as
somas quadráticas não se anulam, a menos que todo valor observado seja igual à
46
PN
2 2 i=1 (Xi )2
A variância da população ( ) é de…nida como = ,
N
com a média da população.
Pn 2
2 2 i=1 xi Xn
A variância da amostra (S ) é de…nida como S = ,
n 1
com Xn a média da amostra.
A essa altura você deve estar se perguntando por que na fórmula da variância da
ao …nal desse curso que a variância da amostra não acertaria em média a variância
fórmula um pouco diferente. Claro que se a amostra é grande (por exemplo, maior
do que 30 observações), dividir por n ou por n 1 não fará muita diferença, mas se
As fórmulas acima podem ser reescritas abrindo o quadrado dos binômios como
PN
2 i=1 Xi2 2
= e
N
Pn
2 i=1 x2i nXn2
S = .
n 1
47
Propriedades da Variância (1) Multiplicando-se todos os valores de uma var-
iável por uma constante, a variância do conjunto …ca multiplicada pelo quadrado
dessa constante.
Para ver isso, suponha que fx1 ; x2 ; x3 ; :::; xn g tenha média Xn .e variância S 2 .
Lembre agora que o conjunto fkx1 ; kx2 ; kx3 ; :::; kxn g terá média k Xn . Assim a
Para ver isso, suponha que fx1 ; x2 ; x3 ; :::; xn g tenha média Xn .e variância S 2 .
Assim, vemos que somar ou diminuir os dados por uma constante …xada não
(3) Pelas fórmulas das variâncias tanto populacional quanto amostral, vemos
que a variância é sempre um número real não-negativo. Ela será nula, se e somente
48
Novamente cabe ressaltar aqui que se os dados são apresentados em tabelas de
por:
Pn 2
2 i=1 xi Xn :fi
S = .
n 1
Desvio-Padrão
metro quadrado. Para retornar à medida original é preciso extrair a raiz quadrada
rP
N
p
2 i=1 (Xi )2
O desvio-padrão da população ( ) é de…nida como = = .
N
s
Pn 2
p i=1 xi Xn
O desvio-padrão da amostra (S) é de…nida como S = S2 = .
n 1
stante a cada valor de um conjunto de dados, o desvio padrão não se altera. Isso
49
decorre do fato de que somando-se ou subtraindo-se uma constante a todos os val-
não se alterará.
módulo da constante.
Vimos que o conjunto fkx1 ; kx2 ; kx3 ; :::; kxn g tem variância k 2 S 2 . Assim o novo
p
desvio-padrão será dado por k 2 S 2 = jkj S.
Coe…ciente de Variação
alta dispersão. Esses valores podem ser altos ou baixos devido à magnitude dos dados
dos dados comparativamente à escala média dos dados. Tal medida é denominada
Assim temos:
S S
CV = ou CV = 100%.
X X
50
valor médio. Assim, uma pequena dispersão absoluta pode ser, na verdade, con-
tação desse tipo são evitados. Quando o CV tem uma medida em percentual abaixo
de 50%, dizemos que os dados são relativamente homogêneos; acima de 50% os da-
dos são considerados heterogêneos, mas caso o coe…ciente de variação seja superior
abilidade.
Exemplo 9 Suponha duas amostras de preços de fechamento atingido por dois pa-
Ações A 56 56 57 58 61 63 63 67 67 67
Ações B 33 42 48 52 57 67 67 77 82 90
Pede-se:
Então temos:
56 + 56 + ::: + 67 + 67 615
XA = = = 61; 5
10 10
33 + 42 + ::: + 82 + 90 615
XB = = = 61; 5
10 10
61 + 63
M eA = = 62
2
57 + 67
M eB = = 62
2
51
M oA = 67
M oB = 67
AA = 67 56 = 11
AB = 90 33 = 57
52
P10 2
i=1 xi XA 188; 50
SA2 = = = 20; 944:::
10 1 9
P10 2
i=1 xi XB 3:018; 50
SB2 = = = 335; 3888:::
10 1 9
p
SA = 20; 944::: = 4; 5765
p
SB = 335; 3888::: = 18; 3136
SA 4; 5765
CVA = = = 0; 0744
XA 61; 5
ou
CVA = 7; 44%
SB 18; 3136
CVB = = = 0; 2978
XB 61; 5
ou
53
Exercício 20 Esboce os histogramas de três variáveis (X, Y e Z) com a mesma
histograma, a média tem maior valor qualitativo para sintetizar o conjunto de dados?
campo de uma dada região. Para isto ele seleciona uma amostra aleatória de 10
trabalhadores, obtendo as seguintes idades: 42, 35, 27, 21, 55, 18, 27, 30, 21, 24.
Pede-se:
mogêneo ou heterogêneo?
Erros Frequência
0 25
1 20
2 3
3 1
4 1
neo ou heterogêneo?
54
levantamento em 10 cidades, foram obtidos os valores (codi…cados) da tabela abaixo:
Cidade A B C D E F G H I J
Investimento 20 16 14 8 19 15 14 16 19 18
Pede-se:
(b) A moda.
(c) A mediana.
(d) O desvio-padrão.
Mês Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez
Índice 69 53 41 46 50 40 41 40 42 38 42 46
Pede-se:
Exercício 25 Suponha que você esteja interessado em avaliar qual de dois exper-
estatística apropriada, qual dos experimentadores você diria ser mais preciso?
Exercício 26 Uma amostra de idades de 100 indivíduos foi retirada de uma certa
55
Idades Frequência
20 ` 30 10
30 ` 40 16
40 ` 50 27
50 ` 60 32
60 ` 70 15
indivíduos da amostra.
tica, pois como discutimos antes, uma distribuição altamente assimétrica enfraquece
o valor da média como medida síntese dos dados, pois a média é abalada por valores
extremos. Além disso, muitos todos testes estatísticos para tomada de decisão sob
Normal, que estudaremos mais adiante nesse curso. Daí a importância desse tópico
em Estatística.
Toda distribuição pode ser classi…cada como simétrica, assimétrica à direita (ou
casos:
Simétrica (Xn = M ed = M o)
56
Assimétrica à Direita (M o < M ed < Xn )
Há várias medidas de assimetria, mas nesse curso nos ateremos apenas ao Coe-
Xn Mo
As =
S
amostra.
Decisão:
Além disso:
57
(i) se 0; 15 < jAs j 1, a assimetria é considerada moderada;
Medidas de Curtose
4
K= 2
2
onde
Pn 4
i=1 xi Xn
4 =
n
e
Pn 2
i=1 xi Xn
2 =
n
Decisão:
58
(a) Se K < 3, então a distribuição é platicúrtica.
Observe que, se a distribuição é platicúrtica, isso indica que há uma grande vari-
seguintes resultados: 5, 15, 15, 15, 25, 25, 25, 25, 35, 35.
Assim, temos:
5+3 15 + 4 25 + 2 35 220
Xn = =
10 10
Xn = 22.
M o = 25
Assim
Xn Mo 22 25
As = = = 0; 3162
S 9; 4868
59
Analisemos agora os dados, quanto ao grau de achatamento (curtose).
P10 4
i=1 xi X10
4 =
10
(5 22)4 + 3 (1522)4 + 4 (25 22)4 + 2 (35 22)4
=
10
83:521 + 7:203 + 324 + 57:122
=
10
148:170
=
10
4 = 14:817
P10 2
i=1 xi X10
2 =
10
(5 22)2 + 3 (1522)2 + 4 (25 22)2 + 2 (35 22)2
=
10
289 + 147 + 36 + 338 810
= = =
10 10
2 = 81
Assim
4 14:817 14:817
K= 2
= 2 =
2 (81) 6:561
K = 2; 2583
samento Lógico (EPL), de Longeot, entre sujeitos dos cursos de graduação em Psi-
60
Média: 22; 30 Mediana: 22; 00
Moda: 22; 00 1o Quartil: 20; 00
Sexo Masculino:
3o Quartil: 25; 00 Variância: 7; 51
Mínimo: 17; 00 Máximo: 26; 00
ti…que.
ti…que.
Exercício 28 Houve uma denúncia por parte dos operários de uma indústria de
que, toda vez que ocorreria um acidente em uma seção da indústria, ocorreriam
acidentes não estavam ocorrendo ao acaso. Para veri…car esta hipótese, foi feita
uma contagem do número de acidentes por hora durante um certo número de dias
61
(e) Avalie os dados quanto à assimetria.
Coe…ciente de Correlação
para um entendimento dessa possível in‡uência de uma variável sobre outra, mas
medida comumente utilizada para se avaliar a correlação linear entre duas variáveis
quantitativas.
fumados por dia tem relação com a capacidade pulmonar, então x é o número de
Pn
i=1 xi Xn : yi Yn
r = qP qP
n 2 n 2
i=1 xi Xn i=1 yi Yn
ou então de forma mais simpli…cada para o cálculo:
Pn P P
n i=1 xi :yi ( ni=1 xi ) : ( ni=1 yi )
r=q P P q P P
2 2
n ni=1 x2i ( ni=1 xi ) n ni=1 yi2 ( ni=1 yi )
62
onde Xn e Yn são as médias da covariável e da variável resposta, respectivamente.
A correlação pode ser positiva, negativa ou nula. Vejamos com exemplos grá…cos
os três casos:
Vemos que na correlação linear positiva, a melhor reta que passa por entre os
pontos tem coe…ciente angular positivo, indicando que, quando a variável explicativa
tivo acima, a nota do vestibular tem correlação positiva com a média das notas da
63
Vemos que na correlação linear negativa, a melhor reta que passa por entre os
pontos tem coe…ciente angular negativo, indicando que, quando a variável explica-
como uma nebulosa, não havendo qualquer indicação de uma melhor reta que passe
próximo aos pontos. Nesse exemplo, não há qualquer correlação entre altura do
de 25 indivíduos.
reta de coe…ciente angular negativo passando muito próximo aos pontos amostrais.
(Se r = 1, então essa reta passa exatamente sobre todos os pontos, ou seja, os
64
se comportam como uma nebulosa ou têm comportamento fortemente não linear.
de coe…ciente angular positivo passando muito próximo aos pontos amostrais. (Se
r = 1, então essa reta passa exatamente sobre todos os pontos, ou seja, os pontos
são colineares.)
r2 = ( 0; 87)2 = 0; 7569 = 75; 69% nos informa que 75; 69% da variabilidade da
variável resposta é explicada pela covariável em estudo, e que, portanto, 24; 31%
(100% 75; 69%) da variabilidade da variável resposta não é explicada pela variável
É preciso, no entanto, ressaltar que mesmo uma alta correlação entre duas var-
iáveis não signi…ca necessariamente uma relação de causa-efeito entre elas! Relações
volvidas, pois poderíamos ter por exemplo uma alta correlação numérica entre grau
de calvície e grau de miopia, sem no entanto ter qualquer relação causal médica
A Reta de Regressão
Mais do que medir o grau de correlação linear entre duas variáveis quantitativas,
interessa-nos também obter a equação da melhor reta que passa pelos pontos ob-
servados, pois através dessa reta podemos estimar a variável resposta para valores
Diferencial, pelo uso da derivação parcial e sua demostração está além do escopo
65
desse curso introdutório.
Depois de constatar que existe uma correlação linear signi…cante, podemos então
escrever uma equação linear que descreva a relação entre as variáveis x e y. Essa
y^i = axi + b
observado da variável resposta e seu valor estimado pela reta de regressão, isto é,
minimizar
X
n X
n
2
X
n
e2i = (yi y^i ) = (yi axi b)2 ,
i=1 i=1 i=1
66
e
b = Yn a:Xn .
reta de regressão.
dos alunos em sala de aula e a média …nal de suas provas em Matemática num
dado ano letivo. Para isso, selecionamos aleatoriamente 7 alunos para a amostra,
dado por:
67
Pelo diagrama de dispersão, vemos que há indicíos de uma boa correlação linear
negativa entre número de faltas e média …nal, indicando que quanto mais faltas tem
um aluno, mais a sua média …nal tende a decrescer. Precisamos agora medir a
correlação entre as variáveis em estudo. Para isso, prepararemos uma tabela com
68
r= 0; 975 ou r = 97; 5%
Vemos então uma alta correlação negativa entre as duas variáveis em estudo,
é dado por r2 = ( 0; 975)2 = 0; 9506 = 95; 06%. Assim apenas 4; 94% das notas
y^i = axi + b
onde
P7 P7 P7
7
i=1 x i :y i i=1 x i : i=1 yi
a = P7 P 7 2
7 i=1 x2i i=1 xi
7 3:751 57 516
=
7 579 572
3:155
=
804
a= 3; 924
b = Y7 a:X7
516 57
= ( 3; 924) :
7 7
b = 105; 667
De posse desta reta, podemos estimar valores de média …nal para números de
faltas não observadas na amostra. Por exemplo, qual seria a média …nal esperada
69
para um aluno que tivesse 4 faltas no ano letivo? Teríamos então
= 89; 97
Ou seja, esperaríamos que um aluno com 4 faltas obtivesse média …nal de 89; 97.
para certo tipo de indústria em certas regiões é um processo difícil e custoso. Como
outra variável de medida mais fácil e que esteja linearmente relacionada com ela.
(a) Com base num critério estatístico, qual das variáveis (potência instalada ou
Justi…que solidamente.
(b) Tendo escolhido a variável que melhor estima a capacidade de produção in-
Exercício 30 Com o objetivo de veri…car até que ponto o "status"da relação amorosa
- casamento ou namoro - in‡ui na percepção do amor por parte dos jovens, foi apli-
cada uma escala de atitudes em 16 pares, sendo oito compostos de namorados e oito
de casados. Uma das suposições das autoras era que entre casados haveria maior
70
Comparação entre Homens e Mulheres Casados quanto ao Grau de Romantismo:
Pede-se:
iável.
iável.
tado 74.
tado 71.
71
Capítulo 3
Probabilidade
Suponha que vamos realizar um experimento cujo resultado não pode ser predito
de…nição:
= f(Ca; Ca); (Ca; Co); (Co; Ca); (Co; Co)g, onde o resultado (a; b) ocorre se a
72
Exemplo 15 Se o experimento consiste em lançar dois dados e observar as faces
superiores, então
8 9
>
> (1; 1) (1; 2) (1; 3) (1; 4) (1; 5) (1; 6) >
>
>
> >
>
>
> (2; 1) (2; 2) (2; 3) (2; 4) (2; 5) (2; 6) >
>
< =
(3; 1) (3; 2) (3; 3) (3; 4) (3; 5) (3; 6)
=
>
> (4; 1) (4; 2) (4; 3) (4; 4) (4; 5) (4; 6) >
>
>
> >
>
>
> (5; 1) (5; 2) (5; 3) (5; 4) (5; 5) (5; 6) >
>
: ;
(6; 1) (6; 2) (6; 3) (6; 4) (6; 5) (6; 6)
segundo dado.
é, = [0; 1).
patíveis se A \ B = ;.
associado. É preciso ter em mente que para todo experimento é possível estabelecer
73
uma in…nidade de espaços amostrais, todos legítimos, pois o espaço amostral deve
ser o conjunto que contém todos os resultados possíveis, mas não há necessidade
nula para os demais pontos se houver. Claro que não há necessidade de se pecar por
excesso, se podemos reconhecer o espaço amostral mínimo, mas isso nem sempre é
possível, como o exemplo 16, que se presta a vários possíveis espaços amostrais e
É preciso lembrar também que toda escolha do espaço amostral induz uma medida
de probabilidade diferente. Por exemplo, se temos uma urna com três bolas brancas
cor, então poderíamos ter os seguintes espaços amostrais, dentre outros possíveis:
as bolas como distinguíveis e, nesse caso, cada ponto tem a mesma probabilidade
1
5
, construindo assim um espaço amostral de elementos equiprováveis. Portanto, se
o evento for "retirar uma bola branca", então esse evento será dado por fbg pelo
a mesma chance de 35 .
74
3.1.1 De…nição e Propriedades das Probabilidades
#A
P (A) =
#
elementos de são igualmente prováveis, ou seja, têm o mesmo peso. Este é o caso
Exemplo 17 Sete pessoas entram juntas num elevador no andar térreo de um ed-
maneira aleatória com cada andar (1; 2; :::; 10) tendo a mesma probabilidade de ser
nA
P (A) = lim
n!1 n
75
Observação 3 O limite acima não pode ser entendido como um limite matemático,
pois dado " > 0 não há garantia de que existe n0 2 N tal que para todo n n0 se
tenha
nA
P (A) < ".
n
nA
É improvável que P (A) " para n N (grande), mas pode acontecer.
n
Outra di…culdade do conceito freqüentista é que o experimento nunca é realizado
seguinte forma: O apresentador do programa lhe mostra três portas, uma das quais
esconde um carro como prêmio e as outras duas não oferecem nada e o colocam
fora do jogo. O que acontece? Você escolhe uma porta e o apresentador abre uma
outra porta vazia não escolhida por você. Assim, ainda há a chance de você ganhar
o carro. Mas agora lhe é oferecida a oportunidade de mudar de porta! O que você
deve fazer para maximizar a chance de acerto? Ficar com a mesma porta escolhida;
mudar para a outra porta; ou qualquer das duas estratégias, por ser indiferente?
pelo menos uma ideia vaga de como se comporta o fenômeno de nosso inter-
76
qual é a probabilidade de que o Vasco ganhe o próximo campeonato? Cer-
outra condição externa, são elementos que só algumas pessoas conhecem e que
poder¬am nos dar uma ideia mais exata desta probabilidade. Esta forma sub-
Então, para alguém no Rio de Janeiro, sem qualquer conhecimento prévio, podemos
Nikolaevich Kolmogorov.
Não nos preocuparemos com o problema de como de…nir probabilidade para cada
foi erigida por Kolmogorov, responsável pela base matemática sólida da teoria.
A1) P (A) 0.
77
A2) P ( ) = 1.
para dar conta dos problemas reais de Probabilidade, será mais conveniente
supor -aditividade:
1 X
1
A3’) Se A1 ; A2 ; ::: são disjuntos dois a dois, então P [ Ai = P (Ai ).
i=1
i=1
mas:
Teorema 1 P (;) = 0.
sariamente que A = ;! Um evento pode ter probabilidade nula e não ser impossível.
entanto um evento pode ter probabilidade 1 e não ser o evento certo . É o que
= ! = (x; y) : x2 + y 2 1
78
Como todo ponto é aleatoriamente escolhido, a probabilidade de um ponto cair numa
região do círculo deveria ser a razão entre a área dessa região e a área do círculo
SA
P (A) = ,
com SA a área da região de…nida pelos pontos de A. Mas então, todo evento ele-
mentar desse espaço amostral tem probabilidade nula, pois se A = f(a; b)g, então
SA = 0, e consequentemente
0
P (A) = = 0.
No entanto A 6= ?. Além disso, observe que todo experimento terá como um resul-
tado um ponto do círculo unitário, que tinha probabilidade nula antes de ele ocorrer.
Seja agora o evento B como sendo o conjunto de pontos do círculo unitário tais
SB
P (B) = = = 1,
B é um evento quase-certo, pois embora possamos obter um ponto do tipo (a; a) que
79
Teorema 4 Sejam A e B . Se A B, então
O que o teorema acima nos informa é que a probabilidade da união de três even-
tos é dado pela soma das probabilidades da ocorrência individual deles, retirada da
soma das probabilidades de ocorrerem dois a dois e somada com a chance de eles
sim, a probabilidade da união de n eventos será dada pela soma das probabilidades
individuais, menos a soma das probabilidades dois a dois, mais a soma das probabili-
dades dos eventos tomados três a três, menos a soma das probabilidades dos eventos
tomados quatro a quatro, e assim por diante. Assim, quando temos um número par
Então
n X
n X X
P [ Ai = P (Ai ) P (Ai \ Aj ) + P (Ai \ Aj \ Ak )
i=1
i=1 i<j i<j<k
X
P (Ai \ Aj \ Ak \ Al ) + ::: + ( 1)n+1 P (A1 \ A2 \ ::: \ An )
i<j<k<l
80
Observação 5 (Paradoxo de Bertrand) O Paradoxo de Bertrand nos mostra
Seja um triângulo equilátero inscrito num círculo unitário. Uma corda do círculo
lado do triângulo?
circunferência. Então p = 31 .
A corda é obtida pela perpendicular ao diâmetro que passa pelo ponto. Então p = 21 .
81
Vejamos os seguintes exemplos para aplicação dos resultados obtidos.
Exemplo 21 Suponha que dois dados sejam lançados. Qual a probabilidade de que
uma urna. Qual a probabilidade de que a primeira e a última bolas sejam brancas?
Exemplo 23 Sete pessoas entram juntas num elevador no andar térreo de um ed-
maneira aleatória com cada andar (1; 2; :::; 10) tendo a mesma probabilidade de ser
82
(a) ser de Quebec ou falar francês?
mostre que
P (E \ F ) P (E) + P (F ) 1.
Exemplo 31 Suponha que n homens presentes numa festa joguem seus chapéus no
Mostre que a probabilidade de que nenhum dos n homens selecione o seu próprio
chapéu é
1 1 1 ( 1)n
+ ::: + .
2! 3! 4! n!
dos paus, ouros, copas e espadas. Cada naipe tem 13 cartas com os símbolos 2, 3, 4,
83
..., 10, J, Q, K, A. Uma mão de pôquer consiste de 5 cartas extraídas do baralho, sem
probabilidade de se extrair:
P (A \ B)
P (A j B) = , A . (3.1)
P (B)
exemplo,
P (Ac j B) = 1 P (A j B).
dade condicional de
84
(a) pelo menos um dos números ser 6;
P (A \ B) = P (B):P (A j B)
= P (A):P (B j A)
(b) P (A1 \ A2 \ ::: \ An ) = P (A1 ):P (A2 j A1 ):P (A3 j A1 \ A2 ):::P (An j A1 \
de se retirar 3 reis. (Use o teorema acima para resolver o problema e compare com
An .
n
B = [ (Ai \ B) .
i=1
85
Como os Ai são disjuntos, então os Ci = Ai \B são disjuntos. Com isto podemos
X
P (B) = P (Ai ):P (B j Ai ) (3.2)
i
para todo B .
P (Ai )P (B j Ai )
P (Ai j B) = X . (3.3)
P (Aj ):P (B j Aj )
j
Exemplo 35 Seja uma caixa contendo 3 moedas: duas honestas e uma de duas
moeda ter sido a de duas caras, dado que o resultado …nal foi cara?
Exemplo 37 Pedro quer enviar uma carta à Marina. A probabilidade de que Pedro
probabilidade de que o carteiro a entregue é de 0,9. Dado que Marina não recebeu a
86
Exemplo 38 Uma moeda é lançada. Se ocorre cara, um dado é lançado e o seu
resultado é registrado. Se ocorre coroa, dois dados são lançados e a soma dos pontos
4 têm dois anéis de esmeralda. Escolhe-se um cofre ao acaso, abre-se um dos com-
cada questão tem cinco respostas possíveis, das quais exatamente uma é correta. O
estudante seleciona a resposta correta se ele sabe a resposta. Caso contrário, ele
(a) Qual a probabilidade de que o estudante escolha a resposta correta para uma
dada questão?
(b) Se o estudante escolhe a resposta correta para uma dada questão, qual a
3.1.3 Independência
casticamente) independentes se
P (A \ B) = P (A):P (B).
87
Observação 6 Eventos de probabilidade 0 ou 1 são independentes de qualquer outro.
ao menos tenha probabilidade zero). Isso …ca claro se pensarmos que P (A) = p > 0
P (A \ B) P (?) 0
P (A j B) = = = = 0 6= p = P (A) .
P (B) P (B) q
Outra maneira de justi…car esse fato é pensar que se A e B não têm nada em
nula, o que reduz uma chance inicial desse outro evento ocorrer a zero. Ou seja,
para que dois conjuntos sejam independentes eles necessitam potencialmente ter algo
exemplo a seguir.
face cara?
(e também Ac e B, e ainda Ac e B c ).
88
Prova. (Em aula.)
para todo i; j 2 I, i 6= j.
ou estocasticamente) independentes se
para todo 1 i1 < i2 < ::: < im n, para todo m = 2; 3; :::; n (isto é, se todas as
são independentes.
89
3.2 Lista de Exercícios
probabilidade que seu paciente esteja com o vírus HIV. Para con…rmar, pede-lhe
que faça um exame que dá positivo em 70% das vezes que o paciente de fato tem a
doença e dá negativo em 65% das vezes que o paciente não tem de fato a doença.
Pergunta-se: Dado que o teste foi positivo, qual a probabilidade de que o paciente
Exercício 35 Suponha que uma caixa contenha 5 moedas e que cada moeda tenha
uma probabilidade diferente de dar cara. Seja pi a probabilidade de sair cara, quando
Resp.: 3=4.
Exercício 36 Dois dados são lançados. Seja A1 = fface ímpar no primeiro dadog,
tos são independentes dois a dois? Eles são conjuntamente independentes? Resp.:
Sim; Não.
Exercício 37 Uma moeda honesta é lançada até que uma cara ocorra ou então até
90
que três lançamentos sejam feitos. Qual a probabilidade de que a moeda deva ser
jogada 3 vezes se se sabe que o primeiro lançamento foi coroa? Resp.: 1=2.
Exercício 38 Prove que se A e B são eventos tais que P (A) > 0, P (B) > 0 e
1=2, calcule P (A [ B), P (Ac [ B c ) e P (Ac \ B). Resp.: 2=3, 5=6 e 1=3.
aproximadamente 0; 65.
comum (52 cartas). Calcule a probabilidade de a primeira carta ser uma dama e a
Exercício 42 Quantas pessoas você deve intrevistar para ter probabilidade igual ou
superior a 0; 5 de encontrar pelo menos uma que aniversarie hoje? Resp.: 253
novo no lago. Dois dias após, você captura 20 peixes no mesmo lago e constata que
dois desses peixes haviam sido marcados por você. Se o lago possui k peixes, qual
era a probabilidade de, capturando 20 peixes, encontrar dois peixes marcados? Resp.:
1
10 k 10 k
.
2 18 20
91
Exercício 45 Qual a probabilidade de, em um grupo de 4 pessoas:
(c) duas terem um mesmo signo, e as outras duas outro signo? Resp.: 11=576.
(d) três terem um mesmo signo, e a outra outro signo? Resp.: 11=432.
3.3 Conceito
obtido. Então = f(Ca; Ca); (Ca; Co); (Co; Ca); (Co; Co)g. Se de…nirmos X =
X(! 1 ) = 2;
X(! 2 ) = X(! 3 ) = 1;
X(! 4 ) = 0.
X(!) = ! 2 .
92
Exemplo 46 Joga-se um dado e observa-se a face superior. Então = f1; 2; 3; 4; 5; 6g
X(!) = !.
uma função real de…nida no espaço tal que o conjunto [! 2 : X(!) x] (daqui
para frente escrito de forma simpli…cada [X x]) é evento aleatório para todo x 2 R;
isto é,
X: !R
Exemplo 47 Sejam = f1; 2; 3; 4g e A = f;; f1; 2g; f3; 4g; g e considere os con-
não é.
por
Exemplo 48 Duas moedas honestas são lançadas. Seja a variável X que conta o
X e represente-a gra…camente.
93
Exemplo 49 Seja um experimento que consiste em selecionar um ponto no círculo
1. P (X > a) = 1 P (X a) = 1 FX (a)
2. P (a < X b) = P (X b) P (X a) = P (X b) P (X a) =
FX (b) FX (a)
= FX (b ) FX (a).
94
6. P (a X b) = P (a < X b) + P (X = a)
cional ao próprio ponto. Seja X a variável aleatória que representa a parte inteira
variável aleatória X.
mento. Pede-se:
variável aleatória X.
R tal que X(!) 2 fx1 ; x2 ; :::g para todo ! 2 . A função p(xi ) de…nida por
[
Observação 9 Note que [X x] = [X = xi ] e assim
i:xi x
X X
F (x) = P (X = xi ) = p(xi ).
i:xi x i:xi x
95
Além disso, observe que
e
X
1
p(xi ) = 1. (3.7)
i=1
atirar até atingir o alvo pela primeira vez. Seja X a variável aleatória que representa
(3.6) e (3.7).
(b) A probabilidade de serem necessários cinco tiros para que ele acerte o alvo.
distribuição FX (x) é contínua. Isto é, se existe uma função fX (x), dita função de
de modo que
Zx
FX (x) = fX (t)dt.
1
96
Observação 10 Pelo Teorema Fundamental do Cálculo, observe que
dFX (x)
fX (x) = .
dx
P (Z > 41 jZ 3
4
).
é contínua, mas sua derivada é zero em quase todos os pontos, isto é, exceto em um
só não é válida num conjunto de pontos que tem probabilidade zero, às vezes também
97
referido como de medida nula.) Em outras palavras, X é singular se, e somente se,
De…nição 14 Uma variável aleatória X é dita mista se tem partes nas diferentes
mistura de parte contínua com parte discreta, pois, como dissemos, a parte singular
raramente ocorre.)
Obtenha:
(c) P (X = 1);
admite a decomposição
F = 1 Fd + 2 Fac + 3 Fs
singular de X, e 1 + 2 + 3 = 1 com 1 0, 2 0e 3 0.
98
Exemplo 57 Seja X uma variável com função de distribuição
8
< 0, x < 2
1
FX (x) = + x+2 , 2 x<0
: 34 1 8 x
4
+ 4 (1 e ), x 0
FY (y) = P fY yg = P fg(X) yg
FY (y) = P fX 2 By g
= PX fBy g
função mensurável de X.
se simples, pois
X
pY (y) = pX (xi )
i:g(xi )=y
(b) Quando X é contínua, o problema é mais complexo pois Y pode ser discreta,
99
Exemplo 58 Seja uma variável aleatória discreta, com função de probabilidade
jp k
x
dada por P (X = x) = 12 para x = 1; 2; 3; ::: Seja Y = X , a parte inteira
p
de X. Qual a função de probabilidade da variável aleatória Y?
Exemplo 59 Seja X uma variável aleatória contínua com função de densidade dada
por
( 1
, 2 x 5
fX (x) = 7
0, caso contrário
Encontre a densidade de Y = X 2 .
Exercício 46 Mostre que se X é uma v.a. do tipo contínuo com função de densi-
(b) FX (0) = 12 ;
100
Mostre que F é de fato uma função de distribuição e calcule:
(a) P (X > 81 )
Exercício 48 Suponha que X seja uma variável aleatória com f.d.p. dada por
1
fX (x) = , 1<x<1
2(1 + jxj)2
probabilidade
10e 10z , z > 0
fZ (z) =
0, z 0
1 p
y
fY (y) = p e 1(0;1) (y).
2 y
Pede-se:
101
(a) Classi…car a v.a. X, segundo o critério discreto, contínuo ou misto, justi…-
cando.
por
x
FX (x) = C1 + C2 para 1<x<1
(jxj + 1)
Pede-se:
Exercício 53 Seja X uma variável aleatória positiva com f.d.p. dada por
3x
fX (x) = 3e ; x>0
1
Obtenha o modelo de probabilidade da variável aleatória Y = .
X +1
f.d.p.
x2
f (x) = Cxe , x 0
102
c
Exercício 56 Suponha que a variável X tenha densidade f (x) = para x > 1 e
x4
f (x) = 0, caso contrário, onde c é uma constante. Pede-se:
(a) o valor de c;
da variável aleatória X;
Pede-se:
natureza de X.
3
(c) Calcular P (X 2
jX < 4).
Pede-se:
103
(b) Classi…que a v.a. X conforme seja discreta, contínua ou mista e obtenha
e singular.
2X, se 0 X 2
Y =
2X + 8, se 2 < X 4
104
Capítulo 4
Esperança Matemática
4.1 De…nição
(d) Se X é uma variável aleatória discreta tomando valores no conjunto fx1 ; x2 ; x3 ; :::g
X
1
E(X) = xi p(xi ).
i=1
105
(e) Se X é uma variável aleatória contínua com função de densidade de probabilidade
fX (x), então
Z1
E(X) = xfX (x)dx
1
então
X
1 Z1 Z1
E(X) = xi p(xi ) + xfX (x)dx + xdFs (x).
i=1 1 1
primeira vez. Seja X a variável que conta o número de lançamentos até a ocor-
Exemplo 62 Suponha que X seja uma variável aleatória com f.d.p. dada por
C(9 x2 ), 3 x 3
f (x) =
0, caso contrário
às seguintes propriedades:
106
Prova. (Em aula.)
FX . Então
Z1 Z1
E(X) = (1 FX (x))dx = P (X > x)dx.
0 0
b
f (x) =
[b2 + (x M )2 ]
E['(X)] '[E(X)].
isso.)
107
Exemplo 64 Pela desigualdade de Jensen, temos, por exemplo, que
De…nição 16 Seja X uma variável aleatória e (x) uma função real mensurável.
Z1 Z1 Z0
E(Y ) = ydF (X) (y) = (1 F (X) (y))dy F (X) (y)dy.
1 0 1
A fórmula acima nem sempre é muito fácil de ser usada, pois devemos obter
onde a existência de uma das integrais implica a existência da outra bem como a
X
1
E[ (X)] = (xi )p(xi ) (se X é discreta)
i=1
Z1
E[ (X)] = (x)fX (x)dx (se X é contínua)
1
108
4.3 Momentos
Assim,
X
1
mk = xki P (X = xi ) se X é v.a.d.
i=1
Z1
mk = xk fX (x)dx se X é v.a.c.
1
X em torno de b, Mk , como
Z1
k
E[(X b) ] = (x b)k dFX (x).
1
Mk = E[(X E(X))k ].
Assim,
X
1
Mk = [xi E(X)]k P (X = xi ) se X é v.a.d.
i=1
Z1
Mk = [x E(X)]k fX (x)dx se X é v.a.c.
1
109
Proposição 5 A variância de uma variável aleatória X atende às seguintes pro-
priedades:
m1 = E(X)
M1 = 0
M2 = V ar(X) = m2 m21 .
DP (X) ou X, como
p
DP (X) = V ar(X).
E(X)
P (X ) .
E jXjt
P (jXj ) t .
110
Proposição 8 (Desigualdade Clássica de Tchebychev) Seja X uma variável aleatória
V ar(X)
P (jX E(X)j ) 2 .
Exemplo 66 Suponha que X seja uma variável aleatória tal que E(X) = 10, P (X
9
7) = 0; 2 e P (X 13) = 0; 3. Prove que V ar(X) 2
.
certamente.
isto é,
111
Assim,
X
1
mX (t) = etxi P (X = xi ) se X é v.a.d.
i=1
Z1
mX (t) = etx fX (x)dx se X é v.a.c.
1
X
1 Z1
mX (t) = etxi P (X = xi ) + etx fX (x)dx se X é v.a. mista.
i=1 1
(i) mX (0) = 1.
dk
mX (t) = E[X k ].
dtk t=0
ou seja
dk
mX (0) = mk (o k-ésimo momento ordinário de X).
dtk
uma moeda honesta até que ocorra a primeira cara. Ache a função geratriz de
112
Exemplo 69 Suponha que X seja uma variável aleatória com função geratriz de
cara e K como coroa. Se ocorre o evento KKK, dizemos que temos uma sequência,
(c) As variâncias de X e Y .
Exercício 62 Seja X uma variável aleatória discreta com distribuição dada por
X 0 1 2
.
P (X = x) 1=2 1=4 1=4
(a) Calcule E(X). Resp.: E(X) = 3=4.
113
Exercício 63 Um vendedor de equipamento pesado pode visitar, num dia, um ou
1=10) ou nenhuma venda com probabilidade 9=10). Indicando por Y o valor total de
(b) Para cada peça processada, o operário ganha um …xo de R$ 2; 00, mas se ele
1; 00.
(b.1) Encontre a distribuição da v.a. G de…nida como a quantia ganha por peça.
g 2; 0 2; 5 3; 0 3; 5 4; 0
Resp.: .
P (G = g) 0; 3 0; 2 0; 3 0; 1 0; 1
(b.2) Encontre a média da v.a. G. Resp.: E(G) = 2; 75.
FX (3) FX (3 ) = 1=2.
114
(b) Obtenha a função
8 de distribuição de X e esboce o seu grá…co.
>
> 0, x < 1
<
1=3, 1 x < 2
Resp.: FX (x) =
>
> 1=2, 2 x < 3
:
1, x 3
Exercício 66 Considere uma urna contendo três bolas vermelhas e cinco pretas.
Retire três bolas e de…na a v.a. X como o número de bolas pretas na amostra.
Exercício 67 Um ‡orista faz estoque de uma ‡or de curta duração que lhe custa R$
0; 50 e que ele vende por R$ 1; 50 no primeiro dia que a ‡or está na loja. Toda ‡or
que não é vendida nesse primeiro dia não serve mais e é jogada fora. Seja X a v.a.
do seu lucro? Resp.: Se ele compra 1 ‡or o lucro médio é R$ 0; 85; se ele compra
2 ‡ores o lucro médio é R$1; 10; e se ele compra 3 ‡ores o lucro médio é R$ 0; 90.
Assim ele deveria comprar 2 ‡ores sempre para maximizar seu lucro médio.
2e 2x , x 0
f (x) =
0, caso contrário
Z1
(a) Mostre que esta é uma f.d.p. Resp.: f (x) 0 para todo x 2 R e fX (x)dx =
1
1.
20
(b) Calcule P (X > 10). Resp.: P (X > 10) = e .
115
Exercício 69 Uma v.a. X tem distribuição triangular no intervalo [0; 1] se sua
(c) Calcule:
Exercício 73 Certa liga é formada pela mistura fundida de dois metais. A liga
resultante contém certa percentagem de chumbo, X, que pode ser considerada uma
116
3
5
10 5 x (100 x) , 0 x 100
f (x) =
0, caso contrário
Suponha que L, o lucro líquido obtido na venda dessa liga (por unidade de peso),
seja dado por L = C1 + C2 X. Calcule E(L), o lucro esperado por unidade. Resp.:
E(L) = C1 + 50C2 .
kg.
(c) Qual a quantidade de arroz que deve ser deixada à disposição dos clientes
diariamente para que não falte arroz em 95% dos dias? Resp.: 245 kg.
V ar(X) = 1=5.
Pede-se:
117
(b) A decomposição da função de distribuição
8 nas partes discreta, absolutamente
< 0, se y < 2
>
1
contínua e singular. Resp.: Fd (y) = , se 2 y < 2 , Parte Absolutamente
>
: 4
1, se y 2
8
>
< 0, se y < 2
y+2
Contínua Fac (y) = , se 2 y < 2 , não há parte singular. FY (y) =
>
: 4
1, se y 2
1 1
Fd (y) + Fac (y) + 0:Fs (y)
2 2
(c) Calcular E (Y ) e V ar (Y ) de duas formas (pela distribuição de X e pela
1 29
distribuição de Y). Resp.: E (Y ) = 2
e V ar (Y ) = 12
3 1
(d) Calcular P ( 2
Y <2j 1<Y 2). Resp.: 2
Exercício 77 Seja X uma variável aleatória com função de densidade dada por
e x
f (x) = , 1 < x < 1.
(1 + e x )2
A variável aleatória X assim de…nida é dita ter distribuição logística.
f ( x)
2
Exercício 78 Seja X uma variável aleatória com E (X) = e V ar (X) = e seja
mX (t) a função geratriz de momentos de X para 1 < t < 1. Seja c > 0 uma
constante real e seja Y uma variável aleatória com função geratriz de momentos
dada por
2
Obtenha E (Y ) e V ar (Y ) em termos de e . Resp.: E (Y ) = c e V ar (Y ) =
2 2
c( + ).
118
Exercício 79 Suponha que X seja uma variável aleatória com E (X) = e V ar (X) =
2 2 2
e que o quarto momento ordinário de X existe. Mostre que E (X 4 ) ( 2
+ ).
119
Capítulo 5
ticular dos vetores bivariados discretos. Os resultados podem ser estendidos aos
Probabilidade.
vetor aleatório são discretas, temos um vetor aleatório discreto e de…nimos sua
p(xi ; yj ) = P (X = xi ; Y = yj ).
X
1 X
1
p(xi ; yj ) = 1.
i=1 j=1
120
De…nição 25 (Função de Densidade Conjunta) Se as variáveis X e Y do ve-
tor aleatório admitem uma função de densidade de probabilidade conjunta fX;Y (x; y)
tal que
e
Z +1 Z +1
fX;Y (x; y)dxdy = 1,
1 1
X
1
P (X = xi ) = p(xi ; yj ).
j=1
X
1
P (Y = yj ) = p(xi ; yj ).
i=1
marginal de X é
Z +1
fX (x) = fX;Y (x; y)dy.
1
tor aleatório discreto. As variáveis aleatórias X e Y são ditas independentes se, para
121
todo (x; y) 2 R2 ,
P (X = x; Y = y) = P (X = x)P (Y = y).
1
(a) Calcule P 2
< X < 43 ; 14 < Y < 1
2
.
122
5.3 Esperança Matemática
conjunta, temos
E [X + Y ] = E [X] + E [Y ] .
E [ X + Y ] = E [X] + E [Y ] .
123
5.4 Distribuições Condicionais e Esperança Condi-
cional
P (X = x; Y = y)
P (X = xjY = y) = .
P (Y = y)
como
P (X = x; Y = y)
P (Y = yjX = x) = .
P (X = x)
fX;Y (x; y)
fXjY (xjy) = .
fY (y)
como
fX;Y (x; y)
fY jX (yjx) = .
fX (x)
1
xfXjY (xjy)dx, se (X; Y ) é vetor contínuo
1
yfY jX (yjx)dy, se (X; Y ) é vetor contínuo
124
Exemplo 74 Cosiderando ainda o exemplo 70, pede-se:
5.5 Covariância
= E [XY ] E [X] E [Y ]
E [XY ] = E[X]E[Y ].
não-correlacionadas.
125
O exemplo a seguir nos mostra que a recíproca do corolário não é sempre verdadeira,
independentes.
0) 6= P (X = 0):P (Y = 0).
V ar [X + Y ] = V ar [X] + V ar [Y ] + 2Cov(X; Y ).
V ar [X + Y ] = V ar [X] + V ar [Y ] .
tão
" #
X
n X
n
V ar Xi = V ar [Xi ] .
i=1 i=1
tão
" #
X
n X
n
2
V ar i Xi = iV ar [Xi ] .
i=1 i=1
certo tipo de rocha pode in‡uir na chance de se encontrar fósseis perto de uma in-
126
ele obteve a distribuição conjunta para as variáveis Z : número de minerais presentes
aleatórias
Sn = X1 + X2 + ::: + Xn
X1 + X2 + ::: + Xn
Xn =
n
Mostre que
2
E (Sn ) = n , V ar (Sn ) = n e
2
E X n = , V ar X n = .
n
127
5.6 Coe…ciente de Correlação
X EX
De…nição 33 Dada uma variável aleatória X, a variável aleatória Z =
X
Cov(X; Y ) X EX Y EY
X;Y = =E .
X: Y X Y
resultados se veri…cam:
(i) 1 X;Y 1.
2
Observação 23 Em modelos lineares, o coe…ciente X;Y representa o quanto da
128
YnX 1 2 3
0 0; 1 0; 1 0; 1
1 0; 2 0 0; 3
2 0 0; 1 0; 1
(a) Determine as distribuições marginais de X e Y.
x 1 2 3 y 0 1 2
Resp.: e
P (X = x) 0; 3 0; 2 0; 5 P (Y = y) 0; 3 0; 5 0; 2
(b) Determine as esperanças e as variâncias de X e Y.
(b) Calcule E ( 3X + 2Y ) e V ar ( 3X + 2Y ).
Resp.: E ( 3X + 2Y ) = 32 , V ar ( 3X + 2Y ) = 101
9
que X = 1.
129
x 1 0 1 y 1 0 1
Resp.: e
P (X = xjY = 0) 1=2 0 1=2 P (Y = yjX = 1) 1=6 1=3 1=2
(d) Calcule E(XjY = 0) e E(Y jX = 1).
1
Resp.: E(XjY = 0) = 0 e E(Y jX = 1) = 3
dela E(X + Y ) e compare o resultado com E(X) + E(Y ), calculado por meio das
marginais de X e Y.
z 2 3 4 5 6
Resp.: e E(X + Y ) = E(X) + E(Y ) = 4
P (Z = z) 0; 1 0; 2 0; 3 0; 4 0
(b) Seja W = XY . Encontre a função de probabilidade de W , calcule a par-
tir dela E(XY ) e e compare o resultado com E(X)E(Y ), calculado por meio das
marginais de X e Y.
w 1 2 3 4 6 9
Resp.: e E(XY ) = E(X)E(Y ) =
P (W = w) 0; 1 0; 2 0; 1 0; 2 0; 4 0
4
0 6= 0; 3 0; 2 = P (X = 3) P (Y = 3).
130
YnX 1 2 3 4 5 6 P (Y = y)
1 1=36 0 0 0 0 0 1=36
2 1=36 1=18 0 0 0 0 1=12
3 1=36 1=36 1=12 0 0 0 5=36
Resp.:
4 1=36 1=36 1=36 1=9 0 0 7=36
5 1=36 1=36 1=36 1=36 5=36 0 1=4
6 1=36 1=36 1=36 1=36 1=36 1=6 11=36
P (X = x) 1=6 1=6 1=6 1=6 1=6 1=6 1
(b) As duas variáveis são independentes? Justi…que matematicamente.
Exercício 85 Suponha que (X; Y ) tenha função de densidade conjunta dada por
e x y , se x > 0 e y > 0
fX;Y (x; y) =
0, caso contrário
independentes.
131
Exercício 86 Suponha que (X; Y ) tenha função de densidade conjunta dada por
Exercício 87 Suponha que (X; Y ) tenha função de densidade conjunta dada por
0 < x < 4.
x+y
(d) Obtenha a densidade condicional de Y dada X. Resp.: fY jX (yjx) = 4(x+2)
,
0 < y < 4.
6x+16
(e) Calcule E (Y jX = x). Resp. E (Y jX = x) = x+2
.
Cov(Y1 ; Y2 ) = Cov(X1 ; X2 ).
e correlação . Seja Z = X Y.
132
Exercício 90 Se X e Y são v.a.’s independentes com variâncias …nitas, demonstre
que
133
Capítulo 6
p, se x = 1
P (X = x) =
q = 1 p, se x = 0
P (X = x) = px (1 p)1 x , x = 0; 1.
134
de sucessos obtidos nas n realizações. Veremos a seguir que essa variável aleatória
seguinte resultado.
E(X) = p,
V ar(X) = pq.
que conta o número de sucessos nas n realizações. A variável aleatória X é dita ter
n
P (X = k) = pk q n k , k = 0; 1; 2; 3; :::; n.
k
onde
n n!
= e n! = 1:2:3:::n.
k k! (n k)!
Observação 24 O nome Binomial vem do fato de que essa distribuição tem relação
n
X
n
n
(a + x) = ak x n k .
k
k=0
n
X
n
n
(p + q) = pk q n k .
k
k=0
135
Mas p + q = p + (1 p) = 1, e assim
X
n
n X
n
n k n k
1 = p q = P (X = k)
k
k=0 k=0
ou seja
X
n
P (X = k) = 1,
k=0
Exemplo 81 Seja uma prova com 5 questões. Suponha que cada questão tenha 4
isto é, "chutando".
de variáveis contínuas. Mas a ideia aqui é preparar o terreno para uma aproximação
do modelo Binomial por uma variável contínua cuja densidade passe próximo ao
E(X) = np,
V ar(X) = npq.
136
Prova. (Em aula.)
= p + p + ::: + p
= np
= pq + pq + ::: + pq
= npq.
5 sucessos.
Exemplo 82 Das variáveis abaixo, assinale quais são binomiais, e para essas dê
(a) De uma urna com 10 bolas brancas e 20 pretas, vamos extrair, com reposição,
(b) Refaça o problema anterior, mas dessa vez as 5 extrações são sem reposição.
(c) Temos 5 urnas com bolas pretas e brancas e vamos extrair uma bola de cada
137
um habitante de cada uma delas e classi…cando-o em pró ou contra um certo projeto
(e) Em uma indústria existem 100 máquinas que fabricam determinada peça.
de tempo e veri…camos uma peça de cada uma das máquinas. Suponha que X seja
o número de defeituosas.
hem independentemente uns dos outros. Dado que pelo menos um dos componentes
(b) P (X 14);
p
(c) E(Z) e V (Z), onde Z = (X 12)= 3;
que conta o número de realizações até que o primeiro sucesso ocorra. A variável
P (X = x) = q x 1 p, x = 1; 2; 3; 4; :::
138
Proposição 18 Se X Geo(p), então
pet
mX (t) = , para t < ln q
1 qet
1
E(X) = ,
p
q
V ar(X) = 2 .
p
temos
P (X = m + n j X m) = P (X = n) .
Exemplo 85 Uma urna contém b bolas brancas e v bolas vermelhas. Bolas são
retiradas ao acaso, com reposição, até que uma bola branca seja encontrada. Seja
mento seja repetido até que o primeiro sucesso ocorra. Se a probabilidade de sucesso
esperado da operação?
139
6.4 A Distribuição Binomial Negativa
que conta o número de realizações até que o r-ésimo sucesso ocorra. A variável
k 1
P (X = k) = pr q k r , k = r; r + 1; r + 2; r + 3; :::;
r 1
P (Y = y) = P (X r = y) = P (X = y + r)
y+r 1
= pr q y
r 1
y+r 1
P (Y = y) = pr q y , y = 0; 1; 2; 3; :::
y
r ( r) ( r 1) ( r 2) ::: ( r y + 1)
=
y y!
y+r 1
= ( 1)y
y
Assim
y+r 1 r
= ( 1)y
y y
140
e, portanto,
r
P (Y = y) = ( 1)y pr q y
y
r
P (Y = y) = pr ( q)y , y = 0; 1; 2; 3; :::
y
r 1
Observação 28 Vimos também que a expansão por Taylor de (1 + x) =
(1 + x)r
é dada por
r
X
1
r
(1 + x) = xk para 1 < x < 1.
k
k=0
Portanto
X
1 X
1
r
P (Y = y) = pr ( q)y
y
y=0 y=0
X
1
r
= p r
( q)y
y
y=0
r r
= p (1 q)
= pr p r
= 1
r
pet
mX (t) = , para t < ln q
1 qet
r
E(X) = ,
p
rq
V ar(X) = 2 .
p
Observação 29 Os resultados acima são intuitivos, uma vez que a v.a. X bino-
mial negativa pode ser vista como r replicações de variáveis aleatórias Geométricas.
141
Assim, se Xi Geo(p), para i = 1; 2; :::; n, independentes então X = X1 + X2 +
conjuntas.)
Exemplo 87 Uma peça produzida em série numa fábrica tem 10% de probabilidade
Seja X a v.a. que representa o número de inspeções até que isso ocorra. Obtenha a
142
Seu objetivo foi construir um modelo de contagem de ocorrências de um dado fenô-
De…nição 35 Seja X uma variável aleatória de…nida em f0; 1; 2; 3; :::g tendo função
x
e
P (X = x) = , para x = 0; 1; 2; 3; ::: e > 0.
x!
Proposição 20 Se X P( ), então
(et 1)
mX (t) = e ,
E(X) = ,
V ar(X) = .
143
Exemplo 88 Suponha que uma fonte radioativa emita partículas a uma taxa de 20
o período de 15 minutos?
(c) Qual a probabilidade de haver pelo menos um acidente em cada mês do ano
de 1998?
três petroleiros por dia. Se mais de três aportarem num dia, o excesso é enviado a
outro porto.
144
Hipergeométrica de paramânetros N , a e n, denotado por X Hip(N; a; n) e
a N a
x n x
P (X = x) = , para maxf0; n bg x minfn; ag.
N
n
a b
Observação 31 Se X Hip(N; a; n), então, denotando p = N
eq= N
temos
E(X) = np,
N n
V ar(X) = npq .
N 1
Antes que uma remessa seja aprovada, um inspetor escolhe 5 desses motores e os
specionados. Suponha que existam, de fato, três motores defeituosos no lote. Qual
Exemplo 93 De um lote que contém 25 peças, das quais 5 são defeituosas, são
145
6.7 Lista de Exercícios
iência tem mostrado que esse processo de fabricação produz 5% de peças defeituosas,
Resp: Seja X a v.a. que conta o número de peças defeituosas na caixa com
18
18 peças. Então P (X = x) = (0; 05)x (0; 95)18 x , x = 0; 1; 2; 3; :::; 18.
x
Desejamos P (X 2) = P (X = 0) + P (X = 1) + P (X = 2).
dade de acerto do atirador é de 90%, qual a probabilidade de que o alvo seja atingido
pelo menos duas vezes, sabendo-se que o mesmo foi atingido pelo menos uma vez?
Resp: Seja X a v.a. que conta o número de sucessos nas 15 tentativas. Então
15
P (X = x) = (0; 4)x (0; 6)15 x , x = 0; 1; 2; 3; :::; 15.
x
Exercício 94 Uma moeda viciada onde a probabilidade de cara é 0,6 é lançada nove
Resp: Seja X a v.a. que conta o número de caras nas 9 tentativas. Então P (X =
9 P
4
x) = (0; 6)x (0; 4)9 x , x = 0; 1; 2; 3; :::; 9. Desejamos P (X = 2k) =
x k=0
P
4
9
(0; 6)2k (0; 4)9 2k
.
k=0 2k
146
Exercício 95 Um contador de partículas tem probabilidade de 0,7 de contar cada
partícula que entra em sua abertura, independentemente de uma partícula para outra.
Qual a distribuição do número de partículas que ele não registra, antes da primeira
Resp: Seja X a v.a. que conta o número de partículas que ele não registra,
antes da primeira partícula a ser contada. Então P (X = x) = (0; 3)x (0; 7), x=
(a) A probabilidade de que numa certa hora ocorram não mais que dois defeitos.
Resp: Seja X a v.a. que conta o número de defeitos por hora, então X
1
P( ). Como P (X = 0) = e = 5
, temos = ln 5. Assim P (X = k) =
(ln 5)k
; k = 0; 1; 2; ::: Logo P (X 2) = P (X = 0) + P (X = 1) + P (X = 2) =
5k!
1 (ln 5)2
5
1 + ln 5 + 2
.
(b) Supondo um regime de trabalho de oito horas diárias, quantos defeitos deve-
viduais contra certos tipos de acidentes. Uma pesquisa piloto do serviço estatístico
permitiu estimar que, num período de um ano, cada pessoa tem uma chance em cada
tipo de apólice, e que a companhia poderá vender em média mil apólices de seguro
147
deste tipo por ano. Determinar a probabilidade de que o número de acidentados não
ultrapasse a três por ano (número a partir do qual a operação não é mais considerada
como rentável).
Exercício 98 Livros produzidos por uma certa editora têm uma média de 1 defeito
de impressão por página. Qual é a probabilidade de que pelo menos em uma página
Resp: Seja X a v.a. que conta o número de defeito de impressão por página.
e 1
Então X P(1). Assim P (X = k) = ; k = 0; 1; 2; ::: Logo p = P (X 5) =
k!
P4 e 1
1 P (X < 5) = 1 . Seja Y a v.a. que conta o número de páginas com
k=0 k!
pelo menos 5 defeitos num livro de 300 páginas. Então Y B(300; p). Desejamos
300
P (Y 1) = 1 P (Y = 0) = 1 p0 (1 p)300 = 1 (1 p)300 = 1
0
300
P4 e 1
.
k=0 k!
Exercício 99 Gotas de chuva caem a uma taxa média de 30 gotas por cm2 e por
minuto. Qual a chance de um particular cm2 não ser atingido por qualquer gota de
Resp: Seja X a v.a. que conta o número de gotas por cm2 e por 10 segundos.
riores, sabe-se que os defeitos têm distribuição de Poisson com uma média de 0; 2
produção, pergunta-se:
148
(a) Qual a probabilidade de haver mais do que uma lâmina na amostra com mais
de 1 defeito na superfície?
Resp: Seja X a v.a. que conta o número de defeitos na superfície de uma lâmina.
e 2 2x
Então X P(2). Assim P (X = x) = ; x = 0; 1; 2; ::: Assim p = P (X > 1) =
x!
1 P (X 1) = 1 3e 2 . Seja Y a v.a. que conta o número de lâminas com pelo
menos 1 defeitos numa amostra de 10. Então Y B(10; p). Desejamos P (Y > 1) =
10 10
1 P (Y = 0) P (Y = 1) = 1 p0 (1 p)10 p1 (1 p)9 = 1
0 1
(1 p)10 10p (1 p)9 , com p = 1 3e 2 .
superfície? E a variância?
Exercício 101 Numa central telefônica, o número de chamadas chega com uma
Resp: Seja X a v.a. que conta o número de chamadas por minuto. Então X
e 8 8x
P(8). Assim P (X = x) = ; x = 0; 1; 2; ::: Assim P (X 10) = 1 P (X <
x!
P9 e 8 8x
10) = 1 .
x=0 x!
(b) menos que nove chamadas;
P8 e 8 8x
Resp: P (X 8) = .
x=0 x!
(c) entre sete (inclusive) e nove (exclusive) chamadas.
8 87 88
Resp: P (7 X < 9) = P (X = 7) + P (X = 8) = e + .
7! 8!
Exercício 102 Num certo tipo de fabricação de …ta magnética, ocorrem cortes a
uma taxa de um por 2:000 pés. Qual a probabilidade de que um rolo com 2:000 pés
149
Resp: Seja X a v.a. que conta o número de cortes num rolo de 2:000 pés. Então
e 1
X P(1). Assim P (X = k) = ; k = 0; 1; 2; ::: Assim P (X = 0) = e 1 .
k!
(b) no máximo dois cortes;
5e 1
Resp: P (X 2) = .
2
(c) pelo menos dois cortes.
Resp: P (X 2) = 1 2e 1 .
Exercício 104 O número de partículas emitidas por uma fonte radioativa, durante
probabilidade de não haver emissões for igual a 1=3, qual é a probabilidade de que
Resp: Seja X a v.a. que conta o número de emissões durante um período es-
150
Exercício 105 Em certa rodovia, a intensidade média do ‡uxo de tráfego é de 30
carros por minuto. Um medidor é colocado na rua para registrar o número de carros
Resp: Seja X a v.a. que conta o número de carros registrados durante um inter-
e 1
valo de 2 segundos, então X P(1). Assim P (X = k) = ; k = 0; 1; 2; ::: Assim
k!
P (X 2) = 1 2e 1 .
Resp: Seja Y a v.a. que conta o número de carros registrados durante um in-
30
e 30k
tervalo de 1 minuto, então Y P(30). Assim P (X = k) = ; k = 0; 1; 2; :::
k!
30
Assim P (Y = 0) = e .
Exercício 106 Suponha que num dado …nal de semana o número de acidentes num
de que haverá pelo menos três acidentes no cruzamento durante o …nal de semana?
Resp: Seja X a v.a. que conta o número de acidentes num …nal de semana,
P
2 e 0;7
(0; 7)x
então X P(0; 7). P (X 3) = 1 P (X 2) = 1 .
x=0 x!
Exercício 107 Suponha que o número de defeitos num metro quadrado de tecido
151
Exercício 108 Suponha que uma certa …ta magnética contenha, em média, 3 de-
feitos por 1:000 pés. Qual a probabilidade de que um rolo de …ta de 1:200 pés não
contenha defeitos?
Resp: Seja X a v.a. que conta o número de defeitos num rolo de …ta de 1:200
3;6
pés.Então X P(3; 6). P (X = 0) = e .
Exercício 109 Suponha que, em média, uma certa loja sirva 15 clientes por hora.
Qual a probabilidade de que a loja não servirá mais do que 20 clientes num particular
período de 2 horas?
Resp: Seja X a v.a. que conta o número de clientes que chegam num período de
P
20 e 30x
30
2 horas. Então X P(30). P (X 20) = .
x=0 x!
Exercício 110 Suponha que num grande lote contendo T produtos manufaturados,
30% dos produtos são defeituosos e 70% são bons. Suponha também que 10 produtos
(a) uma expressão exata para a probabilidade de que não mais do que um produto
binomial.
Resp: Seja X a v.a. que conta o número de defeituosos no lote de T produtos, com
10
T grande. Então X B(10; 0; 3). Assim P (X = x) = (0; 3)x (0; 7)10 x , x =
x
152
10
0; 1; 2; 3; :::; 10. Assim P (X 1) = P (X = 0)+P (X = 1) = (0; 3)0 (0; 7)10 +
0
10
(0; 3)1 (0; 7)9 = (0; 7)10 + 3 (0; 7)9 .
1
153
Capítulo 7
Diz-se que a variável aleatória X tem distribuição uniforme no intervalo [a; b], de-
a+b
E(X) =
2
(b a)2
V ar(x) =
12
154
por
e x, x 0
fX (x) =
0, caso contrário
0, se x < 0
FX (x) =
1 e x , se x 0
P (X t + sjX t) = P (X s) .
Exemplo 95 Para um certo tipo de componente eletrônico, a vida útil X (em mil
(a) Qual a probabilidade de que um novo componente dure mais do que 1:000
horas?
(b) Se um componente já durou 1:000 horas, qual a probabilidade de que ele dure
amente, qual a probabilidade de que pelo menos 3 delas durem mais de 25 dias?
155
7.3 A Distribuição Normal
7.3.1 A Distribuição Normal Padrão
Diz-se que uma variável aleatória Z tem Distribuição Normal (ou Gaussiana) Padrão
com média zero e variância 1, denotado por Z N (0; 1), se a função de densidade
1 z2
fZ (z) = p e 2 , 1 < z < 1.
2
t2
mZ (t) = e 2
E(Z) = 0
V ar(Z) = 1
Vemos pela fórmula da Distribuição Normal e pelo grá…co acima que a curva
normal é simétrica e se aproxima rapidamente de zero nas caudas por ter em seu
z2
núcleo e 2 . Por esse motivo, as distribuições normais são candidatas a modelar
156
seja, dados sem valores extremos ocorrendo com certa frequência e com coe…ciente
de assimetria próximo de 0.
Como (z) não pode ser obtida analiticamente, o valor de (z) é dado por
à segunda casa decimal de z. Vemos já com isso, que, embora Z esteja de…nida em
modelado pela normal padrão sair do intervalo [ 3; 49; 3; 49]. Já vimos que isto se
já que a probabilidade num ponto é nula. Vejamos então alguns exemplos abaixo:
(a) P (Z 1; 36)
(b) P (Z 0; 38)
(d) P ( 1; 32 Z 0; 3)
Rz
Solução: A tabela nos oferece (z) = P (Z z) = 1
fZ (u)du, ou seja, a área
157
z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
-3.4 0:0003 0:0003 0:0003 0:0003 0:0003 0:0003 0:0003 0:0003 0:0003 0:0002
.. .. .. .. .. .. .. .. .. .. ..
. . . . . . . . . . .
-1.3 0:0968 0:0951 0:0934 0:0918 0:0901 0:0885 0:0869 0:0853 0:0838 0:0823
.. .. .. .. .. .. .. .. .. .. ..
. . . . . . . . . . .
:
0.3 0:6179 0:6217 0:6255 0:6293 0:6331 0:6368 0:6406 0:6443 0:6480 0:6517
.. .. .. .. .. .. .. .. .. .. ..
. . . . . . . . . . .
2.7 0:9965 0:9966 0:9967 0:9968 0:9969 0:9970 0:9971 0:9972 0:9973 0:9974
.. .. .. .. .. .. .. .. .. .. ..
. . . . . . . . . . .
3.4 0:9997 0:9997 0:9997 0:9997 0:9997 0:9997 0:9997 0:9997 0:9997 0:9998
2
7.3.2 A Distribuição Normal com média e variância
Diz-se que uma variável aleatória X tem Distribuição Normal (ou Gaussiana) com
2 2
média e variância , denotado por X N( ; ), se a função de densidade de
1 (x )2
fX (x) = p e 2 2 , 1 < x < 1:
2
158
Vemos que aqui também a forma da função de densidade de X é um sino simétrico
Normal são iguais, e pode-se mostrar que a área abaixo da curva normal é unitária.
2 2 2
Proposição 24 Se X N( ; ), então Y = X+ N( + ; ), para
6= 0 e constantes reais.
2 X
Corolário 5 Se X N( ; ), então Z = N (0; 1).
2
Proposição 25 Se X N( ; ), então
t+ 21 2 t2
mX (t) = e ,
E(X) = e
2
V ar(X) = .
159
a curva …que mais e mais achatada, indicando de fato maior dispersão dos dados. O
média e desvio-padrão .
sabemos que
2
X N( ; )
onde = 100 e = 15. Assim, temos X N (100; 225). Sabemos também que
X X 100
Z= = N (0; 1).
15
1 (x 100)2
Desejamos P (X < 115), ou seja, a área à esquerda de 115 sob a curva p e 450 .
15 2
160
Mas
Assim
161
Exemplo 99 As contas mensais de serviços públicos em determinada cidade são
R$ 80:000 e R$ 115:000.
Solução: Seja X a variável aleatória que denota o valor da conta. Então sabemos
que
2
X N( ; )
também que
X X 100:000
Z= = N (0; 1).
12:000
P (80:000 X 115:000)
= P (Z 1; 25) P (Z 1; 67)
= 0; 8944 0; 0475
= 0; 8469
Assim
162
Propriedade 1: Se X N( ; 2
) então
P( X + )
= P( X + )
= P( X )
X
= P
= P( 1 Z 1)
= P (Z 1) P (Z 1)
= 0; 8413 0; 1587
P( 2 X +2 )
= P( 2 X +2 )
= P( 2 X 2 )
2 X 2
= P
= P( 2 Z 2)
= P (Z 2) P (Z 2)
= 0; 9772 0; 0228
163
e …nalmente
P( 3 X +3 )
= P( 3 X +3 )
= P( 3 X 3 )
3 X 3
= P
= P( 3 Z 3)
= P (Z 3) P (Z 3)
= 0; 9987 0; 0013
Propriedade 2: Se X N( x;
2
x) e Y = aX + b, com a 6= 0, então Y
2
N( y; y) onde
y = E (Y ) = E (aX + b) = aE (X) + b = a x +b
2
y = V ar (Y ) = V ar (aX + b) = a2 V ar (X) = a2 2
x
164
ou seja
2
X N( x; x) =) Y = aX + b N (a x + b; a2 2
x)
O que a propriedade acima nos diz é que transformações lineares ou a…ns de uma
Propriedade 3: Se Xi N ( i; 2
i) para i = 1; 2; :::; n são variáveis aleatórias
y = E (Y ) = E ( 1 X1 + 2 X2 + ::: + n Xn + )
y = i i +
i=1
2
y = V ar (Y ) = V ar ( 1 X1 + 2 X2 + ::: + n Xn + )
2 2 2
= 1V ar (X1 ) + 2V ar (X2 ) + ::: + nV ar (Xn ) + V ar ( )
2 2 2
= 1V ar (X1 ) + 2V ar (X2 ) + ::: + nV ar (Xn ) + 0
X
n
2 2 2
y = i i
i=1
ou seja
X
n Xn X
n
2 2 2
Xi N ( i; i) =) Y = i Xi + N( i i + ; i i)
i=1 i=1 i=1
Propriedade 4: Se Xi N( ; 2
) para i = 1; 2; :::; n são variáveis aleatórias
Sn N (n ; n 2 ).
165
2
Essa propriedade decorre da Propriedade 3, tomando i = 1, i = e i =
2
para todo i e = 0.
Propriedade 5: Se Xi N( ; 2
) para i = 1; 2; :::; n são variáveis aleatórias
X1 + X2 + ::: + Xn
independentes e se Xn = , então
n
2
Xn N( Xn ; Xn ).
2
2
onde Xn = e Xn
= , pois
n
X1 + X2 + ::: + Xn
Xn = E Xn = E
n
1
= [E (X1 ) + E (X2 ) + ::: + E (Xn )]
n
1 n
Xn = [ + + ::: + ] = = .
n n
2 X1 + X2 + ::: + Xn
Xn = V ar Xn = V ar
n
1
= [V ar (X1 ) + V ar (X2 ) + ::: + V ar (Xn )]
n2
2 1 2 2 2 n 2 2
Xn = + + ::: + = = .
n2 n2 n
Assim
2
2
Xi N( ; ) =) Xn N( ; ).
n
166
de duração de suas gravidezes terem média inferior a 260 dias (admitindo-se que a
Solução: (a) Seja X a v.a. que denota a duração (em dias) de gravidez de uma
dada mulher. Então sabemos que X N (268; 225). Sabemos também que
X X 268
Z= = N (0; 1).
15
Desejamos
= 0; 2981
Assim
(b) Seja Xi a v.a. que denota a duração (em dias) de gravidez da i-ésima mulher
2
Xn N( ; ).
n
2
225
Mas = 268 e = = 9. Assim
n 25
167
Desejamos
= 0; 0038
(c) Pelo item (b), sob a hipótese de que a dieta não tem efeito, temos uma
260, portanto um evento raro. Como isso de fato ocorreu, temos evidência de que
que é preocupante do ponto de vista médico, já que abaixo de 260 dias a dieta estaria
Exemplo 101 O peso de uma determinada fruta é uma variável aleatória com dis-
a probabilidade de um lote contendo 100 unidades dessa fruta pesar mais que 21 kg.
Solução: Seja Xi a v.a. que denota o peso (em gramas) da i-ésima fruta do
lote, i = 1; 2; :::; 100. Sabemos que Xi N (200; 502 ). Sabemos também que o peso
2
com = 200 e = 502 . Assim
Assim
S100 20:000
Z= N (0; 1).
500
168
Desejamos
= 1 P (Z 2)
= 1 0; 9772
= 0; 0228
169
Capítulo 8
2
Vimos anteriormente que se Xi N( ; ) para i = 1; 2; :::; n são variáveis aleatórias
X1 + X2 + ::: + Xn
independentes e se Xn = , então
n
2
Xn N( Xn ; Xn ).
2
2
2
onde Xn = e Xn
= . Assim Xn N( ; n
). No entanto, independentemente
n
da distribuição das variáveis Xi , se estas forem independentes e identicamente dis-
2
tribuídas com média e variância , teremos sempre que
2
2
Xn = E Xn = e Xn = V ar Xn = ,
n
pois para esses cálculos nos valemos apenas das propriedades da esperança e da
que quanto maior o número de elementos da amostra, menor será a variabilidade dos
valores da média amostral, indicando uma alta concentração dos valores das médias,
este histograma tenderia a ter uma forma simétrica e cada vez mais leptocúrtico
170
Teorema 13 (Teorema Central do Limite) Seja X1 ; X2 ; :::; Xn uma sequência
Sn = X1 + X2 + ::: + Xn
X1 + X2 + ::: + Xn
Xn =
n
então pode-se mostrar que, para n su…cientemente grande, qualquer que seja a dis-
2
Sn N (n ; n 2 ) e Xn N( ; ).
n
Consequentemente, temos
Sn n
p N (0; 1)
n
e
Xn
N (0; 1).
p
n
pior cenário, considera-se n 30, como su…cientemente grande para valer o Teorema
Central do Limite.
171
Exemplo 102 A média de altura dos alunos da UFRJ é 1; 75 m com desvio-padrão
Solução: Seja Xi a v.a. que denota o altura (em cm) do i-ésimo aluno da
Embora não saibamos qual a distribuição das alturas, como o tamanho da amostra
é grande (n = 40), podemos nos valer do Teorema Central do Limite para a…rmar
que
2
X40 N( ; ).
40
Assim
100
X40 N (175; )
40
e
X 40 175
Z= N (0; 1).
10
p
40
172
Desejamos
0 1
B X 40 175 178 175 C
P X40 > 178 = PB@ 10
>
10
C
A
p p
40 40
= P (Z > 1; 90)
= 1 0; 9713
= 0; 0287
Sn N (np; npq).
ou, equivalentemente,
Sn np
p N (0; 1).
npq
173
Observe pelo grá…co acima, que para aproximar a probabilidade de X = k na Bi-
1 1
nomial é necessário integrar a curva Normal no intervalo k 2
;k + 2
, denominado
Exemplo 103 Um par de dados é lançado 180 vezes por hora (aproximadamente).
soma 7 na primeira hora? (b) Qual a probabilidade aproximada de que entre 700 e
Solução: (a) Seja X a variável aleatória que conta o número de vezes em que
houve soma 7 na primeira hora. Como há 180 realizações na primeira hora e como
k 180 k
180 1 5
P (X = k) = , k = 0; 1; 2; 3; :::; 180.
k 6 6
1
Como n é grande, temos que X N (np; npq). Mas np = 180 6
= 30 e npq =
174
1 5
180 6 6
= 25. Assim
X N (30; 25)
cálculo esse ingrato de ser feito. Pela aproximação da Normal com a correção de
continuidade, temos
X 30 24; 5 30
P (X 24; 5) = P
5 5
= P (Z 1; 1)
= 1 P (Z 1; 1)
= 1 0; 1357
= 0; 8643
(b) Seja Y a variável aleatória que conta o número de vezes em que houve soma
Y N (720; 600)
175
Com isso, temos
Y 720
Z= p N (0; 1).
600
Desejamos
X
750
4:320 1
k
5
4:320 k
P (700 Y 750) = ,
k 6 6
k=700
das são números muito grandes. Pela aproximação da Normal com a correção de
continuidade, temos
= P (Z 1; 24) P (Z 0; 84)
= 0; 8925 0:2005
= 0; 692
176
Exercício 112 A temperatura T de destilação do petróleo é crucial na determi-
nação da qualidade …nal do produto. Suponha que T seja uma v.a. com distribuição
uniforme no intervalo (150; 300). Suponha que o custo para produzir um galãode
petróleo seja C1 reais. Se o óleo for destilado a uma temperatura inferior a 200 , o
é vendido a C3 reais.
(a) Qual o número esperado de alunos com altura superior a 165 cm? Resp.:
9:413
(b) Qual o intervalo simétrico em torno da média que conterá 75% das alturas
mente normal, com média 500 e desvio-padrão 50. Se a empresa decide fabricar 600
unidades no mês em estudo, qual a probabilidade de que não possa atender a todos
177
(a) Se os aparelhos são feitos para serem usados por um período de 45 horas,
(b) Se os aparelhos são feitos para serem usados por um período de 49 horas,
tem distribuição N (0; 6140; (0; 0025)2 ). O lucro L de cada rolamento depende de seu
diâmetro. Assim
L = 0; 05 se o rolamento for recuperável, isto é, 0; 608 < X < 0; 610 ou 0; 618 <
X < 0; 620;
Exercício 119 Suponha que um mecanismo eletrônico tenha tempo de vida X regido
por uma distribuição exponencial com média de 1000 horas. Suponha que o custo
garante total devolução do valor pago se X 900. Qual o lucro esperado por item
178
Exercício 120 De um lote de produtos manufaturados, extraímos 100 itens ao
acaso. Se 10% dos itens são defeituosos, calcule a probabilidade exata de 12 itens
que ele funcione sob as condições para as quais foi planejado. Uma amostra de 1000
normal, com média 2 cm e variância 0; 01 cm2 . Para que uma corrente se ajuste à
(a) Qual é a probabilidade de uma corrente com 30 elos não se ajustar à bicicleta?
Resp.: 3; 41%
Exercício 123 Cada seção usada para a construção de um oleoduto tem um com-
bilidade de ela ter que comprar mais do que uma seção adicional, isto é, de as 1600
(b) Qual é a probabilidade do uso exato de 1599 seções, isto é, a soma das 1599
179
Exercício 124 Seja X uma v.a. com distribuição uniforme em [ a; 3a]. Determine
4a2
a média e a variância de X. Resp.: a e , respectivamente.
3
(a) Em quanto deve ser regulado o peso médio para que apenas 10% dos pacotes
(b) Com a máquina assim regulada, qual a probabilidade de que o peso total de
Exercício 126 Um elevador pode suportar uma carga máxima de 500 kg. Se a
10 kg,
(a) qual a probabilidade de que o peso limite seja excedido para um grupo de 7
(b) qual a probabilidade de que o peso limite seja excedido para um grupo de 6
180
Capítulo 9
Estimação
Nesta aula exporemos as ideias centrais da Teoria de Estimação, dando ênfase à esti-
que vale um curso inteiro para o seu tratamento adequado. Vimos que a problema-
dos parâmetros populacionais à luz das informações obtidas de uma amostra dessa
para o parâmetro em estudo. Suponha que o alvo a ser atingido seja o parâmetro
sente um "tiro". Então quando a média dos valores dos "tiros"(ou seja, a média de
viamente, mais do que ter a média dos "tiros"no valor do parâmetro, gostaríamos
também que o atirador fosse preciso nos resultados. Assim podemos ter as seguintes
181
Não-Viesado e Preciso Viesado e Preciso
viesado e preciso, é possível corrigir o "estrabismo"do estimador e fazer com que ele
182
Parâmetro Estimador
Pn
Xi
Média X n = i=1
n
X o
Proporção p p^ = (X: n de "sucessos"na amostra)
n Pn 2
2 2 i=1 Xi Xn
Variância S =
s n 1
Pn 2
i=1 Xi Xn
Desvio-Padrão S=
n 1
Além desses principais estimadores, podemos citar outros de interesse, como:
terquartil populacional;
Seja (X1 ; X2 ; :::; Xn ) uma amostra de tamanho n retirada de uma população com
183
para um parâmetro de interesse.
isto é,
E ^ = .
B ^ =E ^ .
, então B ^ = 0.
Exemplo 104 Seja (X1 ; X2 ; :::; Xn ) uma amostra de tamanho n retirada de uma
, como
2
EQM ^ = E ^ .
Observação 35
2 2
EQM ^ = E ^ =E ^ E ^ +E ^
2 2
= E ^ E ^ + E ^ +2 ^ E ^ E ^
2 2 h i
= E ^ E ^ + E ^ +2 E ^ E ^ E ^
2 2
= E ^E ^ + E ^
h i2
EQM ^ = V ar ^ + B ^
184
De…nição 39 Dados dois estimadores não-tendenciosos ^1 e ^2 para um parâmetro
V ar ^1 < V ar ^2 .
estimador ^ como
r
EP ^ = V ar ^ .
é de…nido como
8 1
>
> X
>
> xk p(xi ), se X é v.a.d
>
< i=1 i
k = E Xk = Z1
>
>
>
> xk fX (x)dx, se X é v.a.c.
>
:
1
1X k
n
mk = X .
n i=1 i
De…nição 43 Dizemos que ^1 , ^2 , ..., ^r são estimadores obtidos pelo método dos
k = mk , para k = 1; 2; :::; r.
185
Exemplo 106 Se (X1 ; X2 ; :::; Xn ) é uma amostra de tamanho n retirada de uma
2
população com uma distribuição normal com média e variância , quais os esti-
população com uma distribuição de Poisson com parâmetro > 0. Quais os possíveis
de verossimilhança como
Como a amostra já foi obtida, a função de verossimilhança deve ser encarada como
Exemplo 108 Seja (x1 ; x2 ; :::; xn ) uma amostra de tamanho n retirada de uma pop-
Exemplo 109 Seja (x1 ; x2 ; :::; xn ) uma amostra de tamanho n retirada de uma pop-
186
Exemplo 110 Seja a realização de 8 ensaios de Bernoulli com prababilidade p de-
quando sabemos por exemplo por estudos anteriores da população inteira que a var-
2
iância era e se supõe que continua a mesma, tendo apenas a hipótese de mudança
da média, a qual se deseja estimar. Mas o caso mais relevante que recai ainda assim
nesse contexto é quando estamos lidando com amostras de tamanho grande (n 30).
tribuição:
Xn
Z= N (0; 1).
p
n
Se a população é normalmente distribuída, então a distribuição é exata:
Xn
Z= N (0; 1):
p
n
Suponha que desejemos formar um intervalo de con…ança para com uma prob-
abilidade de 1 . Então
P z =2 Z z =2 =1
187
0 1
B Xn C
P@ z =2 z =2 A =1
p
n
P z =2 p Xn z =2 p =1
n n
P Xn z =2 p Xn + z =2 p =1
n n
Assim temos:
P Xn z =2 p Xn + z =2 p =1 .
n n
1 . Assim temos:
E=z =2 p .
n
possa estimar a média populacional com um erro E. Isso será dado, isolando-se o
Exemplo 111 Seja uma amostra aleatória com 35 preços (em reais) de um aparelho
celular em estudo.
de 95% de con…ança.
188
(c) Determine o intervalo de con…ança de 95% para a média dos preços do celular
em estudo.
(d) Você quer estimar a média de preço do celular. Quantos preços de aparelhos
terão de ser incluídos em sua amostra se você quiser estar 95% seguro de que a
lacional, incorporamos mais incerteza aos intervalos. Daí a distribuição amostral ter
caudas mais "pesadas"para gerar valores mais atípicos. Assim, quando a variância
2
de uma população aproximadamente nomal é desconhecida, é possível mostrar
que
Xn
T = tn 1 Student,
S
p
n
s
Pn 2
i=1 Xi X n
com S = o desvio-padrão (corrigido) da amostra, e tn 1
n 1
Student a distribuição t-Student com n 1 graus de liberdade. Essa distribuição
liberdade (veja a tabela anexada). Observe que a tabela dá a área à direita do valor
189
Distribuição t-Student
tende à distribuição Normal. Daí o fato de termos proposto no caso anterior, para
Suponha que desejemos formar um intervalo de con…ança para com uma prob-
2
abilidade de 1 (nível de con…ança), supondo desconhecida. Então
P tn 1; =2 T tn 1; =2 =1
0 1
B Xn C
PB
@ tn 1; =2 tn 1; =2 A
C=1
S
p
n
S S
P tn 1; =2 p Xn tn 1; =2 p =1
n n
S S
P Xn tn 1; =2 p X n + tn 1; =2 p =1
n n
Assim, temos:
S S
P Xn tn 1; =2 p X n + tn 1; =2 p =1 .
n n
190
O erro máximo da estimativa, E, dado nível de con…ança, 1 é dado por:
S
E = tn 1; =2 p .
n
possa estimar a média populacional com um erro E. Isso será dado, isolando-se o
S
valor de n em E = tn 1; =2 p . Assim o tamanho n amostral é dado por:
n
2
tn 1; =2 S
n= .
E
a média de lixo reciclado por pessoa foi de 4; 3 kg por dia, com um desvio padrão de
de con…ança de 90% para a média de lixo reciclado por pessoa no Rio de Janeiro.
Suponha que p seja a proporção dos elementos da população que possuem um certo
191
Teorema Central do Limite, que nos garante:
p^ p
Z=r N (0; 1).
p(1 p)
n
r
p(1 p)
Como depende também do parâmetro, a ideia é substituir
r n r
p(1 p) p^(1 p^)
pela estimativa amostral e assim construir um intervalo de
n n
con…ança para p com uma probabilidade de 1 (nível de con…ança). Assim, temos:
P z =2 Z z =2 =1
0 1
B p^ p C
PB
@ z =2 r z =2 A
C=1
p^(1 p^)
n
r r !
p^(1 p^) p^(1 p^)
P z =2 p^ p z =2 =1
n n
r r !
p^(1 p^) p^(1 p^)
P p^ z =2 p p^ + z =2 =1
n n
Assim, temos:
r r !
p^(1 p^) p^(1 p^)
P p^ z =2 p p^ + z =2 =1 .
n n
possa estimar a média populacional com um erro E. Isso será dado, isolando-se o
r
p^(1 p^)
valor de n em E = z =2 . Assim o tamanho n amostral é dado por:
n
z =2 2
n = p^(1 p^) .
E
192
Observe que a fórmula do tamanho amostral acima depende de uma estimativa
preliminar p^ retirada de uma amostra piloto. Caso não seja possível obter a amostra
preliminar, então tomamos o valor de p^ que maximiza o fator p^(1 p^). Pode-se provar
1
pelo cálculo diferencial que p^ = 2
é o valor que maximiza p^(1 p^). Assim, sem uma
Exemplo 113 Em um estudo com 1:907 acidentes de tráfego, 449 estavam rela-
para estimar a proporção populacional com uma precisão de 2%, sem uma amostra
preliminar.
para estimar a proporção populacional com uma precisão de 2%, usando a estimativa
normal), então
(n 1) S 2 2
2 n 1
193
2
onde n 1 representa a distribuição de Qui-Quadrado com n 1 graus de liberdade.
Distribuição Qui-Quadrado
Assim, temos
2 (n 1) S 2 2
P n 1;1 =2 2 n 1; =2 =1
2 2
P n 1;1 =2 (n 1) S 2 2 2
n 1; =2 =1
2 2 (n 1) S 2
n 1;1 =2 (n 1) S 2 =) 2
2
n 1;1 =2
e
(n 1) S 2
(n 1) S 2 2 2
n 1; =2 =) 2
2
n 1; =2
Assim temos:
!
(n 1) S 2 2 (n 1) S 2
P 2 2
=1 .
n 1; =2 n 1;1 =2
194
Exemplo 114 A …m de se estimar o desvio-padrão dos preços de aparelhos de MP3
95% para a variância e o desvio-padrão dos preços dos aparelhos de MP3 no Rio de
Exercício 127 Seja fX1 ; X2 ; :::; Xn g uma amostra aleatória de variáveis aleatórias
x 1 , se 0 < x < 1
fX (x) =
0, caso contrário
signi…cância de 5%. Para isso ele seleciona uma amostra aleatória de tamanho 25
(a) Qual o intervalo de con…ança obtido? Resp.: P (50; 5160 52; 0840) =
0; 95.
(b) Se o fabricante dos sistemas a…rma que a taxa média de seus produtos é de
Exercício 129 A tensão de ruptura dos cabos produzidos por um fabricante apre-
195
processo de fabricação, proclamou-se que a tensão de ruptura pode ter aumentado.
Para testar essa declaração, ensaiou-se uma amostra de 50 cabos, tendo-se obtido a
corpos de prova de liga U-700. A carga no ponto de falha do corpo de prova é dada
(b) Há evidências de que a carga média na falha excede 10 MPa? Resp.: Sim.
Exercício 132 Um fabricante de uma droga medicinal reivindicou que ela era 90%
196
e…caz em curar alergia, em um período de 8 horas. Para testar essa informação,
submetemos 200 pessoas com alergia à droga e 160 pessoas se curaram após o uso
foi retirada, obtendo-se os dados: 46; 4; 46; 1; 45; 8; 47; 0; 46; 1; 45; 9; 45; 8; 46; 9;
0; 2028) = 0; 95.
X
25 X
25
xi = 4:950 e (xi x25 )2 = 21:600
i=1 i=1
taxa média de colesterol de mulheres acima de 65 anos. Resp.: P (187; 734 208; 266) =
0; 9.
razões para se acreditar nisso com base no intervalo de con…ança construído no item
197
Exercício 135 Deseja-se estimar a proporção de médicos não-fumantes. Para isso,
foram selecionados aleatoriamente 150 médicos e veri…cou-se que 123 deles não fu-
mam.
(a) Baseado nesses dados, construa um intervalo de 99% de con…ança para a ver-
0; 99.
(b) Se o Conselho de Medicina a…rma que menos do que 1=3 dos médicos fumam,
Exercício 136 Deseja-se estimar um salário médio de uma população. Sabe-se que
Qual deve ser o tamanho da amostra aleatória para que se possa garantir, com pelo
menos 98% de con…ança, que o salário médio da amostra não se afastará do salário
médio populacional por mais de 0; 05 salário mínimo? Resp.: Devemos ter uma
198
Capítulo 10
Testes de Hipóteses
Nesta aula exporemos as ideias centrais dos Testes de Hipóteses para uma única pop-
ulação: sua construção e seu elementos fundamentais para uma tomada de decisão
que se deseja é, à luz da informação obtida por uma amostra dessa população,
decidir se aceitamos uma hipótese inicial (chamada de hipótese nula, H0 ) por não
atípico dentro do contexto a…rmado pela hipótese nula. Vejamos como se estrutura
um teste de hipóteses.
ou > 0, respectivamente.
H0 : = 0 H0 : 0 H0 : 0
ou ou .
H1 : 6 = 0 H1 : < 0 H1 : > 0
199
Heurística para o Teste de Hipóteses
situação.
essa amostra veio na verdade de uma população em que o parâmetro era diferente
de 0. Se, por outro lado, a probabilidade não for baixa o bastante, não teremos
estaremos sujeitos a dois tipos de erros: o Erro do Tipo I e o Erro do Tipo II.
200
Vemos que cometemos o Erro do Tipo I, quando a hipótese nula é realmente
Assim, devemos estabelecer a priori o nosso erro do tipo I, , isto é, quanto es-
tamos dispostos a errar ao a…rmar que H0 é falsa quando ela é verdadeira. Quanto
cia, aumentamos o nosso erro do tipo II, pois como estamos muito rigorosos para
rejeitar H0 , corremos mais riscos de aceitá-la quando ela de fato é falsa (erro tipo
II). Assim os erros do tipo I e II estão relacionados: diminuir o erro tipo I im-
as hipóteses H0 : = 0 e H1 : = 1.
Erros Tipo I e II
= 1.
201
O poder do teste, ( ), é a probabilidade de rejeitarmos
H0 quando H0 é de fato falsa, ou seja, ( ) = 1 .
Desejamos testar
H0 : = 0
H1 : 6 = 0
a …gura abaixo:
signi…cância estabelecido.
Desejamos testar
H0 : 0
H1 : < 0
202
Se a estatística do teste se situar na região em vermelho (perfazendo 100 %
signi…cância estabelecido.
Desejamos testar
H0 : 0
H1 : > 0
signi…cância estabelecido.
203
O p-valor, ^ ,é a probabilidade de se obter uma estatística amostral com um
valor tão ou mais extremo que o determinado pelos dados da amostra.
podemos decidir se há evidência su…ciente para rejeitar a hipótese nula. Assim, por
exemplo,
tem uma probabilidade ainda menor (ou igual) àquela em que estabelecemos para
1% devemos aceitar H0 , pois nesse caso não consideramos 2; 46% um evento raro ou
204
(1) Estabeleça as hipóteses nula e alternativa: Escreva H0 e H1 como a…rmati-
vas matemáticas. Lembre que H0 sempre contém o símbolo =., mesmo quando as
hipóteses são 0 ou 0.
de se rejeitar a hipótese nula, caso ela seja a realmente verdadeira (ou seja, de se
obter a estatística teste (ou outro valor mais extremo) na distribuição amostral.
(6) Tome sua decisão: Se p , rejeite a hipótese nula. Se p > , não rejeite a
hipótese nula.
(7) Interprete sua decisão: Dada a alegação da hipótese nula, você poderá
preocupada com o tempo perdido com acidentes de trabalho, cuja média, nos últimos
tempos tem sido da ordem de 60 horas/homem por ano e desvio padrão de 20 ho-
205
tomada uma amostra de nove indústrias e medido o número de horas/homem perdi-
das por acidente, que foi de 50 horas. Deseja-se saber se o programa de prevenção
de 5% se há evidências de melhoria.
5%.
Exemplo 116 Seja X uma v.a. com distribuição binomial, com n = 15. Considere
H0 : p 0; 5
H1 : p < 0; 5
Um teste qui-quadrado pode ser usado para determinar se duas variáveis qual-
B B1 B2 Bs Total
A
A1 O11 O12 O1s N1
A2 O21 O22 O2s N2
.. .. .. .. .. ..
. . . . . .
Ar Or1 Or2 Ors Nr
Total N1 N2 Ns N
206
Denotamos por Oij a frequência observada no cruzamento das categorias Ai
e Bj .
por
Ni Nj
Eij = .
N
H0 : A e B são independentes
H1 : A e B não são independentes
X
r X
s
(Oij Eij )2
0 =
i=1 j=1
Eij
cisão.
Decisão:
2
(i) Se 0 > n; , então devemos rejeitar H0 e aceitar H1 . Ou seja, há evidências
2
(ii) Se 0 n; , então devemos rejeitar H0 e aceitar H1 . Ou seja, há evidências
207
Restrições: Para se utilizar o teste Qui-Quadrado para Tabelas de Contingência
(a) Só pode ser utilizado quando o tamanho da amostra é maior que 20.
(b) Quando o tamanho da amostra é maior que 20 e menor do que 40, só pode
X
2 X
2
(jOij Eij j 0; 5)2
0 =
i=1 j=1
Eij
onde jOij Eij j é o valor absoluto da diferença entre o valor observado e o valor
esperado.
Vejamos um exemplo:
Contador. Para isso, foram selecionadas 220 contadores (112 homens e 108 mul-
tingência.
208
Supondo-se que as variáveis sejam independentes, o valor esperado de cada célula
será:
0 = 5; 51
e = 0; 05 é dado por
2
2;0;05 = 5; 991.
A estatística teste, 5; 51, não cai na região de rejeição, portanto não rejeitamos
dentes. Não se deve portanto contratar contadores com base no gênero, já que ser
gestante. Para isso, 985 gestantes foram selecionadas e divididas segundo duas
209
Solução: Nossas hipóteses a serem testadas são
será:
457 28 457 957
E11 = = 13, E12 = = 444
985 985
528 28 528 957
E21 = = 15, E22 = = 513
985 985
X
2 X
2
(jOij Eij j 0; 5)2
0 =
i=1 j=1
Eij
(j10 13j 0; 5)2 (j447 444j 0; 5)2
= + +
13 444
(j18 15j 0; 5)2 (j510 513j 0; 5)2
+
15 513
= 0; 48 + 0; 014 + 0; 42 + 0; 012
0 = 0; 926
e = 0; 01 é dado por
2
1;0;01 = 6; 635.
A estatística teste, 0; 926, não cai na região de rejeição, portanto não rejeita-
utilizada para se avaliar a correlação linear entre duas variáveis quantitativas e que
210
quanto mais próximo de 0 menor é a correlação entre duas variáveis X e Y . Nosso
H0 : =0
H1 : 6= 0
Pn
i=1 xi Xn : yi Yn
r = qP qP
n 2 n 2
i=1 xi Xn i=1 yi Yn
ou então de forma mais simpli…cada para o cálculo:
Pn P P
n i=1 xi :yi ( ni=1 xi ) : ( ni=1 yi )
r=q P P q P P
2 2
n ni=1 x2i ( ni=1 xi ) n ni=1 yi2 ( ni=1 yi )
Decisão:
(a) Se t0 2
= tn 2; =2 ; tn 2; =2 , então rejeitamos H0 e aceitamos H1 : 6= 0. Ou
211
(b) Se, por outro lado, t0 2 tn 1; =2 ; tn 1; =2 , então não rejeitamos H0 . Ou
correlacionadas.
Exemplo 119 Deseja-se saber se há uma correlação linear entre o número de anos
de estudos completados pelo pai (X) e o número de anos de estudo completado pelo
…lho (Y). Para isso, uma amostra de 8 pares de pai e …lho foi selecionada, obtendo-se
os seguintes dados.
X Y X2 Y 2 XY
1 12 12 144 144 144
2 10 8 100 64 80
3 6 12 36 144 72
4 16 11 256 121 176
5 8 10 64 100 80
6 9 8 81 64 72
7 12 16 144 256 192
8 11 15 121 225 165
Total 84 92 946 1118 981
X
8 X
8 X
8 X
8 X
8
xi :yi = 981, xi = 84, yi = 92, x2i = 946 e yi2 = 1:118.
i=1 i=1 i=1 i=1 i=1
212
Utilizando a fórmula simpli…cada para r, temos
P P8 P8
8 8i=1 xi :yi i=1 xi : i=1 yi
r = q P P8
q
P P8
2 2
8 8i=1 x2i i=1 xi 8 8i=1 yi2 i=1 yi
8 981 84 92
= p p
8 946 842 8 1:118 922
120
= p p
512 480
r = 0; 24 ou r = 24%
H0 : =0
H1 : 6= 0
Assim, nosso teste é bilateral e com o nível de signi…cância dado por = 0; 05,
tn 2; =2 = t6;0;025 = 2; 447.
de signi…cância 5%. Assim, não há evidência su…ciente para se acreditar que haja
uma correlação entre o número de anos de estudos completados pelo pai e o número
213
10.3 Teste de Hipóteses para Diferença de Médias
para Dados Pareados
O objetivo desse teste é avaliar se duas respostas obtidas de uma mesma unidade
X (antes) Y (depois)
1 x1 y1
2 x2 y2
.. .. ..
. . .
n xn yn
X (antes) Y (depois) D
1 x1 y1 d1 = y1 x1
2 x2 y2 d2 = y2 x2
.. .. ..
. . .
n xn yn dn = yn xn
Devemos calcular a média e a variância das diferenças di , isto é,
Pn
i=1 di
Dn = = Yn Xn
n
e
Pn 2
2 i=1 di Dn
SD =
n 1
H0 : D =0 H0 : D 0 H0 : D 0
ou ou .
H1 : D 6= 0 H1 : D <0 H1 : D >0
214
A estatística do teste para todos os casos é dada por
Dn
t0 = SD
p
n
Decisão:
e a média do depois pode ser considerada inferior à média do antes. Se, por outro
e a média do depois pode ser considerada superior à média do antes. Se, por outro
215
lado, t0 tn 1; , então não rejeitamos H0 , ou seja, a média do depois não pode ser
Exemplo 120 A tabela abaixo mostra a freqüência cardíaca (em batidas por min-
uto) de cinco pessoas antes e depois de uma sessão de exercícios físicos. Há evidência
e
P5 2
2 i=1 di D5 9 + 16 + 16 + 1 + 4 46
SD = = = = 11; 5
5 1 4 4
e
p
SD = 11; 5 = 3; 39
D5 59
t0 = S
= 3;39 = 38; 92:
pD p
5 5
seja, há diferença entre o antes e depois e a média do depois pode ser considerada
216
superior à média do antes. Em outras palavras, há evidência su…ciente para aceitar
Nesse contexto os membros de uma amostra não têm relação com os membros
(tratamento e controle).
Desejamos avaliar se a diferença entre as médias Xn1 e Yn2 , isto é, Yn2 Xn1 ,
pode ser considerada estatísticamente como diferente de zero, para se concluir que
H0 : 2 1 =0 H0 : 2 1 0 H0 : 2 1 0
ou ou .
H1 : 2 1 6= 0 H1 : 2 1 <0 H1 : 2 1 >0
II.
Yn Xn1
z0 = q2 2
S1 S2
n1
+ n22
com S12 e S22 as variâncias amostrais dos Grupos I e II, respectivamente, isto é,
Pn1 2 Pn2 2
2 i=1 xi Xn1 2 i=1 yi Yn2
S1 = e S2 = .
n1 1 n2 1
217
A estatística z0 tem distribuição normal padrão.
Decisão:
seja, 2 1.
mês depois, ambos os grupos submetem-se a um teste. A nota média do grupo ex-
218
Desejamos testar as seguintes hipóteses:
H0 : 1 2 H0 : 1 2 0
ou equivalentemente
H1 : 1 > 2 H1 : 1 2 >0
A estatística do teste é dada por
X95 Y105 77 73
z0 = q 2 2
=q = 2; 07
S1 S2 152 122
95
+ 105 95
+ 105
memória.
Quando não se pode colher amostras de 30 ou mais itens, pode usar um teste t, se
não iguais. O primeiro passo, portanto, é testar se as duas variâncias amostrais po-
Suponha que um estudo seja conduzido com n1 do Grupo I e n2 do Grupo II, com
219
Sejam S12 e S22 as variâncias amostrais dos Grupos I e II, respectivamente,isto é,
Pn1 2 Pn2 2
i=1 xi Xn1 i=1 yi Yn2
S12 = e S22 = .
n1 1 n2 1
2 2
H0 : 1 = 2
2 2
H1 : 1 6 = 2
2 2
onde 1 e 2 são as variâncias populacionais dos grupos I e II, respectivamente.
S12
F0 = , se S12 S22
S22
ou
S22
F0 = , se S22 S12
S12
Decisão:
S12
(a) No contexto S12 S22 : Se F0 = S22
> Fn1 1;n2 1; =2 , então rejeitamos H0
2 2
e aceitamos H1 : 1 6= 2, isto é, os dois grupos têm variâncias diferentes. Se, por
S12
outro lado, F0 = S22
Fn1 1;n2 1; =2 , então não rejeitamos H0 , e podemos concluir
220
S22
(b) No contexto S22 S12 : Se F0 = S12
> Fn2 1;n1 1; =2 , então rejeitamos H0
2 2
e aceitamos H1 : 1 6= 2, isto é, os dois grupos têm variâncias diferentes. Se, por
S22
outro lado, F0 = S12
Fn2 1;n1 1; =2 , então não rejeitamos H0 , e podemos concluir
deveria usar o teste t com variâncias iguais ou com variâncias diferentes? Use um
Além disso: S1 = 4; 5 e S2 = 4; 2.
2; 53.
que não há diferença entre as duas variâncias. Ao fazer um teste t para comparar
221
Sejam S12 e S22 as variâncias amostrais dos Grupos I e II, respectivamente,isto é,
Pn1 2 Pn2 2
i=1 xi Xn1 i=1 yi Yn2
S12 = e S22 = e
n1 1 n2 1
H0 : 2 1 =0 H0 : 2 1 0 H0 : 2 1 0
ou ou
H1 : 2 1 6= 0 H1 : 2 1 <0 H1 : 2 1 >0
é dada por
Yn Xn1
t0 = q2
^ n11 + n12
que tem distribuição t-Student com n1 + n2 2 graus de liberdade.
Decisão:
diferentes. Se, por outro lado, t0 2 tn1 +n2 2; =2 ; tn1 +n2 2; =2 , então não rejeitamos
222
e inferior à média do Grupo I. Se, por outro lado, t0 tn1 +n2 2; , não rejeitamos
H0 , ou seja, 2 1.
e superior à média do Grupo I. Se, por outro lado, t0 tn1 +n2 2; , não rejeitamos
H0 , ou seja, 2 1.
Exemplo 123 Cinco pick-ups pequenas e oito SUVs realizaram testes de colisão a
cinco milhas por hora. Para as pick-ups, o conserto do pára-choques custou em média
US$ 1:520, com um desvio padrão de US$ 403. No caso dos SUVs, o conserto custou
uma média de US$ 937, com um desvio padrão de US$ 382. Sendo = 0; 05, teste a
alegação de que o conserto de pára-choques das pick-ups custa mais que o dos SUVs.
Solução: Como na primeira fase se comprovou que as variâncias dos dois grupos
Assim, temos
s
(n1 1) S12 + (n2 1) S22
^ =
n1 + n2 2
s
4 (403)2 + 7 (382)2
=
11
^ = 389; 77
Desejamos testar
H0 : 1 2 H0 : 1 2 0
ou equivalentemente .
H1 : 1 > 2 H1 : 1 2 >0
223
A estatística do teste é dada por
(SUVs).
H0 : 2 1 =0 H0 : 2 1 0 H0 : 2 1 0
ou ou
H1 : 2 1 6= 0 H1 : 2 1 <0 H1 : 2 1 >0
é dada por
Yn Xn1
t0 = q2 2
S1 S2
n1
+ n22
2 2
S1 S2
n1
+ n2
2
que tem distribuição t-Student com = 2 2 graus de liberdade (arredon-
(S12 =n1 ) +
(S22 =n2 )
n1 1 n2 1
dando para o inteiro menor mais próximo).
224
De…nindo um nível de signi…cância , podemos agora tomar nossa decisão a
Decisão:
seja, 2 1.
Exemplo 124 Suponha dois grupos, tais que X15 = 400; 9, S1 = 10; 6 e Y15 =
as hipóteses
H0 : 2 1 =0
H1 : 2 1 6= 0
ao mesmo nível de signi…cância. A estatística do teste é dada por
225
22; 36 = 22 graus de liberdade. O valor tabelado para o teste bilaterial é t ; =2 =
t22;0;025 = 2; 074.
Como t0 = 10; 67 2
= [ 2; 074; 2; 074], rejeitamos H0 e aceitamos H1 : 2 1 6=
populacionais p1 e p2 .
X1 X2
p^1 = e p^2 = .
n1 n2
De…na também
X1 + X2
p= eq=1 p.
n1 + n2
H0 : p 1 p2 = 0 H0 : p 1 p2 0 H0 : p 1 p2 0
ou ou
H1 : p 1 p2 6= 0 H1 : p 1 p2 < 0 H1 : p 1 p2 > 0
p^1 p^2
z0 = r
pq n11 + 1
n2
226
De…nindo um nível de signi…cância , podemos agora tomar nossa decisão a
Decisão:
inferior à proporção do Grupo II. Se, por outro lado, z0 z , não rejeitamos H0 ,
ou seja, p1 p2 .
à proporção do Grupo II. Se, por outro lado, z0 z , não rejeitamos H0 , ou seja,
p1 p2 .
5:131 alunos do ensino médio público, 1:503 disseram ter fumado nos 30 dias prece-
que disseram ter fumado é inferior à proporção dos alunos do sistema público que
227