Apostila Basica-Teresa

Apresentação
Esta apostila contém um resumo do material a ser apresentado na disciplina IC-280,

Estatı́stica Básica, na UFRRJ. O texto é baseado no livro texto da disciplina, Estatı́stica
Básica, de Wilton Bussab e Pedro Morettin e contém também vários exercı́cios de outros
livros. Os exercı́cios retirados do livro texto, estão marcados com o sı́mbolo ♠ . Este resumo
não substitui o livro texto e deve servir apenas de guia para o aluno acompanhar a seqüência
da matéria lecionada.
Nos apêndices, são apresentadas tabelas e respostas de alguns exercı́cios propostos.
Agradecemos a monitora da disciplina Estatı́stica Básica, Manoela Machado do Vale, por
fornecer várias destas respostas.
Antonieta D’Alcântara de Queiroz Peres
Maria Teresa Carneiro da Cunha
1
Resumos e Seleção de Exercı́cios
Estatı́stica Básica
Índice
1 Análise Exploratória de dados 4
1.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2 Apresentação dos dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.3 Gráficos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.3.1 Representação gráfica das variáveis qualitativas . . . . . . . . . . . . 8
1.3.2 Representação gráfica das variáveis quantitativas . . . . . . . . . . . 10
1.3.3 Gráficos especiais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.4 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.5 Conjuntos de dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2 Medidas Associadas a Variáveis Quantitativas 20

2.1 Medidas de Posição . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.1.1 Outras medidas de posição . . . . . . . . . . . . . . . . . . . . . . . 21
2.1.2 Medidas de posição para dados agrupados . . . . . . . . . . . . . . . 23
2.1.3 Distribuição em intervalos de classes . . . . . . . . . . . . . . . . . . 24
2.1.4 Propriedades das medidas de posição . . . . . . . . . . . . . . . . . . 25
2.2 Medidas de Dispersão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.2.1 Medidas de dispersão para dados agrupados . . . . . . . . . . . . . . 27
2.2.2 Propriedades das medidas de dispersão . . . . . . . . . . . . . . . . . 28
2.3 Outras medidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.3.1 Boxplot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.4 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3 Análise bidimensional 40
3.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
3.2 Coeficientes de contingência . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.3 Coeficiente de correlação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.4 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
2
4 Probabilidade 49
4.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
4.2 Probabilidade condicional e independência. . . . . . . . . . . . . . . . . . . 51
4.3 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
5 Variáveis Aleatórias Discretas 60

5.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
5.2 Modelos probabilı́sticos para variáveis aleatórias discretas . . . . . . . . . . 63
5.3 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
6 Variáveis aleatórias contı́nuas 72

6.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
6.2 Valor esperado e variância . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
6.3 Modelos probabilı́sticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
6.3.1 Distribuição Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
6.3.2 Algumas caracterı́sticas da distribuição Normal . . . . . . . . . . . . 76
6.3.3 Uso da tabela da Normal padrão . . . . . . . . . . . . . . . . . . . . 77
6.4 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
7 Distribuições Amostrais 84
7.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
7.2 Distribuição Amostral da Média . . . . . . . . . . . . . . . . . . . . . . . . 86
7.3 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
8 Intervalos de Confiança 93
8.1 Intervalos de confiança para a média populacional . . . . . . . . . . . . . . . 93
8.1.1 σ 2 conhecido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
8.1.2 σ 2 desconhecido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
8.2 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
A Notação de Somatório 103

A.1 Definições . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
A.2 Somatório duplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
A.3 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
B Respostas de alguns exercı́cios selecionados 108
C Tabelas e formulários 115
3
1 Análise Exploratória de dados
1.1 Introdução
A Estatı́stica é a parte da ciência que tem por objetivo
• a coleta, redução, análise e modelagem de dados “parciais” (amostra);
• fazer inferências para o conjunto total de dados (população).
Os dados podem ser obtidos por

observação: quando o pesquisador não pode controlar as caracterı́sticas de interesse;
experimentos: quando o pesquisador controla parcialmente as caracterı́sticas de interesse.
Exemplo 1.1 Suponha que se deseja estudar a relação entre os gastos de consumo e a
renda de um determinado grupo de indivı́duos. Uma pesquisa pode constar da escolha, por
sorteio, de alguns indivı́duos do grupo e da coleta das informações sobre as caracterı́sticas
de interesse nestes indivı́duos.
Exemplo 1.2 Deseja-se comparar duas variedades de cana de açúcar, com respeito a um
tipo de adubação. São escolhidos dois nı́veis de adubo (“ausente”, “presente”, por exemplo)
e algumas mudas de cada uma das variedades são plantadas sob cada um destes nı́veis.
No primeiro exemplo, o pesquisador apenas observa as caracterı́sticas de interesse nos

indivı́duos sorteados, e no segundo exemplo, ele controla uma das caracterı́sticas: o nı́vel
de adubo utilizado no experimento. Em ambos os casos, os dados estão sujeitos a variações
do “acaso”, ou seja, podem ser afetados por condições qua não podem ser controladas ou
observadas.
Por meio de uma análise de dados, busca-se uma forma de regularidade ou padrão, ou
modelo, presente nas observações.
Dados = modelo + resı́duos (D=M+R)
Os resı́duos (ou erros) são a diferença entre as observações e o modelo proposto.
A Análise Exploratória de Dados ( EDA ) é um conjunto de técnicas que busca estabele-
cer a melhor relação D=M+R para um particular conjunto de dados.
Algumas definições importantes:
1. variável: é uma caracterı́stica qualquer do objeto em estudo. Pode ser classificada

como
• variável qualitativa quando apresenta como possı́veis realizações uma qualidade

ou atributo do objeto em estudo;
4
• variável quantitativa - quando apresenta como possı́veis realizações, números
resultantes de uma contagem ou mensuração.
As variáveis qualitativas podem ainda ser divididas em: variáveis qualitativas nominais,
se não existe nenhuma ordem em suas possı́veis realizações ou variáveis qualitativas
ordinais, se existir uma ordem em suas possı́veis realizações.
As variáveis quantitativas podem ainda ser divididas em: variáveis quantitativas dis-
cretas, se seus possı́veis valores formam um conjunto finito ou enumerável ou variáveis
quantitativas contı́nuas, se seus possı́veis valores formam um intervalo ou união de
intervalos de números reais.
Esquematicamente, podemos representar a divisão das variáveis por
NOMINAL
QUALITATIVA
% ORDINAL
VARIÁVEL
& DISCRETA
QUANTITATIVA
CONTÍNUA
2. população: é um conjunto de indivı́duos (ou objetos) tendo pelo menos uma variável
comum observável e que é alvo do estudo.
3. amostra: é qualquer subconjunto da população.
Exemplo 1.3 Na Tabela 1.1, apresentamos os resultados fornecidos por 50 alunos da disci-
plina Estatı́stica Básica, turmas T01 e T02, do segundo semestre de 1999. As variáveis TV
e Ex.Fis correspondem ao número médio de horas gastas por semana assistindo TV e pra-
ticando exercı́cios fı́sicos, respectivamente. A variável OpTV é a opinião sobre a qualidade
da programação da TV (B: Boa, M: Média, R: Ruim e N: Não sabe). A variável Ativ. é o
nı́vel de atividade fı́sica, construı́da da seguinte maneira: sedentário: se o estudante pratica
no máximo 2 horas de exercı́cios fı́sicos semanais; médio: se pratica mais de 2 e menos de 6
horas semanais e ativo: se pratica 6 ou mais horas semanais. Classifique cada uma destas
variáveis.
1.2 Apresentação dos dados

Distribuição de Freqüências: Ao estudar uma variável, o principal interesse do pesquisador
é, em geral, conhecer a distribuição desta variável através dos seus valores. Podemos repre-
sentar a distribuição dos valores de uma variável utilizando uma tabela de freqüências da
forma:
5
Tabela 1.1
Aluno Sexo Idade Altura Peso Fumante? TV OpTV Ex.F. Ativ. N o irmãos Religião
1 M 20 1,75 68,0 N 10 M 2 S 1 Católica
2 F 18 1,65 53,5 N 5 R 5 M 1 Outra
3 F 20 1,65 51,0 N 3 R 5 M 3 Evangélica
4 F 21 1,70 68,0 N 3 R 2 S 0 Católica
5 F 19 1,75 87,0 N 20 B 5 M 2 Católica
6 F 18 1,65 51,0 N 3 R 2 S 0 Evangélica
7 M 17 1,70 64,0 N 4 R 6 A 1 Evangélica
8 M 21 1,74 63,5 N 0 N 0 S 5 Nenhuma
9 M 19 1,64 54,3 N 18 B 2 S 0 Católica
10 M 20 1,79 77,0 N 14 B 3 M 0 Nenhuma
11 M 18 1,70 53,0 N 2 R 3 M 2 Evangélica
12 M 21 1,76 69,0 N 2 R 1 S 0 Católica
13 M 18 1,73 66,0 N 6 M 4 M 4 Católica
14 F 20 1,62 56,0 N 3 R 0 S 2 Católica
15 M 20 1,73 65,0 N 2 R 0 S 8 Católica
16 F 20 1,74 58,0 N 9 M 2 S 1 Católica
17 F 19 1,65 67,0 N 4 R 0 S 1 Evangélica
18 M 18 1,85 80,0 N 3 R 0 S 1 Católica
19 M 21 1,77 66,0 N 2 R 0 S 2 Católica
20 M 20 1,67 64,0 N 1 R 10 A 1 Nenhuma
21 F 20 1,65 59,0 N 8 M 2 S 1 Católica
22 M 20 1,66 56,0 N 3 R 0 S 3 Outra
23 F 19 1,60 52,0 N 6 M 2 S 2 Católica
24 F 19 1,60 45,0 N 15 B 2 S 1 Católica
25 M 19 1,83 70,0 N - - 2 S 1 Nenhuma
26 M 19 1,70 70,0 N 23 B 6 A 0 Católica
27 F 23 1,58 58,0 N 2 R 2,5 M 2 Nenhuma
28 M 21 1,87 76,0 N 22 B 2 S 1 Outra
29 F 21 1,58 51,0 N 20 M 2 S 4 Católica
30 M 26 1,82 75,0 N 5 B 3 M 4 Outra
31 F 29 1,60 52,0 N 20 R 0 S 2 Nenhuma
32 M 23 1,82 72,0 N 5 B 2 S 0 Católica
33 M 20 1,83 85,0 N 14 B 2 S 3 Católica
34 M 50 1,68 71,0 N 15 B 5 M 3 Católica
35 M 23 1,77 82,5 N 15 B 2 S 2 Católica
36 F 21 1,69 53,0 N 10 M 2 S 1 Católica
37 M 20 1,83 - N 6 N 2 S 1 Católica
38 M 20 1,76 74,0 N 0 N 6 A 4 Nenhuma
39 M 23 1,81 85,0 N 1 R 0 S 1 Evangélica
40 F 20 1,63 57,5 N 2 B 0 S 2 Nenhuma
41 M 32 1,85 87,5 S 15 R 2 S 1 Nenhuma
42 M 20 1,70 60,0 S 3 B 3 M 3 Nenhuma
43 F 19 1,70 78,0 N 14 R 4 M 0 Evangélica
44 M 20 1,82 80,0 N 1 R 1 S 2 Outra
45 M 19 1,82 55,0 N 20 B 0 S 2 Católica
6
Tabela 1.2 Tabela de freqüências
Variável Freqüência (ni ) Proporção (fi ) Porcentagem (%)
nı́vel 1 n1 f1 100 × f1
nı́vel 2 n2 f2 100 × f2
.. .. .. ..
. . . .
nı́vel k nk fk 100 × fk
Total n = n1 + n2 + . . . + nk 1 = f1 + . . . + fk 100
em que
• n é o número total de observações do conjunto;
• k é o número de nı́veis da variável em questão;
• i é o ı́ndice que indica o nı́vel da variável;
• ni é o número de observações para o nı́vel i da variável;
• fi = ni /n é a proporção de casos no nı́vel i da variável.
Exemplo 1.4 Representar as variáveis “Religião” e “Nı́vel de atividade fı́sica” em tabelas

de freqüência.
Tabela 1.3 Distribuição de freqüências: “Religião ” .
Religião freqüência (ni ) proporção(fi ) %

Católica 23 0,51 51%
Evangélica 7 0,16 16%
Nenhuma 10 0,22 22%
Outras 5 0,11 11%
Total 45 1.00 100%
Tabela 1.4 Distribuição de freqüências:“Nı́vel de atividade fı́sica”.
Atividade freqüência (ni ) proporção (fi ) %

Ativo 4 0.09 9%
Médio 11 0.24 24%
Sedentário 30 0.67 67%
Total 45 1.00 100%
Exemplo 1.5 Representar as variáveis “Nı́vel de atividade fı́sica” e “Sexo” em uma mesma
tabela de freqüências (Distribuição Conjunta).
7
Tabela 1.5 Distribuição conjunta: Nı́vel de atividade fı́sica por Sexo
Sexo
Atividade Feminino Masculino Total
Ativo 0 4 4
Médio 5 6 11
Sedentário 12 18 30
Total 17 28 45
Exemplo 1.6 Representar a variável “Peso” utilizando uma tabela de freqüências. Neste
caso, vamos criar um artifı́cio para representar esta variável em uma tabela de freqüências.
Os nı́veis das variáveis serão representados por intervalos de classe. Vejamos:
Tabela 1.6 Distribuição de freqüências: “Peso (kg)”
Classe xi ni fi %
45 ` 55 50 10 0.23 23%
55 ` 60 57,5 7 0.16 16%
60 ` 70 65 11 0.25 25%
70 ` 80 75 9 0.20 20%
80 ` 90 85 7 0.16 16%
Total – 44 1 100%
em que
• xi é o ponto médio do intervalo ( representa agora o valor da variável naquele intervalo);
• ni é a freqüência de cada classe.
Note que um dos alunos não informou o peso e utilizamos o total de 44 alunos para obter
a freqüência relativa.
1.3 Gráficos
Uma outra forma de se apresentar os dados é por meio da utilização de Gráficos.
1.3.1 Representação gráfica das variáveis qualitativas

Existem vários tipos de gráficos que podem ser utilizados para representar as variáveis qual-
itativas. Para construir estes gráficos, consideraremos as freqüências com que os nı́veis das
variáveis aparecem em um conjunto de dados.
8
Gráfico de Barras
É um dos gráficos mais utilizados para representar variáveis qualitativas. Algumas ob-
servações devem ser feitas sobre este gráfico.
1. O gráfico tem apenas uma escala, a que representa a freqüência ou porcentagem em

cada nı́vel da variável;
2. A largura da barra utilizada não tem nenhum significado especial além do apelo visual;
3. Para facilitar a compreensão e análise, é preferı́vel que as barras sejam apresentadas

segundo uma ordem sistemática. O critério mais utilizado é ordená-las por sua mag-
nitude;
4. As barras devem ser colocadas, de preferência, no sentido horizontal pois desta forma
o nome dos nı́veis da variável podem ser melhor visualizados.
5. É preferı́vel utilizar freqüências quando estivermos representando subdivisões dos nı́veis

das variáveis.
6. Para representar a participação em porcentagem de cada subnı́vel de uma variável,

é recomendável a utilização de barras representando 100% das observações em cada
nı́vel.
Exemplo 1.7 Fazer um gráfico de Barras para a variável “Religião ” cujos valores encontram-
se na Tabela 1.3.
Exemplo 1.8 Representar graficamente a tabela conjunta das variáveis “Nı́vel de atividade
fı́sica” e “Sexo”(Tabela 1.5). Fazer em sala de aula.
9
Gráfico de Setores
É também um gráfico bastante utilizado para representar variáveis qualitativas. É muitas
vezes chamado de Gráfico de Torta ou Gráfico de pizza. Neste gráfico, um cı́rculo representa
100% das observações e cada nı́vel da variável é representado por um setor de área propor-
cional à freqüência observada. Algumas observações podem ser feitas a respeito da construção
do gráfico.
1. Não é um gráfico recomendado quando se quer representar subdivisões dos nı́veis da

variável;
2. Não é recomendado quando o número de nı́veis da variável é muito grande.
Exemplo 1.9 Em recente pesquisa em uma pequena comunidade do interior de Minas

Gerais, foram ouvidos 600 homens e 400 mulheres sobre o consumo de álcool. Entre os
entrevistados, cerca de 400 homens consumiam bebidas alcóolicas sendo que 80% destes be-
biam regularmente e o restante apenas eventualmente. Entre as mulheres, embora a maioria
(70%) consumissem bebidas alcóolicas apenas 120 o faziam regularmente. Representar estas
informações em uma tabela de freqüências e depois colocá-las em um gráfico de colunas
(Figura 1) e em um gráfico de setores (Figura 2).
Tabela 1.7 “Consumo de bebidas: Exemplo 1.9”

Sexo Não bebe Bebe eventualmente Bebe regularmente Total
Masculino 200 80 320 600
Feminino 120 160 120 400
Total 320 240 440 1000
1.3.2 Representação gráfica das variáveis quantitativas
Gráfico de linhas
É o mais comum dos gráficos e um dos mais simples, representando os nı́veis das variáveis
em coordenadas retangulares. Observação sobre a construção do gráfico:
• É um gráfico particularmente útil para representar séries de tempo. O tempo é repre-
sentado no eixo X e a série no eixo Y .
• É comum representar-se mais de uma série no mesmo gráfico.
Exemplo 1.10 Faça um gráfico de linhas representando as séries abaixo.
Mes Jan Fev Mar Abr Mai Jun Jul

INPC 28.8 24.8 27.5 28.3 26.8 30.3 31.0
IRSM 27.9 25.8 26.8 28.2 28.4 30.5 29.2
10
Figura 1: Gráfico de setores: Exemplo 1.9
Figura 2: Gráfico de barras: Exemplo 1.9
11
Figura 3: Gráfico de linhas: Exemplo 1.10
Figura 4: Gráfico de colunas: Exemplo 1.10
Gráfico de colunas
Neste gráfico, os nı́veis das variáveis são também representados por barras, só que verti-
cais. É, em geral, utilizado para representar séries de tempo. Observações sobre a construção
do gráfico:
1. As duas escalas estão presentes, no eixo X representamos o tempo e no eixo Y os nı́veis

da variável;
2. Pode ser utilizado para representar mais de uma série. Neste caso as colunas aparecem
juntas.
Exemplo 1.11 Vamos representar os dados da tabela anterior por um gráfico de colunas.
12
1.3.3 Gráficos especiais
O histograma
O histograma é um gráfico que representa números pela área e não pela altura. É
utilizado, em geral, para representar distribuições de variáveis contı́nuas quando os dados
estão agrupados em classes de freqüência. Embora tenha a aparência de um gráfico de
colunas, não deve ser confundido com ele.
Podemos construir histogramas de freqüências, de proporção ou de porcentagem. A
distribuição nas diversas classes é representada por blocos construı́dos da seguinte forma,
• a base do bloco é o comprimento do intervalo de classe;
• a altura do bloco é a densidade, de freqüência, de proporção ou de porcentagem, na

classe.
A densidade na classe i é definida por

ni
di = , no caso de freqüências,
4i
fi
di = , no caso de proporção,
4i
100 × fi
di = , no caso de porcentagem,
4i
em que 4i representa o comprimento do intervalo da i-ésima classe.
Observações:
• A área do bloco obtido é a quantidade representada naquela classe.
• A área total do histograma representa 100% das observações. Logo, a área total de um
histograma de freqüências é igual a n, a de um histograma de proporção é igual a 1 e
a de um histograma de porcentagem é igual a 100%.
• A área entre dois valores quaisquer fornece uma aproximação para a freqüência (ou
proporção ou porcentagem) no intervalo limitado por eles.
• O número de intervalos de classes e sua amplitude são arbitrários e dependem do

conjunto de dados em questão. É comum, no entanto, encontrar a seguinte fórmula
para o número ideal de classes, K:
K = 1 + log2 n ( Fórmula de Sturges).
Uma vez determinado o valor de K, divide-se a amplitude total pelo número K, para
obter o comprimento dos intervalos das classes. Observe que neste caso, obtemos todas
as classes com a mesma amplitude, o que nem sempre é conveniente.
13
Polı́gono de Freqüências
O polı́gono de freqüências é construı́do de forma semelhante a do histograma. Une-se
o ponto médio das classes na altura determinada pela densidade. Para fechar o polı́gono
unimos os extremos da figura com o eixo das abcissas, nos quais estariam os pontos médios
de uma classe imediatamente anterior e outra imediatamente posterior. Embora a área total
abaixo do polı́gono de freqüências também seja igual a 100% das observações, não podemos
aproximar a freqüência entre dois pontos pela área delimitada por eles.
Histograma Alisado
Se houvesse um número suficientemente grande de observações poder-se-ia ir diminuindo
os intervalos de classe e o histograma iria ficando cada vez menos irregular ate atingir um
caso limite, com uma curva bem mais suave. Esta curva é chamada de histograma alisado.
Ogiva
É o gráfico representativo de uma distribuição acumulada de freqüências e consta de uma
poligonal ascendente. No eixo horizontal colocam-se as extremidades de classe e no eixo
vertical, as freqüências acumuladas (ou proporção acumulada, ou porcentagem acumulada).
Ramo e folhas
A forma de uma distribuição é uma caracterı́stica importante de um conjunto de dados.
Um procedimento alternativo para resumir um conjunto de dados, com o objetivo de se ter
uma idéia da forma da distribuição é o ramo-e-folhas. Uma vantagem do ramo-e-folhas sobre
o histograma é que não perdemos informações sobre os dados.
Observações sobre a construção de um ramo-e-folhas
1. Não existe regra fixa para a construção de um ramo-e-folhas. A idéia básica é dividir
cada observação em duas partes: a 1a , o ramo, é colocada à esquerda de uma linha
vertical; a 2a , a folha, é colocada à direita desta linha.
2. Todos os ramos devem ter o mesmo comprimento.
3. Se ao fazer uma escolha de ramos obtivermos ramos muito carregados, podemos fazer
uma sub-divisão neles.
1.4 Exercı́cios
1.1 As áreas dos vários continentes do mundo, em milhões de quilômetros quadrados, estão
apresentadas na tabela abaixo:
14
Continente Área
África 30,3
Ásia 26,9
Europa 4,9
América do Norte 24,3
Oceania 8,5
América do Sul 17,9
URSS 20,5
TOTAL 133,3
Represente graficamente os dados.
1.2 A tabela seguinte mostra a população estimada, rural e urbana, para o Brasil, em
milhões de pessoas, de acordo com a Fundação IBGE
Ano 1972 1973 1974 1975 1976 1977 1978 1979

População urbana 56,6 59,0 61,5 64,1 66,7 69,5 72,3 75,2
População rural 42,1 12,4 42,7 43,1 43,4 43,8 44,1 44,5
Construa um gráfico que mostre a porcentagem das pessoas que são,

a) residentes da zona urbana; b) residentes da zona rural.
1.3 A tabela seguinte mostra as áreas, em milhões de quilômetros quadrados, dos oceanos.
Represente graficamente os dados, utilizando
a) um gráfico de barras; b) um gráfico de setores.
Oceano Pacı́fico Atlântico Índico Antártico Ártico

Área 183,4 106,7 73,8 19,7 12,4
1.4 Os conjuntos de dados 1, 2, 3 e 4 (Seção 1.5: apêndice no final desta seção) referem-se
à idade de ingresso na Universidade X e altura de estudantes segundo o sexo. Para cada um
deles:
a) Construa um Ramo-e-folhas.
b) Com base no Ramo-e-folhas, construa o histograma, escolhendo apropriadamente os
intervalos de classe.
1.5 Com base nos histogramas dos grupos 1 a 4, obtenha para cada um dos nı́veis da
variável sexo:
15
a) a porcentagem de estudantes com menos de 18 anos;
b) a porcentagem de estudantes com no mı́nimo 19 anos;
c) a altura abaixo da qual se encontra 90% dos estudantes;
d) a altura mı́nima dos 20% dos alunos mais altos.
1.6 Com base nos Ramo-e-folhas, responda as mesmas perguntas da questão 2 e compare
as respostas.
1.7 É possı́vel afirmar, com base nos gráficos, que existe diferença entre as distribuições de
alturas dos estudantes com relação ao sexo? E entre as distribuições de idades de ingresso
na Universidade X?
1.8 Os dados do conjunto 5 (Seção 1.5) referem-se à populações de alguns municı́pios do

estado Y.
a) Construa um ramo-e-folhas e um histograma para este conjunto.
b) Comente sobre as principais caracterı́sticas da distribuição.
1.9 Os dados dos conjuntos 6 e 7 (Seção 1.5) referem-se aos tempos de vida de lotes de
lâmpadas de duas companhias concorrentes A e B.
a) Construa um ramo-e-folhas para cada um dos conjuntos.
b) Comente sobre as principais diferenças entre as distribuições.
c) Você seria capaz de se decidir por uma das companhias, caso tivesse que adquirir um
lote de lâmpadas? Por quê?
1.10 Os dados dos conjuntos 8 e 9 (Seção 1.5) referem-se ao ganho de peso de alguns
animais que foram alimentados com as rações A e B, por um determinado tempo.
a) Construa um ramo-e-folhas para cada um dos conjuntos.
b) Comente sobre as principais diferenças entre as distribuições.
c) Você seria capaz de se decidir por uma das rações, caso fosse chamado a opinar sobre
o assunto?
1.11 O histograma abaixo representa a distribuição dos frangos de uma determinada granja
em relação ao peso:
16
Queremos dividir os frangos em quatro categorias com relação ao peso, de modo que:
Os 20% mais leves sejam da categoria D;
Os 25% seguintes sejam da categoria C;
Os 25% seguintes sejam da categoria B;
Os 30% seguintes sejam da categoria A.
Quais os limites de peso entre as categorias A, B, C e D?
1.12 Em uma pesquisa em uma pequena comunidade dos Estados Unidos, foram observadas
as seguintes distribuições:
a) altura dos adultos casados;

b) altura de todos os membros de famı́lias cujos pais tem idade inferior a 30 anos;
c) altura de todos os membros da comunidade;
d) altura de todos os automóveis da cidade.
Cada um dos histogramas abaixo refere-se a uma das distribuições acima. Associe cada
um deles à distribuição que ele melhor representa.
17
1.5 Conjuntos de dados
CONJUNTO 1: Idade (anos completos) - Sexo Feminino.
27 22 19 18 21 17 19 20 16 18 18 18 18 20 22 18 19 18 19 19
20 19 20 20 18 21 18 20 22 19 19 22 23 18 29 19 17 20 19 18
18 20 19 20 18 24 18 19 21 24
CONJUNTO 2: Altura (cm) - Sexo Feminino
167 168 155 174 161 160 153 163 168 155 169 162 166 159 165 154 160
160 163 169 171 160 164 154 160 157 163 160 169 163 158 170 156 164
162 164 161 172 160 168 158 166 161 161 165 164 155 168 161 151
CONJUNTO 3: Idade (anos completos) - Sexo Masculino.
17 19 19 21 18 17 18 21 17 17 20 18 16 18 17 18 20 19 19 17
18 17 22 17 26 17 32 22 17 17 19 17 26 18 20 18 20 17 16 19
17 18 20 24 17 21 17 17 17 17 22 21 19 17 20 17 20 20 17 18
17 20 17 18 17 20 21 17 20 17 21 17 17 18 19
CONJUNTO 2: Altura (cm) - Sexo Masculino.
171 172 166 167 177 158 175 169 178 176 170 163 175 173 179 171 167
172 170 171 167 172 161 174 179 163 177 177 170 174 165 173 167 169
180 183 172 158 173 172 177 173 174 167 165 175 170 174 186 169 165
174 170 175 173 161 178 180 172 170 173 176 172 172 168 176 175 157
157 175 158 179 166 166 167
CONJUNTO 5: População - Municı́pios do Estado do Rio de Janeiro.
42886 50910 9034 32096 33025 35136 42530 30648 29864 21156
32411 31471 40392 46580 39257 29547 29942 32997 60666 35823
37527 240484 43620 39402 42215 317483 25772 39302 51822 48413
36772 35930 35230 40299 48245 29436 29650 54858 52619 40055
29089 27389 41352 42624 46355 61400 31121 34663 33037 38945
46253 36228 36348 53659 55199 41738 39426 32494 31818 34208
34807 40069 49530 49467 43308 33088 21762 31027 27647 33629
18
CONJUNTO 6: Duração das lâmpadas - Companhia A
783 1361 2385 159 1614 497 1334 3694 672 2254
1415 1035 1372 109 1895 1526 2569 1005 937 2873
646 1358 1806 785 1810 1091 1563 3178 1341 173
927 881 1471 191 1066 1976 1237 2082 4096 4171
1274 4240 11922 2266 2686 912 3025 1228 832 1617
CONJUNTO 7: Duração das lâmpadas - Companhia B.
3832 743 1616 4002 5606 722 4203 2069 3790 1819
613 310 4449 2711 2398 2445 3767 5290 1963 2085
586 972 1503 4046 2426 3705 204 1308 11848 1315
2518 626 3036 1811 4060 1392 3684 5810 2323 2221
622 3595 1745 1825 1215 2556 3653 1567 3006 1964
CONJUNTO 8: Ganho de Peso (kg) - Ração A.
26 30 65 43 27 28 31 28 30 33 60 34 26 32 34 35 29 27 29 34
27 31 66 44 28 29 32 29 31 34 61 35 27 33 35 36 30 28 30 35
CONJUNTO 8: Ganho de Peso (kg) - Ração B.
26 4 35 38 43 43 41 36 9 40 37 42 34 42 39 39 35 35 41 40
25 3 34 37 42 42 40 35 8 39 36 41 33 41 38 38 34 34 40 39
19
2 Medidas Associadas a Variáveis Quantitativas
2.1 Medidas de Posição
A redução dos dados provenientes da observação de uma variável quantitativa por meio do ramo-
e-folhas ou tabelas de frequências pode fornecer mais informações sobre o comportamento desta
variável do que a própria série original de dados. Nesta seção, apresentaremos alguns valores, as
medidas de tendência central, ou medidas de posição, que são representativos da série toda. As
medidas de posição são quantidades que dão uma idéia da localização do conjunto de valores.
Moda
Representada por M o, a moda é definida como a realização mais freqüente de um conjunto de
dados. Por exemplo,
• Conjunto A: 1, 2, 2, 2, 3, 4, 5. A moda é o valor 2.
• Conjunto B: 1, 2, 3, 4, 5. O conjunto não tem uma moda (é amodal)
• Conjunto C: 1, 1, 2, 2, 3, 4. O conjunto tem duas modas, os valores 1 e 2. Dizemos que o

conjunto é bimodal
Quando um conjunto apresenta mais de 2 modas, dizemos que ele é multimodal.
Mediana
Representada por M d, a mediana é definida como sendo a realização que ocupa a posição central
de uma série de observações quando estas estão ordenadas segundo suas grandezas (ordem crescente
ou decrescente). A mediana deixa 50% da distribuição abaixo dela e 50% acima. Por exemplo,
• Conjunto D: 10, 20, 30, 40, 50. A mediana é o valor que ocupa a terceira posição, isto é,
M d = 30.
• Conjunto E: 1, 2, 3, 4, 5, 6. A mediana é o ponto médio entre os dois valores que ocupam a

posição central, isto é, M d = (3 + 4)/2 = 3.5.
De um modo geral, se o número n de observações no conjunto é ı́mpar, então a mediana é o valor

que ocupa a posição (n + 1)/2; se n é par, então a mediana é o ponto médio entre os valores que
ocupam as posições n/2 e (n/2) + 1. Lembre-se que é necessário ordenar o conjunto para identificar
a posição da mediana.
Média Aritmética
Representada por M e ou por x̄, a média aritmética é definida como sendo a soma de todas as
observações dividida pelo número delas.
Por exemplo, a média aritmética do conjunto A acima é:
1+2+2+2+3+4+5
Me = = 19/7 = 2, 714
7
20
De um modo geral, se x1 , x2, x3, . . . , xn são observações da variável X, então a média aritmética
desses valores é dada por:
Pn
x 1 + x2 + x3 + . . . + x n i=1 xi
M e(X) = =
n n
A Média Geométrica
Se x1, x2, . . . , xn são valores positivos, podemos definir sua média geométrica, dada por
√
n
Mg = x1 × x 2 × · · · × x n
A média geométrica de um conjunto de valores é sempre menor ou igual a média aritmética

deste mesmo conjunto. É muito utilizada para encontrar taxas médias.
Média Harmônica
A média harmônica H de um conjunto de valores x1 , x2, . . . xn positivos, é definida como sendo
o inverso da média aritmética dos inversos dos valores, isto é,
n
H=P
n 1
i=1 xi
Observação. As medidas vistas acima são também chamadas medidas de tendência central. A
média aritmética é talvez a mais utilizada entre todas elas podendo, contudo, conduzir a erros
de interpretação quando a utilizamos como medida de posição central. Em muitas situações, a
mediana é um valor mais adequado.
2.1.1 Outras medidas de posição

Quantil
Os quantis são quantidades que dividem a distribuição de valores em grupos do mesmo tamanho.
Os quantis mais comuns recebem nomes especiais. São eles: os quartis, os decis e os percentis.
• Quartil Os quartis são quantis que dividem a distribuição em quatro partes de mesmo
tamanho. Assim, o primeiro quartil (Q1 ) deixa um quarto das observações abaixo dele e três
quartos acima, o segundo quartil (Q2 = Md ) deixa metade dos valores abaixo dele e metade
acima e o terceiro quartil (Q3) deixa três quartos dos valores abaixo dele e um quarto acima.
Uma forma simples de encontrar os quartis é a seguinte: primeiramente, encontramos a
mediana e separamos as observações em dois grupos do mesmo tamanho. Se o número de
observações for ı́mpar, incluı́mos a mediana nos dois grupos. Depois, encontramos a mediana
do primeiro grupo, que será o Q1 e a mediana do segundo grupo, que será o Q3.
• Decil Os decis são quantis que separam a distribuição de valores em 10 grupos do mesmo
tamanho.
21
• Percentil - O percentil de ordem 100p de um conjunto de valores dispostos em ordem
crescente é um valor tal que pelo menos (100p)% das observações são menores ou iguais a ele
e pelo menos 100(1 − p)% são maiores ou iguais a ele. O percentil de ordem 50% é a mediana.
Esta definição pode ser formalizada como segue
(100p)% das observações ≤ P100p,

e 100(1 − p)% das observações ≥ P100p
Veja que P10 = D1, . . . , P90 = D9 e também que P25 = Q1, P50 = Q2 = M d e P75 = Q3.
Exemplo 2.1 Determine os percentis de ordem 30 e 75 do seguinte conjunto:
X = {34, 43, 46, 58, 63, 63, 66, 68, 71, 72, 73, 73, 75, 76, 82, 83, 86, 90, 91, 93, 95, 98, 98, 99}
Temos 24 observações. O percentil de ordem 30 deixa 0, 3 × 24 = 7, 2 (ou seja, 8) observações

abaixo dele (ele incluı́do) e 0, 7 × 24 = 16, 8 (ou seja, 17) acima. Encontramos: P30 = 68.
O percentil de ordem 75 deixa 0, 75 × 24 = 18 observações abaixo dele (ele incluı́do) e
0, 25 × 24 = 6 acima. Vemos então que o percentil é um valor entre 90 e 91. Neste caso,
convenciona-se considerar o ponto médio entre os dois valores como o percentil procurado, o
que nos dá: P75 = (90 + 91)/2 = 90.5.
Observações
• Os quantis são medidas resumo que fazem sentido quando o número de observações é grande.
No exemplo 2.1 acima, queremos separar um grupo de 24 observações em 100 grupos do
mesmo tamanho, o que não resume nada, apenas ilustra o cálculo desta quantidade.
• A definição de quantil para dados não agrupados não é padronizada e é comum encontrarmos
várias formas distintas de obter estes valores. Uma outra forma de cálculo, que pode fornecer
valores distintos dos quantis obtidos com a definição anterior para o mesmo conjunto de dados,
é a seguinte: a posição k do quantil desejado no conjunto de valores é dada por:
s(n + 1)
k= ,
r
em que r é o quantil desejado e s é a ordem do quantil. Quando k não for um valor inteiro,
ele pode ser aproximado para o inteiro mais próximo ou então encontra-se o quantil por meio
de interpolação linear. Então,
Quantil r s
Quartil 4 {1,2,3}
Decil 10 {1,2,3,. . . ,9}
Percentil 100 {1,2,. . . , 99 }
Exemplo 2.2 Calcule Q1, Q2 e Q3 para os dados do Exemplo 2.1 pelos dois métodos e
compare os resultados.
22
Pelo primeiro método, encontramos a mediana (Q2 ) pelo ponto médio dos dois valores cen-
trais: (73+75)/2 = 74. Depois, as medianas das duas metades, que também tem um número
par de observações. Então, Q1 = (63 + 66)/2 = 64.5 e Q3 = (90 + 91)/2 = 90, 5. Note que
Q3 coincidiu com o percentil de ordem 75 do exemplo anterior.
Pelo segundo método, localizamos a posição do primeiro quartil = 1 × (24 + 1)/4 = 6, 25 e
aproximamos para o inteiro mais próximo, 6. Logo, o primeiro quartil é a observação de ordem
6, que é 63. A posição do terceiro quartil é 3 × (24 + 1)/4 = 18, 75, que aproximamos para
19. Logo, o terceiro quartil é dado por 91. A posição da mediana é dada por 2 × 25/4 = 12, 5
e encontramos a mediana pelo ponto médio das observações de posição 12 e 13.
2.1.2 Medidas de posição para dados agrupados

Distribuições de Freqüências
Imagine agora que os dados para os quais desejamos encontrar as medidas de posição estejam
colocados na forma de uma tabela de freqüências, como segue,
i xi ni fi fi acumulada
1 x1 n1 f1 f1
2 x2 n2 f2 f1 + f 2
..
.
k xk nk fk f1 + f 2 + · · · + f k = 1
Total n 1 –
Todas as medidas de posição tem a mesma definição do caso de dados não agrupados. A moda
e a mediana são calculadas da mesma forma, isto é,
Moda: é o valor de xi que corresponde ao maior valor de ni ou o maior valor de fi .

Mediana: é o primeiro valor com freqüência relativa acumulada maior ou igual a 50%.
No caso da média aritmética, podemos usar a informação da tabela para simplificar os cálculos.
O exemplo a seguir ilustra a situação.
Considere o seguinte conjunto de valores:
Conjunto F: 1, 2, 2, 2, 3, 3, 3, 3, 4, 4. Observe que o 2 aparece 3 vezes, o valor 3 aparece 4 vezes
e o valor 4 aparece 2 vezes no conjunto. A média aritmética é,
1+2+2+2+3+3+3+3+4+4 1+3×2+4×3+2×4 27
Me = = = = 2, 7. (1)
10 10 10
Os dados do conjunto F poderiam estar resumidos na seguinte tabela
i xi ni fi fi acumulada xi fi
1 1 1 0, 1 0, 1 0,1
2 2 3 0, 3 0, 4 0,6
3 3 4 0,4 0,8 1,2
4 4 2 0,2 1,0 0,8
Total n 1 – 2,7
23
A última coluna foi incluı́da para mostrar como a conta (1) poderia ter sido feita.
De um modo geral, temos que a média aritmética para um conjunto de dados agrupados em
uma tabela de freqüências é,
Pk k
xi ni X
Me = x̄ = i=1 = xi fi .
n i=1
2.1.3 Distribuição em intervalos de classes

Ao contrário da distribuição simples de freqüências, quando as observações estão agrupadas em
intervalos de classes, não se pode recuperar toda a informação do conjunto original. Desta forma,
as medidas de posição calculadas a partir destas distribuições são apenas aproximações para as
medidas do conjunto original.
Considere a seguinte distribuição,
Classe xi ni fi fi acumulada
l1 ` L 1 x1 n1 f1 f1
l2 ` L 2 x2 n2 f2 f1 + f 2
..
.
lk ` L k xk nk fk f1 + f 2 + · · · + f k = 1
Total n 1 –
em que li e Li denotam os limites inferior e superior da classe i, respectivamente (em geral, li+1 =
Li );
xi é o ponto médio do intervalo da i-ésima classe, isto é,
li + Li
xi = .
2
O sı́mbolo ` indica que o limite inferior está incluı́do na classe e o limite superior não. A moda e
a média são calculadas exatamente como na distribuição simples de freqüência. No caso da média,
Pk k
xi ni X
i=1
Me = = xi fi .
n i=1
Para encontrar a mediana podemos utilizar o histograma, que fornece uma melhor aproxi-
mação neste caso. Isto é, a mediana é a observação que deixa abaixo dela uma área correspondente
a 50% da área total do histograma. Lembre-se que a área total de um histograma é igual a 1 se o
histograma é de proporção, 100% se o histograma é de porcentagem ou n se for de freqüência.
Exemplo 2.3 Vamos calcular a média aritmética e a mediana para a seguinte distribuição em
classes de freqüência. Para a mediana, vamos construir um histograma de proporção.
Classe xi ni fi xi fi fi ac. ∆i di
0 ` 3 1,5 10 0,40 0,60 0,40 3 0.133
3 ` 5 4,0 4 0,16 0,64 0,56 2 0.080
5 ` 10 7,5 5 0,20 1,50 0,76 5 0.040
10 ` 15 12,5 2 0,08 1,00 0,84 5 0.016
15 ` 25 20,0 4 0,16 3,20 1,00 10 0.016
Total 25 1,00 6,94 – – –
24
Então, a média aritmética é x̄ = 6, 94. A classe que contém a mediana é a segunda classe, pois ela
é a primeira cuja freqüência relativa acumulada ultrapassa 0,5.
Histograma
Para obter o valor da mediana, vamos procurar o valor na classe 3 ` 5, que limita uma área
igual a 0,1 entre ele e 3 (pois a classe anterior corresponde a uma área igual a 0,4). Logo,
0, 1
(Md − 3) × 0, 08 = 0, 1 ⇒ Md = + 3 = 4, 25
0, 08
O valor 0,08 que aparece acima é o valor da densidade de proporção na classe mediana que
define a altura do bloco.
Quantis Os quantis podem ser calculados de forma análoga à empregada para obtenção da mediana,
bastando determinar qual a porcentagem que deve ficar abaixo do quantil desejado.
2.1.4 Propriedades das medidas de posição

Com exceção das médias harmônica e geométrica, todas as outras medidas de posição vistas nesta
seção satisfazem as seguintes propriedades:
1. Se X = {a, a, . . ., a}, então as medidas de posição são iguais a a.
2. Se X = {x1 , x2, . . . , xn} e Y = {x1 + a, x2 + a, . . ., xn + a}, então as medidas de posição do

conjunto Y são as medidas de posição de X somadas com a. Então, M e(Y) = M e(X) + a,
Md (Y) = Md (X) + a, Q1(Y) = Q1(X) + a, etc. Isto é, se somamos uma constante a todos
os elementos de um conjunto, suas medidas de posição ficam somadas da mesma constante.
25
3. Se X = {x1 , x2, . . ., xn } e Y = {ax1, ax2, . . . , axn }, então as medidas de tendência central
do conjunto Y são as medidas de tendência central de X, multiplicadas por a. Então,
M e(Y) = aM e(X), Md (Y) = aMd (X). Se a constante a for positiva, esta propriedade é
satisfeita também pelos quantis e teremos Q1 (Y) = aQ1 (X), etc. Isto é, se multiplicamos
todos os elementos de um conjunto por uma constante positiva, suas medidas de posição ficam
multiplicadas pela mesma constante. Se a constante a for negativa, os quantis se alteram
pois a posição dos valores no grupo se altera. Mas teremos por exemplo, Q1 (Y) = aQ3 (X)
e Q3 (Y) = aQ1(X).
4. (Conseqüência de 2 e 3). Se X = {x1 , x2, . . . , xn} e Y = {ax1 + b, ax2 + b, . . ., axn + b},

com a > 0 (veja propriedade 3), então M e(Y) = aM e(X) + b, Md (Y) = aMd (X) + b,
Q1 (Y) = aQ1 (X) + b, etc.
2.2 Medidas de Dispersão

A sumarização de um conjunto de dados por meio de uma única medida representativa de tendência
central, esconde toda a informação sobre a variabilidade deste conjunto. Vejamos o exemplo
seguinte.
Exemplo 2.4 Considere os seguintes conjuntos

X= {3, 4, 5, 6, 7} X̄ = 5.0 Md = 5.0
Y= {1, 3, 5, 7, 9} Ȳ = 5.0 Md = 5.0
Z= {5, 5, 5, 5, 5} Z̄ = 5.0 Md = 5.0
W= {3, 5, 5, 7} W̄ = 5.0 Md = 5.0
V= {−20, 5, 30} V̄ = 5.0 Md = 5.0
Observe que a identificação de cada um desses conjuntos pela média ou pela mediana nada informa
sobre a variabilidade presente nos dados. Por exemplo, o conjunto V é bem mais disperso que o
conjunto Z. Surge então a necessidade de se estabelecer uma medida que nos permita comparar a
variabilidade de conjuntos de dados como os descritos acima.
O princı́pio básico de uma medida de dispersão é o de analisar os desvios das observações em
relação à uma medida de tendência central. Embora estes desvios possam ser definidos em relação
à mediana, utilizamos aqui os desvios em relação à média aritmética.
• Média dos desvios em relação à média Considerando apenas a média destes desvios,
terı́amos, para qualquer conjunto de valores
Pn
i=1 (xi − x̄)
= 0,
n
logo, esta não é uma boa medida.
• Desvio médio O desvio médio de um conjunto de valores, que denotaremos DM , é a média

das distâncias dos pontos à sua média. Isto é,
Pn
i=1 |xi − x̄|
DM (X) = .
n
26
• Variância A variância de um conjunto de valores, que denotaremos V ar, é a média dos
quadrados dos desvios em relação à média (ou do quadrado das distâncias). Isto é,
Pn
i=1 (xi − x̄)2
V ar(X) = .
n
Uma vantagem da variância em relação ao desvio médio é que sua fórmula pode ser simplifi-
cada, facilitando seu cálculo. Tem-se
Pn Pn
i=1 (xi − x̄)2 2
i=1 xi
V ar(X) = = − x̄2.
n n
• Desvio Padrão O desvio padrão de um conjunto de dados, DP , é a raiz quadrada da
variância. Tem a vantagem de ter a mesma unidade dos dados originais.
q
DP (X) = V ar(X).
• Intervalo Interquartı́lico O intervalo interquartı́lico (ou intervalo interquartil) é a diferença

entre o terceiro e primeiro quartis, isto é,
I Q = Q3 − Q1 .
• Coeficiente de Variação Algumas vezes é conveniente expressar a variabilidade de um

conjunto de dados em termos relativos. Por exemplo, um desvio padrão de 10 pode ser
insignificante se a ordem de grandeza das observações for 10.000 mas pode ser altamente
significante se a ordem de grandeza for 50. O coeficiente de variação é definido por
DP (X)
cv(X) = .
X̄
Como o desvio padrão tem a mesma unidade de medida das observações originais, o coeficiente
de variação é adimensional, o que permite a comparação de diferentes conjuntos de dados.
Note que o coeficiente de variação não está definido quando a média das observações é zero.
Exemplo 2.5 Ordene os conjuntos do Exemplo 2.4 segundo o desvio médio e segundo a variância
Conjunto DM V ar
X= {3, 4, 5, 6, 7} 1,2 2
Y= {1, 3, 5, 7, 9} 2,4 8
Z= {5, 5, 5, 5, 5} 0 0
W= {3, 5, 5, 7} 1 2
V= {−20, 5, 30} 16,67 416,67
2.2.1 Medidas de dispersão para dados agrupados

Quando os dados estão agrupados, as definições das medidas de dispersão não mudam, mas seu
cálculo pode ser bastante simplificado. No caso de dados agrupados em classes de frequências, os
valores serão aproximações dos verdadeiros, pois não há como recuperar o conjunto original. Em
ambos os casos, as fórmulas são as mesmas.
Temos:
27
• Desvio Médio Pk k
i=1 |xi − x̄|ni X
DM (X) = = |xi − x̄|fi .
n i=1
• Variância Pk k
i=1 (xi − x̄)2 ni X
V ar(X) = = (xi − x̄)2fi .
n i=1
A fórmula da variância também pode ser simplificada:
Pk k
x2i ni X
i=1
V ar(X) = − x̄2 = x2i fi − x̄2 .
n i=1
• Desvio Padrão q
DP (X) = V ar(X).
Como nas seções 2.1.2 e 2.1.3, fi denota a proporção da i-ésima classe, k denota o número de
classes e xi denota o i-ésimo valor no caso de distribuições simples de frequências ou o ponto médio
da i-ésima classe no caso de distribuições em classes de frequências.
2.2.2 Propriedades das medidas de dispersão

1. Se X = {a, a, . . ., a}, então as medidas de dispersão de X são todas iguais a zero (inclusive
o coeficiente de variação se a 6= 0).
2. Somar uma constante a todos os elementos de um conjunto: X = {x1, x2, . . . , xn}, Y =

{x1 + a, x2 + a, . . . , xn + a}.
• Desvio médio: DM (Y ) = DM (X).

• Variância : V ar(Y ) = V ar(X).
• Desvio padrão: DP (Y ) = DP (X).
• Intervalo Interquartı́lico: IQ (Y ) = IQ (X).
Estas propriedades podem ser ditas como se segue: se deslocarmos um conjunto de dados, a
sua posição relativa à média não muda uma vez que a média também se desloca.
Note que o coeficiente de variação se altera.
3. Multiplicar todos os elementos de um conjunto por uma constante X = {x1, x2, . . . , xn },

Y = {ax1, ax2, . . . , axn }.
• Desvio médio: DM (Y ) = |a|DM (X).

• Variância : V ar(Y ) = a2 V ar(X).
• Desvio padrão: DP (Y ) = |a|DP (X).
• Intervalo Interquartı́lico: IQ (Y ) = |a|IQ (X).
O que acontece com o coeficiente de variação?
28
2.3 Outras medidas
Medidas de tendência central e medidas de dispersão podem não ser adequadas para representar
um determinado conjunto de dados pois podem ser afetadas por valores extremos e muitas vezes
não dão idéia da assimetria ou forma da distribuição dos valores. Além das medidas de posição e
das de dispersão, existem também algumas medidas que se referem à forma de uma distribuição.
Mais especificamente, são medidas de assimetria e medidas do grau de achatamento ou curtose de
uma distribuição.
2.3.1 Boxplot
Uma forma alternativa para se representar um conjunto de dados, é o “boxplot” ou desenho es-
quemático, que fornece informações sobre a assimetria, achatamento, dispersão e posição dos dados
além de informar sobre dados discrepantes, aqueles com valor muito diferente do restante do con-
junto. É extremamente útil quando queremos comparar várias distribuições. Ele é construı́do a
partir do esquema de cinco números, que são
• os quartis Q1 , Q2 e Q3 ;
• os extremos M (valor máximo) e m (valor mı́nimo).
Para construir o “boxplot”, calculamos ainda as seguintes quantidades:

3 3
Li = Q 1 − I Q e L s = Q 3 + IQ ,
2 2
que definem as observações discrepantes. Todo ponto que for menor que Li ou maior que Ls será
considerado um ponto discrepante (“outlier”).
Construção
Em um eixo vertical, representamos os valores da variável em questão. Do lado do eixo cons-
truı́mos uma caixa da seguinte forma: a base fica na altura do primeiro quartil (Q1) e o topo da
caixa fica na altura do terceiro quartil (Q3). Depois marcamos no interior da caixa uma linha
na altura da mediana (Q2). Do alto da caixa segue uma linha até o maior valor que não seja
discrepante e da base da caixa segue uma linha até o menor valor que não seja discrepante. Os
pontos discrepantes são marcados individualmente.
Exemplo 2.6 Suponha que os “boxplot” abaixo representem as distribuições da produção em

toneladas por hectare, de quatro diferentes variedades de cana-de-açúcar. Comente sobre as prin-
cipais diferenças entre estas distribuições.
29
Figura 5: “boxplot”: Produção de cana de açúcar
30
2.4 Exercı́cios
2.1 -♠ Quer se estudar o número de erros de impressão de um livro. Para isso escolheu-se uma
amostra de 50 páginas, encontrando-se o seguinte número de erros por página:
Erros Frequência
0 25
1 20
2 3
3 1
4 1
a) Qual o nuúmero médio de erros por página?

b) E o número mediano?
c) Qual é o desvio padrão?
d) Faça uma representação gráfica para a distribuição.
e) Se o livro tem 500 páginas, qual o número total de erros esperado no livro?
2.2 - ♠ As taxas de juros recebidas por 10 ações durante um certo perı́odo foram (medidas em
porcentagem) 2, 59; 2, 64; 2, 60; 2, 57; 2, 55; 2, 61; 2, 50; 2, 63; 2, 64. Calcule a média, a mediana
e o desvio padrão.
2.3 ♠ a) Dê uma situação onde você acha que a mediana é uma medida mais apropriada do que
a média.
b) Esboce um histograma onde a média e a mediana coincidem. Existe alguma classe de
histogramas onde isso sempre acontece?
c) Esboce os histogramas de três variáveis (X, Y e Z) com a mesma média aritmética, mas com
as variâncias ordenadas em ordem crescente.
2.4 - ♠ Numa pesquisa realizada com 100 famı́lias levantaram-se as seguintes informações:
Número de filhos 0 1 2 3 4 5 mais que 5

Frequência de famı́lias 17 20 28 19 7 4 5
a) Qual a mediana do número de filhos?

b) E a moda?
c) Que problemas você enfrentaria para calcular a média neste caso ? Faça alguma suposição
e encontre-a.
31
2.5 -♠ Suponha que a variável de interesse tenha a distribuição como na figura abaixo:
Você acha que a média é uma boa medida de posição? E a mediana? Justifique.
2.6 - ♠ O número de desquites na cidade, de acordo com a duração do casamento, está represen-
tado na tabela abaixo:
Anos de Número de
casamento desquites
0 ` 6 2800
6 ` 12 1400
12 ` 18 600
18 ` 24 150
24 ` 32 50
a) Qual a duração média dos casamentos? E a mediana?

b) Encontre a variância e o desvio padrão da duração dos casamentos.
c) Construa o histograma da distribuição.
d) Encontre o 1o e o 9o decis.
e) Qual o intervalo interquartil?
f ) Se s representa o desvio padrão da distribuição, qual a porcentagem das observações com-
preendidas entre x̄ − 2s e x̄ + 2s?
2.7 - ♠ O Departamento de Pessoal de uma certa firma fez um levantamento dos salários dos 120
funcionários do setor administrativo, obtendo os seguintes resultados:
Faixa Salarial Frequência

( X salário mı́nimo) relativa
0` 2 0,25
2` 4 0,40
4` 6 0,20
6 ` 10 0,15
32
a) Esboce o histograma correspondente.
b) Calcule a média, a variância e o desvio padrão.
c) Calcule o 1o quartil e a mediana.
d) Se for concedido um aumento de 100% para os 120 funcionários, haverá alteração na média?
E na variância? Justifique sua resposta.
e) Se for concedido um abono de 2 salários mı́nimos para todos os 120 funcionários, haverá
alteração na média? E na variância? E na mediana? Justifique sua resposta.
2.8 -♠ O que acontece com a mediana, a média e o desvio padrão de uma série de dados quando:
a) cada observação é multiplicada por 2?
b) soma-se 10 a cada observação?
c) subtrai-se a média geral x̄ de cada observação?
d) de cada observação subtrai-se x̄ e divide-se pelo desvio padrão DP (X) ?
2.9 - ♠ Na companhia A, a média dos salários é 10.000 unidades e o 3o quartil é 5000.

a) Se você se apresentasse como candidato a essa firma e se o seu salário fosse escolhido ao acaso
entre os possı́veis salários, o que seria mais provável: ganhar mais ou menos que 5.000 unidades?
b) Suponha que na companhia B a média dos salários é 7.000 unidades e a variância é prati-
camente zero, e lá o seu salário também seria escolhido ao acaso. Em qual companhia você se
apresentaria para procurar emprego?
2.10 - ♠ Estudando-se o consumo diário de leite, verificou-se que em certa região, 20% das famı́lias
consomem até um litro, 50% das famı́lias consomem entre 1 e 2 litros, 20% consomem entre 2 e 3
litros e o restante consome entre 3 e 5 litros. Para a variável em estudo:
a) Escreva as informações acima em uma tabela de frequências.
b) Construa o histograma.
c) Calcule a média e a mediana.
d) Calcule a variância e o desvio padrão.
e) Qual o valor do 1o quartil?
2.11 - ♠ A distribuição de frequências do salário anual dos moradores do bairro A que têm alguma
forma de rendimento é apresentada na tabela abaixo:
Faixa salarial Frequência

( × 10 sal. mı́n.)
0 ` 2 10.000
2 ` 4 3.900
4 ` 6 2.000
6 ` 8 1.100
8 ` 10 800
10 ` 12 700
12 ` 14 2.000
TOTAL 20.500
33
X X
Dados : xi = 150.300 x2i = 4.906.500
a) Construa um histograma da distribuição.
b) Qual a média e o desvio padrão da variável salário?
c) O bairro B apresenta, para a mesma variável, uma média de 7,2 e um desvio padrão de 15,1.
Em qual dos bairros a população é mais homogênea quanto à renda?
d) Construa a função de distribuição acumulada e determine qual a faixa salarial dos 10% mais
ricos da população do bairro.
e) Qual a “riqueza total” dos moradores do bairro?
2.12 - ♠ Um órgão do governo do estado está interessado em determinar padrões sobre o investi-
mento em educação, por habitante, realizado pelas prefeituras. De um levantamento em 10 cidades,
foram obtidos os valores (codificados) da tabela abaixo:
Cidade A B C D E F G H I J
Investimento 20 16 14 8 19 15 14 16 19 18
Neste caso, será considerado como investimento básico a média final das observações, calculada
da seguinte maneira:
1- Obter uma média inicial;
2- Eliminar do conjunto aquelas observações que forem superiores à média inicial mais duas vezes
o desvio padrão, ou inferiores à média inicial menos duas vezes o desvio padrão;
3-Calcular a média final com o novo conjunto de observações.
Qual o investimento básico que você daria como resposta?
Observação: O procedimento do item 2 tem a finalidade de eliminar do conjunto a cidade cujo
investimento é muito diferente dos demais.
2.13 ♠ Dado o histograma abaixo, calcular a média, a variância, a moda, a mediana e o 1o quartil.
34
2.14 Em um experimento de competição de variedades de batatinhas, um pesquisador obteve as
seguintes produções em t/ha, resultados de 18 repetições:
Huinkul 20,1 21,1 27,0 26,4 25,4 22,3 26,1 24,0 23,2
27,0 25,2 24,6 26,5 22,5 25,8 27,1 26,2 24,1
S. Rafaela 22,6 29,9 24,2 20,6 25,1 23,5 20,2 21,0 20,5
22,1 21,3 22,1 22,6 20,7 20,3 21,5 21,0 24,1
Para cada uma das variedades:

a) calcule a média e o desvio padrão;
b) construa um ramo e folhas;
c) construa desenhos esquemáticos (“box-plot”), usando a mesma escala para as duas varieda-
des.
d) Com base nos resultados obtidos em a), b) e c), comente as principais diferenças entre as
duas variedades. Você diria que uma das variedades é superior a outra? Porque?
2.15 A tabela abaixo fornece a distribuição do comprimento de espiga em trigo, variedade PUSA
12, obtidos em uma amostra de tamanho 400, por um produtor em 1998 (dados fictı́cios):
Classe (cm) ni
6 ` 9 80
9 ` 11 80
11 ` 13 200
13 ` 17 40
Total 400
a) Construa um histograma de porcentagem para a distribuição;

b) Calcule a média e o desvio padrão da distribuição;
c) O trigo é considerado de alta qualidade se o comprimento da espiga é pelo menos 11,5 cm.
Qual a porcentagem da amostra investigada que pode ser considerada de alta qualidade?
d) O comprador usual desta produção quer um desconto de 50% no preço do trigo de espiga
muito curta (baixa qualidade). Se o produtor espera vender pelo menos 85% de sua produção pelo
preço normal, qual deve ser o limite de comprimento da espiga do trigo de baixa qualidade?
2.16 Em um experimento com cana de açúcar, foram utilizados 3 nı́veis de potássio, k1, k2 e k3
e 2 nı́veis de fostato, p1 e p2 em 2 repetições para cada uma das combinações possı́veis. A tabela
abaixo fornece os resultados obtidos:
Tabela 2: Produção (t/ha)

Potássio
Fosfato k1 k2 k3
p1 30 60 55
35 55 50
p2 50 55 60
40 61 68
35
Calcule as seguintes quantidades
a) a média e o desvio padrão da produção de cana de açúcar no experimento;
b) a média e o desvio padrão da produção para cada nı́vel de fosfato;
c) a média e o desvio padrão da produção para cada nı́vel de potássio.
2.17 - ♠ Em uma granja foi observada a distribuição dos frangos com relação ao peso, que era a
seguinte:
Peso (gramas) ni
960 ` 980 60
980 ` 1.000 160
1.000 ` 1.020 280
1.020 ` 1.040 260
1.040 ` 1.060 160
1.060 ` 1.080 80
a) Qual a média da distribuição?

b) Qual a variância da distribuição?
c) Construa o histograma.
d) Queremos dividir os frangos em quatro categorias, com relação ao peso, de modo que:
- os 20% mais leves sejam da categoria D;
- os 30 % seguintes sejam da categoria C;
- os 30% seguintes sejam da categoria B;
-os 20% seguintes (ou seja, os 20% mais pesados) sejam da categoria A.
Quais os limites de peso entre as categorias A, B, C e D?
e) O granjeiro decide separar deste lote os animais com peso inferior a dois desvios padrões
abaixo da média para receberem ração reforçada, e também separar os animais com peso superior
a um e meio desvio padrão acima da média para usá-los como reprodutores.
Qual a porcentagem de animais que serão separados em cada caso?
2.18 - ♠ A idade média dos candidatos a um determinado curso de aperfeiçoamento sempre

foi baixa, da ordem de 22 anos. Como este curso foi planejado para atender a todas as idades,
decidiu-se fazer uma campanha de divulgação. Para se verificar se a campanha foi ou não eficiente,
fez-se um levantamento da idade dos candidatos à ultima promoção, e os resultados estão na tabela
abaixo.
Idade Frequência Porcentagem

18 ` 20 18 36
20 ` 22 12 24
22 ` 26 10 20
26 ` 30 8 26
30 ` 36 2 4
TOTAL 50 100
36
a) Baseando-se nesses resultados, você diria que a campanha produziu algum efeito (isto é,
aumentou a idade média?)
b) Um outro pesquisador decidiu usar a seguinte regra: se a diferença x̄ − 22 fosse maior que
√
o valor 2DP (X)/ n, então a campanha surtiu efeito. Qual a conclusão dele, baseado nos dados?
c) Faça um histograma da distribuição.
2.19 Um fabricante de rações afirma que seu produto, a ração A, produz resultados tão bons
ou até melhores que os de seu concorrente, ração B. (Veja Exercı́cio 1.10) Um produtor resolveu
experimentar o novo produto para verificar a veracidade da afirmação do fabricante e para isto
utilizou o seguinte critério, retirado de um manual de estatı́stica:
i) Separar alguns animais com as mesmas caracterı́sticas (peso, idade, etc...) em dois grupos de
mesmo tamanho, e alimentar por um determinado tempo um dos grupos com a ração A e o outro
com a ração B.
ii) Após o experimento, observar o ganho de peso de cada animal.
iii) De posse dos dois conjuntos de dados, {x1 , . . ., xn }, e {y1 , . . . , yn } ,(conjuntos 8 e 9, Seção
1.5) calcular:
x̄ − ȳ nV ar(A) + nV ar(B)
t= p , em que S∗2 =
S∗ 2/n 2n − 2
iv) Considerar as rações equivalentes se |t| < 2. ( Use quadro do Exercı́cio 2.20 abaixo)
a) Calcule as médias para cada grupo (x̄ e ȳ)
b) Calcule as variâncias para cada grupo.
c) Calcule a quantidade t acima. Qual foi a decisão tomada pelo produtor?
d) Faça o ramo e folhas para cada uma das distribuições.
e) Para cada grupo, calcule a mediana, o 1o e 3o quartis e o intervalo interquartı́lico.
f ) Use a mesma escala para construir os desenhos esquemáticos para as duas distribuições.
(“box-plot”).
g) Observe os ramo e folhas e os “boxplot” e compare as duas distribuições. O que você acha
do critério utilizado pelo produtor?
h) Uma pessoa, observando os dois conjuntos de dados acima, verificou que em cada um deles,
quatro observações pareciam discrepantes do restante de seu grupo e sugeriu que o produtor refizesse
a análise desconsiderando estes dados. Qual foi o resultado da nova análise?
2.20 Calcule a média aritmética, a variância, o desvio padrão e construa um “box-plot” para cada
um dos conjuntos de 1 a 7 da Seção 1.5. (Use os dados do quadro abaixo )
37
Pn Pn 2
CONJUNTO n i=1 Xi i=1 Xi
1 50 988 19812
2 50 8.117 1.319.095
3 75 1413 27.119
4 75 12.831 2.197.873
5 70 3.153.185 263.709.949.952
6 50 91340 322391584
7 50 131575 530232864
8 40 1382 51984
9 40 1378 51708
2.21 As Cartas Chilenas são poemas crı́ticos ao governador das Minas Gerais, que circularam em
Ouro Preto em 1787. Não foram assinadas e por isso têm sido realizados vários estudos para se
conhecer o autor. Em 1941, o mineiro Arlindo Chaves contou o número de palavras em cada um de
116 perı́odos escolhidos nas Cartas, no poema Vila Rica de Cláudio Manoel da Costa, e nas Liras,
de Tomás Antônio Gonzaga, os dois inconfindentes usualmente considerados como autores. Obteve
os seguintes resultados:
Palavras Gonzaga Cartas Cláudio

0 a 10 19 21 2
10 a 20 28 26 9
20 a 30 36 31 27
30 a 40 22 18 14
40 a 50 8 11 12
50 a 60 3 4 14
60 a 90 0 3 21
90 a 120 0 2 17
Total 116 116 116
P
xi ni 2710 3050 5980
P 2
xi ni 81500 121100 408300
a) Calcule o tamanho médio do perı́odo em cada caso.

b) Calcule a variância em cada caso.
c) Construa os três histogramas.
d) Em sua opinião, quem foi o autor das Cartas - Gonzaga ou Cláudio? Justifique.
2.22 A ingestão diária média per capita, em gramas, de proteı́na para 33 paı́ses desenvolvidos é:
81 113 108 74 79 78 90 93 105 109 106
103 100 100 100 101 101 101 95 90 90 91
92 93 87 89 78 89 85 94 94 94 79
a) Construa um ramo-e-folhas.
b) Obtenha o primeiro e terceiro quartis e a mediana dos dados.
c) Construa um “box-plot”.
38
2.23 Foram observadas as distribuições dos frangos em relação ao peso em duas granjas, I e II. Os
valores abaixo representam, em 100 gramas, o peso mı́nimo, o 1o quartil, a mediana, o 3o Quartil e
o peso máximo, em cada uma das granjas. (Não necessariamente nesta ordem!). Use estes valores
para construir desenhos esquemáticos (“box-plot”) das distribuições. Comente sobre as principais
diferenças entre elas.
I 9 11 15 17 14
II 21 11 15 14 17
39
3 Análise bidimensional
3.1 Introdução
Suponha agora que estejamos interessados em analisar o comportamento conjunto de duas variáveis.
Vimos que podemos representar a distribuição conjunta de duas variáveis por meio de uma tabela
de freqüências de dupla entrada e este será um valioso instrumento para ajudar a compreensão dos
dados.
Exemplo 3.1 Queremos analisar o comportamento conjunto das variáveis “Sexo” (X) e “Nı́vel de
atividade fı́sica” (Y ), cuja tabela de freqüências reproduzimos abaixo (ver Tabela 1.5).
Distribuição conjunta: Nı́vel de atividade fı́sica por Sexo
Sexo
Ativo 0 4 4
Médio 5 6 11
Sedentário 12 18 30
Total 17 28 45
A linha dos totais fornece a distribuição da variável X e a coluna dos totais fornece a distribuição
da variável Y . As distribuições assim obtidas são chamadas de distribuições marginais das variáveis
X e Y.
Podemos ainda construir tabelas de freqüências relativas, como foi feito no caso unidimensional.
Em uma distribuição conjunta, podemos expressar a proporção de cada casela de três maneiras
diferentes: em relação ao total geral; em relação ao total de cada linha ou em relação ao total de
cada coluna. A mais conveniente a ser usada dependerá do objetivo da pesquisa. Construiremos a
seguir, com os dados da tabela acima, as três tabelas possı́veis, utilizando porcentagens.
Tabela 3.1 Distribuição conjunta das porcentagens em relação ao total geral das variáveis X e Y
Sexo
Ativo 0% 8,9%∗ 8,9%
Médio 11,1% 13,3% 24,4%
Sedentário 26,6% 40,0% 66,7%
Total 37,8% 62,2% 100%
∗ 8,9% dos alunos são do sexo “Masculino” e seu nı́vel de atividade fı́sico é “Ativo”.
40
Tabela 3.2 Distribuição conjunta das porcentagens em relação aos totais de cada coluna das
variáveis X e Y
Sexo
Ativo 0% 14,3% ∗ 8,9%
Médio 29,4% 21,4% 24,4%
Sedentário 70,6% 64,3% 66,7%
Total 100% 100% 100%
∗
14,4% dos alunos do sexo “Masculino” têm nı́vel de atividade fı́sica “Ativo”.
Tabela 3.3 Distribuição conjunta das porcentagens em relação aos totais de cada linha das
variáveis X e Y
Sexo
Ativo 0% 100,0%∗ 100%
Médio 45,5% 55,5% 100%
Sedentário 40% 60% 100%
Total 37,8% 62,2% 100%
∗ 100% dos alunos com nı́vel de atividade fı́sica “Ativo”, são do sexo “Masculino”.
O principal objetivo da distribuição conjunta é descrever o grau de associação entre as variáveis,
de modo que possamos prever melhor o resultado de uma delas quando conhecemos a realização da
outra.
Exemplo 3.2 Em um experimento para testar a resistência de eucalyptus à ferrugem causada

por puccinia psidii, um certo número de plantas de três espécies diferentes de eucalyptus foram
infectadas artificalmente. Após certo tempo, contou-se o número de plantas doentes. Os resultados
estão na tabela abaixo.
Tabela 3.4 Nı́vel de infecção por puccinia psiddi em eucalyptus
Infecção E. citrioda E. urophylla E. cloeziana Total

Doentes 6 (5,5%) 10 (10%) 80 (72,7%) 96(30%)
Sadias 104 (94,5%) 90 (90%) 30 (27,3%) 224(70%)
Total 110(100%) 100(100%) 110(100%) 320(100%)
Os valores que aparecem entre parênteses na Tabela 3.4, mostram as porcentagens do “tipo
de infecção” (Y ) em cada “espécie” (X). Estas porcentagens foram calculadas para podermos
comparar a relação (ou grau de associação) entre estas variáveis.
41
A partir desta tabela, podemos observar que, independentemente da espécie, 30% das plantas
adoeceram e 70% delas permaneceram sadias (ver coluna do Total ). Não havendo dependência (ou
associação) entre as variáveis, esperarı́amos estas mesmas proporções para cada uma das espécies.
Olhando atentamente as porcentagens calculadas dentro das caselas da Tabela 3.5, podemos ve-
rificar que as freqüências observadas são bem diferentes das freqüências esperadas o que nos leva
a pensar que existe uma associação entre estas variáveis. Por exemplo, na espécie E. citrioda
esperarı́amos 30% de plantas doentes e observamos 5,5%.
Para facilitar a comparação entre as freqüências esperadas e observadas, construı́mos a Tabela
abaixo.
Tabela 3.5 Nı́vel de infecção por puccinia psiddi em eucalyptus (freqüências observadas e
esperadas)
Espécie
E. citrioda E. urophylla E. cloeziana
Infecção oij eij oij eij oij eij
Doentes 6 33 10 30 80 33
Sadias 104 77 90 10 30 77
em que o ı́ndice i representa plantas doentes (i = 1) ou sadias (i = 2), o ı́ndice j representa a

espécie (j = 1, 2, 3), oij representa a freqüência observada e eij representa a freqüência esperada.
O problema se torna então encontrar uma medida do grau de associação entre as variáveis.
3.2 Coeficientes de contingência

(Continuação do Exemplo 3.2). Para medirmos o grau de associação entre as variáveis X e Y ,
medimos inicialmente as diferenças entre o que teria sido obtido caso não existisse associação entre
elas, e o que foi de fato observado (veja Tabela 3.6).
Tabela 3.6 Desvios entre valores observados e esperados
Infecção E. citrioda E. urophylla E. cloeziana Total

Doentes -27 -20 47 0
Sadias 27 20 -47 0
Total 0 0 0 0
Note que tanto a linha quanto a coluna de total são nulas e que algumas caselas apresentam
desvios maiores da suposição de independência. Para quantificar estes desvios, vamos considerar
os desvios relativos, rij , que levam em conta o número diferente de plantas de cada espécie.
(oij − eij )2
rij = .
eij
Assim, para a casela Doentes/E. citrioda, temos (−27)2/33 = 22, 1 e para a casela Doentes/E.
cloeziana, temos (−47)2/33 = 66, 9, indicando um desvio devido a esta última casela, maior do que
aquele da primeira.
42
Uma medida do afastamento global pode ser dada pela soma dos valores. Esta medida chama-se
χ2 (qui-quadrado) e é dada pela expressão,
X X (oij − eij )2
χ2 = .
i j
eij
No nosso exemplo, terı́amos,
(6 − 33)2 (10 − 30)2 (80 − 33)2 (104 − 77)2 (90 − 70)2 (30 − 77)2
χ2 = + + + + + = 146, 23.
33 30 33 77 70 77
Como é difı́cil dizer se este valor é alto ou não, (seria 0 se não houvesse associação), K. Pearson,
famoso estatı́stico do começo do século, propôs a utilização do chamado Coeficiente de Contingência
C, definido por s
χ2
C= ,
χ2 + n
em que n é o número de total de observações. Este coeficiente é um número entre 0 e 1, sendo nulo
quando as variáveis não são associadas. Algumas vezes porém, mesmo existindo uma associação
perfeita, C pode não ser igual a 1. Uma alternativa, então, é considerar como medida de associação
o seguinte coeficiente, que chamaremos de Coeficiente de contingência corrigido, dado por
C
C∗ = p ,
(t − 1)/t
em que t é o mı́nimo entre o número de colunas e o número de linhas da tabela.

No exemplo acima, temos s
146, 23
C= = 0, 56
146, 23 + 320
e
0, 56
C∗ = p = 0, 79
1/2
indicando que o grau de associação entre as variáveis neste caso é bem alto.
Observações
• Uma maneira fácil de se obter o valor esperado em cada casela é,
(Total da linha i) × (Total da coluna j)

eij = .
(Total geral)
• O coeficiente de contingência de Pearson pode ser utilizado tanto para variáveis qualitativas
quanto para variáveis quantitativas agrupadas em classes.
3.3 Coeficiente de correlação

Quando as variáveis envolvidas são ambas quantitativas (não agrupadas), um procedimento bas-
tante útil para se verificar a associação entre as variáveis é o gráfico de dispersão, que nada mais é
do que a representação dos pares de valores em um sistema cartesiano.
43
Figura 6: Diagrama de dispersão: K2 O versus Potássio
Exemplo 3.3 A tabela abaixo fornece os teores dos nutrientes K (Potássio) e M g (Magnésio) em
folhas de soja, e a dose anual de adubo utilizado na plantação (K2O: Óxido de Potássio).
Tabela 3.7
Teores de nutrientes
Dose anual de K2O(Kg/ha):X K, Y1 (g/Kg) M g Y2 (mg/Kg)
0 6 10,5
40 11 7,9
80 18 6,4
120 22 5,8
160 25 5,5
200 21 5,2
Fonte: PAB(1997) vol. 32(12) pg.1235-1249.
Na Figura 6, mostramos o diagrama de dispersão entre as variáveis X e Y1 . Observando a

disposição dos pontos, verificamos que quando aumentamos a dose anual do adubo parece haver
uma tendência de aumento do teor do nutriente K nas folhas de soja.
No caso do Magnésio, ao contrário, quando aumentamos a dose de adubo, a concentração do
nutriente diminui. Veja Figura 7.
Observada uma associação entre as variáveis quantitativas, desejamos quantificar o grau desta
associação. Estudaremos aqui a relação mais simples, que é a linear, isto é, iremos definir uma
medida que julga o quanto a nuvem de pontos do diagrama de dispersão aproxima-se de uma reta.
A medida que utilizaremos para quantificar a associação entre duas variáveis quantitativas é o
coeficiente de correlação que definimos abaixo.
44
Figura 7: Diagrama de dispersão: K2 O versus Magnésio
Definição 3.1 Dados n pares de valores (x1, y1), (x2, y2 ), . . ., (xn, yn ), chamamos de coeficiente de
correlação entre as duas variáveis X e Y a relação,
Pn
1 i=1 (xi
− x̄)(yi − ȳ)
Cor(X, Y ) = .
n DP(X)DP(Y )
Costuma-se usar a seguinte fórmula equivalente de cálculo,
Pn
i=1 xi yi − nx̄ȳ
Cor(X, Y ) = q P P .
( ni=1 x2i − nx̄2 )( ni=1 yi2 − nȳ 2 )
O coeficiente de correlação linear assume sempre um valor entre −1 e 1. Valores positivos

correspondem a uma associação direta e negativos correspondem a uma associação inversa. Quando
o coeficiente de correlação for igual a 1 ou −1, existe uma associação linear perfeita entre X e Y e
quando ele é igual a 0, não existe nenhuma associação linear entre as variáveis.
45
3.4 Exercı́cios
3.1 Um time de futebol está interessado em saber se as condições do tempo tem alguma influência
no resultado do jogo. Observaram as condições do tempo durante 65 partidas obtendo os seguintes
resultados:
Resultado Tempo Total

Bom Ruim
Venceu 17 5 22
Empatou 6 10 16
Perdeu 4 23 27
Total 27 38 65
a) Calcule o coeficiente de contingência e o coeficiente de contingência corrigido.

b) Com base nos resultados do item a), você diria que as condições do tempo tem um efeito do
resultado deste time? Comente.
3.2 100 animais foram divididos em dois grupos de 56 e 44 animais. No primeiro grupo, que foi
vacinado contra uma determinada doença, 47 animais não adoeceram. No segundo grupo, que não
foi vacinado, 28 animais não adoeceram.
a) Construa uma tabela de contingência com os dados acima.
b) Calcule o coeficiente de contingência e o coeficiente de contingência corrigido.
c) Você diria que estes resultados sugerem que a vacina protege contra esta doença? Justifique.
3.3 Em uma pesquisa em 4 localidades, P, Q, R, e S, verificou-se que os preços dos automóveis de

350 pessoas entrevistadas pertenciam a quatro categorias, A, B, C e D. As freqüências observadas
foram
Preço Localidade
P Q R S
A 9 10 12 19
B 13 20 18 29
C 24 29 12 25
D 34 41 18 37
a) Encontre as freqüências que seriam esperadas caso não houvesse nenhuma associação entre
localidade e preço do automóvel.
b) Calcule o coeficiente de contingência e comente.
3.4 Uma companhia que fabrica máquinas de lavar, conduziu uma pesquisa com 500 donas de
casa que compraram destas máquinas em um determinado ano. Apenas 150 destas donas de casa
responderam à pesquisa e então a companhia resolveu enviar novo questionário para as outras 350
donas de casa que não haviam respondido ao primeiro. Destas, 200 responderam e a companhia
46
enviou ainda um terceiro questionário para as demais, obtendo outras 50 respostas. A companhia
enviou então um representante às residências das 100 donas de casa restantes, conseguindo assim
as 500 respostas que pretendia. Como resultado deste trabalho, a companhia suspeita que existe
alguma associação entre o grau de satisfação da dona de casa e sua boa vontade em responder ao
questionário. Com base nos dados abaixo, você diria que esta suposição faz sentido? Justifique sua
resposta.
Satisfeita Indiferente Insatisfeita Total

Respondeu imediatamente 100 40 10 150
Respondeu segundo quest. 134 48 18 200
Respondeu terceiro quest. 21 20 9 50
Entrevista 45 42 13 100
Total 300 150 50 500
3.5 Em uma pesquisa com 5000 indivı́duos, desejava-se investigar uma possı́vel associação entre
daltonismo e sexo. Encontrou-se os seguintes resultados,
Sexo Visão normal Daltônico

Masculino 2210 190
Feminino 2540 60
Calcule o coeficiente de contingência, o coeficiente de contingência corrigido e comente.
3.6 Calcule os coeficientes de correlação entre X e Y1 e entre X e Y2 para os dados do Exemplo

3.3.
3.7 A tabela abaixo fornece a produção obtida em função da quantidade de fertilizante utilizado
Fertilizante (X) 0 1 2 3 4 5 6 7 8
Produção (Y ) 160 168 176 179 183 186 189 186 184
a) Construa um diagrama de dispersão para os dados acima e comente sobre a associação entre
as variáveis.
b) Calcule o coeficiente de correlação entre X e Y . Comente.
3.8 A tabela abaixo fornece a precipitação mensal (X) e o número médio diário de horas de sol
(Y ), observadas em uma estação metereológica em Londres em 1973
Mês JAN FEV MAR ABR MAI JUN JUL AGO SET OUT NOV DEZ
Prec (mm) 39 35 20 63 76 65 88 54 77 51 44 60
Luz (h) 1,1 2,7 4,5 5,1 5,5 7,6 5,2 5,7 4,8 2,9 2,8 1,8
47
a) Construa um diagrama de dispersão para os dados acima.
b) Calcule o coeficiente de correlação entre X e Y .
c) Construa uma nova variável, X1, da seguinte maneira: ordene os meses de 1 a 12, atribuindo
o valor 1 ao mês com mais alta precipitação.
d) Construa outra variável, Y1 , ordenando os meses de 1 a 12, atribuindo o valor 1 ao mês com
maior média de luz por dia.
e) Calcule o coeficiente de correlação entre X1 e Y1 . Comente.
3.9 As alturas H, em cm, e os pesos W , em kg, de 10 pessoas foram medidos. Encontrou-se

P P P P P 2
H = 1710, W = 760, H 2 = 293.162, HW = 130.628 e W = 59.300. Calcule o
coeficiente de correlação entre os valores de H e W .
3.10 Habilidade em matemática é o mesmo que inteligência. Para testar a validade desta afirmação,
testes de matemática e de inteligência foram aplicados em 50 garotos. Os resultados dos testes de
matemática (X) e os coeficientes de inteligência (Y ) forneceram os seguintes resultados:
X X X X X
xi = 25, yi = 140, x2i = 1713, yi2 = 6380, xi yi = 1990.
Calcule o coeficiente de correlação entre X e Y e comente.
3.11 Um professor solicitou a um aluno que calculasse os coeficientes de correlação entre duas
variáveis em quatro conjuntos de dados, A, B, C e D. O aluno encontrou os valores -0,90; 0,97;
0,02 e 0,67 mas perdeu todas as suas anotações. Com base nos diagramas de dispersão abaixo,
determine os coeficientes de correlação para cada um dos conjuntos.
48
4 Probabilidade
4.1 Introdução
A distribuição de freqüências das observações é um poderoso recurso para entender a variabilidade
de um fenômeno. Muitas vezes, com suposições adequadas e sem observar diretamente o fenômeno,
podemos criar um modelo teórico que representa a distribuição das freqüências quando o fenômeno
não é observado diretamente. Tais modelos são chamados “Modelos Probabilı́sticos”.
Exemplo 4.1 Ao estudar as proporções de ocorrência das faces de um dado, um possı́vel modelo
teórico seria: Só podem ocorrer seis faces, e a freqüência de cada face é 1/6.
Definição 4.1 Um experimento ou fenômeno aleatório é um experimento cujo resultado não pode
ser previsto com certeza.
Todo experimento ou fenômeno que envolva um elemento casual terá seu modelo probabilı́stico
especificado, no momento em que estabelecemos:
1. um espaço amostral;
2. uma probabilidade para cada ponto amostral.
Definição 4.2 O Espaço Amostral de um experimento aleatório é o conjunto de todos os resultados

possı́veis do experimento.
Exemplo 4.2 Alguns experimentos
• E1 . Lançar uma moeda e verificar se ocorre cara ou coroa.
• E2 . Escolher ao acaso uma pessoa de uma população e observar sua altura em metros.
• E3 . Usar um determinado tipo de vacina e verificar se foi eficaz ou não.
Vamos agora determinar o espaço amostral para estes experimentos.
S1 = {cara, coroa}
S2 = [0, 5; 3, 0]
S3 = { sim , não}
Definição 4.3 Um evento é um subconjunto qualquer do espaço amostral.
Dizemos que um evento ocorreu se o resultado do experimento foi um elemento desse evento.
Exemplo 4.3 Considere um lançamento de um dado. Seja A o evento “sair um número par”.
Temos então, S = {1, 2, 3, 4, 5, 6} e A = {2, 4, 6}.
49
Definição 4.4 (Freqüência relativa) Suponha que repetimos n vezes o mesmo experimento aleatório.
Se A e B são dois eventos associados a este experimento e nA e nB o número de vezes que A e B
ocorreram, respectivamente, então
nA nB
fA = e fB = ,
n n
são as freqüências relativas de A e B nas n repetições do experimento.
Propriedades da freqüência relativa
1. 0 ≤ fA ≤ 1
2. fA = 1 ⇔ nA = n
3. fA = 0 ⇔ nA = 0
4. se A ∩ B = ∅, então fA∪B = fA + fB
O Princı́pio da Regularidade Estatı́stica afirma que se um experimento for realizado sob as

mesmas condições um grande número de vezes, a freqüência relativa tende a se estabilizar. Neste
caso, definimos uma função P : S → [0, 1], que chamamos de Probabilidade, que pode ser entendida
como o limite da freqüência relativa e que satisfaz as seguintes condições,
1. 0 ≤ P (A) ≤ 1
2. P (S) = 1
3. Se A ∩ B = ∅, então P (A ∪ B) = P (A) + P (B)
Se os elementos de S são equiprováveis (isto é, tem a mesma chance de ocorrer) definiremos a
probabilidade de um evento A como sendo
número de elementos de A
P (A) = .
número de elementos de S
Exemplo 4.4 O quadro abaixo representa uma possı́vel divisão dos alunos matriculados em um
dado Instituto de Matemática.
Curso Sexo Total

Homens (H) Mulheres (M )
Matemática Pura (MP ) 70 40 110
Matemática Aplicada (MA ) 15 15 30
Estatı́stica (E) 10 20 30
Computação (C) 20 10 30
Total 115 85 200
Seja MP o evento que ocorre quando, escolhendo-se ao acaso um aluno do Instituto de Matemática,
ele for um estudante do Curso de Matemática Pura. Teremos então P (MP ) = 110/200. Temos
ainda, P (H) = 115/200, P (E) = 30/200, etc.
Considere os seguintes eventos:
50
• A ∪ B, o evento que ocorre quando pelo menos um dos eventos A ou B ocorre.
• A ∩ B, o evento que ocorre quando os dois eventos A e B ocorrem ao mesmo tempo.
Temos então alguns teoremas importantes.
Teorema 4.1 Seja ∅ o evento vazio. Então,
P (∅) = 0.
Teorema 4.2 Se Ac denota o complementar do evento A, então
P (Ac ) = 1 − P (A).
Teorema 4.3 Sejam A e B dois eventos quaisquer associados a um mesmo experimento aleatório.
Então,
P (A ∪ B) = P (A) + P (B) − P (A ∩ B).
Exemplo 4.5 Seja E um experimento e A e B dois eventos tais que P (A) = 1/2, P (B) = 1/3 e
P (A ∩ B) = 1/4. Logo,
P (Ac ) = 1 − P (A) = 1 − 1/2 = 1/2,

P (B c ) = 1 − P (B) = 1 − 1/3 = 2/3,
P (A ∪ B) = P (A) + P (B) − P (A ∩ B) = 7/12,
P (Ac ∩ B c ) = P [(A ∪ B)c ] = 1 − 7/12 = 5/12.
4.2 Probabilidade condicional e independência.

No Exemplo 4.4, vamos calcular a seguinte probabilidade: “Dado que o estudante escolhido ao acaso
esteja matriculado no curso de Estatı́stica, qual é a probabilidade de ser uma mulher?” Podemos
escrever isto da seguinte forma:
P (mulher|Estatı́stica) = 2/3.
Definição 4.5 Sejam A e B dois eventos quaisquer. Definiremos a probabilidade condicional de

A dado B como sendo
P (A ∩ B)
P (A|B) = , para P (B) > 0.
P (B)
Lê-se probabilidade condicional de A dado que B ocorreu. Quando P (B) = 0, convenciona-se
P (A|B) = 0.
Regra do produto Multiplicando ambos os lados da igualdade na Definição 4.5, obtemos
P (A ∩ B) = P (B) · P (A|B).
Esta regra é bastante útil pois nos permite calcular a probabilidade da interseção utilizando
probabilidade condicional.
51
Exemplo 4.6 Retirar sem reposição 2 bolas de uma urna que contém 7 bolas vermelhas e 3 bolas
brancas. Calcule a probabilidade de cada resultado do espaço amostral. Podemos representar o
espaço amostral como S = {BB, BV, V B, V V }. Então,
P (BB) = P (B1 ∩ B2 ) = P (B1 ) · P (B2 |B1) = 3/10 × 2/9 = 6/9,

P (BV ) = 21/90,
P (V B) = 21/90,
P (V V ) = 42/90
Eventos Independentes
Sejam A e B dois eventos quaisquer, associados a um experimento aleatório. Dizemos que A e
B são independentes se
P (A ∩ B) = P (A) × P (B).
Se A e B são independentes, temos então que P (A|B) = P (A) pois
P (A ∩ B) P (A) × P (B)
P (A|B) = = = P (A).
P (B) P (B)
Teorema de Bayes: um exemplo
Considere a seguinte situação: Uma companhia produz circuitos integrados em três fábricas,
I, II e III. a fábrica I produz 40% dos circuitos, enquanto II e III produzem 30% cada uma. As
probabilidades de que um circuito integrado produzido por estas fábricas não funcione são 0.01,
0.04 e 0.03, respectivamente. Escolhido um circuito da produção conjunta das três fábricas, qual é
a probabilidade de o mesmo não funcionar?
Considere os seguintes eventos: B = “o circuito não funciona”, Ci = “o circuito é produzido
pela fábrica i, i = I, II, III”. Queremos encontrar P (B), sabendo que
P (I) = 0, 4, P (B|I) = 0, 01
P (II) = 0, 3, P (B|II) = 0, 04
P (III) = 0, 3, P (B|III) = 0, 03
Como C1 , C2 e C3 são eventos mutuamente exclusivos e reunidos formam o espaço amostral com-
pleto, podemos escrever o evento B da seguinte forma :
B = (C1 ∩ B) ∪ (C2 ∩ B) ∪ (C3 ∩ B),

e teremos então,
P (B) = P (C1 ∩ B) + P (C2 ∩ B) + P (C3 ∩ B).
Pela definição de probabilidade condicional, sabemos que P (B|Ci ) = P (B ∩ Ci )/P (Ci ), o que
nos permite escrever que
P (B ∩ Ci ) = P (B|Ci ) · P (Ci ).
Logo,
P (B) = P (B|C1 ) · P (C1 ) + P (B|C2 ) · P (C2 ) + P (B|C3 ) · P (C3 )
52
= 0, 4 × 0, 01 + 0, 3 × 0, 04 + 0, 3 × 0, 03 = 0, 025
Suponha agora que o circuito escolhido seja defeituoso e queremos determinar a probabilidade
dele ter sido produzido pela fábrica I. Queremos então calcular a seguinte probabilidade: P (C1 /B).
Pela definição de probabilidade condicional temos então,
P (C1 ∩ B) P (C1 ∩ B) 0, 4 × 0, 001

P (C1 |B) = = = = 0, 16
P (B) P (C1 ∩ B) + P (C2 ∩ B) + P (C3 ∩ B) 0, 025
53
4.3 Exercı́cios
4.1 Defina o espaço amostral para cada experimento dado abaixo.
a) Jogue um dado e observe o número mostrado na face de cima.
b) Jogue uma moeda 4 vezes e observe o número de caras obtido.
c) Jogue uma moeda 4 vezes e observe a seqüência obtida de caras e coroas.
d)Em uma linha de produção, fabrique peças em série e conte o número de peças defeituosas
produzidas em um perı́odo de 24 horas.
e) Uma asa de avião é fixada por um grande número de rebites. Conte o número de rebites
defeituosos.
f ) Uma lâmpada é fabricada. Em seguida é ensaiada quanto à duração de vida, pela colocação
em um soquete e anotação do tempo decorrido ( em horas) até queimar.
g) Um lote de 10 peças contém 3 defeituosas. As peças são retiradas uma a uma (sem reposição
da peça retirada) até que a última peça defeituosa seja encontrada. O número total de peças do
lote é contado.
h) Peças são fabricadas até que 10 peças perfeitas sejam produzidas. O número total de peças
fabricadas é contado.
i) Um mı́ssil é lançado. Em um momento especı́fico t, suas três componentes de velocidade
x, y, z, são observadas.
j) Um mı́ssil recém-lançado é observado nos instantes t1 , t2, t3 . . . tn . Em cada um desses in-
stantes, a altura do mı́ssel acima do solo é registrada.
l) A resistência à tração de uma barra metálica é medida.
m) De uma urna que só contém bolas pretas, retira-se uma bola e verifica-se sua cor.
4.2 ♠ Defina um espaço amostral para cada um dos seguintes experimentos aleatórios:
a) Lançamento de dois dados. Anota-se a configuração obtida.
b) Numa linha de produção conta-se o número de peças defeituosas num intervalo de uma hora.
c) Investigam-se famı́lias com 4 crianças, anotando-se a configuração segundo o sexo.
d) Numa entrevista telefônica com 250 assinantes, pergunta-se se o proprietário tem ou não
máquina de lavar.
e) Mede-se a duração de lâmpadas, deixando-as acesas até que queimem.
f ) Um fichário com 10 nomes contém 3 nomes de mulheres. Seleciona-se ficha após ficha, até o
último nome de mulher ser selecionado, e anota-se o número de fichas selecionadas.
g) Lança-se uma moeda até aparecer cara e anota-se o número de lançamentos.
h) Um relógio mecânico pode parar a qualquer momento por falha técnica. Mede-se o ângulo
(em graus) que o ponteiro dos segundos forma com o eixo imaginário orientado do centro ao número
12.
i) Mesmo enunciado anterior, mas supondo que o relógio seja elétrico, onde o ponteiro dos
segundos move-se continuamente.
j) De um grupo de 5 pessoas A, B, C, D, E, sorteiam-se duas, uma após a outra, com reposição,
e anota-se a configuração formada.
l) Mesmo enunciado que j, sem reposição.
m) Mesmo enunciado que j, mas os dois selecionados simultaneamente.
54
4.3 ♠ Duas moedas são lançadas. Dê dois espaços amostrais para este experimento. Represente
um deles como o produto cartesiano de dois outros espaços amostrais. Liste e calcule a probabilidade
dos eventos:
a) Pelo menos uma cara;
b) Duas caras;
c) O complementar do evento em (b).
4.4 ♠ Expresse em termos de operações entre eventos:

a) A ocorre mas B não ocorre.
b) exatamente um dos eventos A e B ocorre.
c) nenhum dos dois eventos A e B ocorre.
4.5 ♠ Dentre 6 números positivos e 8 negativos, 2 números são escolhidos ao acaso (sem reposição)
e multiplicados. Qual a probabilidade de que o produto seja positivo?
4.6 ♠ Considere o lançamento de dois dados. Considere os eventos A = soma de dois números
igual a 9 e B = número do primeiro dado maior ou igual a 4. Enumere os elementos de A e B.
Enumere os elementos e calcule a probabilidade dos eventos A ∪ B, A ∩ B e Ac .
4.7 ♠ Que suposições deveriam ser feitas para que os resultados dos experimentos abaixo possam
ser considerados equiprováveis?
a) Lançamento de um dado.
b) Opinião de moradores de uma cidade sobre um projeto governamental.
4.8 ♠ Considere uma urna contendo três bolas pretas e cinco bolas vermelhas. Retire duas bolas
da urna. Obtenha os resultados possı́veis e as respectivas probabilidades se as retiradas são feitas:
a) Com reposição;
b) Sem reposição.
4.9 ♠ No problema anterior, calcule as probabilidades dos eventos:

a) bola preta na primeira e segunda extrações;
b) bola preta na segunda extração.
c) bola vermelha na primeira extração.
4.10 ♠ A probabilidade de que A resolva um problema é de 2/3 e a probabilidade de que B resolva

é de 3/4. Se ambos tentarem independentemente, qual a probabilidade do problema se resolvido?
4.11 ♠ Um dado é viciado, de tal forma que a probabilidade de sair um certo ponto é proporcional
ao seu valor (por exemplo, o ponto 6 é 3 vezes mais provável de sair do que o ponto 2). Calcular
a) a probabilidade de sair 5, sabendo-se que o ponto que saiu é ı́mpar.
b) a probabilidade de tirar um número par, sabendo-se que saiu um número maior que 3.
55
4.12 ♠ As probabilidades de que dois eventos independentes ocorram são p e q, respectivamente.
Qual a probabilidade de que
a) nenhum destes eventos ocorra?
b) pelo menos um destes eventos ocorra?
4.13 ♠ Duas lâmpadas queimadas foram acidentalmente misturadas com 6 lâmpadas boas. Se
vamos testando as lâmpadas, uma por uma, até encontrar as 2 defeituosas, qual é a probabilidade
de que a última defeituosa seja encontrada no quarto teste?
4.14 ♠ Prove que se A e B são independentes, também o serão Ac e B c , A e B c e Ac e B.
4.15 ♠ Se P (A)=1/3, P (B c )=1/4, A e B podem se disjuntos (mutuamente exclusivos)?

(Sugestão: P (A) = P (A ∩ B) + P (A ∩ B) e A ∩ B c ⊂ B c .)
4.16 ♣ Uma caixa contém 4 válvulas defeituosas e 6 perfeitas. Duas válvulas são extraı́das juntas.
Uma delas é ensaiada e se verifica ser perfeita. Qual a probabilidade de que a outra válvula também
seja perfeita?
4.17 ♣ No problema anterior, as válvulas são verificadas extraindo-se uma válvula ao acaso,
ensaiando-a e repetindo-se o procedimento até que todas as 4 válvulas defeituosas sejam encon-
tradas. Qual será a probabilidade de que quarta válvula defeituosa seja encontrada:
a) No quinto ensaio?
b) No décimo ensaio?
4.18 ♣ Suponha que temos duas urnas 1 e 2, cada uma delas com duas gavetas. A urna 1 contém
uma moeda de ouro em uma gaveta e uma moeda de prata na outra gaveta enquanto a urna 2
contém uma moeda de ouro em cada gaveta. Uma urna é escolhida ao acaso; a seguir uma de suas
gavetas é aberta ao acaso. Verifica-se que a moeda encontrada nessa gaveta é de ouro. Qual é a
probabilidade de que a moeda provenha da urna 2?
4.19 ♣ Uma bolsa contém três moedas, uma das quais foi cunhada com duas caras, enquanto as
duas outras moedas são normais e não viciadas. Uma moeda é tirada ao acaso da bolsa e jogada
quatro vezes, em sequência. Se sair cara toda vez, qual será a probabilidade de que essa seja a
moeda de duas caras?
4.20 ♣ Um dado é atirado n vezes. Qual é a probabilidade de que “6” apareça ao menos uma
vez em n vezes?
56
4.21 ♣ Sabe-se que na fabricação de um certo artigo, defeitos de um tipo ocorrem com probabil-
idade 0,1 e defeitos de outro tipo com probabilidade 0,05. Qual será a probabilidade de que:
a) Um artigo não tenha ambos os tipos de defeitos?
b) Um artigo seja defeituoso?
c) Um artigo tenha apenas um tipo de defeito, sabido que é defeituoso?
4.22 ♣ Suponha que A e B sejam eventos tais que P (A) = x, P (B) = y, e P (A ∩ B) = z.

Expresse cada uma das seguintes probabilidades em termos de x, y e z.
a) P (Ac ∩ B c )
b) P (Ac ∪ B)
c) P (Ac ∩ B).
4.23 ♣ Suponha que A, B e C sejam eventos tais que P (A) = P (B) = P (C) = 1/4, P (A ∩ B) =
P (C ∩ B) = 0 e P (A ∩ C) =1/8. Calcule a probabilidade de que ao menos um dos eventos A, B
ou C ocorra.
4.24 Admita que a probabilidade de nascimento de criança do sexo masculino seja 1/2. Em uma
famı́lia com 2 crianças, qual a probabilidade de que ambas sejam meninas dado que:
a) a mais velha é menina.
b) pelo menos uma é menina.
4.25 Suponha que você tenha feito uma aposta simples na loto, isto é, escolheu 5 dezenas.
a) Qual é a probabilidade de ganhar a quina?
b) Qual a probabilidade de acertar a quadra?
c) Qual a probabilidade de acertar o terno?
4.26 Um atirador faz 12 tentativas independentes para acertar no alvo. Qual é a probabilidade
de que ele acerte o alvo ao menos uma vez se ele possui probabilidade 9/10 de acertar em cada
tentativa?
4.27 Um novo teste é proposto para detectar uma forma particular de câncer, que incide em cêrca
de 1% das mulheres com mais de 40 anos. Quando o teste é aplicado em mulheres nesta faixa etária
sabidamente doentes, em 95% dos casos ele é sensı́vel, isto é, acusa a presença do câncer. Quando
aplicado em mulheres sadias, o teste acusa a doença em 3% dos casos ( falso positivo). Represente
por D: {presença de câncer} e por B: {o resultado do teste é positivo} ( acusa a doença). Calcule
P (D|B) e interprete o resultado.
4.28 Cada um de 3 jogadores arremessa uma moeda equilibrada. Se o resultado de um dos

arremessos diferir dos outros dois, o jogo termina. Em caso contrário, os jogadores recomeçam o
jogo. Qual a probabilidade de que o jogo termine logo na 1a rodada?
57
4.29 Sabe-se que a ocorrência de uma determinada caracterı́stica oftalmológica está associada à
cor dos olhos. A tabela abaixo fornece os resultados de exames em 300 pacientes de um determinado
hospital:
Caracterı́stica Cor dos olhos

oftalmológica Azul Castanho Outros
Presente 70 30 20
Ausente 20 110 50
a) Uma pessoa deste grupo é escolhida ao acaso e verifica-se que tem olhos azuis. Qual a
probabilidade de que ela tenha a caracterı́tica oftalmológica?
b) Uma outra pessoa é escolhida ao acaso e verifica-se que tem a caracterı́stica oftalmológica.
Qual a probabilidade de que ela tenha olhos castanhos?
4.30 Um pesquisador está estudando 3 drogas idênticas na aparência e numeradas de 1 a 3.

Quando as drogas são injetadas em cobaias, a probabilidade de que uma antitoxina se desenvolva
é 1/4 para a droga 1, 1/8 para a droga 2 e 1/3 para a droga 3. Existem dois frascos da droga 1,
três da droga 2 e um da droga 3. Por descuido, os rótulos dos frascos se perderam e o pesquisador
escolhe um deles ao acaso. Quando a droga é injetada na cobaia, a antitoxina não se forma. Qual
é a probabilidade de que ele tenha usado a droga 1? A droga 2? A droga 3?
4.31 Numa determinada população as frequências relativas nos grupos sanguı́neos ABO estão
distribuı́das da seguinte maneira: 39% têm o antı́geno A, 48% têm o antı́geno B e 15% têm ambos
os antı́genos.
a) Qual a frequência relativa dos indivı́duos com ausência de ambos os antı́genos (grupo O)?
b) Se um indivı́duo é selecionado aleatoriamente e possui o antı́geno B, qual a probabilidade
de que o antı́geno A :
i) esteja presente? ii) esteja ausente?
4.32 Sabe-se que a enxaqueca é herdada através de um gen dominante. Foi constatado que numa
determinada famı́lia (pai, mãe e filho), apenas o pai não sofria de enxaqueca. Se o filho se casar
com uma pessoa que não sofre de enxaqueca, qual a probabilidade de que, tendo dois filhos,
a) Pelo menos um deles tenha enxaqueca?
b) Um ou outro, mas não ambos, tenha enxaqueca?
4.33 Admita que 5 em cada 100 homens sejam daltônicos e que entre as mulheres esta proporção
seja de 25 em 10.000. Uma pessoa é escolhida ao acaso na população e verifica-se ser daltônica.
Qual é a probabilidade de que seja um homem? ( Admita que as populações masculina e feminina
tenham o mesmo tamanho).
4.34 Cada vez que injetamos uma dose de fenobirtal numa cobaia, ela pode ou não ter um choque
provocado por excesso de ceruplastina no sangue. Isto depende da dose, do seguinte modo:
58
Dose Prob. de ter
(mg) o choque
100 0.20
200 0.40
300 0.70
500 0.95
Um laboratório dispõe de 3 cobaias para conduzir o seguinte experimento: a droga será injetada
nas cobaias até que uma delas tenha o choque. (Isto é, o experimento pára quando ocorrer um
choque pela primeira vez ou quando todas as três cobaias tiverem sido usadas). Qual a menor dose
que pode ser utilizada para que a probabilidade de que ocorra um choque seja pelo menos 0.6?
59
5 Variáveis Aleatórias Discretas
5.1 Introdução
Quando estudamos técnicas de descrição de dados, vimos que os recursos para tratar variáveis
quantitativas são muito mais ricos que os utilizados para analisar variáveis qualitativas. Devido a
isso, algumas vezes podemos usar de artifı́cios para transformar variáveis qualitativas em variáveis
quantitativas. Em um questionário, por exemplo, uma pergunta que admite apenas as respostas
SIM ou NÃO pode ser transformada em respostas do tipo 0 ou 1. Mais especificamente, se S =
{ SIM, NÃO }, podemos definir uma função real,
X : S −→ IR,
de tal forma que X(NÃO)= 0 e X(SIM)= 1.
Definição 5.1 Uma variável aleatória X é uma função real cujo domı́nio é o espaço amostral
associado a um experimento aleatório.
Uma variável aleatória pode ser

• Discreta Se sua imagem for um conjunto finito ou infinito enumerável de valores;
• Contı́nua Se sua imagem for um intervalo ou união de intervalos.

Nesta seção, vamos apresentar as propriedades das variáveis aleatórias discretas e para isso
vamos considerar, primeiramente, o exemplo
Exemplo 5.1 De uma urna contendo sete bolas brancas e três bolas vermelhas, são feitas duas
extrações, sem reposição. Vamos definir a variável aleatória X: número de bolas brancas obtidas
nas duas extrações. A cada resultado do experimento, está associado um valor da variável aleatória
(v.a.) X, e cada um desses resultados tem uma probabilidade associada, o que nos permite escrever:
Resultado valor de X probabilidade

3
VV X=0 10 × 29 = 6/90
3 7
VB X=1 10 × 9 = 21/90
7
BV X=1 10 × 39 = 21/90
7
BB X=2 10 × 69 = 42/90
Desta forma, podemos dizer que os seguintes eventos são equivalentes,

{X = 0} ≡ {V V },
{X = 1} ≡ {V B} ∪ {BV },
{X = 2} ≡ {V V },
e portanto temos as seguintes probabilidades,

P (X = 0) = P ({V V }) = 6/90,
P (X = 1) = P ({V B} ∪ {BV }) = 42/90,
P (X = 2) = P ({V V }) = 42/90.
60
Figura 8: Função de probabilidade da v. a. X, do Exemplo 5.1
De um modo geral, se A = {ω1, ω2 , . . .} ⊂ Ω é tal que X(ωj ) = xi , para ωj ∈ A e X(ωj ) 6= xi ,

para ωi ∈ Ac , então P (X = xi ) = P (A).
Definição 5.2 (Função de Probabilidade) A função de probabilidade de uma variável aleatória X,

é uma função que define a probabilidade de ocorrência de cada resultado xi desta variável, isto é,
se X assume os valores {x1, x2, . . . , xn }, então
pX (xi ) = P (X = xi ) = pi , i = 1, . . . , n.
A função de probabilidade satisfaz as seguintes condições,

1. pX (xi ) ≥ 0, para todo xi ;
Pn
2. i=1 pX (xi ) = 1.
Observação Uma variável aleatória discreta pode assumir valores em um conjunto infinito enu-
merável.
(Cont. do Exemplo 5.1) A função de probabilidade da variável aleatória X do Exemplo 5.1
pode então ser escrita como,


 6/90, se x = 0

 42/90, se x = 1
p(x) =

 42/90, se x=2


0, caso contrário.
A Figura 8 mostra o gráfico desta função.
Podemos definir algumas caracterı́sticas das variáveis aleatórias discretas, análogas às carac-
terı́sticas de uma distribuição de frequências.
Seja X uma variável aleatória discreta, assumindo valores no conjunto RX = {x1 , x2, . . .}.
• Valor Esperado
O valor esperado de X, ou esperança matemática de X ou ainda média de X é o valor
X
E(X) = xi p(xi ).
xi ∈RX
61
• Variância
A variância de X é o valor
X
Var(X) = (xi − E(X))2 p(xi ).
xi ∈RX
Vale X
Var(X) = x2i p(xi) − E(X)2.
xi ∈RX
O desvio padrão de X, como no caso de uma distribuição de frequências, é definido como

p
DP (X) = Var(X).
• Função de distribuição acumulada

A função de distribuição ou função de distribuição acumulada de X é dada por
FX (x) = P (X ≤ x), para todo x ∈ IR.
A função de distribuição satisfaz as seguintes propriedades,
1. 0 ≤ F (x) ≤ 1;
2. limx→−∞ F (x) = 0;
3. limx→∞ F (x) = 1;
4. limh→0 {F (x + h) − F (x)} = p(x);
5. Se b > a, então F (b) ≥ F (a).
Observação A propriedade 5 nos diz que F é não decrescente.
Cont. do Exemplo 5.1

Vamos calcular a esperança, a variância, o desvio padrão e obter a função de distribuição da variável
aleatória X do Exemplo 5.1. Temos,
• Esperança
3
X 6 42 42 126
E(X) = xi p(xi ) = 0 × +1× +2× = = 1, 4.
i=1
90 90 90 90
• Variância
3
X 6 42 42
Var(X) = (xi − E(X))2 p(xi ) = (0 − 1, 4)2 × + (1 − 1, 4)2 × + (2 − 1, 4)2 × = 0, 42.
i=1
90 90 90
Ou então,
3
X 6 42 42
Var(X) = x2i p(xi ) − E(X)2 = 02 × + 12 × + 22 × − (1, 4)2 = 0, 42.
i=1
90 90 90
√
O desvio padrão é então, 0, 42 ' 0, 648.
62
Figura 9: Função de distribuição da v.a. do Exercı́cio 5.1
• Função de distribuição
A função de distribuição de X é dada por


 0, se x<0

 6/90, se 0≤x<1
F (x) =

 48/90, se 1≤x<2


1 se x ≥ 1.
O gráfico da função de distribuição de uma variável aleatória discreta tem sempre a forma
de uma escada. A altura dos degraus em um ponto é igual à probabilidade naquele ponto.
A Figura 9 mostra o caso do Exemplo 5.1.
5.2 Modelos probabilı́sticos para variáveis aleatórias discretas

Nesta seção, vamos estudar alguns modelos probabilı́sticos especiais, que ocorrem com muita
frequência na prática.
Definição 5.3 (Experimento de Bernoulli) Um experimento (ou ensaio) de Bernoulli é um expe-

rimento que admite apenas dois tipos de resultados, que chamaremos sucesso e fracasso.
Exemplo 5.2 Em todos os casos abaixo, temos experimentos de Bernoulli.
• Lançar uma moeda e obervar a face voltada para cima. Os possı́veis resultados são cara
(sucesso) e coroa (fracasso);
• Lançar um dado e observar se ocorre a face número 5 (sucesso) ou ocorre outra face (fracasso);
• Uma peça é escolhida ao acaso de um lote contendo 500 peças e observa-se se a peça é
defeituosa (sucesso) ou se a peça é perfeita (fracasso);
• Escolhe-se uma pessoa ao acaso e observa-se o sexo da pessoa escolhida. Temos também dois
resultados, feminino (sucesso) ou masculino (fracasso).
63
Observação Se a probabilidade de ocorrência de sucesso é igual a p, dizemos que o experimento é
um experimento de Bernoulli com parâmetro p.
A partir de um experimento de Bernoulli, podemos definir uma série de variáveis aleatórias.
Definição 5.4 Variável aleatória de Bernoulli

Considere um experimento de Bernoulli com parâmetro p. Então a variável aleatória definida
por
X(sucesso) = 1 e X(fracasso) = 0,
é chamada variável aleatória de Bernoulli com parâmetro p.
A função de probabilidade de X é dada por

1 − p, se x = 0
p(x) = ,
p, se x = 1
sua esperança é dada por E(X) = 0 × (1 − p) + 1 × p = p, e sua variância é dada por Var(X) =
02 × (1 − p) + 1 × p − p2 = p − p2 = p(1 − p). A função de distribuição de X é

0 se x < 0
F (x) = 1 − p, se 0 ≤ x < 1

1, se x ≥ 1.
Definição 5.5 ( Distribuição Binomial)

Seja X o número de sucessos em n repetições independentes de um ensaio de Bernoulli com
parâmetro p. Então X tem distribuição binomial com parâmetros n e p.
A função de probabilidade de uma variável aletória binomial, de parâmetros n e p (notação:

X ∼ B(n, p)) é dada por
n x
x p (1 − p)n−x para x = 0, 1, . . ., n,
p(x) =
0 caso contrário.
A função de distribuição de X é dada por

 0, se x < 0
P [x] n k
F (x) = k=0 k p (1 − p)n−k , para 0 ≤ x ≤ n

1 se x ≥ n,
onde [x] denota o maior inteiro menor ou igual a x.

A esperança de X é !
Xn
n x
E(X) = x p (1 − p)n−x = np,
x=0
x
e sua variância é dada por np(1 − p).
Exemplo 5.3 Um dado é lançado três vezes. Seja X o número de vezes que aparece o número 5
nas três repetições. Descreva a distribuição da probabilidade da variável aleatória X.
64
Vamos definir os seguintes eventos
A = {sucesso} = { sair o número 5 } = {5}

Ac = {f racasso} = { sair um número 6= 5} = {1, 2, 3, 4, 6}.
Logo, P (A) = p = 1/6 e P (Ac ) = 1 − p = 5/6. Podemos assumir que as repetições são
independentes e desta forma, X tem uma distribuição binomial com parâmetros n = 3 e p = 1/6.
Isto é, sua função de probabilidade é dada por
3 x 3−x ,
p(x) = x (1/6) (5/6) se x = 0, 1, 2, 3
0 caso contrário.
Sua esperança é 3 × 1/6 = 1/2 e sua variância é 3 × 1/6 × 5/6 = 5/12. (Exercı́cio: determine a
função de distribuição de X).
Definição 5.6 (Distribuição de Poisson) Dizemos que uma variável aleatória tem distribuição de
Poisson com parâmetro λ, se ela assume valores no conjunto {0, 1, . . . , } e sua função de probabi-
lidade é dada por −λ k
e λ
p(x) = k! se k = 0, 1, 2, . . .,
0 caso contrário.
Usamos a notação X ∼ Po(λ).
A distribuição de Poisson é muito utilizada para modelar o que chamamos eventos raros. Ela
também pode ser pensada como sendo uma aproximação para a distribuição binomial quando
n → ∞, p → 0, mas np → λ.
Alguns exemplos onde a distribuição de Poisson pode ser empregada são
1. X1: o número de chamadas recebidas por uma central telefônica durante um perı́odo de 30
minutos;
2. X2: o número de bactérias em um litro de água não purificada;
3. X3: o número de partı́culas radiativas que, em um experimento de laboratório, entram em

um contador durante um milissegundo;
4. X4: o número de acidentes com automóveis particulares em determinado trecho da estrada,

num perı́odo de 24 horas;
5. X5: o número de rochas em uma determinada superfı́cie;
6. X6: o número de falhas em uma máquina durante um dia.
Repare que em todos os exemplos acima, a variável aleatória resulta de uma contagem. A dis-
tribuição de Poisson é também largamente empregada quando se deseja contar o número de eventos
de um certo tipo que ocorrem em um intervalo de tempo, ou superfı́cie ou volume. O nome desta
distribuição está associado ao matemático francês S. Denis Poisson (1781-1840), que a estudou em
65
um livro onde trata da aplicação da teoria das probabilidades a justiça comum.
Se X ∼ Po(λ), então sua função de distribuição é dada por

0, se x < 0
F (x) = P[x] e−λ λk ,
k=0 k! , se x ≥ 0
sua esperança é igual a λ e sua variância também é igual a λ.
Exemplo 5.4 Um sistema PBX recebe uma média de 5 chamadas por minuto. Supondo que o
número de chamadas recebidas tenha uma distribuição de Poisson, obtenha a probabilidade de que
o PBX
a) não receba nenhuma chamada durante um intervalo de um minuto;
b) não receba nenhuma chamada durante um intervalo de dois minutos;
c) não receba mais que uma chamada em um intervalo de um minuto;
d) receba mais que duas chamadas em dois minutos.
Solução: a) Temos X ∼ Po(5). Logo, a probabilidade desejada é
e−5 50
P (X = 0) = = e−5 ' 0, 0067.
0!
b) Para resolver o item b), basta notar que em média, o PBX recebe 10 chamadas a cada
dois minutos. Logo, podemos pensar que a variável aleatória Y , o número de chamadas em dois
minutos, tem uma distribuição Po(10). Então,
e−10 100
P (Y = 0) = = e−10 ' 0.000045.
0!
c) Queremos P (X ≤ 1). Temos
e−5 50 e−5 51
P (X ≥ 1) = P (X = 0) + P (X = 1) = + = e−5 + e−5 × 5 ' 0, 04043.
0! 1!
d) Queremos P (Y ≥ 2). Temos
P (Y > 2) = P (Y = 3) + P (Y = 4) + · · · = 1 − P (Y ≤ 2)
= 1 − {P (Y = 0) + P (Y = 1) + P (Y = 2)} ' 0.00277.
Observação As distribuições Binomial e Poisson estão tabeladas (ver Seção C).
66
5.3 Exercı́cios
5.1 ♠ Considere uma urna contendo 3 bolas vermelhas e 5 pretas. Retire 3 bolas, sem reposição
e defina a variável aleatória X igual ao número de bolas pretas. Obtenha a distribuição de X.
5.2 ♠ Repita o problema anterior, mas considerando extrações com reposição.
5.3 ♠ Suponha que uma moeda perfeita é lançada até que apareça cara pela primeira vez. Seja
X o número de lançamentos até que isto aconteça. Obtenha a distribuição de X. (Observe que,
neste problema, pelo menos teoricamente, X pode assumir um número infinito de valores.)
5.4 ♠ Uma moeda perfeita é lançada 4 vezes. Seja Y o número de caras obtidas. Obtenha a
distribuição de Y.
5.5 ♠ Repita o problema anterior, considerando agora que a moeda é viciada, sendo a probabili-
dade de cara dada por p, 0 < p < 1, p 6= 1/2.
5.6 ♠ Calcule a média e a variância da variável aleatória Y definida no problema acima.
5.7 ♠ Generalize o Exercı́cio 5.4, para n lançamentos da moeda.
5.8 ♠ Suponha que a v.a. V tenha a seguinte distribuição:
v 0 1
p q 1−q
Obtenha E(V ) e V ar(V ).
5.9 ♠ O tempo T , em minutos, necessário para um operário processar certa peça, é uma v.a.
com a seguinte distribuição de probabilidade:
T 2 3 4 5 6 7
p 0,1 0,1 0,3 0,2 0,2 0,1
a) Calcule o tempo médio de processamento. b) Calcule o desvio padrão de T .

Para cada peça processada, o operário ganha um fixo de 2,00 u.m. (unidade monetária), mas
se ele processa a peça em menos de 6 minutos, ganha 0,50 u.m. por cada minuto poupado. Por
exemplo, se ele processa a peça em 4 minutos, recebe a quantia adicional de 1,00 u.m.
b) Encontre a distribuição, a média e a variância da v.a. G: quantia em u.m. ganha por peça.
67
5.10 O número de jornais que um certo jornaleiro é capaz de vender num dia é uma variável
aleatória discreta com lei de probabilidade dada por:

 Ax para x = 1, 2, . . ., 50
P (X = x) = A(101 − x) x = 51, 52, . . ., 100

0 outros valores
a) Calcule o valor de A.
b) Calcule a probabilidade de vender:
i) Exatamente 50 jornais. ii) Mais de 50 jornais iii)Entre 26 e 75 jornais (inclusive).
5.11 ♠ Das variáveis abaixo descritas, assinale quais são binomiais, e para estas dê os respectivos
campos de definição e função de probabilidade. Quando julgar que a variável não é binomial, aponte
as razões de sua conclusão.
a) De uma urna com 10 bolas brancas e 20 pretas, vamos extrair, com reposição, cinco bolas.
X é o número de bolas brancas nas 5 extrações.
b) Refaça o problema anterior, mas desta vez as n extrações são sem reposição.
c) De 5 urnas com bolas pretas e brancas, vamos extrair de cada uma delas uma bola. Suponha
que X é o número de bolas brancas obtidas no final.
d) Vamos realizar uma pesquisa em 10 cidades brasileiras, escolhendo ao acaso um habitante
de cada uma delas, e classificando-o em pró ou contra um certo projeto federal. Suponha que X é
o número de indivı́duos contra o projeto no final da pesquisa.
e) Em uma indústria existem 100 máquinas que fabricam determinada peça. Cada peça é
classificada como sendo boa ou defeituosa. Escolhemos ao acaso um instante de tempo, e verificamos
uma peça de cada uma das máquinas. Suponha que X seja o número de peças defeituosas.
5.12 Se X é uma variável aleatória com distribuição binomial com parâmetros n e p, calcule
P (X = k) para cada conjunto de valores de n, p, e k dados na tabela abaixo:
n 2 2 2 3 4 4 4 4 4 4 4
p 0.4 0.4 0.4 0.4 0.4 0.4 0.5 0.6 0.3 0.2 1
k 0 1 2 0 0 1 1 1 1 1 1
P (X = k)
5.13 ♠ Na manufatura de certo artigo, é sabido que 1 entre 10 dos artigos é defeituoso. Qual a
probabilidade de que uma amostra casual de tamanho 4 contenha:
a) nenhum defeituoso? b) não mais do que dois defeituosos?
c) exatamente um defeituoso? d) exatamente dois defeituosos?
5.14 ♠ Um fabricante de peças de automóveis garante que uma caixa de suas peças conterá, no
máximo, 2 defeituosas. Se a caixa contém 18 peças e a experiência tem demonstrado que esse
processo de fabricação produz 5% das peças defeituosas, qual a probabilidade de que uma caixa
satisfaça a garantia?
68
5.15 ♠ Certo curso de treinamento aumenta a produtividade de uma certa população de fun-
cionários em 80% dos casos. Se 10 funcionários quaisquer participam deste curso, encontre a
probabilidade de:
a) exatamente 7 funcionários aumentarem a produtividade;
b) não mais do que 8 funcionários aumentaram a produtivdade;
c) pelo menos 3 funcionários não aumentaram a produtividade.
5.16 ♠ Deteminado tipo de parafuso é vendido em caixas com 1000 peças. É uma caracterı́stica
da fabricação produzir 10% defeituosos. Normalmente, cada caixa é vendida por 13,50 u.m. Um
comprador faz a seguinte proposta: de cada caixa, ele escolhe uma amostra de 20 peças: se a
caixa tiver 0 defeituso, ele paga 20,00 u.m.; 1 ou 2 defeituosos, ele paga 10,00 u.m.; 3 ou mais
defeituosos, ele paga 8,00 u.m. Qual alternativa é a mais vantajosa para o fabricante? (Justificar
estatisticamente).
5.17 ♠ Uma fábrica produz válvulas, das quais 20% são defeituosas. As válvulas são vendidas
em caixas com 10 peças. Se a caixa não tiver nenhuma defeituosa, seu preço de venda é 10,00 u.m.;
tendo uma, o preço é 8,00 u.m.; duas ou três, o preço é 6,00 u.m.; mais do que três, o preço é 2,00
u.m. Qual o preço médio de uma caixa?
5.18 ♠ Um industrial fabrica peças, das quais 1/5 são defeituosas. Dois compradores, A e B, clas-
sificaram as partidas adquiridas em categorias I e II, pagando 1,20 u.m. e 0,80 u.m. respectivamente
do seguinte modo:
Comprador A: retira uma amostra de 5 peças; se encontrar mais de uma defeituosa, classifica
como II.
Comprador B: retira amostra de 10 peças; se encontrar mais de 2 defeituosas, classifica como
II.
Em média, qual comprador oferece mais lucro?
5.19 O daltonismo aparece em 10% das pessoas de uma certa população; explique como você
obteria o tamanho mı́nimo necessário para que uma amostra (com reposição) desta população
tivesse pelo menos 2 pessoas daltônicas com probabilidade maior ou igual a 0.95. (Assuma que
você tivesse à sua disposição tabelas adequadas).
5.20 Em uma certa população, cerca de 40% dos eleitores são democratas. Você pode determinar
o tamanho da amostra n e este número de eleitores é selecionado ao acaso, com reposição, dessa
população. Você ganha um prêmio se houver exatamente 2 democratas na amostra. Que valor de
n lhe dá a maior chance? Qual a sua chance para este valor de n?
5.21 Em um exame do tipo múltipla escolha, com 3 opções para cada uma das 5 questões, qual
é a probabilidade de que um aluno acerte 4 ou mais questões, chutando todas elas?
69
5.22 A VARIG sabe que 5% dos passageiros que fazem a reserva e compram a passagem para
um certo vôo não aparecem para viajar. Devido a isto, sua polı́tica é vender 52 passagens para o
vôo, que é feito num avião de 50 lugares. Qual a probabilidade de que cada passageiro que apareça
com a passagem tenha lugar no avião?
5.23 Suponha que 20 coelhos tenham sido usados em um estudo sobre agentes coaguladores de
sangue. Inicialmente, um anticoagulante foi ministrado a 10 coelhos que foram, posteriormente,
colocados em uma mesma gaiola com os animais que não receberam a droga. Supondo que os
coelhos não sejam distinguı́veis, encontre a probabilidade de que entre 12 coelhos selecionados ao
acaso, 6 tenham tomado a droga e 6 não.
5.24 Admita que a proporção de sexos seja 1:1. Determine a probabilidade de que uma famı́lia
selecionada aleatoriamente, com 5 crianças tenha:
a) exatamente uma menina b) pelo menos uma menina c) não mais de uma menina.
5.25 Um produtor de sementes afirma que 80% das sementes de certo tipo germinam. Você planta
5 destas sementes, compradas deste produtor. Qual a probabilidade de :
a) Exatamente 2 sementes germinarem?
b) Pelo menos 3 sementes germinarem?
c) No máximo 2 sementes germinarem?
d) Suponha que 100 pessoas estejam em situação análoga à sua, isto é, cada uma plantou 5
destas sementes.
i) Para quantas pessoas esperamos que exatamente 2 sementes germinem?
ii) Pelo menos 3 germinem? iii) No máximo 3 germinem?
e) Suponha que após certo tempo, você tenha verificado que no máximo duas das sementes que
plantou germinaram. Isto leva a descrer da afirmação do produtor de que 80% destas sementes
germinam? Porque?
5.26 Dois indivı́duos, A e B, discordam quanto à proveniência de 12 insetos. O indivı́duo A afirma

que os 12 insetos são provenientes do cruzamento de hı́bridos do tipo Aa, enquanto o indivı́duo B
afirma que estes provêm de cruzamentos onde um dos genitores é da forma Aa e o outro é da forma
aa. Seja X a variável aleatória que conta o número de homozigotos (aa) entre os 12 insetos.
a) Se A estiver com a razão, qual a distribuição de probabilidade de X? E se for B?
b) Suponha que usaremos o seguinte critério para decidir quem está com razão: se 6 ou mais
insetos forem do tipo aa daremos razão a B, caso contrário daremos razão a A. Qual a probabilidade
de cometer um erro dizendo que A (B) está com a razão quando na verdade B (A) está certo?
5.27 Alega-se que um suplemento vitamı́nico auxilia cangurus a aprender a sair de um labirinto
de paredes altas. Para testar a veracidade desta afirmação, 16 cangurus são divididos em 8 pares.
Em cada par, um canguru é escolhido ao acaso para receber o suplemento vitamı́nico e o outro é
alimentado com uma dieta normal. Os tempos de aprendizado são então cronometrados e observa-
se que em 6 dos 8 pares, o canguru que recebeu a vitamina aprendeu mais rápido. Se a vitamina
não tem efeito, de maneira que cada um dos animais tem a mesma chance de ser o mais rápido,
qual é a probabilidade de que 6 ou mais animais tratados aprendam mais rápido, apenas por acaso?
70
5.28 Os motores de um avião operam independentemente e cada um deles pode falhar em vôo,
com probabilidade q < 1. Suponha que o vôo decorre com inteira segurança se pelo menos a metade
dos motores funcionam. Determine a probabilidade de completa segurança de vôo, no caso de:
a) Um quadrimotor b) Um bimotor.
Para que valores de q seria preferı́vel um bimotor a um quadrimotor?
5.29 Um certo tratamento é capaz de imunizar 78% dos coelhos contra uma determinada doença.
Uma nova amostra de 50 coelhos é testada. Seja X o número de animais que se tornarão imunes.
Qual é a esperança e o desvio padrão de X?
5.30 Ao examinarmos uma lâmina ao microscópio, suponha que o número de bactérias percebidas
em uma área igual à do campo visual do aparelho siga uma distribuição de Poisson, com número
médio de bactérias igual a 2,5. Se uma tal área da lâmina é escolhida ao acaso, qual a probabilidade
de não conter mais que 5 bactérias? Nenhuma bactéria?
5.31 Oito ratos experimentais se movem aleatoriamente sobre uma superfı́cie que é dividida em
vinte quadrantes de mesmo tamanho, numerados 1,2,...20. Uma fotografia é tirada. Admitindo-se
a distribuição de Poisson,
a) Qual é a probabilidade de que exatamente um rato seja encontrado no quadrante no 1?
b) Quantos quadrantes devem conter 0, 1, 2,... ratos? (Sugestão: calcular o número médio de
ratos, por quadrante, e usar uma tabela de probabilidade de Poisson.)
71
6 Variáveis aleatórias contı́nuas
6.1 Introdução
Na seção anterior, vimos que uma variável aleatória X é uma função real definida em um espaço
amostral associado a um experimento aleatório. Algumas vezes, o conjunto dos valores possı́veis da
v.a. X não é um conjunto finito ou enumerável, como acontecia no caso discreto. Vamos considerar
o seguinte exemplo.
Exemplo 6.1 Suponha que a distribuição de uma dada população segundo a altura, em metros,
seja a seguinte:
Altura(m) % ∆i fi dip xi xi fi
1, 50 ` 1, 60 20 0,10 0,2 2 1,55 0,31
1, 60 ` 1, 80 50 0,20 0,5 2,5 1,70 0,85
1, 80 ` 1, 90 30 0,10 0,3 3 1,85 0.555
Total 100 – 1 – – 1,715
Suponha que uma pessoa seja escolhida ao acaso desta população e seja X a altura da pessoa
escolhida. Então X é uma variável aleatória pois associa um número a um resultado de um
experimento aleatório.
Por meio do histograma da distribuição acima, podemos atribuir probabilidades a eventos asso-
ciados a este experimento. Por exemplo, suponha que desejamos obter as seguintes probabilidades:
a) probabilidade da altura da pessoa escolhida ser menor que 1,60m (ou P (X < 1, 60));
b) probabilidade da altura da pessoa escolhida estar entre 1,75m e 1,85m
(ou P (1, 75 < X < 1, 85)).
c) probabilidade da altura da pessoa escolhida ser igual a 1,75m (P (X = 1, 75)).
Observe que se uma pessoa é escolhida ao acaso da população, então a probabilidade de que
a altura dela esteja em determinado intervalo, é igual à proporção de pessoas com altura naquele
intervalo. Interpretando a área abaixo do histograma entre dois valores como a proporção de
pessoas na população com altura entre estes dois valores, fica simples encontrar as probabilidades
desejadas.
Em a) temos que P (X < 1, 60) é dada pela proporção de pessoas com altura inferior a 1,60m,
que corresponde à área do histograma até 1,6. Em b), temos que P (1, 75 < X < 1, 85) é dada pela
proporção de pessoas na população com altura entre 1,75m e 1,85m, que é dada pela área abaixo
do histograma entre 1,75 e 1,85. A Figura 10 mostra o histograma da distribuição. Em c), temos
que a área abaixo do histograma no intervalo desejado é igual a zero e portanto a probabilidade de
que a altura seja igual a 1,75m é zero!
A variável aleatória X do Exemplo 6.1 é um exemplo de uma variável contı́nua. O histograma
da distribuição, se ignorarmos os lados dos blocos, pode ser interpretado como sendo o gráfico da
seguinte função f , 
 2 se 1, 5 ≤ x < 1, 6


2, 5 se 1, 6 ≤ x < 1, 8
f (x) =

3
 se 1, 8 ≤ x < 1, 9
0 caso contrário
72
Figura 10: Histograma da distribuição de alturas do Exemplo 6.1
que chamaremos de função densidade de probabilidade da variável aleatória X e que tem as seguintes
propriedades,
1. f (x) ≥ 0 para todo x ; (quer dizer que o gráfico de f está todo acima do eixo dos x)
2. a área abaixo do gráfico de f é igual a 1 (igual à área total abaixo do histograma de proporção);
3. a probabilidade de X estar em um determinado intervalo é igual à área abaixo de f neste

intervalo.
Observação 1 É importante não confundir variável aleatória contı́nua com variável contı́nua, como
foi definido anteriormente. Por exemplo, se estivermos observando a variável altura em um grupo de
5 estudantes, a caracterı́stica observada em cada um é uma variável contı́nua pois pode, a princı́pio,
ser qualquer valor em um intervalo. Suponha agora que estas alturas tenham sido medidas (com
precisão), tendo sido obtidos os seguintes valores, em metros: 1,65; 1,67;1,68;1,70;1,82. Se um estu-
dante for escolhido ao acaso deste grupo e definimos X como sendo a altura do estudante escolhido,
então X é uma variável aleatória discreta, pois pode assumir apenas um dos cinco valores acima,
cada um com probabilidade 1/5.
Observação 2 Quando utilizamos um histograma para representar uma distribuição de uma po-
pulação, estamos em geral utilizando uma aproximação ou um modelo teórico para ela. Nenhuma
população finita ou enumerável pode ter, de fato, uma distribuição contı́nua, embora muitas vezes
seja possı́vel encontrar uma distribuição contı́nua que se aproxima da verdadeira, como no caso do
histograma. Se houvesse um número suficientemente grande de observações, poderı́amos ir dimi-
nuindo os intervalos de classe e o histograma iria ficando cada vez menos irregular, até atingir um
caso limite com uma curva bem mais suave. Desta forma, qualquer curva que esteja toda acima
do eixo dos x e que delimite uma área total igual a 1, poderia ser um histograma alisado de uma
população e portanto poderia ser o gráfico de uma função de densidade de uma v.a. X.
73
Figura 11: Gráfico da função densidade, Exemplo 6.2
Exemplo 6.2 Verifique que a função abaixo representa a função de densidade de alguma variável
aleatória, 
 4x, se 0 ≤ x < 1/2
f (x) = −4x + 4, 1/2 ≤ x < 1

o outros valores
Solução Temos,
1. f (x) ≥ 0 para todo x;
2. Área total abaixo da curva é igual à área do triângulo
(base) × (altura) 1×2

= = 1.
2 2
Logo, f (x) representa a função densidade de uma variável aleatória X e P (X > 1/2) é a área
hachurada na figura = (1−1/2)×2
2 = 1/2.
Nem sempre é tão simples encontrar a área abaixo do gráfico de uma função. Por exemplo,
como poderı́amos determinar a área delimitada pelo gráfico de uma função quadrática? Em casos
como este, para verificarmos se a área total abaixo da curva vale 1, teremos que utilizar algumas
ferramentas do Cálculo.
Definição 6.1 A integral definida de uma função positiva f em um intervalo [a,b], representa a
área abaixo do gráfico da função neste intervalo.
Exemplo 6.3 Podemos calcular a área hachurada no gráfico da Figura 12 por meio da integral da
função F no intervalo [a, b], que denotaremos por
Z b
f (x)dx
a
74
Figura 12: Gráfico de f do Exemplo 6.3
6.2 Valor esperado e variância

Podemos definir medidas de posição e dispersão tais como valor esperado e variância para uma
variável contı́nua e para isso necessitamos também de ferramentas do Cálculo.
Definição 6.2 Se X é uma variável aleatória contı́nua com função densidade f , então a média de
X, ou seu valor esperado é dado por
Z ∞
E(X) = xf (x)dx
−∞
se a integral imprópria acima convergir.
Definição 6.3 Se X é uma variável aleatória contı́nua com função densidade f , e média E(X),
então a variância de X é dada por
Z ∞
Var(X) = (x − E(X))2f (x)dx
−∞
se a integral imprópria acima convergir.
Tanto o valor esperado quanto a variância de uma variável aleatória satisfazem propriedades
similares às propriedades da média e variância de um conjunto de dados e são válidas para variáveis
discretas ou contı́nuas. Temos
1. Se Y = aX + b e a e b são constantes, então,
E(Y ) = aE(X) + b e Var(Y ) = a2 Var(X).
2. Var(X) ≥ 0. Se Var(X) = 0, então X é constante, isto é, P (X = a) = 1, para alguma

constante a.
3. Se denotarmos por µ o valor esperado de X e por σ 2 sua variância, então a variável aleatória
Z definida por
X−µ
Z= ,
σ
tem média 0 e variância 1. Dizemos neste caso que Z é a padronização de X.
75
6.3 Modelos probabilı́sticos
6.3.1 Distribuição Normal
A equação da curva normal foi publicada pela primeira vez em 12 de novembro de 1733, por
Abraham De Moivre (1667–1774) que trabalhava na solução de problemas relacionados com jogos.
Por volta de 1870, o matemático belga Adolph Quetelet teve a idéia de usar esta curva como um
histograma ideal, ao qual histogramas obtidos para conjuntos de dados pudessem ser comparados.
Definição 6.4 Dizemos que uma variável aleatória contı́nua tem distribuição Normal com parâmetros
µ e σ 2 , se o gráfico de sua função de densidade de probabilidade for uma curva normal. Mais es-
pecificamente, quando sua função de densidade de probabilidade for dada pela equação
1 1 x−µ 2
f (x) = √ e− 2 ( σ ) , −∞ < x < ∞,
2πσ 2
em que e = 2, 71828 . . ., π = 3, 14159 . . .
Os parâmetros da distribuição µ e σ 2 são, respectivamente, a média e a variância da variável

aleatória.
Observação Denotamos por N (µ, σ 2) a variável aleatória Normal com média µ e variância σ 2 .
6.3.2 Algumas caracterı́sticas da distribuição Normal

1. A curva Normal é simétrica em torno de sua média µ;
2. A área total abaixo da curva é 1 (é uma densidade de probabilidade). Devido à simetria,
50% da área fica à esquerda de µ e 50% fica à direita.
3. A média, a mediana e a moda são iguais;
4. A distribuição Normal fica inteiramente especificada para cada escolha do par µ e σ 2 (µ pode
assumir qualquer valor real e σ 2 é, obviamente, positivo).
5. Qualquer combinação linear de uma variável aleatória Normal também é uma variável aleatória
Normal. Mais especificamente, se X ∼ N (µ, σ 2) e Y = aX + b para constantes quaisquer a
e b, então Y ∼ N (aµ + b, a2σ 2).
2
6. Se X ∼ N (µX , σX ) e Y ∼ N (µY , σY2 ) são duas variáveis aleatórias “independentes”, então
aX + bY ∼ N (aµX + bµY , a2σX2
+ b2σY2 ).
Definição 6.5 Dizemos que uma variável aleatória X tem distribuição Normal Padrão ou Normal
reduzida se X ∼ N (0, 1), isto é, se X tiver uma distribuição Normal com média 0 e variância 1.
A função de densidade da Normal Padrão é
1 2
f (x) = √ e−x /2, −∞ < x < ∞
2π
76
A curva Normal Padrão está tabelada e para determinar a área abaixo da curva entre dois
pontos quaisquer, xo ≤ x1 , não precisamos calcular a integral
Z x1 1 2
√ e−x /2 dx,
xo 2π
mesmo porque ela não pode ser calculada exatamente e aproximações só são possı́veis por meio de
métodos numéricos. Para obter áreas sob curvas Normais quaisquer, podemos usar o fato 5 acima,
com a = 1/σ e b = µ/σ, isto é,
X−µ X µ
Se X ∼ N (µ, σ 2), teremos Z = = − ∼ N (0, 1),
σ σ σ
e consultar a tabela da Normal padrão.
6.3.3 Uso da tabela da Normal padrão

A tabela da distribuição Normal padrão fornece os valores da área abaixo da curva N (0, 1) entre
os valores 0 e z, para z ≥ 0. Isto é, fornece a probabilidade de uma v.a. Z ∼ N (0, 1) tomar valores
entre 0 e z.
Como utilizar a Tabela III de “Tabelas Estatı́sticas”:
Z z 1 2
Valor Tabelado = P (0 ≤ Z ≤ z) = √ e−x /2
0 2π
z 0 1 2 3 4 5 6 7 8 9
0.0 .0000 .0040 .0080 .0120 .0160 .0199 .0239 .0279 .0319 .0359
0.1 .0398 .0438 .0478 .0517 .0557 .0596 .0636 .0675 .0714 .0753
.. ..
. .
1.6 .4452 .4463 .4474 .4484 .4495 .4505 .4515 .4525 4535 .4545
.. ..
. .
1.9 .4713 .4719 .4726 .4732 .4738 .4744 .4750 .4756 .4761 .4767
.. ..
. .
3.8 .4999 .4999 .4999 .4999 .4999 .4999 .4999 .4999 .4999 .4999
Na linha da tabela temos a parte inteira e a primeira decimal de z;

na coluna da tabela temos a segunda decimal de z;
no corpo da tabela temos P (0 ≤ Z ≤ z).

Por exemplo, se z = 0, 13, cruzamos o valor 0.1 da linha com o valor 3 na coluna obtemos 0.0517
(na tabela, o 0 antes do ponto decimal foi omitido). Esta é, portanto, a área sob a curva Normal
entre 0 e 0,13.
A tabela só fornece áreas à direita do 0 (valores positivos de z), mas podemos encontrar áreas
também à esquerda do 0, usando a simetria da curva e o fato de que P (Z ≥ 0) = 0.5.
Exemplo 6.4 Vamos calcular algumas probabilidades envolvendo a distribuição normal.
77
1. P (−1, 64 ≤ Z ≤ 0) = P (0 ≤ Z ≤ 1, 64) = 0.4495 (Figura 13 a)
2. P (Z ≥ 1, 64) = 0, 5 − 0.4495 = 0.0505 (Figura 13 b).
3. P (Z ≤ 1, 64) = P (Z ≤ 0) + P (0 ≤ Z ≤ 1, 64) = 0, 5 + 0, 4495 = 0, 9495 (Figura 13 c)
4. P (Z ≤ −1, 64) = P (Z ≥ 1, 64) = 0, 0505 (por simetria) (Figura 13 d)
Figura 13:
5. P (|Z| ≤ 1, 64) = P (−1, 64 ≤ Z ≤ 1, 64) = 2P (0 ≤ Z ≤ 1, 64) = 2(0, 4495) = 0, 8990

(Figura 14 a)
6. P (1, 64 ≤ Z ≤ 1, 96) = P (0 ≤ Z ≤ 1, 96) − P (0 ≤ Z ≤ 1, 64) = 0, 4750 − 0, 4495 = 0, 0255

(Figura 14 b)
7. P (−1, 64 ≤ Z ≤ 1, 96) = P (0 ≤ Z ≤ 1, 64) + P (0 ≤ Z ≤ 1, 96) = 0, 4495 + 0, 4750 = 0, 9245

(Figura 14 c)
Exemplo 6.5 Vamos determinar o valor de z tal que P (0 ≤ Z ≤ z) = 0, 0753. Agora, conhecemos
o valor tabelado e procuramos o valor de z que corresponde a ele. No corpo da tabela o valor 0,0753
está na linha 0.1 e na coluna 9. Portanto o valor de z é 0,19 (Figura 14 d).
Exemplo 6.6 Seja X ∼ N (4, σ 2 = 64). Calcule as seguintes probabilidades: P (X > 6) e
P (|X| ≥ 2). Temos

X −µ 6−µ X −4 6−4
P (X > 6) = P > =P > =
σ σ 8 8
P (Z > 0, 25) = 0, 5 − 0, 0987 = 0, 4013
e

−2 − µ X−µ 2−µ
P (|X| > 2) = 1 − P (|X| ≤ 2) = 1 − P (−2 ≤ X ≤ 2) = 1 − P ≤ ≤
σ σ σ

−2 − 4 X −4 2−4
1−P ≤ ≤ = 1 − P (−0, 75 ≤ Z ≤ −0, 25) = 1 − (0, 2734 − 0, 0987) =
8 8 8
0,8253. (Z denota a normal padrão)
78
Figura 14:
79
6.4 Exercı́cios
6.1 ♠ Uma v.a. X tem distribuição triangular no intervalo [0,1] se a sua função de densidade de
probabilidade é dada por: 


0, x<0

 Cx, 0 ≤ x ≤ 1/2
f (x) =

 C(1 − x), 1/2 ≤ x ≤ 1


0, x>1
a) Que valor deve ter a constante C, de modo que f (x) seja uma função de densidade?
b) Faça o gráfico de f (x).
c) Determine P (X ≤ 1/2), P (X > 1/2) e P (1/4 ≤ X ≤ 3/4).
d) Obtenha E(X) .
Sugestão .: Use o fato de que o gráfico de f (x) pode ser interpretado como o histograma da
distribuição e que a área do triângulo é = (base x altura)/2.
6.2 ♠ Suponha que estamos atirando dardos em uma alvo circular de raio 10 cm, e seja X a
distância do ponto atingido pelo dardo ao centro do alvo. A função de densidade de X é:

kx, se 0 ≤ 10
f (x) =
0 nos demais valores
a) Qual a probabilidade de acertar a mosca, se ela é um cı́rculo de 1 cm de raio?
b) Mostre que a probabilidade de acertar qualquer cı́rculo concêntrico é proporcional à sua área.
6.3 Se X ∼ N (0, 1), calcule:

a) P (X > 0, 55) b) P (X > −0, 55) c) P (X < −2, 33)
d) P (−1, 96 < X < 1, 96) e) P (−2, 58 < X < 2, 58) f ) P (−1, 65 < X < 1, 65)
g) P (X = 0, 74) h) P (0 < X < 1, 43) i) P (−1, 43 < X < 0)
j) P (−1, 43 < X < 1, 43) k) P (|X| > 1) l) P (X < −2 ou X > 1)
6.4 Determine o valor de z nas expressões abaixo, assumindo Z ∼ N (0, 1).

a) P (Z < z) = 0, 0055 b) P (Z > z) = 0, 0384 c) P (−2, 67 ≤ Z ≤ z) = 0, 9718
d) P (Z ≤ z) = 0, 1251 e) P (−z ≤ Z ≤ z) = 0, 8132 f ) P (−z ≤ Z ≤ 2, 98) = 0, 1117
6.5 Determinar a área subentendida pela curva normal :

a) à esquerda de −1, 78; b) à esquerda de 0,56; c) à direita de −1, 45;
d) à direita de 2,16; e) entre −0, 80 e 1,53;
f ) à esquerda de −2, 52 e à direita de 1,83; g) à direita de −2, 52 e à esquerda de 1,83.
6.6 ♠ Se X : N (10, 4) , calcular:

a) P (8 < X < 10), c) P (X > 10),
b) P (9 ≤ X ≤ 12), d) P (X < 8 ou X > 11)
80
6.7 ♠ Na distribuição X : N (100, 100), encontre:
a) P (X < 115) b) P (X ≥ 80),
c) P (|X − 100| ≤ 10), d) o valor a, tal que P (100 − a ≤ X ≤ 100 + a) = 0, 95.
6.8 ♠ Na distribuição X : N (µ, σ 2), encontre:

a) P (X ≤ µ + 2σ), b) P (|X − µ| ≤ σ),
c) o número a, tal que P (µ − aσ ≤ X ≤ µ + aσ) = 0, 99,
d) o número a, tal que P (X > a) = 0, 90.
6.9 ♣ Suponha que X tenha distribuição N (0, 25). Calcule P (1 < X 2 < 4).
6.10 ♠ Suponha que as amplitudes de vida de dois aparelhos elétricos, D1 e D2, tenham dis-
tribuições N (42, 36) e N (45, 9), respectivamente. Se o aparelho é para ser usado por um perı́odo
de 45 horas, qual aparelho deve ser preferido? E se for por um perı́odo de 49 horas?
6.11 ♠ O diâmetro X de rolamentos de esfera fabricados por certa fábrica tem distribuição
N (0, 6140; (0, 0025)2). O lucro T de cada esfera depende de seu diâmetro, e T = 0, 10 se a
esfera é boa; (0, 6100 < X < 0, 6180);
T = 0, 05 se a esfera é recuperável (0, 6080 < X < 0, 6100) ou (0, 6180 < X < 0, 6200);
T = −0, 10 se a esfera é defeituosa (X < 0, 6080 ouX > 0, 62). Calcular:
a) As probabilidades de as esferas serem boas, recuperáveis e defeituosas.
b) E(T ) e V ar(T ).
6.12 ♠ As notas de Estatı́stica Econômica dos alunos de uma determinada universidade distri-
buem-se de acordo com uma distribuição normal, com média 6,4 e desvio padrão 0,8. O professor
atribui graus A, B e C da seguinte forma:
Nota Grau
x<5 C
5 ≤ x < 7, 5 B
7, 5 ≤ x ≤ 10 A
Em uma classe de 80 alunos, qual o número esperado de alunos com grau A? B? C?
6.13 ♠ O peso bruto de latas de conserva é uma v.a. normal com média 1.000 g e desvio padrão
20 g. as latas têm peso médio de 100 g e devio padrão de 10 g, também com distribuição normal
de peso.
a) Qual a probabilidade de uma lata conter menos de 850 g de peso lı́quido?
b) Qual a probabilidade de uma lata conter mais de 920 g de peso lı́quido?
81
6.14 ♠ A distribuição dos pesos de coelhos criados numa granja pode muito bem ser representada
por uma distribuição normal, com média de 5 kg e desvio padrão de 0,8 kg. Uma abatedouro
comprará 5.000 coelhos e pretende classificá-los de acordo com o peso, do seguinte modo: 20% dos
mais leves como pequenos, os 55% seguintes como médios, os 15% seguintes como grandes e os 10
% mais pesados como extras. Quais os limites de peso para cada classificação?
6.15 ♠ Uma enchedora automática de garrafas de refrigerantes está regulada para que o volume
médio de lı́quido em cada garrafa seja de 1.000 cm3 e o desvio padrão de 10 cm3 . Pode-se admitir
que a distribuição da variável seja normal.
a) Qual a porcentagem de garrafas em que o volume de lı́quido é menor que 990 cm3 ?
b) Qual a porcentagem de garrafas em que o volume não se desvia da média em mais de 2 desvios
padrões?
c) O que acontecerá com a porcentagem do item (b) se a máquina for regulada de forma que a
média seja 1.200 cm3 e o desvio padrão 20 cm3 ?
6.16 A precipitação pluviométrica média em certa cidade, no mês de dezembro, é de 8,9 cm.
Admitindo a distribuição normal com desvio padrão 2,5 cm, determinar a probabilidade de que, no
mês de dezembro próximo, a precipitação seja:
a) inferior a 1,6 cm b) superior a 12 cm
c) superior a 5 cm mas não superior a 7,5 cm.
6.17 ♠ As vendas de um determinado produto têm distribuição aproximadamente normal, com

média 500 e desvio padrão 50. Se a empresa decide fabricar 600 unidades no mês em estudo, qual é
a probabilidade de que não possa atender a todos os pedidos desse mês, por estar com a produção
esgotada?
6.18 ♠ As alturas de 10.000 alunos de um colégio têm distribuição aproximadamente normal, com
média 170 cm e desvio padrão 5 cm.
a) Qual o número esperado de alunos com altura superior a 1,65 m?
b) Qual o intervalo simétrico em torno da média, que conterá 75% das alturas dos alunos?
6.19 Suponha que a vida, em horas, de um equipamento eletrônico produzido por um determinado
processo tenha distribuição normal com média µ = 160 horas e desvio padrão σ. Qual é o máximo
valor possı́vel para σ se a vida X de um destes equipamentos deve ter um probabilidade de 0,80 de
estar entre 120 e 200 horas?
6.20 ♦ Suponha que a altura, em centı́metros, de um homem de 21 anos de idade seja um

fenômeno aleatório com resultados numéricos que obedece uma lei de probabilidades normal com
média µ = 170 e desvio padrão σ = 5. Qual é a probabilidade condicional de que a altura de um
homem de 21 anos de idade seja maior que 170 cm, dado que é maior que 160 cm?
82
6.21 ♦ Se as taxas de colesterol para uma dada população estão distribuı́das aproximadamente
como uma normal com média de 200mg/100 ml e desvio padrão de 20 mg/100 ml encontre a
probabilidade de que um indivı́duo escolhido ao acaso desta população tenha sua taxa de colesterol:
a) Entre 180 e 200 mg/100 ml b) Maior que 225 mg/100 ml
c) Menor que 150 mg/100 ml d) Entre 190 e 210 mg/100 ml
6.22 ♣ Sabe-se que a precipitação anual de chuva, em certa localidade, é uma variável aleatória
normalmente distribuı́da, com média igual a 29,5 cm e desvio padrão 2,5 cm. Quantos centı́metros
de chuva (anualmente) são ultrapassados em cerca de 5 por cento do tempo?
6.23 ♣ Suponha que a temperatura (medida em graus centı́grados) seja normalmente distribuı́da,
com média 10o e variância 4o . Qual é a probabilidade de que a temperatura T esteja entre 48o e
53o Fahrenheit? ((F o − 32) × 9 = C o /5)
6.24 ♣ Sabe-se que os erros, em certo dispositivo para medir comprimentos, são normalmente
distribuı́dos com média zero e desvio padrão 1 unidade. Qual é a probabilidade de que o erro na
medida seja maior que 1 unidade? 2 unidades? 3 unidades?
6.25 ♣ Suponha que X, o comprimento de uma barra, tenha distribuição N (10, 2). Em vez
de medir o valor de X, somente serão especificadas certas exigências que devem ser atendidas.
Especificamente, cada barra fabricada será classificada como sendo do tipo A, se X < 8 e como
sendo do tipo B, caso contrário. Se 10 destas barras forem fabricadas, qual é a probabilidade de que
um igual número de barras caia em cada uma das categorias acima? (Sugestão: Calcule primeiro
a probabilidade de uma barra pertencer a uma das categorias acima; depois use a distribuição
binomial).
6.26 Os registros indicam que o tempo para se fazer um teste é aproximadamente normal, com
média 80 minutos e desvio padrão 5 minutos.
a) Qual é a porcentagem de candidatos que levam menos de 85 minutos para concluir o teste?
b) Se o tempo máximo concedido para a realização do teste é de 1 hora e 35 minutos, qual é a
porcentagem de candidatos que não conseguirá terminar o teste? c) Qual é o número esperado de
pessoas, entre 150 que se submetem ao teste, que entregará o teste até 1 hora e 10 minutos?
83
7 Distribuições Amostrais
Nesta seção vamos apresentar alguns conceitos básicos sobre inferência estatı́stica.
7.1 Introdução
Definição 7.1 População - É um conjunto de indivı́duos (ou objetos), tendo pelo menos uma
variável em comum observável.
(Em geral, representamos a população por sua distribuição).
Definição 7.2 Amostra - É qualquer subconjunto da população.
No caso mais comum, escolhe-se ao acaso um subconjunto da população de tal maneira que
cada elemento da amostra seja uma variável aleatória com a mesma distribuição da população.
A amostra assim obtida é chamada Amostra Aleatória (ou casual) Simples (a.a.s.). ( Obs.: Se a
população for finita, a única maneira de se escolher uma amostra com esta caracterı́stica é fazendo
uma escolha com reposição). Notação para uma amostra aleatória de tamanho n: (X1, . . . , Xn).
Definição 7.3 Inferência Estatı́stica - Conjunto de técnicas estatı́sticas que têm como objetivo
produzir afirmações sobre uma dada caracterı́stica da população a partir de informações colhidas
de uma amostra. Os dois problemas básicos da Inferência Estatı́stica são: Estimação e Teste de
Hipóteses.
Definição 7.4 Parâmetros - São caracterı́sticas da população. Ex.: Média populacional, Variância
populacional, Mediana populacional, etc.
Definição 7.5 Estatı́stica É qualquer função da amostra (X1, . . . , Xn).
( Obs.: Uma estatı́stica é uma variável aleatória, pois é função de variáveis aleatórias
(T = f (X1, . . . , Xn )). As inferências sobre os parâmetros serão baseadas em estatı́sticas.
Definição 7.6 Estimador- Se θ é um parâmetro de uma distribuição (população) e empregamos

uma estatı́stica T baseada em uma amostra desta distribuição para estimar este parâmetro, dizemos
que T é um Estimador de θ.
Definição 7.7 Estimativa - O valor de um estimador, observado na amostra.
Tabela 7.1 - Notação usual para os principais parâmetros e seus estimadores

Média Variância D. Padrão No elem. Proporção
População
(parâmetro) µ σ2 σ N p
Amostra √
(Estatı́stica) X̄ σ̂ 2 ou S 2 σ̂ 2 ou S n p̂
84
Obs.: X̄ = X1 + . n. . + Xn é a média amostral;
Pn
σ̂ 2 = (1/n) i=1 (Xi − X̄)2 ;
1 P n
S 2 = n−1 i=1 (Xi − X̄)
2 é geralmente chamada de variância amostral é a estatı́stica mais
utilizada como estimador de σ 2. Em geral, as calculadoras cientı́ficas fornecem o valor de s2 como

a variância de um conjunto de valores.
Outras estatı́sticas : Mediana da amostra, Máximo e Mı́nimo da amostra, Percentis, etc.
Definição 7.8 Distribuição Amostral - A distribuição amostral de uma determinada estatı́stica

é a distribuição de todos os possı́veis valores que ela pode assumir, calculados a partir de todas as
possı́veis amostras de mesmo tamanho.
A média aritmética e a variância da distribuição amostral de uma estatı́stica T são, respectiva-

mente, o valor esperado (Esperança ou E(T )) e Variância (σT2 ) da estatı́stica T .
Definição 7.9 Estimadores não Viciados (ou não viesados)- Um estimador T de um parâmetro
θ é não viciado se E(T ) = θ.
Isto quer dizer que se considerarmos todas as amostras possı́veis de tamanho n e calcularmos
o estimador T para todas elas, a média aritmética dos valores obtidos será o próprio parâmetro θ.
Observações
1 (IMPORTANTE!) Ao utilizarmos uma amostra aleatória de tamanho n para fazermos inferências
sobre parâmetros da população de onde esta amostra foi retirada, calculamos estatı́sticas que serão
estimadores para estes parâmetros. No caso especı́fico da variância, poderı́amos utilizar, por exem-
plo os seguintes estimadores de σ 2, a variância populacional:
Pn Pn Pn
2 i=1 (Xi − X̄)2 2 i=1 (Xi− X̄)2 − X̄)2
i=1 (Xi
σ̂ = , S = , T= , etc.
n n−1 n−2
Embora a estatı́stica σ̂ 2 acima pareça o estimador mais natural para a variância, S 2 (a variância
amostral) é o mais utilizado por ser não viciado, isto é, E(S 2) = σ 2.
2- Note que a variância de um conjunto de n valores é sempre dada por
Pn n
− x̄)2 X
i=1 (xi
= (1/n) x2i − x̄2
n i=1
Pn
onde x̄ = (1/n) i=1 xi . Ou, equivalentemente, por
k
X k
X
(xi − x̄)2 fi = x2i fi − x̄2
i=1 i=1
P
onde x̄ = ki=1 xi fi . Esta é, portanto, a única maneira pela qual podemos calcular a variância de
uma população (σ 2), caso tenhamos acesso integral a ela. (Observe ainda que podemos reescrever
85
as fórmulas acima utilizando a notação da Tabela 7.1, isto é, para uma população de tamanho N ,
temos :
N
X N
X
σ 2 = (1/N ) x2i − µ2 , ou σ2 = x2i fi − µ2
i=1 i=1
3 -X̄, a média amostral, é um estimador não viciado da média populacional, isto é, E(X̄) = µ.
Definição 7.10 Estimadores Consistentes Dizemos que Tn é um estimador consistente para

o parâmetro θ se
1. limn→∞ E(Tn) = θ e
2. limn→∞ V ar(Tn ) = 0 .
Na definição acima, o ı́ndice n em Tn representa o tamanho da amostra considerada.
7.2 Distribuição Amostral da Média

Considere uma população com média µ e variância σ 2. Se (X1, . . . , Xn) é uma amostra aleatória
simples desta população, a média amostral X̄ tem as seguintes propriedades:
σ2
E(X̄) = µ e V ar(X̄) = .
n
Populações Normais
Se a população de interesse tem distribuição Normal com média µ e variância σ 2, então
σ2
X̄ ∼ N (µ,
).
n
Como conseqüência, temos os seguintes resultados para uma população Normal,
1.
X̄ − µ
√ ∼ N (0, 1),
σ/ n
2. Se e é a variável aletória que mede a diferença entre a estatı́stica X̄ e o parâmetro µ, isto é,
e = X̄ − µ, então, !
σ2
e ∼ N 0, .
n
(e é chamado erro amostral da média).

Na maioria dos aplicações práticas, deseja-se estimar tanto a média quanto a variância de uma
dada população. Desta forma, o seguinte resultado é bastante importante.
Seja X1 , . . . , Xn uma amostra aleatória simples retirada de uma população Normal de média µ
e variância σ 2. Então a estatı́stica
X̄ − µ
t= √
S/ n
tem uma distribuição t de Student com n − 1 graus de liberdade.
A distribuição t está tabelada. Algumas propriedades:
86
1. A distribuição tn (t de Student com n graus de liberdade) é simétrica em torno de 0;
2. E(tn ) = 0 e Var(tn ) = n/(n − 2), se n > 2;
3. tn → N (0, 1) quando n → ∞ (quer dizer, a função de densidade de tn se aproxima da função

de densidade de uma normal padrão, quando n cresce).
Populações não Normais
Suponha agora que a população de interesse não tenha distribuição normal. Neste caso, podemos
utilizar o seguinte teorema,
Teorema 7.1 Teorema Central do Limite Seja X1 , . . . Xn uma amostra aleatória simples ex-
traı́da de uma população com média µ e variância σ 2. Então,
X̄ − µ
√ ' N (0, 1).
σ/ n
Isto quer dizer que a distribuição amostral de X̄ se aproxima da distribuição normal à medida
que n cresce. A velocidade de convergência vai depender da distribuição da população da qual a
amostra foi retirada. Quanto mais próxima da Normal for a população original, mais rápida será
esta convergência. Como regra prática, aceita-se que para amostras aleatórias com mais de 30
elementos a aproximação já pode ser considerada muito boa.
Consequências:
X̄ −
√ µ , então Z tem distribuição aproximadamente Normal Padrão (Z ' N (0, 1)) .
i) Se Z =
σ/ n
ii) O erro amostral da média e = X̄ − µ, tem distribuição aproximadamente Normal com média 0
2 2
e variância σn . (e ' N (0, σn )).
Exemplo: Solução do exercı́cio 7.1:
Solução a):
µ = 1(1/3) + 2(1/3) + 3(1/3) = 2;
3
X 3
X
σ2 = (xi − µ)2 fi = x2i fi − µ2 = 12 (1/3) + 22(1/3) + 32 (1/3) − 22 = 2/3
i=1 i=1
b), c) e d): (Obs.: nas tabelas abaixo, x̄, v 2 e s2 representam os diferentes valores dos
estimadores X̄, σ̂ 2e S 2 , respectivamente.)
87
Tabela 7.2 n=2
Amostra Prob. x̄ v2 s2
1 (1,1) 1/9 1 0,0 0,0
2 (1,2) 1/9 3/2 0,25 0,5
3 (1,3) 1/9 4/2 1,0 2,0
4 (2,1) 1/9 3/2 0,25 0,5
5 (2,2) 1/9 2 0,0 0,0
6 (2,3) 1/9 5/2 0,25 0,5
7 (3,1) 1/9 2 1,0 2,0
8 (3,2) 1/9 5/2 0,25 0,5
9 (3,3) 1/9 3 0,0 0,0
e) e f ) (parte)
Tabela 7.3 Distribuição da Média amostral (X̄)

x̄ 1 3/2 2 5/2 3
P (X̄ = x̄) 1/9 2/9 3/9 2/9 1/9
2 ) de X̄ :
Valor esperado (E(X̄)) e Variância (σX̄
1 32 3 52 1
E(X̄) = 1 + +2 + +3 = 2 (= µ)
9 2 9 9 2 9 9
1 3 2 2 3 5 2 2 1
2 2 2 2 1 2/3 σ2
V ar(X̄) = σX̄ = 1 + +2 + +3 − 22 = = =
9 2 9 9 2 9 9 3 2 n
Tabela 7.4 Distribuição de σ̂ 2 e de S 2 (n = 2)

v2 P (σ̂ 2 = v 2 ) s2 P (S 2 = s2 )
0 3/9 0 3/9
0.25 4/9 0.5 4/9
1.0 2/9 2 2/9
3 4
1 2
E(σ̂ 2) = 0 + 0, 25 = (6= σ 2)
+ 1, 0
9 9 9 3
3 4 2 2
E(S 2) = 0 + 0, 5 + 2, 0 = (= σ 2)
9 9 9 3
88
Tabela 7.5 n = 3
Amostra Prob. x̄ v2 Amostra Prob. x̄ v2
1 (1,1,1) 1/27 1 0 15 (2,2,3) 1/27 7/3 2/9
2 (1,1,2) 1/27 4/3 2/9 16 (2,3,1) 1/27 2 6/9
3 (1,1,3) 1/27 5/3 8/9 17 (2,3,2) 1/27 7/3 2/9
4 (1,2,1) 1/27 4/3 2/9 18 (2,3,3) 1/27 8/3 2/9
5 (1,2,2) 1/27 5/3 2/9 19 (3,1,1) 1/27 5/3 8/9
6 (1,2,3) 1/27 2 6/9 20 (3,1,2) 1/27 2 6/9
7 (1,3,1) 1/27 5/3 8/9 21 (3,1,3) 1/27 7/3 8/9
8 (1,3,2) 1/27 2 6/9 22 (3,2,1) 1/27 2 6/9
9 (1,3,3) 1/27 7/3 8/9 23 (3,2,2) 1/27 7/3 2/9
10 (2,1,1) 1/27 4/3 2/9 24 (3,2,3) 1/27 8/3 2/9
11 (2,1,2) 1/27 5/3 2/9 25 (3,3,1) 1/27 7/3 8/9
12 (2,1,3) 1/27 2 6/9 26 (3,3,2) 1/27 8/3 2/9
13 (2,2,1) 1/27 5/3 2/9 27 (3,3,3) 1/27 3 0
14 (2,2,2) 1/27 2 0
Tabela 7.6 Distribuição de X̄, (n = 3)

x̄ 1 4/3 5/3 2 7/3 8/3 3
P (X̄ = x̄) 1/27 3/27 6/27 7/27 6/27 3/27 1/27
1 4 3 1
E(X̄) = 1 + + ...+3 = 2 (= µ)
27 3 27 27
1 4 2 3 1 2 σ2
2
V ar(X̄) = σX̄ = 12 + + . . . + 32 − 22 = (= )
27 3 27 27 9 n
Tabela 7.7 Distribuição de σ̂ 2 e de S 2 (n = 3)

v 2 P (σˆ2 = v 2) s2 P (s2 = v 2 )
0 3/27 0 3/27
2/9 12/27 3/9 12/27
6/9 6/27 9/9 6/27
8/9 6/27 12/9 6/27
3 2 2 12 6 2 6 8 2 6 4
E(σ̂ 2) = 0 + + + = (6= σ 2 )
27 9 27 9 27 9 27 9
3 3 2 12 12 2 6
2 6 2
E(S 2) = 0 + +1 + = (= σ 2)
27 9 27 27 9 27 3
89
7.3 Exercı́cios
7.1 Considere uma população onde a caracterı́stica a ser observada assume apenas 3 valores: 1,
2 e 3, na mesma proporção, isto é temos a seguinte distribuição:
xi 1 2 3
fi 1/3 1/3 1/3
a) Calcule a média e a variância desta população.

b) Obtenha a lista de todas as amostras distintas de tamanho 2 que podem ser obtidas desta
população.
c) Calcule a probabilidade de que uma amostra aleatória simples de tamanho 2 escolhida desta
população, seja igual a cada uma das amostras da lista obtida no item a).
d) Para cada amostra, calcule a média aritmética (x̄), a a variância amostral (s2 ) e σ̂ 2 .
e) Obtenha a distribuição amostral (exata) de cada uma destas estatı́sticas e calcule a Esperança
e Variância destas distribuições.
f ) Verifique os resultados sobre as propriedades destes estimadores para este exemplo.
g) Repita o exercı́cio para n = 3.
h) Represente graficamente a distribuição da população e distribuição amostral da média aritmética
para n = 2 e n = 3.
7.2 ♦ Suponha que uma população consista dos seguintes valores: 1, 3, 5, 7, 9. Construa a dis-
tribuição amostral de X̄ baseada em amostras de tamanho 2 selecionadas sem reposição. Encontre
a média e a variância da distribuição amostral.
7.3 ♦ Dada uma população normalmente distribuı́da com média 100 e desvio padrão 20, encontre
a seguintes probabilidades baseadas em uma amostra de tamanho 16:
a) P (X̄ ≥ 100) b) P (96 ≤ X̄ ≤ 108) c) P (X̄ ≤ 110).
7.4 ♠ Uma variável aleatória X tem distribuição normal, com média 100 e desvio padrão 10.
a) Qual a P (90 < X < 110)?
b) Se X̄ é a média de uma amostra de 16 elementos retirados dessa população, calcule
P (90 < X̄ < 110).
c) Desenhe, num único gráfico, as distribuições de X e X̄.
d) Que tamanho deveria ter a amostra para que P (90 < X̄ < 110) = 95%?
7.5 ♠ A máquina de empacotar um determinado produto o faz segundo uma distribuição normal,
com média µ e desvio padrão 10g.
a) Em quanto deve ser regulado o peso médio µ para que apenas 10% dos pacotes tenham menos
do que 500g?
b) Com a máquina assim regulada, qual a probabilidade de que o peso total de 4 pacotes escolhidos
ao acaso seja inferior a 2kg?
90
7.6 ♠ No exercı́cio anterior, e após a máquina estar regulada, programou-se uma carta de controle
de qualidade. De hora em hora, será retirada uma amostra de 4 pacotes, e estes serão pesados. Se
a média da amostra for inferior a 495 g ou superior a 520 g, pára-se a produção para reajustar a
máquina, isto é, reajustar o peso médio.
a) Qual a probabilidade de ser feita uma parada desnecessária?
b) Se o peso médio da máquina desregulou-se para 500 g, qual a probabilidade de continuar-se a
produção fora dos padrões desejados?
7.7 ♠ A capacidade máxima de um elevador é de 500 kg. Se a distribuição X dos pesos dos
usuários é suposta N (70, 100):
a) Qual a probabilidade de 7 passageiros ultrapassarem esse limite?
b) E seis passageiros?
7.8 ♠ Uma variável X tem distribuição normal, com média 10 e desvio padrão 4. Aos participantes
de um jogo, é permitido observar uma amostra de qualquer tamanho e calcular a média amostral.
Ganha um prêmio aquele cuja média amostral for maior que 12.
a) Se um participante escolher uma amostra de tamanho 16, qual a probabilidade de ele ganhar
um prêmio?
b) Escolha um tamanho de amostra diferente de 16 para participar do jogo. Qual a probabilidade
de você ganhar um prêmio?
c) Baseado nos resultados acima, qua o melhor tamanho de amostra para participar do jogo?
7.9 ∇ A análise de ocorrência de um mineral numa região é uma variável aleatória com média 4
e variância 3/2. A unidade de medida é a porcentagem de mineral por unidade de volume. Para
uma amostra de tamanho 20:
a) Que dizer da distribuição de X̄?
b) Que tamanho deveria ter a amostra para que P (3, 5 < X̄ ≤ 4, 5) = 0, 95?
7.10 ♠ Se uma amostra com 36 observações é tomada de uma população, qual deve ser o tamanho
de uma outra amostra para que o erro padrão desta amostra seja 2/3 do erro padrão da média da
primeira amostra?
7.11 ♠ Definimos a variável e = X̄ − µ, como sendo o erro amostral da média. Suponha que a
variância dos salários de uma certa região seja 400 unidades ao quadrado.
a) Determine E(e) e V ar(e).
b) Que proporção das amostras de tamanho 25 terão erro amostral absoluto maior do que 2
unidades?
c) E que proproção das amostras de tamanho 100?
d) Neste último caso, qual o valor de d, tal que P (|e| > d) = 1%?
e) Qual deve ser o tamanho da amostra para que 95% dos erros amostrais absolutos sejam inferiores
a uma unidade?
91
7.12 ♠ A distribuição dos comprimentos dos elos de uma corrente de bicicleta é normal, com
média 2cm e variância igual a 0,01 cm2 . Para que uma corrente se ajuste à bicicleta, deve ter
comprimento total entre 58 e 61 cm.
a) Qual a probabilidade de uma corrente com 30 elos não se ajustar à bicicleta?
b) E uma corrente com 29 elos?
7.13 ♠ Cada seção usada para construção de um oleoduto tem um comprimento médio de 5 m e
desvio padrão de 20 cm. O comprimento total do oleoduto será de 8 km.
a) Se a firma construtora do oleoduto encomendar 1.600 seções, qual a probabilidade de terem que
comprar mais do que uma seção adicional ( isto é, das 1.600 seções somarem 7.995 m ou menos)?
b) Qual a probabilidade do uso exato de 1599 seções, isto é, a soma das 1599 seções estar entre
8.000 e 8.005 m?
7.14 ♠ Uma empresa fabrica cilindros com 50 mm de diâmetro. O desvio padrão dos diâmetros
dos cilindros é 2,5 mm. Os diâmetros de uma amostra de 4 cilindros são medidos a cada hora. A
média da amostra é usada para decidir se o processo de fabricação está operando satisfatoriamente.
Aplica-se a seguinte regra de decisão: se o diâmetro médio da amostra de 4 cilindros é igual a 53.7
mm ou mais, ou igual a 46,3 mm ou menos, deve-se parar o processo. Se o diâmetro médio estiver
entre 46,3 e 53,7 mm, o processo deve continuar.
a) Qual a probabilidade de se parar o processo se a média µ continuar com 50 mm?
b) Qual a probabilidade do processo continuar se a média se deslocar para µ = 53, 7?
7.15 ♦ Suponha que em uma certa população de pessoas dependentes de uma certa droga, a
duração média desta dependência seja de 5 anos e o desvio padrão de 3 anos. Qual é a probabili-
dade de que uma amostra aleatória de 36 indivı́duos desta população forneça uma duração média
de dependência entre 4 e 6 anos?
7.16 ♦ Suponha que o tempo de resposta de indivı́duos sadios a um certo estı́mulo seja uma
variável aleatória com distribuição normal com média 15 segundos e uma variância de 16. Qual é
a probabilidade de que uma amostra aleatória de 16 indivı́duos forneça uma média de tempo de
resposta de 12 segundos ou mais?
7.17 ♦ Se as taxas de ácido úrico em homens adultos sadios tem distribuição aproximadamente
normal com média 5.7 mg e desvio padrão 1 mg (%), encontre a probabilidade de que uma amostra
de tamanho 9 forneça uma média :
a) Maior que 6. b) Entre 5 e 6. c) Menor que 5.2
7.18 Denotando por tn a distribuição t com n graus de liberdade, encontre x tal que
a) P (t1 > x) = 0.05 b) P (t5 ≤ x) = 0.95 c) P (t20 ≤ x) = 0.90
d) P (t20 > x) = 0.15 e) P (|t15 | > x) = 0.10)
92
8 Intervalos de Confiança
Quando usamos uma estatı́stica T como estimador para um parâmetro θ, estamos usando um
estimador pontual para este parâmetro, o que não nos permite julgar qual a possı́vel magnitude do
erro que estamos cometendo. Para contornar este problema, em geral fazemos uso dos Intervalos
de confiança, baseados na distribuição amostral do estimador pontual do parâmetro em questão.
8.1 Intervalos de confiança para a média populacional

A construção de intervalos de confiança para µ é feita a partir da distribuição amostral de X̄, o
estimador pontual mais comum para a média populacional.
8.1.1 σ 2 conhecido
Para construir intervalos de confiança para µ, devemos ter um modelo para a distribuição da
população de interesse (ou para a distribuição da caracterı́stica de interesse). Vamos considerar
duas situações:
1. populações normais e
2. populações não normais.
Quando a distribuição da população é normal, temos como obter a distribuição amostral da

média amostral (ver Seção 7) e para outras distribuições vamos utilizar distribuições amostrais
aproximadas.
População Normal
Considere uma população Normal com média µ desconhecida e variância σ 2 conhecida. Dada
uma amostra aleatória simples X1, . . . , Xn, calculamos a estimativa pontual X̄ para µ, o que nos
leva a cometer um erro X̄ − µ, de magnitude desconhecida. Como
X̄ − µ
√ ∼ N (0, 1) temos X̄ − µ ∼ N (0, σ 2/n),
σ/ n
o que nos permite determinar a probabilidade de cometer erros de determinada magnitude (nı́vel
de confiança). Por exemplo:
σ
P (|X̄ − µ| < 1, 96 √ ) = 0, 95, ou
n
σ σ
P (−1, 96 √ < X̄ − µ < 1, 96 √ ) = 0, 95, ou
n n
σ σ
P (X̄ − 1, 96 √ < µ < X̄ + 1, 96 √ ) = 0, 95. (2)
n n
Como µ não é uma variável aleatória( X̄ é), devemos interpretar a expressão em (2) como segue.
93
Se construirmos intervalos da forma (x̄−1, 96 √σn , x̄+1, 96 √σn ) para todas as amostras possı́veis
de tamanho n, 95% deles conterão a média populacional. Este exemplo pode ser generalizado. O
intervalo
σ σ
X̄ − zα/2 √ , X̄ + zα/2 √
n n
é um intervalo de (1 − α)100% de confiança para a média populacional µ,com base em uma amostra
aleatória simples de tamanho n da distribuição. Dizemos que 1 − α é o Nı́vel de Confiança do
intervalo, em que zα/2 é tal que P (|Z| < zα/2 ) = 1 − α com Z ∼ N (0, 1).
Fixado o nı́vel de confiança 1 − α, procuramos o valor zα/2 que corresponda ao valor tabelado
(0, 5 − α/2 ) na curva Normal Padrão. Veja figura abaixo:
Figura 15:
Populações não normais

Na maioria dos casos onde a distribuição não é Normal, não é possı́vel determinar intervalos com
confiança exata. No entanto, o Teorema Central do Limite nos dá uma garantia de que intervalos
construı́dos a partir da distribuição Normal, terão confiança aproximada 1−α. A Tabela 8.1 mostra
as expressões para os intervalos neste caso.
8.1.2 σ 2 desconhecido
Na maioria das aplicações práticas não conhecemos a variância σ 2 da distribuição de interesse e neste
caso, precisamos estimar esta variância. Os resultados sobre a distribuição amostral de X̄ e inter-
valos de confiança para a média continuam válidos se substituirmos σ 2 por um “bom” estimador σ̂ 2.
População Normal
O intervalo de confiança para a média neste caso se baseia no fato de que a estatı́stica

S
t = (X̄ − µ)/ √
n
tem distribuição t de Student com (n − 1) graus de liberdade. Esta distribuição tem uma forma
semelhante à da N(0,1), é simétrica em torno de zero e também está tabelada. S é o estimador
usual, não viciado de σ 2 ( ver Seção 8).
Várias tabelas da distribuição t de Student não fornecem valores crı́ticos para n > 30. Mas neste
caso, podemos usar o fato de que a distribuição de t = (X̄ − µ)/( √Sn ) se aproxima da distribuição
94
N (0, 1) a medida que o tamanho da amostra cresce. Então, um intervalo de confiança para µ, de
confiança aproximada 1 − α, é o mesmo obtido com variância conhecida, apenas substituindo σ 2
por s2 (veja Tabela 8.1).
Outras Distribuições
Quando a distribuição da população não é normal e a variância não é conhecida, podemos
ainda assim construir intervalos de confiança aproximada utilizando a distribuição normal, desde
que tenhamos um “bom” estimador de σ 2. Estimadores consistentes, isto é, que se aproximam de
σ 2 quando o tamanho da amostra cresce, são bons estimadores. A escolha do melhor estimador vai
depender da distribuição da população.
Podemos ilustrar esta situação, construindo um intervalo de confiança para a proporção popu-
lacional.
Exemplo 8.1 Suponha que p seja a proporção com que uma certa caracterı́stica aparece em uma
dada população. Podemos então modelar esta população segundo uma distribuição de Bernoulli com
parâmetro p. Cada elemento da população poderá assumir apenas os valores 1 (se a caracterı́stica
estiver presente) ou 0 (caso contrário). A média populacional será p e a variância populacional
p(1 − p). Ao considerarmos uma amostra aleatória simples de tamanho n desta população, teremos

1 se a caracterı́stica estiver presente no i-ésimo elemento da amostra
Xi =
0 caso contrário.
P
Logo, ni=1 Xi será o número de elementos na amostra que tem a caracterı́stica e X̄ será a
proporção amostral, que denotaremos p̂. O estimador p̂(1 − p̂) é um “bom” estimador de σ 2 .
Temos então que
p̂ − p
q ' N (0, 1),
p̂(1−p̂)
n
isto é, a distribuição amostral de p̂ se aproxima da curva normal quando n cresce. O intervalo de
confiança para p está na Tabela 8.1.
Amostra Piloto A amplitude ou comprimento de um intervalo de confiança, que denotaremos

por d, pode ser fixada a priori. Ela é, na verdade, a precisão da estimativa obtida e pode ser usada
para determinar o tamanho da amostra necessário para se obter a precisão desejada. Para isso, no
entanto, é preciso que se conheça a variância da população ou que se tenha uma estimativa desta
variância. Quando a variância é desconhecida, pode-se utilizar uma amostra piloto de tamanho
pequeno para se obter uma estimativa da variância e a partir desta estimativa, determina-se o
tamanho da amostra. No caso de proporções, o tamanho da amostra seria obtido a partir de
s
d p̂(1 − p̂)
= zα/2 × ,
2 n
o que nos daria
2 p̂(1 − p̂)
zα/2
n= .
d2 /4
Neste caso pode-se utilizar o fato de que p(1 − p) ≤ 1/4 (vale a igualdade quando p = 1/2).
2 /d2 ,
Substuindo p̂(1 − p̂) por 1/4 na expressão para n, obtemos uma amostra de tamanho n = zα/2
que corresponde a uma confiança maior ou igual à desejada.
95
Tabela 8.1 Intervalo de Confiança para a média populacional, µ
Distribuição Intervalo (1- α) Amplitute

População
Normal
1 2
σ conhecido (x̄ − zα/2 √σn , x̄ + zα/2 √σn ) 2zα/2 √σn
2 σ 2 desconhecido (x̄ − zα/2 √sn , x̄ + zα/2 √sn ) 2zα/2 √sn
n ≥ 30
3 σ2 desconhecido (x̄ − tα/2 √sn , x̄ + tα/2 √sn ) 2tα/2 √sn
n < 30
Outras distribuições
4 σ 2 conhecido (x̄ − zα/2 √σn , x̄ + zα/2 √σn ) 2zα/2 √σn
n ≥ 30
5 σ 2 desconhecido (x̄ − zα/2 √σ̂n , x̄ + zα/2 √σ̂n ) 2zα/2 √σ̂n
n ≥ 30
q q q
p̂(1−p̂) p̂(1−p̂) p̂(1−p̂)
6 Proporção p̂ − zα/2 n , p̂ + zα/2 n 2zα/2 n
σ̂ 2 é um bom estimador da variância σ 2

zα/2 é o valor na distribuição N (0, 1) que deixa uma área α/2 à sua direita.
tα/2 é o valor na distribuição t de Student com n − 1 graus de liberdade, que deixa uma área
α/2 à sua direita.
Exemplo 8.2 Vamos considerar novamente o Exercı́cio 7.1.
A tabela 2 fornece os limites inferiores (li) e superiores (ls) dos possı́veis intervalos de 95% de
confiança, construı́dos usando o caso 4 da Tabela 8.1 (variância conhecida, distribuição não Normal)
para n = 3, no exemplo em que a população assume os valores 1, 2 e 3 na mesma proporção (Veja
Tabelas 1 e 2, da aula Distribuições Amostrais). Temos µ = 2 e σ 2 = 2/3. Observe que na
verdade, (25/27)100%, ou 92, 59% e não 95% dos intervalos contém a verdadeira média, mas isto
se deve a dois fatos:
1. usamos uma distribuição amostral aproximada, a Normal, para construir o intervalo. Esta
aproximação é boa para amostras grandes (pelo menos 30, veja a Tabela 8.1) mas foi utilizada
para n = 3;
2. No exemplo, X̄ é uma variável aleatória discreta. Neste caso, nem sempre é possı́vel obter
intervalos com nı́vel de confiança exato, fixado antes.
Neste exemplo, os intervalos obtidos tem nı́vel de confiança 92, 59%, que corresponde à proporção
25/27 de intervalos que contêm a média populacional, µ = 2.
96
Tabela 8.2 Distribuição de X̄ e Intervalos de confiança para µ, Exercı́cio 7.1.
x̄ 1 4/3 5/3 2 7/3 8/3 3
P (X̄ = x̄) 1/27 3/27 6/27 7/27 6/27 3/27 1/27
li(0,95) 0,08 0,41 0,74 1,08 1,41 1,74 2,08
ls(0,95) 1,92 2,25 2,59 2,92 3,26 3,59 3,92
Exemplo 8.3 Solução do Exercı́cio 8.3
Temos o caso 5 do Quadro 1: distribuição desconhecida, n > 30 e variância desconhecida.

Admitindo que o desvio padrão da amostra seja um bom estimador do desvio padrão verdadeiro,
σ, temos:
a) A confiança desejada é 99% ou o nı́vel de confiança é 1 − α = 0, 99. Logo, α = 1 − 0, 99 = 0, 01
ou α/2 = 0, 005. Devemos então procurar na tabela da N(0,1) o valor de zα/2 que deixa uma área
de 0,005 à sua direita (um número tal que seu valor tabelado seja 0,495 ou o mais próximo disto).
Obtemos z0,005 = 2, 58, e o intervalo de 99% de confiança é
σ̂ 100
x̄ ± zα/2 × √ = 800 ± 2, 58 √ = 800 ± 12, 9 = (787, 1; 812, 9)
n 400
b) Queremos obter a confiança do intervalo (800 ± 0, 98). Neste caso, a amplitude do intervalo é
2 × 0, 98 ou, equivalentemente,
100 0, 98
0, 98 = zα/2 √ = zα/2 × 5 ⇒ zα/2 = = 0, 196 ' 0, 20.
n 5
O valor tabelado de zα/2 é VT(0,20)=0,0793 o que nos dá
0, 5 − α/2 = 0, 0793 ⇒ 1 − α ' 0, 158 ' 0, 16 ou 16%
Logo, o intervalo acima tem apenas 16% de confiança.

c) Queremos determinar o tamanho de amostra necessário para que tenhamos 95% de confiança no
intervalo 800 ± 7, 84.
O valor de zα/2 que corresponde à confiança 95% é z0,0025 = 1, 96. Temos então
100
7, 84 = 1, 96 × √ .
n
Resolvendo para n, temos

√ 1, 96 × 100
n= = 25 o que nos dá n = 625.
7, 84
æ
97
8.2 Exercı́cios
8.1 ♠ Calcule o intervalo de confiança para a média populacional em cada um dos casos abaixo.
Média Amostral Tamanho da amostra Desvio Padrão Coeficiente de

da População Confiança
170 cm 100 15 cm 95%
165 cm 184 30 cm 85%
180 cm 225 30 cm 70%
8.2 Calcule o intervalo de confiança para a média populacional em cada um dos casos abaixo.
Média Amostral Tamanho da amostra Desvio Padrão Coeficiente de

da Amostra Confiança
170 cm 16 15 cm 95%
165 cm 25 30 cm 85%
180 cm 36 30 cm 70%
8.3 ♠ De 50.000 válvulas fabricadas por uma companhia, retira-se uma amostra de 400 válvulas
e obtém-se a vida média de 800 horas e desvio padrão de 100 horas.
a) Qual o intervalo de confiança de 99% para a vida média da população?
b) Com que confiança dir-se-ia que a vida média é 800 ±0,98?
c) Que tamanho deve ter a amostra para que seja de 95% a confiança na estimativa 800 ± 7,84?
(Que suposições você fez para responder às questões acima?)
8.4 Em uma amostra aleatória de 25 crianças de uma determinada comunidade, encontrou-se

altura média 150 cm e desvio padrão 5 cm. Admitindo que a distribuição das alturas das crianças
é Normal, determine um intervalo de 95% de confiança para a altura média da população.
8.5 ♠ Uma amostra aleatória de 625 donas-de-casa revela que 70% delas preferem a marca X de
detergente. Construir um intervalo de confiança para p= proporção das donas-de-casa que preferem
X, com coeficiente de confiança γ = 90%.
8.6 ♠ Da experiência passada, sabe-se que o desvio padrão da altura de crianças de 5a série do
1o grau é 5 cm.
a) Colhendo uma amostra de 36 dessas crianças, observou-se a média de 150 cm. Qual o intervalo
de confiança de 95% para a média populacional?
b) Que tamanho deve ter a amostra para que o intervalo 150± 0,98 tenha 95% de confiança?
c) Refaça os itens
√ a) e b) supondo que o desvio padrão de 5 cm seja uma estimativa obtida através
da amostra ( S 2 ).
98
8.7 ∇ O intervalo [35, 21; 35, 99] é o intervalo com confiança 95%, construı́do a partir de uma
amostra de tamanho 100, para a média µ de uma população Normal com desvio padrão igual a 2.
a) Qual o valor encontrado para a média desta amostra?
b) Se utilizássemos esta mesma amostra, mas uma confiança de 90%, qual seria o novo intervalo de
confiança?
8.8 Num certo grupo de pacientes, o nı́vel de colesterol no sangue é uma variável aleatória com
distribuição Normal, de média desconhecida e variância 64 (mg/ml)2.
a) Para uma amostra de 49 indivı́duos que forneceu nı́vel médio de colesterol de 120 mg/ml, construa
o intervalo de confiança de 88% para µ.
b) Se você desejasse diminuir a amplitude do intervalo encontrado em a), quais seriam suas alter-
nativas?
8.9 Um pesquisador deseja estimar a proporção de ratos nos quais se desenvolve um certo tipo de
tumor quando são submetidos a radiação. Ele deseja que sua estimativa não se desvie da proporção
verdadeira por mais de 0,02 com uma probabilidade de pelo menos 90%.
a) Quantos animais ele precisa examinar para satisfazer essas exigências?
b) Como seria possı́vel diminuir o tamanho da amostra utilizando a informação adicional de que
em geral esse tipo de radiação não afeta mais que 20% dos ratos?
8.10 Um pesquisador está estudando a resistência de um determinado material sob determinadas

condições. Ele sabe que essa variável é normalmente distribuı́da com desvio padrão de 2 unidades.
a) Utilizando os valores 4,9; 7,0; 8,1; 5,4; 5,6; 6,8; 7,2; 5,7; 6.2, unidades, obtidos de uma amostra
de tamanho 9, determine o intervalo de confiança para a resistência média com um coeficiente de
confiança γ = 0, 90.
b) Qual o tamanho da amostra necessário para que o erro cometido, ao estimarmos a resistência
média, não seja superior a 0,001 unidades com probabilidade 0,90?
c) Refaça o item a), supondo que o desvio padrão não fosse conhecido.
8.11 Encontre o coeficiente de confiança de um intervalo de confiança para p̂, se n = 100, p̂ = 0, 60

e a amplitude do intervalo deve ser igual a 0,090.
8.12 Suponha que uma amostra de tamanho n = 100 de uma distribuição normal N (µ, σ 2)
forneceu X̄ = 510, 6. Supondo σ 2 conhecido e igual a 16, obtenha um intervalo de confiança
para µ com coeficiente de confiança 90%.
8.13 A dosagem de certa substância no sangue segue uma distribuição Normal com média µ e
desvio padrão 15 mg/l. Se uma amostra de tamanho 25 for coletada, determine:
a) A probabilidade de |X̄ − µ| ser inferior a 5.
b) O intervalo para µ com confiança 98%, se temos x̄ = 98 mg/l.
99
8.14 Qual dever ser o tamanho de uma amostra cujo desvio padrão é igual a 10 para que a
diferença da média amostral para a média da população, em valor absoluto, seja menor que 1, com
coeficiente de confiança igual a:
a) 95% b) 99%
8.15 Uma população tem desvio padrão igual a 10.

a) Que tamanho deve ter uma amostra para que, com probabilidade 8% o erro em estimar a média
seja superior a 1 unidade?
b) Supondo-se escolhida a amostra no caso anterior, qual o intervalo de confiança, se x̄ = 50?
8.16 ♦ Alguns estudos sobre o Mal de Alzheimer mostraram um aumento na produção de 14CO2
em pacientes com esta doença. Em um destes estudos os seguintes valores de 14CO2 foram obtidas
de 16 biopsias corticais:
1009 1280 1180 1255 1547 2352 1956 1080

1776 1767 1680 2050 1452 2857 3100 1621
a) Assuma que a população destes valores seja normalmente distribuı́da com um desvio padrão de
350 e construa um intervalo de confiança de 95% para a média populacional.
b) Repita o item a) supondo que a variância populacional seja desconhecida.
P
(Dados: i x2i = 54.351.114)
8.17 • A velocidade da luz foi medida 2.500 vezes em um experimento. Foi encontrada uma média
de 299.774 km por segundo, com um desvio padrão de 14 km por segundo. Assuma a distribuição
Normal para estas medidas. Encontre um intervalo com aproximadamente 95% de confiança para
a velocidade da luz.
8.18 • Falso ou verdadeiro: Se a distribuição da população não for Normal, não podemos usar
esta curva para obter intervalos de confiança. Justifique sua resposta.
8.19 • Um procedimento de pesagem produz erros de medida que seguem o seguinte histograma:
A média dos desvios é 0 e o desvio padrão é 6 microgramas. Um objeto foi pesado 4 vezes e
deseja-se construir um intervalo de confiança para o peso do objeto. Pode-se usar a curva Normal?
E a distribuição de Student? Justifique suas respostas. E se fossem feitas 100 medidas?
100
8.20 ♠ Antes de uma eleição, um determinado partido está interessado em estimar a proporção
p de eleitores favoráveis ao seu candidato. Uma amostra piloto de tamanho 100 revelou que 60%
dos eleitores eram favoráveis ao candidato em questão.
a) Determine o tamanho da amostra necessário para que o erro cometido na estimação seja de, no
máximo, 0,01 com probabilidade de 80%.
b) Se na amostra final, com tamanho igual ao obtido em a), observou-se que 55% dos eleitores
eram favoráveis ao candidato em questão, construa um intervalo de confiança para a proporção p.
(Utilize γ = 0, 95)
8.21 ♠ Suponha que estejamos interessados em estimar a porcentagem de consumidores de um

certo produto. Se uma amostra de tamanho 300 forneceu 100 indivı́duos que consomem o dado
produto, determine:
a) O intervalo de confiança de p, com coeficiente de confiança de 95% (interprete o resultado).
b) O tamanho da amostra necessário para que o erro da estimativa não exceda a 0,02 unidades com
probabilidade de 95% (interprete o resultado).
8.22 ♠ Antes de uma eleição em que existiam 2 candidatos A e B, foi feita uma pesquisa com
400 eleitores escolhidos ao acaso e verificou-se que 208 deles pretendiam votar no candidato A.
Construa um intervalo de confiança com coeficiente γ = 0, 95% para a porcentagem de eleitores
favoráveis ao candidato A na época das eleições.
8.23 ♦ Uma pesquisa, com uma amostra de 150 domicı́lios em uma comunidade urbana, revelou
que em 87% dos casos, pelo menos um membro do domicı́lio tinha algum tipo de suguro de saúde.
Construa intervalos de 90, 95 e 99% de confiança para p, a verdadeira proporção de domicı́lios na
comunidade com a caracterı́stica de interesse.
8.24 ♦ Em um estudo desenvolvido para verificar a relação entre uma certa droga e uma certa
anomalia em embriões de galinha, injetou-se a droga em 50 ovos fertilizados no quarto dia de
incubação. No vigésimo dia de incubação, os embriões foram examinados e em 12 dele foi constatada
a anomalia. Encontre intervalos de 90, 95 e 99% de confiança para p.
8.25 Considere um experimento em que dois grupos de ratos (fêmeas) foram alimentados com
dietas apresentando alto e baixo conteúdo de proteı́na. A tabela abaixo dá o ganho de peso em
gramas para cada rato entre o 28o e o 84o de vida.
Alto conteúdo 123 134 146 104 119 124 161 107 83 113 129 97
Baixo conteúdo 70 118 101 85 107 132 94
Suponha que o ganho de peso possa ser modelado segundo uma distribuição normal com a
mesma variância σ 2 para ambas as dietas.
a) Crie um critério para decidir se estas dietas são equivalentes, com base no intervalo de confiança
para a diferença entre as médias.
b) Construa intervalos de confiança de nı́vel 90%, 95% e 99% para a diferença entre as médias de
ganho de peso. Utilize o critério em a) para decidir sobre a equivalência das duas dietas, para cada
um destes intervalos. Comente.
101
8.26 Dadas duas amostras extraı́das de populações normais de mesma variância, com
n1 = 10 x̄1 = 73 s1 = 5, 9
n2 = 13 x̄2 = 57 s2 = 5, 0,
Construa um intervalo de confiança para a diferença entre as médias.
8.27 Para comparar as possibilidades de produção de dois tipos de batata, plantaram-se sementes
de cada tipo em lotes distintos. As safras, em unidades adequadas, foram:
A 35 28 30 41 44 32 34 33 38 36 35
B 42 30 28 36 42 34 52 40 41 35 41
Suponha que a distribuição normal seja adequada para modelar estas produções.
a) Construa intervalos de confiança de nı́vel 90%, 95% e 99% para a diferença entre as médias de
2 2
produção, supondo que as variâncias populacionais sejam σA = 16 e σB = 36.
b) Repita o item a), supondo que as variâncias sejam desconhecidas porém iguais.
c) Comente sobre a equivalência entre as duas variedades.
102
A Notação de Somatório
A.1 Definições
Índices
O sı́mbolo xi (lê-se x ı́ndice i) representa qualquer um dos valores x1 , x2, . . ., xn . A letra i neste
caso é chamada ı́ndice.
Somatório
O sı́mbolo
n
X
xi (3)
i=1
é utilizado para representar a soma dos valores x com ı́ndices indo de 1 até n, isto é
n
X
xi = x 1 + x 2 + · · · + x n .
i=1
Dizemos soma de xi para i variando de 1 a n ou somatório

X
de xi , i variando de 1 a n. O sı́mbolo
P P
em (3) pode ser abreviado para xi , ou i xi ou xi , quando não houver dúvida sobre quais
i
ı́ndices estão envolvidos na soma.
A notação de somatório pode ser utilizada para representar somas parciais dos valores xi , 1 =
1, . . . , n. Por exemplo,
5
X
xi = x 2 + x 3 + x 4 + x 5 .
i=2
Várias expressões podem ser simplificadas utilizando-se a notação de somatório. Por exemplo,
k
X
X 1 Y1 + X 2 Y2 + · · · + X k Yk = X i Yi
i=1
k
X
2X2Y23 + 3X3Y33 + · · · + kXk Y k3 = iXi Yi3
i=2
7
X
1 + X32 + X54 + X76 + · · · + X15
14
= 2i
X2i+1 (X10 = 1)
i=0
No terceiro caso, repare que podemos representar os números ı́mpares como 2i + 1,

i = 0, 1, 2, 3, . . . e os pares como 2i, i = 0, 1, 2, 3, . . ..
Propriedades
Como o somatório é apenas uma notação para uma soma, ele satisfaz as seguintes propriedades:
n
X Pn
• 1) c = nc, onde c é uma constante. ( i=1 c = c + c + · · · + c, n vezes).
i=1
103
n
X Pn
• 2) axi = ax1 + · · · + axn = a(x1 + · · · xn ) = a i=1 xi .
i=1
n
X Pn
• 3) (axi + b) = a i=1 xi + nb.
i=1
n
X Pn Pn
• 4) (xi + yi ) = i=1 xi + i=1 yi .
i=1
Como consequência, temos que

n
X n
X n
X
(axi + b)2 = a x2i + 2ab xi + nb2.
i=1 i=1 i=1
A.2 Somatório duplo

Algumas vezes podemos usar dois ou mais ı́ndices para indentificar uma quantidade. Por exemplo,
imagine que a variável x seja a produção obtida em um experimento, no qual considerou-se 3
variedades de cana de açúcar, sob 4 nı́veis diferentes de adubação. Neste caso, é mais conveniente
utilizar dois ı́ndices para representar a produção em cada caso. Podemos utilizar, por exemplo,
o ı́ndice i representando a variedade de cana de açúcar e o ı́ndice j representando o nı́vel do adubo.
Desta forma, xij representa a produção da variedade i sob o nı́vel j de adubação. Podemos escrever
então
xij , i = 1, 2, 3, j = 1, 2, 3, 4.
Um somatório duplo inclui os dois ı́ndices,
n1 X
X n2 n1
X
xij = (xi1 + xi2 + · · · xin2 )
i=1 j=1 i=1
Xn1 n1
X n1
X
= xi1 + xi2 + · · · + xin2
i=1 i=1 i=1
= (x11 + · · · + xn1 1) + (x12 + · · · + xn1 2 ) + · · · + (x1n2 + · · · + xn1 n2 )
–♣–
A.3 Exercı́cios
P
A.1 Denote ni=1 xi /n por x̄. Para x1 = 6, x2 = 3, x3 = 1, x4 = 5, x5 = 2 e k = 5 , calcule as
seguintes quantidades:
104
Pk Pk
(a) i=1 xi (g) i=1 x2i
Pk P5
(b) i=1 3(xi ) (h) (1/5) i=1 xi
P5 P5
(c) i=1 (xi − x̄) (i) i=1 (xi − x̄)3
Pk P5
(d) i=1 (xi − 1)(xi + 1) (j) j=1 xj (xj − 1)
P5 2 P4
(e) i=2 (3xi + 2xi ) (k) i=1 xi (xi+1 + 2)2
X5 5 2
2 1 X
xi − xi
i=1
5 i=1
(f ) 4
A.2 Seja {x1 , x2 ,...,xk} um conjunto de valores. Expresse o seguinte usando o sinal de somatório
P
:
(a) Soma de todos os números.

(b) Soma dos primeiros (k − 1) números.
(c) Soma dos quadrados dos números.
(d) Soma dos quadrados dos desvios em relação a 10.
(e) Média aritmética dos números.
(f ) Soma dos quadrados dos desvios em relação à média, dividida por k − 1
P
A.3 Use o sinal de somatório, , para escrever as somas abaixo em forma compacta:
(a) Z1 + Z2 + . . . + Z6 (k) X2 + X4 + X6 + . . . + X40
(b) Y12 + Y22 + .... + Ym2 (l) X2 Y3 + X4 Y6 + X6 Y9 + . . . X40Y60
a2 a3 ak
(c) X1Y1 + X2Y2 + ... + Xk Yk (m) 1 + a + 2! + 3! +...+ k!
(d) X1f1 + X2f2 + ... + Xn fn (n) 2 + 6 + 10 + 14 + 18 + 22
(e) X12Y1 + X22Y2 + ... + Xk2Yk (o) 1 + X32 + X54 + X76 + . . . X15
14
(f ) 2X2Y23 + 3X3Y33 + ... + kXk Yk3 (p) X0Y1 + X12Y2 + X23Y3 + . . . + Xn−1
n
Yn
2 n
(g) a0 + a1 X1 + a2 X2 + ... + an Xn
(h) 1 + 4 + 9 + 16 + 25 + 36
e−λ λ2 e−λ λ3 e−λ λ20

(i) e−λ + e−λ λ + 2! + 3! + ...+ 20!
n 2 n−2 n n−2 2
(j) q n + npq n−1 + 2 p q +...+ n−2 p q + npn−1 q + pn
m m!
(OBS.: k = k!(m−k)! , m! = m(m − 1)(m − 2) . . . 2.1, 0! = 1 )
105
A.4 Usando álgebra elementar, mostre os seguintes resultados e dê exemplos numéricos.
1 P
Se x̄ = k xi , então
k
X
(a) (xi − x̄) = 0.
i=1
k
X k
X k 2
2 1 X
(b) (xi − x̄) = x2i − xi
i=1 i=1
k i=1
Pc Pc
Se x̄ = (1/k) i=1 xi fi ek= i=1 fi , então
c
X
(c) (xi − x̄)fi = 0
i=1
c
X c
X c
X
(d ) (xi + 1)2fi = x2i fi + 2 xi fi + k
i=1 i=1 i=1
c
X c
X c 2
2 1 X
(e) (xi − x̄) fi = x2i fi − xi fi
i=1 i=1
k i=1
A.5 Considere um experimento realizado com camundongos em um labirinto. Quatro camundon-

gos em cada uma de cinco ninhadas foram tratados com três concentrações de um alucinógino e um
placebo. Estes quatro nı́veis da droga foram aleatoriamente distribuı́dos entre os animais de cada
ninhada. A variável de interesse foi o tempo necessário para completar uma volta no labirinto, e
estes valores são fornecidos em segundos.
Ninhada
Nı́vel da droga 1 2 3 4 5 Total
placebo 4 6 5 5 4 24
Conc. 1 7 6 8 6 7 34
Conc. 2 9 9 10 9 8 45
Conc. 3 15 21 20 19 16 91
Expresse usando o sı́mbolo de somatório e calcule seu valor:

(a) O tempo total gasto pelos camundongos que tomaram placebo.
(b) O tempo total gasto pelos camundongos da 3a ninhada.
(c) O tempo total gasto no experimento.
(d) O tempo total gasto pelos camundongos que não tomaram placebo.
(e) O tempo total gasto pelas ninhadas de ordem ı́mpar que não tomaram placebo.
A.6 Desenvolva os seguintes somatórios:

Pn P4 j j+1 Pk
(a) i=1 (bi − Xi ) (b) j=1 2j xj yj (c) i=1 (−1)
i
xi yi+1
Pi P5
(d) k=1 Xki (e) n=0 (−1)
n+1
n
106
A.7 Considere os dois conjuntos de dados abaixo:
i 1 2 3 4 5 6 7 8 9 10
xi 6 10 12 14 16 18 22 24 26 32
yi 40 42 46 51 57 60 70 75 80 82
a) Calcule:
Pn Pn P P P
i=1 xi i=1 yi n xi yi − xi yi
x̄ = , ȳ = , a = ȳ − bx̄, b= P 2 P 2
n n n xi − ( xi )
b) Obtenha dois outros conjuntos de dados, usando as seguintes transformações: zi = xi − x̄ e
ti = yi − ȳ e calcule:
P P P P P
z i ti (xi − x̄)2 (yi − ȳ)2 (zi − z̄)2 (ti − t̄)2
b∗ = P 2 , s2x = , s2y = , s2z = , s2t = .
zi n−1 n−1 n−1 n−1
A.8 Considere os seguintes conjuntos de valores:
i xi yi
1 4 -8
2 3 2
3 0 2
4 1 3
P4 3
X
i=1 xi yi
− x̄ȳ
Obtenha : a) b) (x2i − ixi),
DP (X).DP (Y ) i=1
em que sP
n
n
i=1 (xi − x̄)2 1X
DP (X) = , e x̄ = xi .
n n i=1
107
B Respostas de alguns exercı́cios selecionados
1.4 a) Conjunto 1
1 6
1 7 7
1 8 8 8 8 8 8 8 8 8 8 8 8 8 8
1 9 9 9 9 9 9 9 9 9 9 9 9
2 0 0 0 0 0 0 0 0 0
2 1 1 1
2 2 2 2 2
2 3
2 4 4
2
2
2 7
2
2 9
Conjunto 2
15 1 3 4 4
15∗ 5 5 5 6 7 8 8 9
16 0 0 0 0 0 0 0 1 1 1 1 1 2 2 3 3 3 3 4 4 4 4
16∗ 5 5 6 6 7 8 8 8 8 9 9 9
17 0 1 2 4
17∗
1.5
a) M: 40,2% b) M: 46,4% c) M: 179 cm d) M:177,5 cm
F: 34,8% F: 53,6% F: 170 cm F:168 cm
1.6
a) M: 58% b) M: 42% c) M: 178 cm d) M:176 cm
F: 346% F: 66% F: 169 cm F:168 cm
1.7 Sim/não.
1.10 a) Conjunto 8 (Ração A)
0
1
2 6 6 7 7 7 7 8 8 8 8 9 9 9 9
3 0 0 0 0 1 1 1 2 2 3 3 4 4 4 4 5 5 5 5 6
4 3 4
5
6 0 1 5 6
108
Conjunto 9 (Ração B)
0 3 4 8 9
1
2 5 6
3 3 4 4 4 4 5 5 5 5 6 6 7 7 8 8 8 9 9 9 9
4 0 0 0 0 1 1 1 1 2 2 2 2 3 3
5
6
1.11
A:(1055;1175] B:(1010,7;1055] C:(975;1010,7] D: [925,975]
2.1 a) x̄ = 0, 66 erros por página b) 0,5 c) 0,84 e) 330
2.2 Med=2,6 x̄ = 2, 59, DP=0,043
2.5 a) Med=2 b) Moda=2
2.6 a) x̄ = 6, 91, Med=3 b) Var=28,4, DP=5,3
2.7 b) x̄ = 3, 65, Var=5,13, DP=2,26 c) Q1=2, Med=2,75

d) Sim. Nova média = 2x̄=7,3 e nova variância = 4×5,13= 20,52
2.8 a) Nova média = 2x̄, novo desvio padrão = 2DP, nova mediana = 2Med.
b) Nova média = x̄ + 10, novo desvio padrão = DP, nova mediana = Med +10.
2.10 a)
Classes xi Porcentagem
0`1 0,5 20
1`2 1,5 50
2`3 2,5 20
3`5 4,0 10
c) x̄ = 1, 75, Med=1,6 e) 1,1
109
2.12 1) 15,9 3) 16,78
2.13 x̄ = 5, 9, Var=6,19, Moda=8, Med=6
3.1 C= 0, 44, , C∗ = 0, 62
3.2 C= 0, 42
3.4 C∗ = 0, 18
3.8 0,62
3.9 0,60
4.3 a) 3/4 b) 1/4 c) 3/4
4.4 a) A ∩ B c b)(A ∪ B c ) ∩ (Ac ∩ B) c) Ac ∩ B c
4.5 P(Produto> 0) = 43/91
4.6 P (A ∪ B) = 19/36 P (A ∩ B) = 1/12 P (Ac ) = 8/9
4.8 a) com reposição P(P P ) = 9/64, P(V V ) = 25/64, P(V P ) = 15/64, P(P V ) = 15/64.
b) sem reposição P(P P ) = 6/56, P(V V ) = 20/56, P(V P ) = 15/56, P(P V ) = 15/56.
4.9 a) com reposição: 9/64; sem reposição: 6/56

b) com reposição: 9/64; sem reposição: 6/56
c) com reposição: 40/64; sem reposição: 35/56
110
4.10 P(problema ser resolvido)=11/12
4.11 a) 5/9 b) 2/3
4.12 a) 1 − p − q + pq b) p + q − pq
4.16 5/9
4.17 a) 0,0768 b) 0,0836
4.18 2/3
4.19 8/9
4.20 ! 0 n−0
n 1 5
1− = 1 − (5/6)n
0 6 6
4.22 a) 1 − x − y + z b) 1 − x + z c)y − z
4.23 P(A ∪ B ∪ C) = 5/8
4.27 0,24
4.28 3/4
4.29 a) 7/9 b) 1/4
4.31 a) 0,28 b) i) 0,15 ii) 0,33
6.3 a) 0,2912 b) 0,7088 i) 0,4236 j) 0,8472 k) 0,3174 l) 0,1814

6.4 a) z = −2, 54 b) z = 1, 77 c) z = 1, 97 e) z = 1, 32
6.6 a) 0,3413 b) 0,5328 c) 0,4672
6.7 c) 0,6826 d) a = 19, 6.
6.8 a) 0,0227 b) 0,6826 c) a = 2, 57 d) a = µ − 1, 28σ
111
6.12 A: 3; B: 70; C: 7
6.14 4,33; 5,54; 6,02
6.17 0,023
6.18 a) 9413 b) (164,25; 175,75)
6.24 0,3174; 0,0454; 0,0026
6.26 a) 84,13% b) 0,13% d) 3
7.4 a) 68% b) ≈ 100% d) 4

7.7 a) 35,20% b) 0,05%
7.12 a) 4,75% b) 50%
7.13 a) 26,44% b) 16,01%
7.15 0,9974
7.16 0,9987
8.1
170 ± 2, 96
165 ± 3, 18
180 ± 2, 08
8.3 a) [787,1; 812,9] b) 16% c) 625
8.6 a) [148,37; 151,63]
8.7 a)X̄ = 35, 6 b) [35,27;35,93]
8.8 [118,23; 121,77]
8.16
a) 1747, 625 ± 1, 96 × 350/4 = [1747, 625 ± 171, 5]
b) 1747, 625 ± 2, 131 × 604, 65/4 = [1747, 625 ± 322, 13]
A.1
a)17 b) 51 c) 0 d) 70 e) 111 f) 4,3
g) 75 h) 3,4 i) 5,06 j) 58 k)306
A.2 Pk Pk−1 Pk
a) i=1 xi b) i=1 xi c) x2i
Pi=1
Pk 2 Pk k
(xi−x̄)2
d) i=1 (xi − 10) e)x̄ = ( i=1 xi )/k f) i=1
k−1
A.3
112
P6 Pm Pk Pn
a) i=1 zi b) i=1 yi2 c) i=1 xi yi d) i=1 xi fi
Pk Pk Pn P6
e) i=1 x2i yi f) 3
i=2 (xi yi )ki g) i=0 xii ai h) i=1 x2i
P20 Pn P20 P20

e−λ λi n
i) i=0 i!
j) i=0 i
pi q n−i k) i=1 x2i l) i=1 x2iy3i
Pk ai P5 P6 2i Pn
m) i=0 i! n) i=0 (4xi + 2) o) i=1 x2i−1 p) i=1 xii−1 yi
A.5
P5 P4
a) j=1 x1j = 24s b) i=1 xi3 = 43s c)194s d)170s e)100s
A.6
a) (b1 − X1 ) + (b2 − X2 ) + · · · + (bn − Xn )
b) 2x1 y12 + 4x22y23 + 8x33 y34 + 16x44 y45
c) −x1y2 + x2y3 + · · · + (−1)k xk yk+1
d) X1i + X2i + X3 + · · · + Xii
e) 0 + 1 − 2 + 3 − 4 + 5
113
A.7
a) x̄ = 18 ȳ = 60, 3 a = 25, 74 b=1,92
2
b) SX = 64 SZ2 = 64
A.9
a) −3, 17 b) 15
114
C Tabelas e formulários
Pn Pn Pn
i=1 xi i=1 (xi − x̄)2 i=1 x2i DP (X)
x̄ = , Var = = − x̄2 , CV (X) =
n n n x̄
Dados agrupados:
Pk k Pk Pk k
i=1 xi n i X i=1 (xi − x̄)2 ni i=1 x2i ni X
x̄ = = xi fi , Var = = − x̄2 = x2i fi − x̄2
n i=1 n n i=1
Posição dos quantis: k = s(n+1)

r
Dados discrepantes: > Q3 + 32 IQ ou < Q1 − 32 IQ, onde IQ = Q3 − Q1.
s
2
X (oij − eij )2 χ2 C
Análise bidimensional: χ = , C= , C∗ = q ,
i,j eij χ2 + n t−1
t
oij : valor observado na linha i e coluna j; eij : valor esperado = ( total da linha i)×(total da coluna j)
,
total geral
t: mı́nimo entre o número de linhas e o número de colunas.
Pn n P
1 i=1 (xi− x̄)(yi − ȳ) xi yi − nx̄ȳ
corr(X, Y ) = = q P i=1 P
n DP (X)DP (Y ) ( x2i − nx̄2 )( yi2 − nȳ 2)
.......................................................................................
P (A|B) = P (A ∩ B)/P (B), P (A1 ∩ A2 ∩ · · · ∩ An ) = P (A1 )P (A2 |A1) · · · P (An |A1 ∩ A2 · · · ∩ An−1 )
P (A ∪ B) = P (A) + P (B) − P (A ∩ B), P (Ac ) = 1 − P (A)
Se X é uma variável aleatória discreta:

P P P 2
p(x) = P (X = x), i p(xi ) = 1, F (x) = P (X ≤ x), E(X) = i xi p(xi ), Var(X) = i xi p(xi ) −
2
E(X) .

Binomial: X ∼ B(n, p) : p(x) = nx px (1 − p)n−x , x = 0, 1, . . ., n; E(X) = np; Var(X) = np(1 − p).
−λ x
Poisson: X ∼ P o(λ) : p(x) = e x!λ , E(X) = λ; Var(X) = λ.
R
Se X é uma variável contı́nua: P (a ≤ X ≤ b) = ab f (x)dx,
Rx R∞ R∞ 2
F (x) = P (X ≤ x) = −∞ f (t)dt, E(X) = −∞ xf (x)dx, Var(X) = −∞ x f (x)dx − E(X)2.
Normal: X ∼ N (µ, σ 2), E(X) = µ, Var(X) = σ 2, X − µ ∼ N (0, 1).
σ
.............................................................................................
115
Pn Pn
2 − X̄)2
i=1 (Xi
2
i=1 Xi n (m − 1)S12 + (n − 1)S22
S = = − X̄ 2 Sp2 =
n−1 n−1 n−1 m+n−2
Intervalos de Confiança
População Dist. amostral Intervalo (1- α)

Normal
2
σ conhecido X̄ ∼ N (µ, σ 2/n) (x̄ ∓ zα/2 √σn )
. √
σ 2 desconhecido (X̄ − µ) (S/ n) ' N (0, 1) (x̄ ∓ zα/2 √sn )
n ≥ 30 . √
σ2 desconhecido (X̄ − µ) (S/ n) ∼ tn−1 (x̄ ∓ tα/2 √sn )
n < 30
Outras distribuições . √
σ 2 conhecido (X̄ − µ) (σ/ n) ' N (0, 1) (x̄ ∓ zα/2 √σn )
n ≥ 30 . √
2
σ desconhecido (X̄ − µ) (σ̂/ n) ' N (0, 1) (x̄ ∓ zα/2 √σ̂n )
n ≥ 30
.q q
p̂(1−p̂) p̂(1−p̂)
Proporção (p̂ − p) n ' N (0, 1) p̂ ∓ zα/2 n
Dif. de médias
(Normal) q
q
. σ12 σ22 σ12 σ22
variâncias conhecidas (X̄ − Ȳ ) − (µ1 − µ2 ) m + n ∼ N (0, 1) X̄ − Ȳ ) ∓ zα/2 m + n
. q q
1 1 1 1
variâncias desc. (X̄ − Ȳ ) − (µ1 − µ2 ) Sp m + n ∼ tn+m−2 X̄ − Ȳ ) ∓ tα/2 Sp m + n
(iguais)
116
Tabela C.1 Distribuição Binomial
Corpo da tábua: P (X = k)
!
n
P (X = k) = pk (1 − p)n−k , k = 0, 1, . . ., n
k
n = 2
k↓ 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 ← p
0 .902 .810 .722 .640 .562 .490 .423 .360 .303 .250 2
1 .095 .180 .255 .320 .375 .420 .455 .480 .495 .500 1
2 .003 .010 .023 .040 .063 .090 .122 .160 .202 .250 0
p→ 0.95 0.90 0.85 0.80 0.75 0.70 0.65 0.60 0.55 0.50 k ↑
n = 3
k↓ 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 ← p
0 .857 .729 .614 .512 .422 .343 .275 .216 .166 .125 3
1 .135 .243 .325 .384 .422 .441 .444 .432 .408 .375 2
2 .007 .027 .057 .096 .141 .189 .239 .288 .334 .375 1
3 0+ .001 .003 .008 .016 .027 .043 .064 .091 .125 0
p→ 0.95 0.90 0.85 0.80 0.75 0.70 0.65 0.60 0.55 0.50 k ↑
n = 4
k↓ 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 ← p
0 .815 .656 .522 .410 .316 .240 .179 .130 .092 .063 4
1 .171 .292 .368 .410 .422 .412 .384 .346 .299 .250 3
2 .014 .049 .098 .154 .211 .265 .311 .346 .368 .375 2
3 0+ .004 .011 .026 .047 .076 .111 .154 .200 .250 1
4 0+ 0+ .001 .002 .004 .008 .015 .026 .041 .063 0
p→ 0.95 0.90 0.85 0.80 0.75 0.70 0.65 0.60 0.55 0.50 k ↑
n = 5
k↓ 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 ← p
0 .774 .590 .444 .328 .237 .168 .116 .078 .050 .031 5
1 .204 .328 .392 .410 .396 .360 .312 .259 .206 .156 4
2 .021 .073 .138 .205 .264 .309 .336 .346 .337 .312 3
3 .001 .008 .024 .051 .088 .132 .181 .230 .276 .312 2
4 0+ 0+ .002 .006 .015 .028 .049 .077 .113 .156 1
5 0+ 0+ 0+ 0+ .001 .002 .005 .010 .018 .031 0
p→ 0.95 0.90 0.85 0.80 0.75 0.70 0.65 0.60 0.55 0.50 k ↑
117
Tabela C.1 (Cont.)
Corpo da tábua: P (X = k), k = 0, 1, . . ., n
n = 6
k↓ 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 ← p
0 .735 .531 .377 .262 .178 .118 .075 .047 .028 .016 6
1 .232 .354 .399 .393 .356 .303 .244 .187 .136 .094 5
2 .031 .098 .176 .246 .297 .324 .328 .311 .278 .234 4
3 .002 .015 .041 .082 .132 .185 .235 .276 .303 .312 3
4 0+ .001 .005 .015 .033 .060 .095 .138 .186 .234 2
5 0+ 0+ 0+ .002 .004 .010 .020 .037 .061 .094 1
6 0+ 0+ 0+ 0+ 0+ .001 .002 .004 .008 .016 0
p→ 0.95 0.90 0.85 0.80 0.75 0.70 0.65 0.60 0.55 0.50 k ↑
n = 7
k↓ 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 ← p
0 .698 .478 .321 .210 .133 .082 .049 .028 .015 .008 7
1 .257 .372 .396 .367 .311 .247 .185 .131 .087 .055 6
2 .041 .124 .210 .275 .311 .318 .298 .261 .214 .164 5
3 .004 .023 .062 .115 .173 .227 .268 .290 .292 .273 4
4 0+ .003 .011 .029 .058 .097 .144 .194 .239 .273 3
5 0+ 0+ .001 .004 .012 .025 .047 .077 .117 .164 2
6 0+ 0+ 0+ 0+ .001 .004 .008 .017 .032 .055 1
7 0+ 0+ 0+ 0+ 0+ 0+ .001 .002 .004 .008 0
p→ 0.95 0.90 0.85 0.80 0.75 0.70 0.65 0.60 0.55 0.50 k ↑
n = 8
k↓ 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 ← p
0 .663 .430 .272 .168 .100 .058 .032 .017 .008 .004 8
1 .279 .383 .385 .336 .267 .198 .137 .090 .055 .031 7
2 .051 .149 .238 .294 .311 .296 .259 .209 .157 .109 6
3 .005 .033 .084 .147 .208 .254 .279 .279 .257 .219 5
4 0+ .005 .018 .046 .087 .136 .188 .232 .263 .273 4
5 0+ 0+ .003 .009 .023 .047 .081 .124 .172 .219 3
6 0+ 0+ 0+ .001 .004 .010 .022 .041 .070 .109 2
7 0+ 0+ 0+ 0+ 0+ .001 .003 .008 .016 .031 1
8 0+ 0+ 0+ 0+ 0+ 0+ 0+ .001 .002 .004 0
p→ 0.95 0.90 0.85 0.80 0.75 0.70 0.65 0.60 0.55 0.50 k ↑
Tabela C.1 (Cont.)
n = 9
k↓ 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 ← p
0 .630 .387 .232 .134 .075 .040 .021 .010 .005 .002 9
1 .299 .387 .368 .302 .225 .156 .100 .060 .034 .018 8
2 .063 .172 .260 .302 .300 .267 .216 .161 .111 .070 7
3 .008 .045 .107 .176 .234 .267 .272 .251 .212 .164 6
4 .001 .007 .028 .066 .117 .172 .219 .251 .260 .246 5
5 0+ .001 .005 .017 .039 .074 .118 .167 .213 .246 4
6 0+ 0+ .001 .003 .009 .021 .042 .074 .116 .164 3
7 0+ 0+ 0+ 0+ .001 .004 .010 .021 .041 .070 2
8 0+ 0+ 0+ 0+ 0+ 0+ .001 .004 .008 .018 1
9 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ .001 .002 0
p→ 0.95 0.90 0.85 0.80 0.75 0.70 0.65 0.60 0.55 0.50 k ↑
n = 10
k↓ 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 ← p
0 .599 .349 .197 .107 .056 .028 .013 .006 .003 .001 10
1 .315 .387 .347 .268 .188 .121 .072 .040 .021 .010 9
2 .075 .194 .276 .302 .282 .233 .176 .121 .076 .044 8
3 .010 .057 .130 .201 .250 .267 .252 .215 .166 .117 7
4 .001 .011 .040 .088 .146 .200 .238 .251 .238 .205 6
5 0+ .001 .008 .026 .058 .103 .154 .201 .234 .246 5
6 0+ 0+ .001 .006 .016 .037 .069 .111 .160 .205 4
7 0+ 0+ 0+ .001 .003 .009 .021 .042 .075 .117 3
8 0+ 0+ 0+ 0+ 0+ .001 .004 .011 .023 .044 2
9 0+ 0+ 0+ 0+ 0+ 0+ .001 .002 .004 .010 1
10 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ .001 0
p→ 0.95 0.90 0.85 0.80 0.75 0.70 0.65 0.60 0.55 0.50 k ↑
Tabela C.1(Cont.)
n = 12
k↓ 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 ← p
0 .540 .282 .142 .069 .032 .014 .006 .002 .001 0+ 12
1 .341 .377 .301 .206 .127 .071 .037 .017 .008 .003 11
2 .099 .230 .292 .283 .232 .168 .109 .064 .034 .016 10
3 .017 .085 .172 .236 .258 .240 .195 .142 .092 .054 9
4 .002 .021 .068 .133 .194 .231 .237 .213 .170 .121 8
5 0+ .004 .019 .053 .103 .158 .204 .227 .222 .193 7
6 0+ 0+ .004 .016 .040 .079 .128 .177 .212 .226 6
7 0+ 0+ .001 .003 .011 .029 .059 .101 .149 .193 5
8 0+ 0+ 0+ .001 .002 .008 .020 .042 .076 .121 4
9 0+ 0+ 0+ 0+ 0+ .001 .005 .012 .028 .054 3
10 0+ 0+ 0+ 0+ 0+ 0+ .001 .002 .007 .016 2
11 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ .001 .003 1
12 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0
p→ 0.95 0.90 0.85 0.80 0.75 0.70 0.65 0.60 0.55 0.50 k ↑
n = 14
k↓ 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 ← p
0 .488 .229 .103 .044 .018 .007 .002 .001 0+ 0+ 14
1 .359 .356 .254 .154 .083 .041 .018 .007 .003 .001 13
2 .123 .257 .291 .250 .180 .113 .063 .032 .014 .006 12
3 .026 .114 .206 .250 .240 .194 .137 .085 .046 .022 11
4 .004 .035 .100 .172 .220 .229 .202 .155 .104 .061 10
5 0+ .008 .035 .086 .147 .196 .218 .207 .170 .122 9
6 0+ .001 .009 .032 .073 .126 .176 .207 .209 .183 8
7 0+ 0+ .002 .009 .028 .062 .108 .157 .195 .209 7
8 0+ 0+ 0+ .002 .008 .023 .051 .092 .140 .183 6
9 0+ 0+ 0+ 0+ .002 .007 .018 .041 .076 .122 5
10 0+ 0+ 0+ 0+ 0+ .001 .005 .014 .031 .061 4
11 0+ 0+ 0+ 0+ 0+ 0+ .001 .003 .009 .022 3
12 0+ 0+ 0+ 0+ 0+ 0+ 0+ .001 .002 .006 2
13 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ .001 1
14 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0 + 0
p→ 0.95 0.90 0.85 0.80 0.75 0.70 0.65 0.60 0.55 0.50 k ↑
Tabela C.1 (Cont.)
n = 16
k↓ 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 ← p
0 .440 .185 .074 .028 .010 .003 .001 0+ 0+ 0+ 16
1 .371 .329 .210 .113 .053 .023 .009 .003 .001 0+ 15
2 .146 .275 .277 .211 .134 .073 .035 .015 .006 .002 14
3 .036 .142 .229 .246 .208 .146 .089 .047 .022 .009 13
4 .006 .051 .131 .200 .225 .204 .155 .101 .057 .028 12
5 .001 .014 .056 .120 .180 .210 .201 .162 .112 .067 11
6 0+ .003 .018 .055 .110 .165 .198 .198 .168 .122 10
7 0+ 0+ .005 .020 .052 .101 .152 .189 .197 .175 9
8 0+ 0+ .001 .006 .020 .049 .092 .142 .181 .196 8
9 0+ 0+ 0+ .001 .006 .019 .044 .084 .132 .175 7
10 0+ 0+ 0+ 0+ .001 .006 .017 .039 .075 .122 6
11 0+ 0+ 0+ 0+ 0+ .001 .005 .014 .034 .067 5
12 0+ 0+ 0+ 0+ 0+ 0+ .001 .004 .011 .028 4
13 0+ 0+ 0+ 0+ 0+ 0+ 0+ .001 .003 .009 3
14 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ .001 .002 2
15 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0 + 1
16 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0
p→ 0.95 0.90 0.85 0.80 0.75 0.70 0.65 0.60 0.55 0.50 k ↑
n = 18
k↓ 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 ← p
0 .397 .150 .054 .018 .006 .002 0+ 0+ 0+ 0+ 18
1 .376 .300 .170 .081 .034 .013 .004 .001 0+ 0 + 17
2 .168 .284 .256 .172 .096 .046 .019 .007 .002 .001 16
3 .047 .168 .241 .230 .170 .105 .055 .025 .009 .003 15
4 .009 .070 .159 .215 .213 .168 .110 .061 .029 .012 14
5 .001 .022 .079 .151 .199 .202 .166 .115 .067 .033 13
6 0+ .005 .030 .082 .144 .187 .194 .166 .118 .071 12
7 0+ .001 .009 .035 .082 .138 .179 .189 .166 .121 11
8 0+ 0+ .002 .012 .038 .081 .133 .173 .186 .167 10
9 0+ 0+ 0+ .003 .014 .039 .079 .128 .169 .185 9
10 0+ 0+ 0+ .001 .004 .015 .038 .077 .125 .167 8
11 0+ 0+ 0+ 0+ .001 .005 .015 .037 .074 .121 7
12 0+ 0+ 0+ 0+ 0+ .001 .005 .015 .035 .071 6
13 0+ 0+ 0+ 0+ 0+ 0+ .001 .004 .013 .033 5
14 0+ 0+ 0+ 0+ 0+ 0+ 0+ .001 .004 .012 4
15 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ .001 .003 3
16 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ .001 2
17 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0 + 1
18 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0 + 0
Tabela C.1 (Cont.)
n = 20
k↓ 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 ← p
0 .358 .122 .039 .012 .003 .001 0+ 0+ 0+ 0+ 20
1 .377 .270 .137 .058 .021 .007 .002 0+ 0+ 0+ 19
+
2 .189 .285 .229 .137 .067 .028 .010 .003 .001 0 18
3 .060 .190 .243 .205 .134 .072 .032 .012 .004 .001 17
4 .013 .090 .182 .218 .190 .130 .074 .035 .014 .005 16
5 .002 .032 .103 .175 .202 .179 .127 .075 .036 .015 15
6 0+ .009 .045 .109 .169 .192 .171 .124 .075 .037 14
7 0+ .002 .016 .055 .112 .164 .184 .166 .122 .074 13
8 0+ 0+ .005 .022 .061 .114 .161 .180 .162 .120 12
9 0+ 0+ .001 .007 .027 .065 .116 .160 .177 .160 11
10 0+ 0+ 0+ .002 .010 .031 .069 .117 .159 .176 10
11 0+ 0+ 0+ 0+ .003 .012 .034 .071 .119 .160 9
12 0+ 0+ 0+ 0+ .001 .004 .014 .035 .073 .120 8
13 0+ 0+ 0+ 0+ 0+ .001 .004 .015 .037 .074 7
14 0+ 0+ 0+ 0+ 0+ 0+ .001 .005 .015 .037 6
15 0+ 0+ 0+ 0+ 0+ 0+ 0+ .001 .005 .015 5
16 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ .001 .005 4
17 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ .001 3
18 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0 + 2
19 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 1
20 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0 +
0
p→ 0.95 0.90 0.85 0.80 0.75 0.70 0.65 0.60 0.55 0.50 k ↑
Tabela C.2 Distribuição de Poisson
Corpo da tábua: P (X = k), k = 0, 1, . . .
e−α αk
P (X = k) =
k!
α
k↓ 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 0.55 0.60 0.65
0 .951 .905 .861 .819 .779 .741 .705 .670 .638 .607 .577 .549 .522
1 .048 .090 .129 .164 .195 .222 .247 .268 .287 .303 .317 .329 .339
2 .001 .005 .010 .016 .024 .033 .043 .054 .065 .076 .087 .099 .110
3 0+ 0+ 0+ .001 .002 .003 .005 .007 .010 .013 .016 .020 .024
4 0+ 0+ 0+ 0+ 0+ 0+ 0+ .001 .001 .002 .002 .003 .004
≥5 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 001
α
k↓ 0.70 0.75 0.80 0.85 0.90 0.95 1.00 1.05 1.10 1.15 1.20 1.25 1.40
0 .497 .472 .449 .427 .407 .387 .368 .350 .333 .317 .301 .287 .247
1 .348 .354 .359 .363 .366 .367 .368 .367 .366 .364 .361 .358 .345
2 .122 .133 .144 .154 .165 .175 .184 .193 .201 .209 .217 .224 .242
3 .028 .033 .038 .044 .049 .055 .061 .068 .074 .080 .087 .093 .113
4 .005 .006 .008 .009 .011 .013 .015 .018 .020 .023 .026 .029 .039
5 .001 .001 .001 .002 .002 .002 .003 .004 .004 .005 .006 .007 .011
6 0+ 0+ 0+ 0+ 0+ 0+ .001 .001 .001 .001 .001 .002 .003
7 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ .001
8 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+
Tabela C.2 (Cont.)
α
k↓ 1.8 2.0 2.5 3.0 3.5 4.0 4.5 5.0 6.0 7.0 8.0 9.0 10.0
0 .165 .135 .082 .050 .030 .018 .011 .007 .002 .001 0+ 0+ 0+
1 .298 .271 .205 .149 .106 .073 .050 .034 .015 .006 .003 .001 0+
2 .268 .271 .257 .224 .185 .147 .112 .084 .045 .022 .011 .005 .002
3 .161 .180 .214 .224 .216 .195 .169 .140 .089 .052 .029 .015 .008
4 .072 .090 .134 .168 .189 .195 .190 .175 .134 .091 .057 .034 .019
5 .026 .036 .067 .101 .132 .156 .171 .175 .161 .128 .092 .061 .038
6 .008 .012 .028 .050 .077 .104 .128 .146 .161 .149 .122 .091 .063
7 .002 .003 .010 .022 .039 .060 .082 .104 .138 .149 .140 .117 .090
8 0+ .001 .003 .008 .017 .030 .046 .065 .103 .130 .140 .132 .113
9 0+ 0+ .001 .003 .007 .013 .023 .036 .069 .101 .124 .132 .125
10 0+ 0+ 0+ .001 .002 .005 .010 .018 .041 .071 .099 .119 .125
11 0+ 0+ 0+ 0+ .001 .002 .004 .008 .023 .045 .072 .097 .114
12 0+ 0+ 0+ 0+ 0+ .001 .002 .003 .011 .026 .048 .073 .095
13 0+ 0+ 0+ 0+ 0+ 0+ .001 .001 .005 .014 .030 .050 .073
14 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ .002 .007 .017 .032 .052
15 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ .001 .003 .009 .019 .035
16 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ .001 .005 .011 .022
17 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ .001 .002 .006 .013
18 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ .001 .003 .007
19 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ .001 .004
20 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ .001 .002
21 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ .001
22 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+
Tabela C.3 Normal Padrão
Z z 2
e−x /2 dx
Valor Tabelado = P (0 ≤ Z ≤ z) = √
0 2π
z 0 1 2 3 4 5 6 7 8 9
0.0 .0000 .0040 .0080 .0120 .0160 .0199 .0239 .0279 .0319 .0359
0.1 .0398 .0438 .0478 .0517 .0557 .0596 .0636 .0675 .0714 .0753
0.2 .0793 .0832 .0871 .0910 .0948 .0987 .1026 .1064 .1103 .1141
0.3 .1179 .1217 .1255 .1293 .1331 .1368 .1406 .1443 .1480 .1517
0.4 .1554 .1591 .1628 .1664 .1700 .1736 .1772 .1808 .1844 .1879
0.5 .1915 .1950 .1985 .2019 .2054 .2088 .2123 .2157 .2190 .2224
0.6 .2257 .2291 .2324 .2357 .2389 .2422 .2454 .2486 .2517 .2549
0.7 .2580 .2611 .2642 .2673 .2704 .2734 .2764 .2794 .2823 .2852
0.8 .2881 .2910 .2939 .2967 .2995 .3023 .3051 .3078 .3106 .3133
0.9 .3159 .3186 .3212 .3238 .3264 .3289 .3315 .3340 .3365 .3389
1.0 .3413 .3438 .3461 .3485 .3508 .3531 .3554 .3577 .3599 .3621
1.1 .3643 .3665 .3686 .3708 .3729 .3749 .3770 .3790 .3810 .3830
1.2 .3849 .3869 .3888 .3907 .3925 .3944 .3962 .3980 .3997 .4015
1.3 .4032 .4049 .4066 .4082 .4099 .4115 .4131 .4147 .4162 .4177
1.4 .4192 .4207 .4222 .4236 .4251 .4265 .4279 .4292 .4306 .4319
1.5 .4332 .4345 .4357 .4370 .4382 .4394 .4406 .4418 .4429 .4441
1.6 .4452 .4463 .4474 .4484 .4495 .4505 .4515 .4525 .4535 .4545
1.7 .4554 .4564 .4573 .4582 .4591 .4599 .4608 .4616 .4625 .4633
1.8 .4641 .4649 .4656 .4664 .4671 .4678 .4686 .4693 .4699 .4706
1.9 .4713 .4719 .4726 .4732 .4738 .4744 .4750 .4756 .4761 .4767
2.0 .4772 .4778 .4783 .4788 .4793 .4798 .4803 .4808 .4812 .4817
2.1 .4821 .4826 .4830 .4834 .4838 .4842 .4846 .4850 .4854 .4857
2.2 .4861 .4864 .4868 .4871 .4875 .4878 .4881 .4884 .4887 .4890
2.3 .4893 .4896 .4898 .4901 .4904 .4906 .4909 .4911 .4913 .4916
2.4 .4918 .4920 .4922 .4925 .4927 .4929 .4931 .4932 .4934 .4936
2.5 .4938 .4940 .4941 .4943 .4945 .4946 .4948 .4949 .4951 .4952
2.6 .4953 .4955 .4956 .4957 .4959 .4960 .4961 .4962 .4963 .4964
2.7 .4965 .4966 .4967 .4968 .4969 .4970 .4971 .4972 .4973 .4974
2.8 .4974 .4975 .4976 .4977 .4977 .4978 .4979 .4979 .4980 .4981
2.9 .4981 .4982 .4982 .4983 .4984 .4984 .4985 .4985 .4986 .4986
3.0 .4987 .4987 .4987 .4988 .4988 .4989 .4989 .4989 .4990 .4990
3.1 .4990 .4991 .4991 .4991 .4992 .4992 .4992 .4992 .4993 .4993
3.2 .4993 .4993 .4994 .4994 .4994 .4994 .4994 .4995 .4995 .4995
3.3 .4995 .4995 .4995 .4996 .4996 .4996 .4996 .4996 .4996 .4997
3.4 .4997 .4997 .4997 .4997 .4997 .4997 .4997 .4997 .4997 .4998
3.5 .4998 .4998 .4998 .4998 .4998 .4998 .4998 .4998 .4998 .4998
3.6 .4998 .4998 .4999 .4999 .4999 .4999 .4999 .4999 .4999 .4999
3.7 .4999 .4999 .4999 .4999 .4999 .4999 .4999 .4999 .4999 .4999
3.8 .4999 .4999 .4999 .4999 .4999 .4999 .4999 .4999 .4999 .4999
Tabela C.4 Distribuição t de Student
Valores crı́ticos de t tais que P (−tc < t < tc ) = 1 − p
p −→ 0.001 0.002 0.01 0.02 0.03 0.04 0.05 0.06 0.10 0.15 0.20 0.30 0.40 0.60
g.l. ↓
1 636.61 318.32 63.66 31.82 21.20 15.89 12.71 10.58 6.31 4.17 3.08 1.96 1.38 0.73
2 31.60 22.33 9.92 6.96 5.64 4.85 4.30 3.90 2.92 2.28 1.89 1.39 1.06 0.62
3 12.92 10.21 5.84 4.54 3.90 3.48 3.18 2.95 2.35 1.92 1.64 1.25 0.98 0.58
4 8.61 7.17 4.60 3.75 3.30 3.00 2.78 2.60 2.13 1.78 1.53 1.19 0.94 0.57
5 6.87 5.89 4.03 3.36 3.00 2.76 2.57 2.42 2.02 1.70 1.48 1.16 0.92 0.56
6 5.96 5.21 3.71 3.14 2.83 2.61 2.45 2.31 1.94 1.65 1.44 1.13 0.91 0.55
7 5.41 4.79 3.50 3.00 2.71 2.52 2.36 2.24 1.89 1.62 1.41 1.12 0.90 0.55
8 5.04 4.50 3.36 2.90 2.63 2.45 2.31 2.19 1.86 1.59 1.40 1.11 0.89 0.55
9 4.78 4.30 3.25 2.82 2.57 2.40 2.26 2.15 1.83 1.57 1.38 1.10 0.88 0.54
10 4.59 4.14 3.17 2.76 2.53 2.36 2.23 2.12 1.81 1.56 1.37 1.09 0.88 0.54
11 4.44 4.02 3.11 2.72 2.49 2.33 2.20 2.10 1.80 1.55 1.36 1.09 0.88 0.54
12 4.32 3.93 3.05 2.68 2.46 2.30 2.18 2.08 1.78 1.54 1.36 1.08 0.87 0.54
13 4.22 3.85 3.01 2.65 2.44 2.28 2.16 2.06 1.77 1.53 1.35 1.08 0.87 0.54
14 4.14 3.79 2.98 2.62 2.41 2.26 2.14 2.05 1.76 1.52 1.35 1.08 0.87 0.54
15 4.07 3.73 2.95 2.60 2.40 2.25 2.13 2.03 1.75 1.52 1.34 1.07 0.87 0.54
16 4.01 3.69 2.92 2.58 2.38 2.24 2.12 2.02 1.75 1.51 1.34 1.07 0.86 0.54
17 3.97 3.65 2.90 2.57 2.37 2.22 2.11 2.02 1.74 1.51 1.33 1.07 0.86 0.53
18 3.92 3.61 2.88 2.55 2.36 2.21 2.10 2.01 1.73 1.50 1.33 1.07 0.86 0.53
19 3.88 3.58 2.86 2.54 2.35 2.20 2.09 2.00 1.73 1.50 1.33 1.07 0.86 0.53
20 3.85 3.55 2.85 2.53 2.34 2.20 2.09 1.99 1.72 1.50 1.33 1.06 0.86 0.53
21 3.82 3.53 2.83 2.52 2.33 2.19 2.08 1.99 1.72 1.49 1.32 1.06 0.86 0.53
22 3.79 3.51 2.82 2.51 2.32 2.18 2.07 1.98 1.72 1.49 1.32 1.06 0.86 0.53
23 3.77 3.48 2.81 2.50 2.31 2.18 2.07 1.98 1.71 1.49 1.32 1.06 0.86 0.53
24 3.75 3.47 2.80 2.49 2.31 2.17 2.06 1.97 1.71 1.49 1.32 1.06 0.86 0.53
25 3.73 3.45 2.79 2.49 2.30 2.17 2.06 1.97 1.71 1.49 1.32 1.06 0.86 0.53
26 3.71 3.44 2.78 2.48 2.30 2.16 2.06 1.97 1.71 1.48 1.31 1.06 0.86 0.53
27 3.69 3.42 2.77 2.47 2.29 2.16 2.05 1.96 1.70 1.48 1.31 1.06 0.86 0.53
28 3.67 3.41 2.76 2.47 2.29 2.15 2.05 1.96 1.70 1.48 1.31 1.06 0.85 0.53
29 3.66 3.40 2.76 2.46 2.28 2.15 2.05 1.96 1.70 1.48 1.31 1.06 0.85 0.53
30 3.65 3.39 2.75 2.46 2.28 2.15 2.04 1.95 1.70 1.48 1.31 1.05 0.85 0.53
31 3.63 3.37 2.74 2.45 2.27 2.14 2.04 1.95 1.70 1.48 1.31 1.05 0.85 0.53
32 3.62 3.37 2.74 2.45 2.27 2.14 2.04 1.95 1.69 1.47 1.31 1.05 0.85 0.53
33 3.61 3.36 2.73 2.44 2.27 2.14 2.03 1.95 1.69 1.47 1.31 1.05 0.85 0.53
34 3.60 3.35 2.73 2.44 2.27 2.14 2.03 1.95 1.69 1.47 1.31 1.05 0.85 0.53
35 3.59 3.34 2.72 2.44 2.26 2.13 2.03 1.94 1.69 1.47 1.31 1.05 0.85 0.53
40 3.55 3.31 2.70 2.42 2.25 2.12 2.02 1.94 1.68 1.47 1.30 1.05 0.85 0.53
45 3.52 3.28 2.69 2.41 2.24 2.11 2.01 1.93 1.68 1.46 1.30 1.05 0.85 0.53
50 3.50 3.26 2.68 2.40 2.23 2.11 2.01 1.92 1.68 1.46 1.30 1.05 0.85 0.53
55 3.48 3.25 2.67 2.40 2.23 2.10 2.00 1.92 1.67 1.46 1.30 1.05 0.85 0.53
60 3.46 3.23 2.66 2.39 2.22 2.10 2.00 1.92 1.67 1.46 1.30 1.05 0.85 0.53
65 3.45 3.22 2.65 2.39 2.22 2.10 2.00 1.91 1.67 1.46 1.29 1.04 0.85 0.53
120 3.37 3.16 2.62 2.36 2.20 2.08 1.98 1.90 1.66 1.45 1.29 1.04 0.84 0.53
∞ 3.29 3.09 2.58 2.33 2.17 2.05 1.96 1.88 1.65 1.44 1.28 1.04 0.84 0.52

Apostila Basica-Teresa

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Apostila Basica-Teresa

Enviado por

Direitos autorais:

Formatos disponíveis

Apresentação

Esta apostila contém um resumo do material a ser apresentado na disciplina IC-280,

Antonieta D’Alcântara de Queiroz Peres

Maria Teresa Carneiro da Cunha

2 Medidas Associadas a Variáveis Quantitativas 20

5 Variáveis Aleatórias Discretas 60

6 Variáveis aleatórias contı́nuas 72

A Notação de Somatório 103

B Respostas de alguns exercı́cios selecionados 108

C Tabelas e formulários 115

• a coleta, redução, análise e modelagem de dados “parciais” (amostra);

• fazer inferências para o conjunto total de dados (população).

Os dados podem ser obtidos por

No primeiro exemplo, o pesquisador apenas observa as caracterı́sticas de interesse nos

Algumas definições importantes:

1. variável: é uma caracterı́stica qualquer do objeto em estudo. Pode ser classificada

• variável qualitativa quando apresenta como possı́veis realizações uma qualidade

Esquematicamente, podemos representar a divisão das variáveis por

3. amostra: é qualquer subconjunto da população.

1.2 Apresentação dos dados

• n é o número total de observações do conjunto;

• k é o número de nı́veis da variável em questão;

• i é o ı́ndice que indica o nı́vel da variável;

• ni é o número de observações para o nı́vel i da variável;

• fi = ni /n é a proporção de casos no nı́vel i da variável.

Exemplo 1.4 Representar as variáveis “Religião” e “Nı́vel de atividade fı́sica” em tabelas

Tabela 1.3 Distribuição de freqüências: “Religião ” .

Religião freqüência (ni ) proporção(fi ) %

Tabela 1.4 Distribuição de freqüências:“Nı́vel de atividade fı́sica”.

Atividade freqüência (ni ) proporção (fi ) %

Tabela 1.6 Distribuição de freqüências: “Peso (kg)”

• xi é o ponto médio do intervalo ( representa agora o valor da variável naquele intervalo);

• ni é a freqüência de cada classe.

1.3.1 Representação gráfica das variáveis qualitativas

1. O gráfico tem apenas uma escala, a que representa a freqüência ou porcentagem em

3. Para facilitar a compreensão e análise, é preferı́vel que as barras sejam apresentadas

5. É preferı́vel utilizar freqüências quando estivermos representando subdivisões dos nı́veis

6. Para representar a participação em porcentagem de cada subnı́vel de uma variável,

1. Não é um gráfico recomendado quando se quer representar subdivisões dos nı́veis da

2. Não é recomendado quando o número de nı́veis da variável é muito grande.

Exemplo 1.9 Em recente pesquisa em uma pequena comunidade do interior de Minas

Tabela 1.7 “Consumo de bebidas: Exemplo 1.9”

1.3.2 Representação gráfica das variáveis quantitativas

• É comum representar-se mais de uma série no mesmo gráfico.

Exemplo 1.10 Faça um gráfico de linhas representando as séries abaixo.

Mes Jan Fev Mar Abr Mai Jun Jul

Figura 2: Gráfico de barras: Exemplo 1.9

Figura 4: Gráfico de colunas: Exemplo 1.10

1. As duas escalas estão presentes, no eixo X representamos o tempo e no eixo Y os nı́veis

• a base do bloco é o comprimento do intervalo de classe;

• a altura do bloco é a densidade, de freqüência, de proporção ou de porcentagem, na

A densidade na classe i é definida por

• A área do bloco obtido é a quantidade representada naquela classe.

• O número de intervalos de classes e sua amplitude são arbitrários e dependem do

K = 1 + log2 n ( Fórmula de Sturges).

2. Todos os ramos devem ter o mesmo comprimento.

Represente graficamente os dados.

Ano 1972 1973 1974 1975 1976 1977 1978 1979

Construa um gráfico que mostre a porcentagem das pessoas que são,

a) um gráfico de barras; b) um gráfico de setores.

Oceano Pacı́fico Atlântico Índico Antártico Ártico

1.8 Os dados do conjunto 5 (Seção 1.5) referem-se à populações de alguns municı́pios do

a) altura dos adultos casados;

CONJUNTO 1: Idade (anos completos) - Sexo Feminino.