Você está na página 1de 126

Apresentação

Esta apostila contém um resumo do material a ser apresentado na disciplina IC-280,


Estatı́stica Básica, na UFRRJ. O texto é baseado no livro texto da disciplina, Estatı́stica
Básica, de Wilton Bussab e Pedro Morettin e contém também vários exercı́cios de outros
livros. Os exercı́cios retirados do livro texto, estão marcados com o sı́mbolo ♠ . Este resumo
não substitui o livro texto e deve servir apenas de guia para o aluno acompanhar a seqüência
da matéria lecionada.
Nos apêndices, são apresentadas tabelas e respostas de alguns exercı́cios propostos.
Agradecemos a monitora da disciplina Estatı́stica Básica, Manoela Machado do Vale, por
fornecer várias destas respostas.

Antonieta D’Alcântara de Queiroz Peres

Maria Teresa Carneiro da Cunha

1
Resumos e Seleção de Exercı́cios
Estatı́stica Básica

Índice
1 Análise Exploratória de dados 4
1.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2 Apresentação dos dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.3 Gráficos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.3.1 Representação gráfica das variáveis qualitativas . . . . . . . . . . . . 8
1.3.2 Representação gráfica das variáveis quantitativas . . . . . . . . . . . 10
1.3.3 Gráficos especiais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.4 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.5 Conjuntos de dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

2 Medidas Associadas a Variáveis Quantitativas 20


2.1 Medidas de Posição . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.1.1 Outras medidas de posição . . . . . . . . . . . . . . . . . . . . . . . 21
2.1.2 Medidas de posição para dados agrupados . . . . . . . . . . . . . . . 23
2.1.3 Distribuição em intervalos de classes . . . . . . . . . . . . . . . . . . 24
2.1.4 Propriedades das medidas de posição . . . . . . . . . . . . . . . . . . 25
2.2 Medidas de Dispersão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.2.1 Medidas de dispersão para dados agrupados . . . . . . . . . . . . . . 27
2.2.2 Propriedades das medidas de dispersão . . . . . . . . . . . . . . . . . 28
2.3 Outras medidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.3.1 Boxplot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.4 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

3 Análise bidimensional 40
3.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
3.2 Coeficientes de contingência . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.3 Coeficiente de correlação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.4 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

2
4 Probabilidade 49
4.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
4.2 Probabilidade condicional e independência. . . . . . . . . . . . . . . . . . . 51
4.3 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

5 Variáveis Aleatórias Discretas 60


5.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
5.2 Modelos probabilı́sticos para variáveis aleatórias discretas . . . . . . . . . . 63
5.3 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

6 Variáveis aleatórias contı́nuas 72


6.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
6.2 Valor esperado e variância . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
6.3 Modelos probabilı́sticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
6.3.1 Distribuição Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
6.3.2 Algumas caracterı́sticas da distribuição Normal . . . . . . . . . . . . 76
6.3.3 Uso da tabela da Normal padrão . . . . . . . . . . . . . . . . . . . . 77
6.4 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

7 Distribuições Amostrais 84
7.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
7.2 Distribuição Amostral da Média . . . . . . . . . . . . . . . . . . . . . . . . 86
7.3 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90

8 Intervalos de Confiança 93
8.1 Intervalos de confiança para a média populacional . . . . . . . . . . . . . . . 93
8.1.1 σ 2 conhecido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
8.1.2 σ 2 desconhecido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
8.2 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98

A Notação de Somatório 103


A.1 Definições . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
A.2 Somatório duplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
A.3 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104

B Respostas de alguns exercı́cios selecionados 108

C Tabelas e formulários 115

3
1 Análise Exploratória de dados

1.1 Introdução
A Estatı́stica é a parte da ciência que tem por objetivo

• a coleta, redução, análise e modelagem de dados “parciais” (amostra);

• fazer inferências para o conjunto total de dados (população).

Os dados podem ser obtidos por


observação: quando o pesquisador não pode controlar as caracterı́sticas de interesse;
experimentos: quando o pesquisador controla parcialmente as caracterı́sticas de interesse.

Exemplo 1.1 Suponha que se deseja estudar a relação entre os gastos de consumo e a
renda de um determinado grupo de indivı́duos. Uma pesquisa pode constar da escolha, por
sorteio, de alguns indivı́duos do grupo e da coleta das informações sobre as caracterı́sticas
de interesse nestes indivı́duos.

Exemplo 1.2 Deseja-se comparar duas variedades de cana de açúcar, com respeito a um
tipo de adubação. São escolhidos dois nı́veis de adubo (“ausente”, “presente”, por exemplo)
e algumas mudas de cada uma das variedades são plantadas sob cada um destes nı́veis.

No primeiro exemplo, o pesquisador apenas observa as caracterı́sticas de interesse nos


indivı́duos sorteados, e no segundo exemplo, ele controla uma das caracterı́sticas: o nı́vel
de adubo utilizado no experimento. Em ambos os casos, os dados estão sujeitos a variações
do “acaso”, ou seja, podem ser afetados por condições qua não podem ser controladas ou
observadas.
Por meio de uma análise de dados, busca-se uma forma de regularidade ou padrão, ou
modelo, presente nas observações.
Dados = modelo + resı́duos (D=M+R)
Os resı́duos (ou erros) são a diferença entre as observações e o modelo proposto.
A Análise Exploratória de Dados ( EDA ) é um conjunto de técnicas que busca estabele-
cer a melhor relação D=M+R para um particular conjunto de dados.

Algumas definições importantes:

1. variável: é uma caracterı́stica qualquer do objeto em estudo. Pode ser classificada


como

• variável qualitativa quando apresenta como possı́veis realizações uma qualidade


ou atributo do objeto em estudo;

4
• variável quantitativa - quando apresenta como possı́veis realizações, números
resultantes de uma contagem ou mensuração.

As variáveis qualitativas podem ainda ser divididas em: variáveis qualitativas nominais,
se não existe nenhuma ordem em suas possı́veis realizações ou variáveis qualitativas
ordinais, se existir uma ordem em suas possı́veis realizações.
As variáveis quantitativas podem ainda ser divididas em: variáveis quantitativas dis-
cretas, se seus possı́veis valores formam um conjunto finito ou enumerável ou variáveis
quantitativas contı́nuas, se seus possı́veis valores formam um intervalo ou união de
intervalos de números reais.

Esquematicamente, podemos representar a divisão das variáveis por

NOMINAL
QUALITATIVA
% ORDINAL
VARIÁVEL
& DISCRETA
QUANTITATIVA
CONTÍNUA

2. população: é um conjunto de indivı́duos (ou objetos) tendo pelo menos uma variável
comum observável e que é alvo do estudo.

3. amostra: é qualquer subconjunto da população.

Exemplo 1.3 Na Tabela 1.1, apresentamos os resultados fornecidos por 50 alunos da disci-
plina Estatı́stica Básica, turmas T01 e T02, do segundo semestre de 1999. As variáveis TV
e Ex.Fis correspondem ao número médio de horas gastas por semana assistindo TV e pra-
ticando exercı́cios fı́sicos, respectivamente. A variável OpTV é a opinião sobre a qualidade
da programação da TV (B: Boa, M: Média, R: Ruim e N: Não sabe). A variável Ativ. é o
nı́vel de atividade fı́sica, construı́da da seguinte maneira: sedentário: se o estudante pratica
no máximo 2 horas de exercı́cios fı́sicos semanais; médio: se pratica mais de 2 e menos de 6
horas semanais e ativo: se pratica 6 ou mais horas semanais. Classifique cada uma destas
variáveis.

1.2 Apresentação dos dados


Distribuição de Freqüências: Ao estudar uma variável, o principal interesse do pesquisador
é, em geral, conhecer a distribuição desta variável através dos seus valores. Podemos repre-
sentar a distribuição dos valores de uma variável utilizando uma tabela de freqüências da
forma:

5
Tabela 1.1
Aluno Sexo Idade Altura Peso Fumante? TV OpTV Ex.F. Ativ. N o irmãos Religião
1 M 20 1,75 68,0 N 10 M 2 S 1 Católica
2 F 18 1,65 53,5 N 5 R 5 M 1 Outra
3 F 20 1,65 51,0 N 3 R 5 M 3 Evangélica
4 F 21 1,70 68,0 N 3 R 2 S 0 Católica
5 F 19 1,75 87,0 N 20 B 5 M 2 Católica
6 F 18 1,65 51,0 N 3 R 2 S 0 Evangélica
7 M 17 1,70 64,0 N 4 R 6 A 1 Evangélica
8 M 21 1,74 63,5 N 0 N 0 S 5 Nenhuma
9 M 19 1,64 54,3 N 18 B 2 S 0 Católica
10 M 20 1,79 77,0 N 14 B 3 M 0 Nenhuma
11 M 18 1,70 53,0 N 2 R 3 M 2 Evangélica
12 M 21 1,76 69,0 N 2 R 1 S 0 Católica
13 M 18 1,73 66,0 N 6 M 4 M 4 Católica
14 F 20 1,62 56,0 N 3 R 0 S 2 Católica
15 M 20 1,73 65,0 N 2 R 0 S 8 Católica
16 F 20 1,74 58,0 N 9 M 2 S 1 Católica
17 F 19 1,65 67,0 N 4 R 0 S 1 Evangélica
18 M 18 1,85 80,0 N 3 R 0 S 1 Católica
19 M 21 1,77 66,0 N 2 R 0 S 2 Católica
20 M 20 1,67 64,0 N 1 R 10 A 1 Nenhuma
21 F 20 1,65 59,0 N 8 M 2 S 1 Católica
22 M 20 1,66 56,0 N 3 R 0 S 3 Outra
23 F 19 1,60 52,0 N 6 M 2 S 2 Católica
24 F 19 1,60 45,0 N 15 B 2 S 1 Católica
25 M 19 1,83 70,0 N - - 2 S 1 Nenhuma
26 M 19 1,70 70,0 N 23 B 6 A 0 Católica
27 F 23 1,58 58,0 N 2 R 2,5 M 2 Nenhuma
28 M 21 1,87 76,0 N 22 B 2 S 1 Outra
29 F 21 1,58 51,0 N 20 M 2 S 4 Católica
30 M 26 1,82 75,0 N 5 B 3 M 4 Outra
31 F 29 1,60 52,0 N 20 R 0 S 2 Nenhuma
32 M 23 1,82 72,0 N 5 B 2 S 0 Católica
33 M 20 1,83 85,0 N 14 B 2 S 3 Católica
34 M 50 1,68 71,0 N 15 B 5 M 3 Católica
35 M 23 1,77 82,5 N 15 B 2 S 2 Católica
36 F 21 1,69 53,0 N 10 M 2 S 1 Católica
37 M 20 1,83 - N 6 N 2 S 1 Católica
38 M 20 1,76 74,0 N 0 N 6 A 4 Nenhuma
39 M 23 1,81 85,0 N 1 R 0 S 1 Evangélica
40 F 20 1,63 57,5 N 2 B 0 S 2 Nenhuma
41 M 32 1,85 87,5 S 15 R 2 S 1 Nenhuma
42 M 20 1,70 60,0 S 3 B 3 M 3 Nenhuma
43 F 19 1,70 78,0 N 14 R 4 M 0 Evangélica
44 M 20 1,82 80,0 N 1 R 1 S 2 Outra
45 M 19 1,82 55,0 N 20 B 0 S 2 Católica

6
Tabela 1.2 Tabela de freqüências
Variável Freqüência (ni ) Proporção (fi ) Porcentagem (%)
nı́vel 1 n1 f1 100 × f1
nı́vel 2 n2 f2 100 × f2
.. .. .. ..
. . . .
nı́vel k nk fk 100 × fk
Total n = n1 + n2 + . . . + nk 1 = f1 + . . . + fk 100

em que

• n é o número total de observações do conjunto;

• k é o número de nı́veis da variável em questão;

• i é o ı́ndice que indica o nı́vel da variável;

• ni é o número de observações para o nı́vel i da variável;

• fi = ni /n é a proporção de casos no nı́vel i da variável.

Exemplo 1.4 Representar as variáveis “Religião” e “Nı́vel de atividade fı́sica” em tabelas


de freqüência.

Tabela 1.3 Distribuição de freqüências: “Religião ” .

Religião freqüência (ni ) proporção(fi ) %


Católica 23 0,51 51%
Evangélica 7 0,16 16%
Nenhuma 10 0,22 22%
Outras 5 0,11 11%
Total 45 1.00 100%

Tabela 1.4 Distribuição de freqüências:“Nı́vel de atividade fı́sica”.

Atividade freqüência (ni ) proporção (fi ) %


Ativo 4 0.09 9%
Médio 11 0.24 24%
Sedentário 30 0.67 67%
Total 45 1.00 100%

Exemplo 1.5 Representar as variáveis “Nı́vel de atividade fı́sica” e “Sexo” em uma mesma
tabela de freqüências (Distribuição Conjunta).

7
Tabela 1.5 Distribuição conjunta: Nı́vel de atividade fı́sica por Sexo

Sexo
Atividade Feminino Masculino Total
Ativo 0 4 4
Médio 5 6 11
Sedentário 12 18 30
Total 17 28 45

Exemplo 1.6 Representar a variável “Peso” utilizando uma tabela de freqüências. Neste
caso, vamos criar um artifı́cio para representar esta variável em uma tabela de freqüências.
Os nı́veis das variáveis serão representados por intervalos de classe. Vejamos:

Tabela 1.6 Distribuição de freqüências: “Peso (kg)”

Classe xi ni fi %
45 ` 55 50 10 0.23 23%
55 ` 60 57,5 7 0.16 16%
60 ` 70 65 11 0.25 25%
70 ` 80 75 9 0.20 20%
80 ` 90 85 7 0.16 16%
Total – 44 1 100%

em que

• xi é o ponto médio do intervalo ( representa agora o valor da variável naquele intervalo);

• ni é a freqüência de cada classe.

Note que um dos alunos não informou o peso e utilizamos o total de 44 alunos para obter
a freqüência relativa.

1.3 Gráficos
Uma outra forma de se apresentar os dados é por meio da utilização de Gráficos.

1.3.1 Representação gráfica das variáveis qualitativas


Existem vários tipos de gráficos que podem ser utilizados para representar as variáveis qual-
itativas. Para construir estes gráficos, consideraremos as freqüências com que os nı́veis das
variáveis aparecem em um conjunto de dados.

8
Gráfico de Barras
É um dos gráficos mais utilizados para representar variáveis qualitativas. Algumas ob-
servações devem ser feitas sobre este gráfico.

1. O gráfico tem apenas uma escala, a que representa a freqüência ou porcentagem em


cada nı́vel da variável;

2. A largura da barra utilizada não tem nenhum significado especial além do apelo visual;

3. Para facilitar a compreensão e análise, é preferı́vel que as barras sejam apresentadas


segundo uma ordem sistemática. O critério mais utilizado é ordená-las por sua mag-
nitude;

4. As barras devem ser colocadas, de preferência, no sentido horizontal pois desta forma
o nome dos nı́veis da variável podem ser melhor visualizados.

5. É preferı́vel utilizar freqüências quando estivermos representando subdivisões dos nı́veis


das variáveis.

6. Para representar a participação em porcentagem de cada subnı́vel de uma variável,


é recomendável a utilização de barras representando 100% das observações em cada
nı́vel.

Exemplo 1.7 Fazer um gráfico de Barras para a variável “Religião ” cujos valores encontram-
se na Tabela 1.3.

Exemplo 1.8 Representar graficamente a tabela conjunta das variáveis “Nı́vel de atividade
fı́sica” e “Sexo”(Tabela 1.5). Fazer em sala de aula.

9
Gráfico de Setores
É também um gráfico bastante utilizado para representar variáveis qualitativas. É muitas
vezes chamado de Gráfico de Torta ou Gráfico de pizza. Neste gráfico, um cı́rculo representa
100% das observações e cada nı́vel da variável é representado por um setor de área propor-
cional à freqüência observada. Algumas observações podem ser feitas a respeito da construção
do gráfico.

1. Não é um gráfico recomendado quando se quer representar subdivisões dos nı́veis da


variável;

2. Não é recomendado quando o número de nı́veis da variável é muito grande.

Exemplo 1.9 Em recente pesquisa em uma pequena comunidade do interior de Minas


Gerais, foram ouvidos 600 homens e 400 mulheres sobre o consumo de álcool. Entre os
entrevistados, cerca de 400 homens consumiam bebidas alcóolicas sendo que 80% destes be-
biam regularmente e o restante apenas eventualmente. Entre as mulheres, embora a maioria
(70%) consumissem bebidas alcóolicas apenas 120 o faziam regularmente. Representar estas
informações em uma tabela de freqüências e depois colocá-las em um gráfico de colunas
(Figura 1) e em um gráfico de setores (Figura 2).

Tabela 1.7 “Consumo de bebidas: Exemplo 1.9”


Sexo Não bebe Bebe eventualmente Bebe regularmente Total
Masculino 200 80 320 600
Feminino 120 160 120 400
Total 320 240 440 1000

1.3.2 Representação gráfica das variáveis quantitativas

Gráfico de linhas
É o mais comum dos gráficos e um dos mais simples, representando os nı́veis das variáveis
em coordenadas retangulares. Observação sobre a construção do gráfico:
• É um gráfico particularmente útil para representar séries de tempo. O tempo é repre-
sentado no eixo X e a série no eixo Y .

• É comum representar-se mais de uma série no mesmo gráfico.

Exemplo 1.10 Faça um gráfico de linhas representando as séries abaixo.

Mes Jan Fev Mar Abr Mai Jun Jul


INPC 28.8 24.8 27.5 28.3 26.8 30.3 31.0
IRSM 27.9 25.8 26.8 28.2 28.4 30.5 29.2

10
Figura 1: Gráfico de setores: Exemplo 1.9

Figura 2: Gráfico de barras: Exemplo 1.9

11
Figura 3: Gráfico de linhas: Exemplo 1.10

Figura 4: Gráfico de colunas: Exemplo 1.10

Gráfico de colunas
Neste gráfico, os nı́veis das variáveis são também representados por barras, só que verti-
cais. É, em geral, utilizado para representar séries de tempo. Observações sobre a construção
do gráfico:

1. As duas escalas estão presentes, no eixo X representamos o tempo e no eixo Y os nı́veis


da variável;

2. Pode ser utilizado para representar mais de uma série. Neste caso as colunas aparecem
juntas.

Exemplo 1.11 Vamos representar os dados da tabela anterior por um gráfico de colunas.

12
1.3.3 Gráficos especiais

O histograma
O histograma é um gráfico que representa números pela área e não pela altura. É
utilizado, em geral, para representar distribuições de variáveis contı́nuas quando os dados
estão agrupados em classes de freqüência. Embora tenha a aparência de um gráfico de
colunas, não deve ser confundido com ele.
Podemos construir histogramas de freqüências, de proporção ou de porcentagem. A
distribuição nas diversas classes é representada por blocos construı́dos da seguinte forma,

• a base do bloco é o comprimento do intervalo de classe;

• a altura do bloco é a densidade, de freqüência, de proporção ou de porcentagem, na


classe.

A densidade na classe i é definida por


ni
di = , no caso de freqüências,
4i
fi
di = , no caso de proporção,
4i
100 × fi
di = , no caso de porcentagem,
4i
em que 4i representa o comprimento do intervalo da i-ésima classe.
Observações:

• A área do bloco obtido é a quantidade representada naquela classe.

• A área total do histograma representa 100% das observações. Logo, a área total de um
histograma de freqüências é igual a n, a de um histograma de proporção é igual a 1 e
a de um histograma de porcentagem é igual a 100%.

• A área entre dois valores quaisquer fornece uma aproximação para a freqüência (ou
proporção ou porcentagem) no intervalo limitado por eles.

• O número de intervalos de classes e sua amplitude são arbitrários e dependem do


conjunto de dados em questão. É comum, no entanto, encontrar a seguinte fórmula
para o número ideal de classes, K:

K = 1 + log2 n ( Fórmula de Sturges).

Uma vez determinado o valor de K, divide-se a amplitude total pelo número K, para
obter o comprimento dos intervalos das classes. Observe que neste caso, obtemos todas
as classes com a mesma amplitude, o que nem sempre é conveniente.

13
Polı́gono de Freqüências
O polı́gono de freqüências é construı́do de forma semelhante a do histograma. Une-se
o ponto médio das classes na altura determinada pela densidade. Para fechar o polı́gono
unimos os extremos da figura com o eixo das abcissas, nos quais estariam os pontos médios
de uma classe imediatamente anterior e outra imediatamente posterior. Embora a área total
abaixo do polı́gono de freqüências também seja igual a 100% das observações, não podemos
aproximar a freqüência entre dois pontos pela área delimitada por eles.

Histograma Alisado
Se houvesse um número suficientemente grande de observações poder-se-ia ir diminuindo
os intervalos de classe e o histograma iria ficando cada vez menos irregular ate atingir um
caso limite, com uma curva bem mais suave. Esta curva é chamada de histograma alisado.

Ogiva
É o gráfico representativo de uma distribuição acumulada de freqüências e consta de uma
poligonal ascendente. No eixo horizontal colocam-se as extremidades de classe e no eixo
vertical, as freqüências acumuladas (ou proporção acumulada, ou porcentagem acumulada).

Ramo e folhas
A forma de uma distribuição é uma caracterı́stica importante de um conjunto de dados.
Um procedimento alternativo para resumir um conjunto de dados, com o objetivo de se ter
uma idéia da forma da distribuição é o ramo-e-folhas. Uma vantagem do ramo-e-folhas sobre
o histograma é que não perdemos informações sobre os dados.
Observações sobre a construção de um ramo-e-folhas

1. Não existe regra fixa para a construção de um ramo-e-folhas. A idéia básica é dividir
cada observação em duas partes: a 1a , o ramo, é colocada à esquerda de uma linha
vertical; a 2a , a folha, é colocada à direita desta linha.

2. Todos os ramos devem ter o mesmo comprimento.

3. Se ao fazer uma escolha de ramos obtivermos ramos muito carregados, podemos fazer
uma sub-divisão neles.

1.4 Exercı́cios
1.1 As áreas dos vários continentes do mundo, em milhões de quilômetros quadrados, estão
apresentadas na tabela abaixo:

14
Continente Área
África 30,3
Ásia 26,9
Europa 4,9
América do Norte 24,3
Oceania 8,5
América do Sul 17,9
URSS 20,5
TOTAL 133,3

Represente graficamente os dados.

1.2 A tabela seguinte mostra a população estimada, rural e urbana, para o Brasil, em
milhões de pessoas, de acordo com a Fundação IBGE

Ano 1972 1973 1974 1975 1976 1977 1978 1979


População urbana 56,6 59,0 61,5 64,1 66,7 69,5 72,3 75,2
População rural 42,1 12,4 42,7 43,1 43,4 43,8 44,1 44,5

Construa um gráfico que mostre a porcentagem das pessoas que são,


a) residentes da zona urbana; b) residentes da zona rural.

1.3 A tabela seguinte mostra as áreas, em milhões de quilômetros quadrados, dos oceanos.
Represente graficamente os dados, utilizando

a) um gráfico de barras; b) um gráfico de setores.

Oceano Pacı́fico Atlântico Índico Antártico Ártico


Área 183,4 106,7 73,8 19,7 12,4

1.4 Os conjuntos de dados 1, 2, 3 e 4 (Seção 1.5: apêndice no final desta seção) referem-se
à idade de ingresso na Universidade X e altura de estudantes segundo o sexo. Para cada um
deles:

a) Construa um Ramo-e-folhas.
b) Com base no Ramo-e-folhas, construa o histograma, escolhendo apropriadamente os
intervalos de classe.

1.5 Com base nos histogramas dos grupos 1 a 4, obtenha para cada um dos nı́veis da
variável sexo:

15
a) a porcentagem de estudantes com menos de 18 anos;
b) a porcentagem de estudantes com no mı́nimo 19 anos;
c) a altura abaixo da qual se encontra 90% dos estudantes;
d) a altura mı́nima dos 20% dos alunos mais altos.
1.6 Com base nos Ramo-e-folhas, responda as mesmas perguntas da questão 2 e compare
as respostas.

1.7 É possı́vel afirmar, com base nos gráficos, que existe diferença entre as distribuições de
alturas dos estudantes com relação ao sexo? E entre as distribuições de idades de ingresso
na Universidade X?

1.8 Os dados do conjunto 5 (Seção 1.5) referem-se à populações de alguns municı́pios do


estado Y.
a) Construa um ramo-e-folhas e um histograma para este conjunto.
b) Comente sobre as principais caracterı́sticas da distribuição.
1.9 Os dados dos conjuntos 6 e 7 (Seção 1.5) referem-se aos tempos de vida de lotes de
lâmpadas de duas companhias concorrentes A e B.
a) Construa um ramo-e-folhas para cada um dos conjuntos.
b) Comente sobre as principais diferenças entre as distribuições.
c) Você seria capaz de se decidir por uma das companhias, caso tivesse que adquirir um
lote de lâmpadas? Por quê?
1.10 Os dados dos conjuntos 8 e 9 (Seção 1.5) referem-se ao ganho de peso de alguns
animais que foram alimentados com as rações A e B, por um determinado tempo.
a) Construa um ramo-e-folhas para cada um dos conjuntos.
b) Comente sobre as principais diferenças entre as distribuições.
c) Você seria capaz de se decidir por uma das rações, caso fosse chamado a opinar sobre
o assunto?
1.11 O histograma abaixo representa a distribuição dos frangos de uma determinada granja
em relação ao peso:

16
Queremos dividir os frangos em quatro categorias com relação ao peso, de modo que:
Os 20% mais leves sejam da categoria D;
Os 25% seguintes sejam da categoria C;
Os 25% seguintes sejam da categoria B;
Os 30% seguintes sejam da categoria A.
Quais os limites de peso entre as categorias A, B, C e D?

1.12 Em uma pesquisa em uma pequena comunidade dos Estados Unidos, foram observadas
as seguintes distribuições:

a) altura dos adultos casados;


b) altura de todos os membros de famı́lias cujos pais tem idade inferior a 30 anos;
c) altura de todos os membros da comunidade;
d) altura de todos os automóveis da cidade.
Cada um dos histogramas abaixo refere-se a uma das distribuições acima. Associe cada
um deles à distribuição que ele melhor representa.

17
1.5 Conjuntos de dados

CONJUNTO 1: Idade (anos completos) - Sexo Feminino.

27 22 19 18 21 17 19 20 16 18 18 18 18 20 22 18 19 18 19 19
20 19 20 20 18 21 18 20 22 19 19 22 23 18 29 19 17 20 19 18
18 20 19 20 18 24 18 19 21 24

CONJUNTO 2: Altura (cm) - Sexo Feminino

167 168 155 174 161 160 153 163 168 155 169 162 166 159 165 154 160
160 163 169 171 160 164 154 160 157 163 160 169 163 158 170 156 164
162 164 161 172 160 168 158 166 161 161 165 164 155 168 161 151

CONJUNTO 3: Idade (anos completos) - Sexo Masculino.

17 19 19 21 18 17 18 21 17 17 20 18 16 18 17 18 20 19 19 17
18 17 22 17 26 17 32 22 17 17 19 17 26 18 20 18 20 17 16 19
17 18 20 24 17 21 17 17 17 17 22 21 19 17 20 17 20 20 17 18
17 20 17 18 17 20 21 17 20 17 21 17 17 18 19

CONJUNTO 2: Altura (cm) - Sexo Masculino.

171 172 166 167 177 158 175 169 178 176 170 163 175 173 179 171 167
172 170 171 167 172 161 174 179 163 177 177 170 174 165 173 167 169
180 183 172 158 173 172 177 173 174 167 165 175 170 174 186 169 165
174 170 175 173 161 178 180 172 170 173 176 172 172 168 176 175 157
157 175 158 179 166 166 167

CONJUNTO 5: População - Municı́pios do Estado do Rio de Janeiro.

42886 50910 9034 32096 33025 35136 42530 30648 29864 21156
32411 31471 40392 46580 39257 29547 29942 32997 60666 35823
37527 240484 43620 39402 42215 317483 25772 39302 51822 48413
36772 35930 35230 40299 48245 29436 29650 54858 52619 40055
29089 27389 41352 42624 46355 61400 31121 34663 33037 38945
46253 36228 36348 53659 55199 41738 39426 32494 31818 34208
34807 40069 49530 49467 43308 33088 21762 31027 27647 33629

18
CONJUNTO 6: Duração das lâmpadas - Companhia A

783 1361 2385 159 1614 497 1334 3694 672 2254
1415 1035 1372 109 1895 1526 2569 1005 937 2873
646 1358 1806 785 1810 1091 1563 3178 1341 173
927 881 1471 191 1066 1976 1237 2082 4096 4171
1274 4240 11922 2266 2686 912 3025 1228 832 1617

CONJUNTO 7: Duração das lâmpadas - Companhia B.

3832 743 1616 4002 5606 722 4203 2069 3790 1819
613 310 4449 2711 2398 2445 3767 5290 1963 2085
586 972 1503 4046 2426 3705 204 1308 11848 1315
2518 626 3036 1811 4060 1392 3684 5810 2323 2221
622 3595 1745 1825 1215 2556 3653 1567 3006 1964

CONJUNTO 8: Ganho de Peso (kg) - Ração A.

26 30 65 43 27 28 31 28 30 33 60 34 26 32 34 35 29 27 29 34
27 31 66 44 28 29 32 29 31 34 61 35 27 33 35 36 30 28 30 35

CONJUNTO 8: Ganho de Peso (kg) - Ração B.

26 4 35 38 43 43 41 36 9 40 37 42 34 42 39 39 35 35 41 40
25 3 34 37 42 42 40 35 8 39 36 41 33 41 38 38 34 34 40 39

19
2 Medidas Associadas a Variáveis Quantitativas
2.1 Medidas de Posição
A redução dos dados provenientes da observação de uma variável quantitativa por meio do ramo-
e-folhas ou tabelas de frequências pode fornecer mais informações sobre o comportamento desta
variável do que a própria série original de dados. Nesta seção, apresentaremos alguns valores, as
medidas de tendência central, ou medidas de posição, que são representativos da série toda. As
medidas de posição são quantidades que dão uma idéia da localização do conjunto de valores.

Moda
Representada por M o, a moda é definida como a realização mais freqüente de um conjunto de
dados. Por exemplo,

• Conjunto A: 1, 2, 2, 2, 3, 4, 5. A moda é o valor 2.

• Conjunto B: 1, 2, 3, 4, 5. O conjunto não tem uma moda (é amodal)

• Conjunto C: 1, 1, 2, 2, 3, 4. O conjunto tem duas modas, os valores 1 e 2. Dizemos que o


conjunto é bimodal

Quando um conjunto apresenta mais de 2 modas, dizemos que ele é multimodal.

Mediana
Representada por M d, a mediana é definida como sendo a realização que ocupa a posição central
de uma série de observações quando estas estão ordenadas segundo suas grandezas (ordem crescente
ou decrescente). A mediana deixa 50% da distribuição abaixo dela e 50% acima. Por exemplo,

• Conjunto D: 10, 20, 30, 40, 50. A mediana é o valor que ocupa a terceira posição, isto é,
M d = 30.

• Conjunto E: 1, 2, 3, 4, 5, 6. A mediana é o ponto médio entre os dois valores que ocupam a


posição central, isto é, M d = (3 + 4)/2 = 3.5.

De um modo geral, se o número n de observações no conjunto é ı́mpar, então a mediana é o valor


que ocupa a posição (n + 1)/2; se n é par, então a mediana é o ponto médio entre os valores que
ocupam as posições n/2 e (n/2) + 1. Lembre-se que é necessário ordenar o conjunto para identificar
a posição da mediana.

Média Aritmética
Representada por M e ou por x̄, a média aritmética é definida como sendo a soma de todas as
observações dividida pelo número delas.
Por exemplo, a média aritmética do conjunto A acima é:
1+2+2+2+3+4+5
Me = = 19/7 = 2, 714
7

20
De um modo geral, se x1 , x2, x3, . . . , xn são observações da variável X, então a média aritmética
desses valores é dada por:
Pn
x 1 + x2 + x3 + . . . + x n i=1 xi
M e(X) = =
n n
A Média Geométrica
Se x1, x2, . . . , xn são valores positivos, podemos definir sua média geométrica, dada por

n
Mg = x1 × x 2 × · · · × x n

A média geométrica de um conjunto de valores é sempre menor ou igual a média aritmética


deste mesmo conjunto. É muito utilizada para encontrar taxas médias.

Média Harmônica
A média harmônica H de um conjunto de valores x1 , x2, . . . xn positivos, é definida como sendo
o inverso da média aritmética dos inversos dos valores, isto é,
n
H=P
n 1
i=1 xi

Observação. As medidas vistas acima são também chamadas medidas de tendência central. A
média aritmética é talvez a mais utilizada entre todas elas podendo, contudo, conduzir a erros
de interpretação quando a utilizamos como medida de posição central. Em muitas situações, a
mediana é um valor mais adequado.

2.1.1 Outras medidas de posição


Quantil
Os quantis são quantidades que dividem a distribuição de valores em grupos do mesmo tamanho.
Os quantis mais comuns recebem nomes especiais. São eles: os quartis, os decis e os percentis.

• Quartil Os quartis são quantis que dividem a distribuição em quatro partes de mesmo
tamanho. Assim, o primeiro quartil (Q1 ) deixa um quarto das observações abaixo dele e três
quartos acima, o segundo quartil (Q2 = Md ) deixa metade dos valores abaixo dele e metade
acima e o terceiro quartil (Q3) deixa três quartos dos valores abaixo dele e um quarto acima.
Uma forma simples de encontrar os quartis é a seguinte: primeiramente, encontramos a
mediana e separamos as observações em dois grupos do mesmo tamanho. Se o número de
observações for ı́mpar, incluı́mos a mediana nos dois grupos. Depois, encontramos a mediana
do primeiro grupo, que será o Q1 e a mediana do segundo grupo, que será o Q3.

• Decil Os decis são quantis que separam a distribuição de valores em 10 grupos do mesmo
tamanho.

21
• Percentil - O percentil de ordem 100p de um conjunto de valores dispostos em ordem
crescente é um valor tal que pelo menos (100p)% das observações são menores ou iguais a ele
e pelo menos 100(1 − p)% são maiores ou iguais a ele. O percentil de ordem 50% é a mediana.
Esta definição pode ser formalizada como segue

(100p)% das observações ≤ P100p,


e 100(1 − p)% das observações ≥ P100p

Veja que P10 = D1, . . . , P90 = D9 e também que P25 = Q1, P50 = Q2 = M d e P75 = Q3.

Exemplo 2.1 Determine os percentis de ordem 30 e 75 do seguinte conjunto:

X = {34, 43, 46, 58, 63, 63, 66, 68, 71, 72, 73, 73, 75, 76, 82, 83, 86, 90, 91, 93, 95, 98, 98, 99}

Temos 24 observações. O percentil de ordem 30 deixa 0, 3 × 24 = 7, 2 (ou seja, 8) observações


abaixo dele (ele incluı́do) e 0, 7 × 24 = 16, 8 (ou seja, 17) acima. Encontramos: P30 = 68.
O percentil de ordem 75 deixa 0, 75 × 24 = 18 observações abaixo dele (ele incluı́do) e
0, 25 × 24 = 6 acima. Vemos então que o percentil é um valor entre 90 e 91. Neste caso,
convenciona-se considerar o ponto médio entre os dois valores como o percentil procurado, o
que nos dá: P75 = (90 + 91)/2 = 90.5.

Observações

• Os quantis são medidas resumo que fazem sentido quando o número de observações é grande.
No exemplo 2.1 acima, queremos separar um grupo de 24 observações em 100 grupos do
mesmo tamanho, o que não resume nada, apenas ilustra o cálculo desta quantidade.

• A definição de quantil para dados não agrupados não é padronizada e é comum encontrarmos
várias formas distintas de obter estes valores. Uma outra forma de cálculo, que pode fornecer
valores distintos dos quantis obtidos com a definição anterior para o mesmo conjunto de dados,
é a seguinte: a posição k do quantil desejado no conjunto de valores é dada por:

s(n + 1)
k= ,
r
em que r é o quantil desejado e s é a ordem do quantil. Quando k não for um valor inteiro,
ele pode ser aproximado para o inteiro mais próximo ou então encontra-se o quantil por meio
de interpolação linear. Então,

Quantil r s
Quartil 4 {1,2,3}
Decil 10 {1,2,3,. . . ,9}
Percentil 100 {1,2,. . . , 99 }

Exemplo 2.2 Calcule Q1, Q2 e Q3 para os dados do Exemplo 2.1 pelos dois métodos e
compare os resultados.

22
Pelo primeiro método, encontramos a mediana (Q2 ) pelo ponto médio dos dois valores cen-
trais: (73+75)/2 = 74. Depois, as medianas das duas metades, que também tem um número
par de observações. Então, Q1 = (63 + 66)/2 = 64.5 e Q3 = (90 + 91)/2 = 90, 5. Note que
Q3 coincidiu com o percentil de ordem 75 do exemplo anterior.
Pelo segundo método, localizamos a posição do primeiro quartil = 1 × (24 + 1)/4 = 6, 25 e
aproximamos para o inteiro mais próximo, 6. Logo, o primeiro quartil é a observação de ordem
6, que é 63. A posição do terceiro quartil é 3 × (24 + 1)/4 = 18, 75, que aproximamos para
19. Logo, o terceiro quartil é dado por 91. A posição da mediana é dada por 2 × 25/4 = 12, 5
e encontramos a mediana pelo ponto médio das observações de posição 12 e 13.

2.1.2 Medidas de posição para dados agrupados


Distribuições de Freqüências

Imagine agora que os dados para os quais desejamos encontrar as medidas de posição estejam
colocados na forma de uma tabela de freqüências, como segue,

i xi ni fi fi acumulada
1 x1 n1 f1 f1
2 x2 n2 f2 f1 + f 2
..
.
k xk nk fk f1 + f 2 + · · · + f k = 1
Total n 1 –
Todas as medidas de posição tem a mesma definição do caso de dados não agrupados. A moda
e a mediana são calculadas da mesma forma, isto é,

Moda: é o valor de xi que corresponde ao maior valor de ni ou o maior valor de fi .


Mediana: é o primeiro valor com freqüência relativa acumulada maior ou igual a 50%.

No caso da média aritmética, podemos usar a informação da tabela para simplificar os cálculos.
O exemplo a seguir ilustra a situação.
Considere o seguinte conjunto de valores:
Conjunto F: 1, 2, 2, 2, 3, 3, 3, 3, 4, 4. Observe que o 2 aparece 3 vezes, o valor 3 aparece 4 vezes
e o valor 4 aparece 2 vezes no conjunto. A média aritmética é,
1+2+2+2+3+3+3+3+4+4 1+3×2+4×3+2×4 27
Me = = = = 2, 7. (1)
10 10 10
Os dados do conjunto F poderiam estar resumidos na seguinte tabela
i xi ni fi fi acumulada xi fi
1 1 1 0, 1 0, 1 0,1
2 2 3 0, 3 0, 4 0,6
3 3 4 0,4 0,8 1,2
4 4 2 0,2 1,0 0,8
Total n 1 – 2,7

23
A última coluna foi incluı́da para mostrar como a conta (1) poderia ter sido feita.
De um modo geral, temos que a média aritmética para um conjunto de dados agrupados em
uma tabela de freqüências é,
Pk k
xi ni X
Me = x̄ = i=1 = xi fi .
n i=1

2.1.3 Distribuição em intervalos de classes


Ao contrário da distribuição simples de freqüências, quando as observações estão agrupadas em
intervalos de classes, não se pode recuperar toda a informação do conjunto original. Desta forma,
as medidas de posição calculadas a partir destas distribuições são apenas aproximações para as
medidas do conjunto original.
Considere a seguinte distribuição,

Classe xi ni fi fi acumulada
l1 ` L 1 x1 n1 f1 f1
l2 ` L 2 x2 n2 f2 f1 + f 2
..
.
lk ` L k xk nk fk f1 + f 2 + · · · + f k = 1
Total n 1 –

em que li e Li denotam os limites inferior e superior da classe i, respectivamente (em geral, li+1 =
Li );
xi é o ponto médio do intervalo da i-ésima classe, isto é,
li + Li
xi = .
2
O sı́mbolo ` indica que o limite inferior está incluı́do na classe e o limite superior não. A moda e
a média são calculadas exatamente como na distribuição simples de freqüência. No caso da média,
Pk k
xi ni X
i=1
Me = = xi fi .
n i=1
Para encontrar a mediana podemos utilizar o histograma, que fornece uma melhor aproxi-
mação neste caso. Isto é, a mediana é a observação que deixa abaixo dela uma área correspondente
a 50% da área total do histograma. Lembre-se que a área total de um histograma é igual a 1 se o
histograma é de proporção, 100% se o histograma é de porcentagem ou n se for de freqüência.
Exemplo 2.3 Vamos calcular a média aritmética e a mediana para a seguinte distribuição em
classes de freqüência. Para a mediana, vamos construir um histograma de proporção.

Classe xi ni fi xi fi fi ac. ∆i di
0 ` 3 1,5 10 0,40 0,60 0,40 3 0.133
3 ` 5 4,0 4 0,16 0,64 0,56 2 0.080
5 ` 10 7,5 5 0,20 1,50 0,76 5 0.040
10 ` 15 12,5 2 0,08 1,00 0,84 5 0.016
15 ` 25 20,0 4 0,16 3,20 1,00 10 0.016
Total 25 1,00 6,94 – – –

24
Então, a média aritmética é x̄ = 6, 94. A classe que contém a mediana é a segunda classe, pois ela
é a primeira cuja freqüência relativa acumulada ultrapassa 0,5.

Histograma

Para obter o valor da mediana, vamos procurar o valor na classe 3 ` 5, que limita uma área
igual a 0,1 entre ele e 3 (pois a classe anterior corresponde a uma área igual a 0,4). Logo,

0, 1
(Md − 3) × 0, 08 = 0, 1 ⇒ Md = + 3 = 4, 25
0, 08
O valor 0,08 que aparece acima é o valor da densidade de proporção na classe mediana que
define a altura do bloco.

Quantis Os quantis podem ser calculados de forma análoga à empregada para obtenção da mediana,
bastando determinar qual a porcentagem que deve ficar abaixo do quantil desejado.

2.1.4 Propriedades das medidas de posição


Com exceção das médias harmônica e geométrica, todas as outras medidas de posição vistas nesta
seção satisfazem as seguintes propriedades:

1. Se X = {a, a, . . ., a}, então as medidas de posição são iguais a a.

2. Se X = {x1 , x2, . . . , xn} e Y = {x1 + a, x2 + a, . . ., xn + a}, então as medidas de posição do


conjunto Y são as medidas de posição de X somadas com a. Então, M e(Y) = M e(X) + a,
Md (Y) = Md (X) + a, Q1(Y) = Q1(X) + a, etc. Isto é, se somamos uma constante a todos
os elementos de um conjunto, suas medidas de posição ficam somadas da mesma constante.

25
3. Se X = {x1 , x2, . . ., xn } e Y = {ax1, ax2, . . . , axn }, então as medidas de tendência central
do conjunto Y são as medidas de tendência central de X, multiplicadas por a. Então,
M e(Y) = aM e(X), Md (Y) = aMd (X). Se a constante a for positiva, esta propriedade é
satisfeita também pelos quantis e teremos Q1 (Y) = aQ1 (X), etc. Isto é, se multiplicamos
todos os elementos de um conjunto por uma constante positiva, suas medidas de posição ficam
multiplicadas pela mesma constante. Se a constante a for negativa, os quantis se alteram
pois a posição dos valores no grupo se altera. Mas teremos por exemplo, Q1 (Y) = aQ3 (X)
e Q3 (Y) = aQ1(X).

4. (Conseqüência de 2 e 3). Se X = {x1 , x2, . . . , xn} e Y = {ax1 + b, ax2 + b, . . ., axn + b},


com a > 0 (veja propriedade 3), então M e(Y) = aM e(X) + b, Md (Y) = aMd (X) + b,
Q1 (Y) = aQ1 (X) + b, etc.

2.2 Medidas de Dispersão


A sumarização de um conjunto de dados por meio de uma única medida representativa de tendência
central, esconde toda a informação sobre a variabilidade deste conjunto. Vejamos o exemplo
seguinte.

Exemplo 2.4 Considere os seguintes conjuntos


X= {3, 4, 5, 6, 7} X̄ = 5.0 Md = 5.0
Y= {1, 3, 5, 7, 9} Ȳ = 5.0 Md = 5.0
Z= {5, 5, 5, 5, 5} Z̄ = 5.0 Md = 5.0
W= {3, 5, 5, 7} W̄ = 5.0 Md = 5.0
V= {−20, 5, 30} V̄ = 5.0 Md = 5.0

Observe que a identificação de cada um desses conjuntos pela média ou pela mediana nada informa
sobre a variabilidade presente nos dados. Por exemplo, o conjunto V é bem mais disperso que o
conjunto Z. Surge então a necessidade de se estabelecer uma medida que nos permita comparar a
variabilidade de conjuntos de dados como os descritos acima.
O princı́pio básico de uma medida de dispersão é o de analisar os desvios das observações em
relação à uma medida de tendência central. Embora estes desvios possam ser definidos em relação
à mediana, utilizamos aqui os desvios em relação à média aritmética.

• Média dos desvios em relação à média Considerando apenas a média destes desvios,
terı́amos, para qualquer conjunto de valores
Pn
i=1 (xi − x̄)
= 0,
n
logo, esta não é uma boa medida.

• Desvio médio O desvio médio de um conjunto de valores, que denotaremos DM , é a média


das distâncias dos pontos à sua média. Isto é,
Pn
i=1 |xi − x̄|
DM (X) = .
n

26
• Variância A variância de um conjunto de valores, que denotaremos V ar, é a média dos
quadrados dos desvios em relação à média (ou do quadrado das distâncias). Isto é,
Pn
i=1 (xi − x̄)2
V ar(X) = .
n
Uma vantagem da variância em relação ao desvio médio é que sua fórmula pode ser simplifi-
cada, facilitando seu cálculo. Tem-se
Pn Pn
i=1 (xi − x̄)2 2
i=1 xi
V ar(X) = = − x̄2.
n n
• Desvio Padrão O desvio padrão de um conjunto de dados, DP , é a raiz quadrada da
variância. Tem a vantagem de ter a mesma unidade dos dados originais.
q
DP (X) = V ar(X).

• Intervalo Interquartı́lico O intervalo interquartı́lico (ou intervalo interquartil) é a diferença


entre o terceiro e primeiro quartis, isto é,

I Q = Q3 − Q1 .

• Coeficiente de Variação Algumas vezes é conveniente expressar a variabilidade de um


conjunto de dados em termos relativos. Por exemplo, um desvio padrão de 10 pode ser
insignificante se a ordem de grandeza das observações for 10.000 mas pode ser altamente
significante se a ordem de grandeza for 50. O coeficiente de variação é definido por
DP (X)
cv(X) = .

Como o desvio padrão tem a mesma unidade de medida das observações originais, o coeficiente
de variação é adimensional, o que permite a comparação de diferentes conjuntos de dados.
Note que o coeficiente de variação não está definido quando a média das observações é zero.

Exemplo 2.5 Ordene os conjuntos do Exemplo 2.4 segundo o desvio médio e segundo a variância

Conjunto DM V ar
X= {3, 4, 5, 6, 7} 1,2 2
Y= {1, 3, 5, 7, 9} 2,4 8
Z= {5, 5, 5, 5, 5} 0 0
W= {3, 5, 5, 7} 1 2
V= {−20, 5, 30} 16,67 416,67

2.2.1 Medidas de dispersão para dados agrupados


Quando os dados estão agrupados, as definições das medidas de dispersão não mudam, mas seu
cálculo pode ser bastante simplificado. No caso de dados agrupados em classes de frequências, os
valores serão aproximações dos verdadeiros, pois não há como recuperar o conjunto original. Em
ambos os casos, as fórmulas são as mesmas.
Temos:

27
• Desvio Médio Pk k
i=1 |xi − x̄|ni X
DM (X) = = |xi − x̄|fi .
n i=1

• Variância Pk k
i=1 (xi − x̄)2 ni X
V ar(X) = = (xi − x̄)2fi .
n i=1
A fórmula da variância também pode ser simplificada:
Pk k
x2i ni X
i=1
V ar(X) = − x̄2 = x2i fi − x̄2 .
n i=1

• Desvio Padrão q
DP (X) = V ar(X).

Como nas seções 2.1.2 e 2.1.3, fi denota a proporção da i-ésima classe, k denota o número de
classes e xi denota o i-ésimo valor no caso de distribuições simples de frequências ou o ponto médio
da i-ésima classe no caso de distribuições em classes de frequências.

2.2.2 Propriedades das medidas de dispersão


1. Se X = {a, a, . . ., a}, então as medidas de dispersão de X são todas iguais a zero (inclusive
o coeficiente de variação se a 6= 0).

2. Somar uma constante a todos os elementos de um conjunto: X = {x1, x2, . . . , xn}, Y =


{x1 + a, x2 + a, . . . , xn + a}.

• Desvio médio: DM (Y ) = DM (X).


• Variância : V ar(Y ) = V ar(X).
• Desvio padrão: DP (Y ) = DP (X).
• Intervalo Interquartı́lico: IQ (Y ) = IQ (X).

Estas propriedades podem ser ditas como se segue: se deslocarmos um conjunto de dados, a
sua posição relativa à média não muda uma vez que a média também se desloca.
Note que o coeficiente de variação se altera.

3. Multiplicar todos os elementos de um conjunto por uma constante X = {x1, x2, . . . , xn },


Y = {ax1, ax2, . . . , axn }.

• Desvio médio: DM (Y ) = |a|DM (X).


• Variância : V ar(Y ) = a2 V ar(X).
• Desvio padrão: DP (Y ) = |a|DP (X).
• Intervalo Interquartı́lico: IQ (Y ) = |a|IQ (X).

O que acontece com o coeficiente de variação?

28
2.3 Outras medidas
Medidas de tendência central e medidas de dispersão podem não ser adequadas para representar
um determinado conjunto de dados pois podem ser afetadas por valores extremos e muitas vezes
não dão idéia da assimetria ou forma da distribuição dos valores. Além das medidas de posição e
das de dispersão, existem também algumas medidas que se referem à forma de uma distribuição.
Mais especificamente, são medidas de assimetria e medidas do grau de achatamento ou curtose de
uma distribuição.

2.3.1 Boxplot
Uma forma alternativa para se representar um conjunto de dados, é o “boxplot” ou desenho es-
quemático, que fornece informações sobre a assimetria, achatamento, dispersão e posição dos dados
além de informar sobre dados discrepantes, aqueles com valor muito diferente do restante do con-
junto. É extremamente útil quando queremos comparar várias distribuições. Ele é construı́do a
partir do esquema de cinco números, que são

• os quartis Q1 , Q2 e Q3 ;

• os extremos M (valor máximo) e m (valor mı́nimo).

Para construir o “boxplot”, calculamos ainda as seguintes quantidades:


3 3
Li = Q 1 − I Q e L s = Q 3 + IQ ,
2 2
que definem as observações discrepantes. Todo ponto que for menor que Li ou maior que Ls será
considerado um ponto discrepante (“outlier”).
Construção
Em um eixo vertical, representamos os valores da variável em questão. Do lado do eixo cons-
truı́mos uma caixa da seguinte forma: a base fica na altura do primeiro quartil (Q1) e o topo da
caixa fica na altura do terceiro quartil (Q3). Depois marcamos no interior da caixa uma linha
na altura da mediana (Q2). Do alto da caixa segue uma linha até o maior valor que não seja
discrepante e da base da caixa segue uma linha até o menor valor que não seja discrepante. Os
pontos discrepantes são marcados individualmente.

Exemplo 2.6 Suponha que os “boxplot” abaixo representem as distribuições da produção em


toneladas por hectare, de quatro diferentes variedades de cana-de-açúcar. Comente sobre as prin-
cipais diferenças entre estas distribuições.

29
Figura 5: “boxplot”: Produção de cana de açúcar

30
2.4 Exercı́cios

2.1 -♠ Quer se estudar o número de erros de impressão de um livro. Para isso escolheu-se uma
amostra de 50 páginas, encontrando-se o seguinte número de erros por página:

Erros Frequência
0 25
1 20
2 3
3 1
4 1

a) Qual o nuúmero médio de erros por página?


b) E o número mediano?
c) Qual é o desvio padrão?
d) Faça uma representação gráfica para a distribuição.
e) Se o livro tem 500 páginas, qual o número total de erros esperado no livro?

2.2 - ♠ As taxas de juros recebidas por 10 ações durante um certo perı́odo foram (medidas em
porcentagem) 2, 59; 2, 64; 2, 60; 2, 57; 2, 55; 2, 61; 2, 50; 2, 63; 2, 64. Calcule a média, a mediana
e o desvio padrão.

2.3 ♠ a) Dê uma situação onde você acha que a mediana é uma medida mais apropriada do que
a média.
b) Esboce um histograma onde a média e a mediana coincidem. Existe alguma classe de
histogramas onde isso sempre acontece?
c) Esboce os histogramas de três variáveis (X, Y e Z) com a mesma média aritmética, mas com
as variâncias ordenadas em ordem crescente.

2.4 - ♠ Numa pesquisa realizada com 100 famı́lias levantaram-se as seguintes informações:

Número de filhos 0 1 2 3 4 5 mais que 5


Frequência de famı́lias 17 20 28 19 7 4 5

a) Qual a mediana do número de filhos?


b) E a moda?
c) Que problemas você enfrentaria para calcular a média neste caso ? Faça alguma suposição
e encontre-a.

31
2.5 -♠ Suponha que a variável de interesse tenha a distribuição como na figura abaixo:

Você acha que a média é uma boa medida de posição? E a mediana? Justifique.

2.6 - ♠ O número de desquites na cidade, de acordo com a duração do casamento, está represen-
tado na tabela abaixo:

Anos de Número de
casamento desquites
0 ` 6 2800
6 ` 12 1400
12 ` 18 600
18 ` 24 150
24 ` 32 50

a) Qual a duração média dos casamentos? E a mediana?


b) Encontre a variância e o desvio padrão da duração dos casamentos.
c) Construa o histograma da distribuição.
d) Encontre o 1o e o 9o decis.
e) Qual o intervalo interquartil?
f ) Se s representa o desvio padrão da distribuição, qual a porcentagem das observações com-
preendidas entre x̄ − 2s e x̄ + 2s?

2.7 - ♠ O Departamento de Pessoal de uma certa firma fez um levantamento dos salários dos 120
funcionários do setor administrativo, obtendo os seguintes resultados:

Faixa Salarial Frequência


( X salário mı́nimo) relativa
0` 2 0,25
2` 4 0,40
4` 6 0,20
6 ` 10 0,15

32
a) Esboce o histograma correspondente.
b) Calcule a média, a variância e o desvio padrão.
c) Calcule o 1o quartil e a mediana.
d) Se for concedido um aumento de 100% para os 120 funcionários, haverá alteração na média?
E na variância? Justifique sua resposta.
e) Se for concedido um abono de 2 salários mı́nimos para todos os 120 funcionários, haverá
alteração na média? E na variância? E na mediana? Justifique sua resposta.

2.8 -♠ O que acontece com a mediana, a média e o desvio padrão de uma série de dados quando:
a) cada observação é multiplicada por 2?
b) soma-se 10 a cada observação?
c) subtrai-se a média geral x̄ de cada observação?
d) de cada observação subtrai-se x̄ e divide-se pelo desvio padrão DP (X) ?

2.9 - ♠ Na companhia A, a média dos salários é 10.000 unidades e o 3o quartil é 5000.


a) Se você se apresentasse como candidato a essa firma e se o seu salário fosse escolhido ao acaso
entre os possı́veis salários, o que seria mais provável: ganhar mais ou menos que 5.000 unidades?
b) Suponha que na companhia B a média dos salários é 7.000 unidades e a variância é prati-
camente zero, e lá o seu salário também seria escolhido ao acaso. Em qual companhia você se
apresentaria para procurar emprego?

2.10 - ♠ Estudando-se o consumo diário de leite, verificou-se que em certa região, 20% das famı́lias
consomem até um litro, 50% das famı́lias consomem entre 1 e 2 litros, 20% consomem entre 2 e 3
litros e o restante consome entre 3 e 5 litros. Para a variável em estudo:
a) Escreva as informações acima em uma tabela de frequências.
b) Construa o histograma.
c) Calcule a média e a mediana.
d) Calcule a variância e o desvio padrão.
e) Qual o valor do 1o quartil?

2.11 - ♠ A distribuição de frequências do salário anual dos moradores do bairro A que têm alguma
forma de rendimento é apresentada na tabela abaixo:

Faixa salarial Frequência


( × 10 sal. mı́n.)
0 ` 2 10.000
2 ` 4 3.900
4 ` 6 2.000
6 ` 8 1.100
8 ` 10 800
10 ` 12 700
12 ` 14 2.000
TOTAL 20.500

33
X X
Dados : xi = 150.300 x2i = 4.906.500
a) Construa um histograma da distribuição.
b) Qual a média e o desvio padrão da variável salário?
c) O bairro B apresenta, para a mesma variável, uma média de 7,2 e um desvio padrão de 15,1.
Em qual dos bairros a população é mais homogênea quanto à renda?
d) Construa a função de distribuição acumulada e determine qual a faixa salarial dos 10% mais
ricos da população do bairro.
e) Qual a “riqueza total” dos moradores do bairro?

2.12 - ♠ Um órgão do governo do estado está interessado em determinar padrões sobre o investi-
mento em educação, por habitante, realizado pelas prefeituras. De um levantamento em 10 cidades,
foram obtidos os valores (codificados) da tabela abaixo:

Cidade A B C D E F G H I J
Investimento 20 16 14 8 19 15 14 16 19 18

Neste caso, será considerado como investimento básico a média final das observações, calculada
da seguinte maneira:
1- Obter uma média inicial;
2- Eliminar do conjunto aquelas observações que forem superiores à média inicial mais duas vezes
o desvio padrão, ou inferiores à média inicial menos duas vezes o desvio padrão;
3-Calcular a média final com o novo conjunto de observações.
Qual o investimento básico que você daria como resposta?
Observação: O procedimento do item 2 tem a finalidade de eliminar do conjunto a cidade cujo
investimento é muito diferente dos demais.

2.13 ♠ Dado o histograma abaixo, calcular a média, a variância, a moda, a mediana e o 1o quartil.

34
2.14 Em um experimento de competição de variedades de batatinhas, um pesquisador obteve as
seguintes produções em t/ha, resultados de 18 repetições:

Huinkul 20,1 21,1 27,0 26,4 25,4 22,3 26,1 24,0 23,2
27,0 25,2 24,6 26,5 22,5 25,8 27,1 26,2 24,1
S. Rafaela 22,6 29,9 24,2 20,6 25,1 23,5 20,2 21,0 20,5
22,1 21,3 22,1 22,6 20,7 20,3 21,5 21,0 24,1

Para cada uma das variedades:


a) calcule a média e o desvio padrão;
b) construa um ramo e folhas;
c) construa desenhos esquemáticos (“box-plot”), usando a mesma escala para as duas varieda-
des.
d) Com base nos resultados obtidos em a), b) e c), comente as principais diferenças entre as
duas variedades. Você diria que uma das variedades é superior a outra? Porque?

2.15 A tabela abaixo fornece a distribuição do comprimento de espiga em trigo, variedade PUSA
12, obtidos em uma amostra de tamanho 400, por um produtor em 1998 (dados fictı́cios):

Classe (cm) ni
6 ` 9 80
9 ` 11 80
11 ` 13 200
13 ` 17 40
Total 400

a) Construa um histograma de porcentagem para a distribuição;


b) Calcule a média e o desvio padrão da distribuição;
c) O trigo é considerado de alta qualidade se o comprimento da espiga é pelo menos 11,5 cm.
Qual a porcentagem da amostra investigada que pode ser considerada de alta qualidade?
d) O comprador usual desta produção quer um desconto de 50% no preço do trigo de espiga
muito curta (baixa qualidade). Se o produtor espera vender pelo menos 85% de sua produção pelo
preço normal, qual deve ser o limite de comprimento da espiga do trigo de baixa qualidade?

2.16 Em um experimento com cana de açúcar, foram utilizados 3 nı́veis de potássio, k1, k2 e k3
e 2 nı́veis de fostato, p1 e p2 em 2 repetições para cada uma das combinações possı́veis. A tabela
abaixo fornece os resultados obtidos:

Tabela 2: Produção (t/ha)


Potássio
Fosfato k1 k2 k3
p1 30 60 55
35 55 50
p2 50 55 60
40 61 68

35
Calcule as seguintes quantidades
a) a média e o desvio padrão da produção de cana de açúcar no experimento;
b) a média e o desvio padrão da produção para cada nı́vel de fosfato;
c) a média e o desvio padrão da produção para cada nı́vel de potássio.

2.17 - ♠ Em uma granja foi observada a distribuição dos frangos com relação ao peso, que era a
seguinte:

Peso (gramas) ni
960 ` 980 60
980 ` 1.000 160
1.000 ` 1.020 280
1.020 ` 1.040 260
1.040 ` 1.060 160
1.060 ` 1.080 80

a) Qual a média da distribuição?


b) Qual a variância da distribuição?
c) Construa o histograma.
d) Queremos dividir os frangos em quatro categorias, com relação ao peso, de modo que:
- os 20% mais leves sejam da categoria D;
- os 30 % seguintes sejam da categoria C;
- os 30% seguintes sejam da categoria B;
-os 20% seguintes (ou seja, os 20% mais pesados) sejam da categoria A.
Quais os limites de peso entre as categorias A, B, C e D?
e) O granjeiro decide separar deste lote os animais com peso inferior a dois desvios padrões
abaixo da média para receberem ração reforçada, e também separar os animais com peso superior
a um e meio desvio padrão acima da média para usá-los como reprodutores.
Qual a porcentagem de animais que serão separados em cada caso?

2.18 - ♠ A idade média dos candidatos a um determinado curso de aperfeiçoamento sempre


foi baixa, da ordem de 22 anos. Como este curso foi planejado para atender a todas as idades,
decidiu-se fazer uma campanha de divulgação. Para se verificar se a campanha foi ou não eficiente,
fez-se um levantamento da idade dos candidatos à ultima promoção, e os resultados estão na tabela
abaixo.

Idade Frequência Porcentagem


18 ` 20 18 36
20 ` 22 12 24
22 ` 26 10 20
26 ` 30 8 26
30 ` 36 2 4
TOTAL 50 100

36
a) Baseando-se nesses resultados, você diria que a campanha produziu algum efeito (isto é,
aumentou a idade média?)
b) Um outro pesquisador decidiu usar a seguinte regra: se a diferença x̄ − 22 fosse maior que

o valor 2DP (X)/ n, então a campanha surtiu efeito. Qual a conclusão dele, baseado nos dados?
c) Faça um histograma da distribuição.

2.19 Um fabricante de rações afirma que seu produto, a ração A, produz resultados tão bons
ou até melhores que os de seu concorrente, ração B. (Veja Exercı́cio 1.10) Um produtor resolveu
experimentar o novo produto para verificar a veracidade da afirmação do fabricante e para isto
utilizou o seguinte critério, retirado de um manual de estatı́stica:
i) Separar alguns animais com as mesmas caracterı́sticas (peso, idade, etc...) em dois grupos de
mesmo tamanho, e alimentar por um determinado tempo um dos grupos com a ração A e o outro
com a ração B.
ii) Após o experimento, observar o ganho de peso de cada animal.
iii) De posse dos dois conjuntos de dados, {x1 , . . ., xn }, e {y1 , . . . , yn } ,(conjuntos 8 e 9, Seção
1.5) calcular:

x̄ − ȳ nV ar(A) + nV ar(B)
t= p , em que S∗2 =
S∗ 2/n 2n − 2
iv) Considerar as rações equivalentes se |t| < 2. ( Use quadro do Exercı́cio 2.20 abaixo)
a) Calcule as médias para cada grupo (x̄ e ȳ)
b) Calcule as variâncias para cada grupo.
c) Calcule a quantidade t acima. Qual foi a decisão tomada pelo produtor?
d) Faça o ramo e folhas para cada uma das distribuições.
e) Para cada grupo, calcule a mediana, o 1o e 3o quartis e o intervalo interquartı́lico.
f ) Use a mesma escala para construir os desenhos esquemáticos para as duas distribuições.
(“box-plot”).
g) Observe os ramo e folhas e os “boxplot” e compare as duas distribuições. O que você acha
do critério utilizado pelo produtor?
h) Uma pessoa, observando os dois conjuntos de dados acima, verificou que em cada um deles,
quatro observações pareciam discrepantes do restante de seu grupo e sugeriu que o produtor refizesse
a análise desconsiderando estes dados. Qual foi o resultado da nova análise?

2.20 Calcule a média aritmética, a variância, o desvio padrão e construa um “box-plot” para cada
um dos conjuntos de 1 a 7 da Seção 1.5. (Use os dados do quadro abaixo )

37
Pn Pn 2
CONJUNTO n i=1 Xi i=1 Xi
1 50 988 19812
2 50 8.117 1.319.095
3 75 1413 27.119
4 75 12.831 2.197.873
5 70 3.153.185 263.709.949.952
6 50 91340 322391584
7 50 131575 530232864
8 40 1382 51984
9 40 1378 51708

2.21 As Cartas Chilenas são poemas crı́ticos ao governador das Minas Gerais, que circularam em
Ouro Preto em 1787. Não foram assinadas e por isso têm sido realizados vários estudos para se
conhecer o autor. Em 1941, o mineiro Arlindo Chaves contou o número de palavras em cada um de
116 perı́odos escolhidos nas Cartas, no poema Vila Rica de Cláudio Manoel da Costa, e nas Liras,
de Tomás Antônio Gonzaga, os dois inconfindentes usualmente considerados como autores. Obteve
os seguintes resultados:

Palavras Gonzaga Cartas Cláudio


0 a 10 19 21 2
10 a 20 28 26 9
20 a 30 36 31 27
30 a 40 22 18 14
40 a 50 8 11 12
50 a 60 3 4 14
60 a 90 0 3 21
90 a 120 0 2 17
Total 116 116 116
P
xi ni 2710 3050 5980
P 2
xi ni 81500 121100 408300

a) Calcule o tamanho médio do perı́odo em cada caso.


b) Calcule a variância em cada caso.
c) Construa os três histogramas.
d) Em sua opinião, quem foi o autor das Cartas - Gonzaga ou Cláudio? Justifique.

2.22 A ingestão diária média per capita, em gramas, de proteı́na para 33 paı́ses desenvolvidos é:
81 113 108 74 79 78 90 93 105 109 106
103 100 100 100 101 101 101 95 90 90 91
92 93 87 89 78 89 85 94 94 94 79
a) Construa um ramo-e-folhas.
b) Obtenha o primeiro e terceiro quartis e a mediana dos dados.
c) Construa um “box-plot”.

38
2.23 Foram observadas as distribuições dos frangos em relação ao peso em duas granjas, I e II. Os
valores abaixo representam, em 100 gramas, o peso mı́nimo, o 1o quartil, a mediana, o 3o Quartil e
o peso máximo, em cada uma das granjas. (Não necessariamente nesta ordem!). Use estes valores
para construir desenhos esquemáticos (“box-plot”) das distribuições. Comente sobre as principais
diferenças entre elas.

I 9 11 15 17 14
II 21 11 15 14 17

39
3 Análise bidimensional
3.1 Introdução
Suponha agora que estejamos interessados em analisar o comportamento conjunto de duas variáveis.
Vimos que podemos representar a distribuição conjunta de duas variáveis por meio de uma tabela
de freqüências de dupla entrada e este será um valioso instrumento para ajudar a compreensão dos
dados.

Exemplo 3.1 Queremos analisar o comportamento conjunto das variáveis “Sexo” (X) e “Nı́vel de
atividade fı́sica” (Y ), cuja tabela de freqüências reproduzimos abaixo (ver Tabela 1.5).

Distribuição conjunta: Nı́vel de atividade fı́sica por Sexo

Sexo
Atividade Feminino Masculino Total
Ativo 0 4 4
Médio 5 6 11
Sedentário 12 18 30
Total 17 28 45

A linha dos totais fornece a distribuição da variável X e a coluna dos totais fornece a distribuição
da variável Y . As distribuições assim obtidas são chamadas de distribuições marginais das variáveis
X e Y.
Podemos ainda construir tabelas de freqüências relativas, como foi feito no caso unidimensional.
Em uma distribuição conjunta, podemos expressar a proporção de cada casela de três maneiras
diferentes: em relação ao total geral; em relação ao total de cada linha ou em relação ao total de
cada coluna. A mais conveniente a ser usada dependerá do objetivo da pesquisa. Construiremos a
seguir, com os dados da tabela acima, as três tabelas possı́veis, utilizando porcentagens.

Tabela 3.1 Distribuição conjunta das porcentagens em relação ao total geral das variáveis X e Y

Sexo
Atividade Feminino Masculino Total
Ativo 0% 8,9%∗ 8,9%
Médio 11,1% 13,3% 24,4%
Sedentário 26,6% 40,0% 66,7%
Total 37,8% 62,2% 100%

∗ 8,9% dos alunos são do sexo “Masculino” e seu nı́vel de atividade fı́sico é “Ativo”.

40
Tabela 3.2 Distribuição conjunta das porcentagens em relação aos totais de cada coluna das
variáveis X e Y

Sexo
Atividade Feminino Masculino Total
Ativo 0% 14,3% ∗ 8,9%
Médio 29,4% 21,4% 24,4%
Sedentário 70,6% 64,3% 66,7%
Total 100% 100% 100%


14,4% dos alunos do sexo “Masculino” têm nı́vel de atividade fı́sica “Ativo”.

Tabela 3.3 Distribuição conjunta das porcentagens em relação aos totais de cada linha das
variáveis X e Y

Sexo
Atividade Feminino Masculino Total
Ativo 0% 100,0%∗ 100%
Médio 45,5% 55,5% 100%
Sedentário 40% 60% 100%
Total 37,8% 62,2% 100%

∗ 100% dos alunos com nı́vel de atividade fı́sica “Ativo”, são do sexo “Masculino”.
O principal objetivo da distribuição conjunta é descrever o grau de associação entre as variáveis,
de modo que possamos prever melhor o resultado de uma delas quando conhecemos a realização da
outra.

Exemplo 3.2 Em um experimento para testar a resistência de eucalyptus à ferrugem causada


por puccinia psidii, um certo número de plantas de três espécies diferentes de eucalyptus foram
infectadas artificalmente. Após certo tempo, contou-se o número de plantas doentes. Os resultados
estão na tabela abaixo.

Tabela 3.4 Nı́vel de infecção por puccinia psiddi em eucalyptus

Infecção E. citrioda E. urophylla E. cloeziana Total


Doentes 6 (5,5%) 10 (10%) 80 (72,7%) 96(30%)
Sadias 104 (94,5%) 90 (90%) 30 (27,3%) 224(70%)
Total 110(100%) 100(100%) 110(100%) 320(100%)

Os valores que aparecem entre parênteses na Tabela 3.4, mostram as porcentagens do “tipo
de infecção” (Y ) em cada “espécie” (X). Estas porcentagens foram calculadas para podermos
comparar a relação (ou grau de associação) entre estas variáveis.

41
A partir desta tabela, podemos observar que, independentemente da espécie, 30% das plantas
adoeceram e 70% delas permaneceram sadias (ver coluna do Total ). Não havendo dependência (ou
associação) entre as variáveis, esperarı́amos estas mesmas proporções para cada uma das espécies.
Olhando atentamente as porcentagens calculadas dentro das caselas da Tabela 3.5, podemos ve-
rificar que as freqüências observadas são bem diferentes das freqüências esperadas o que nos leva
a pensar que existe uma associação entre estas variáveis. Por exemplo, na espécie E. citrioda
esperarı́amos 30% de plantas doentes e observamos 5,5%.
Para facilitar a comparação entre as freqüências esperadas e observadas, construı́mos a Tabela
abaixo.

Tabela 3.5 Nı́vel de infecção por puccinia psiddi em eucalyptus (freqüências observadas e
esperadas)

Espécie
E. citrioda E. urophylla E. cloeziana
Infecção oij eij oij eij oij eij
Doentes 6 33 10 30 80 33
Sadias 104 77 90 10 30 77

em que o ı́ndice i representa plantas doentes (i = 1) ou sadias (i = 2), o ı́ndice j representa a


espécie (j = 1, 2, 3), oij representa a freqüência observada e eij representa a freqüência esperada.
O problema se torna então encontrar uma medida do grau de associação entre as variáveis.

3.2 Coeficientes de contingência


(Continuação do Exemplo 3.2). Para medirmos o grau de associação entre as variáveis X e Y ,
medimos inicialmente as diferenças entre o que teria sido obtido caso não existisse associação entre
elas, e o que foi de fato observado (veja Tabela 3.6).

Tabela 3.6 Desvios entre valores observados e esperados

Infecção E. citrioda E. urophylla E. cloeziana Total


Doentes -27 -20 47 0
Sadias 27 20 -47 0
Total 0 0 0 0

Note que tanto a linha quanto a coluna de total são nulas e que algumas caselas apresentam
desvios maiores da suposição de independência. Para quantificar estes desvios, vamos considerar
os desvios relativos, rij , que levam em conta o número diferente de plantas de cada espécie.

(oij − eij )2
rij = .
eij

Assim, para a casela Doentes/E. citrioda, temos (−27)2/33 = 22, 1 e para a casela Doentes/E.
cloeziana, temos (−47)2/33 = 66, 9, indicando um desvio devido a esta última casela, maior do que
aquele da primeira.

42
Uma medida do afastamento global pode ser dada pela soma dos valores. Esta medida chama-se
χ2 (qui-quadrado) e é dada pela expressão,
X X (oij − eij )2
χ2 = .
i j
eij

No nosso exemplo, terı́amos,

(6 − 33)2 (10 − 30)2 (80 − 33)2 (104 − 77)2 (90 − 70)2 (30 − 77)2
χ2 = + + + + + = 146, 23.
33 30 33 77 70 77
Como é difı́cil dizer se este valor é alto ou não, (seria 0 se não houvesse associação), K. Pearson,
famoso estatı́stico do começo do século, propôs a utilização do chamado Coeficiente de Contingência
C, definido por s
χ2
C= ,
χ2 + n
em que n é o número de total de observações. Este coeficiente é um número entre 0 e 1, sendo nulo
quando as variáveis não são associadas. Algumas vezes porém, mesmo existindo uma associação
perfeita, C pode não ser igual a 1. Uma alternativa, então, é considerar como medida de associação
o seguinte coeficiente, que chamaremos de Coeficiente de contingência corrigido, dado por
C
C∗ = p ,
(t − 1)/t

em que t é o mı́nimo entre o número de colunas e o número de linhas da tabela.


No exemplo acima, temos s
146, 23
C= = 0, 56
146, 23 + 320
e
0, 56
C∗ = p = 0, 79
1/2
indicando que o grau de associação entre as variáveis neste caso é bem alto.

Observações

• Uma maneira fácil de se obter o valor esperado em cada casela é,

(Total da linha i) × (Total da coluna j)


eij = .
(Total geral)

• O coeficiente de contingência de Pearson pode ser utilizado tanto para variáveis qualitativas
quanto para variáveis quantitativas agrupadas em classes.

3.3 Coeficiente de correlação


Quando as variáveis envolvidas são ambas quantitativas (não agrupadas), um procedimento bas-
tante útil para se verificar a associação entre as variáveis é o gráfico de dispersão, que nada mais é
do que a representação dos pares de valores em um sistema cartesiano.

43
Figura 6: Diagrama de dispersão: K2 O versus Potássio

Exemplo 3.3 A tabela abaixo fornece os teores dos nutrientes K (Potássio) e M g (Magnésio) em
folhas de soja, e a dose anual de adubo utilizado na plantação (K2O: Óxido de Potássio).

Tabela 3.7

Teores de nutrientes
Dose anual de K2O(Kg/ha):X K, Y1 (g/Kg) M g Y2 (mg/Kg)
0 6 10,5
40 11 7,9
80 18 6,4
120 22 5,8
160 25 5,5
200 21 5,2
Fonte: PAB(1997) vol. 32(12) pg.1235-1249.

Na Figura 6, mostramos o diagrama de dispersão entre as variáveis X e Y1 . Observando a


disposição dos pontos, verificamos que quando aumentamos a dose anual do adubo parece haver
uma tendência de aumento do teor do nutriente K nas folhas de soja.
No caso do Magnésio, ao contrário, quando aumentamos a dose de adubo, a concentração do
nutriente diminui. Veja Figura 7.
Observada uma associação entre as variáveis quantitativas, desejamos quantificar o grau desta
associação. Estudaremos aqui a relação mais simples, que é a linear, isto é, iremos definir uma
medida que julga o quanto a nuvem de pontos do diagrama de dispersão aproxima-se de uma reta.
A medida que utilizaremos para quantificar a associação entre duas variáveis quantitativas é o
coeficiente de correlação que definimos abaixo.

44
Figura 7: Diagrama de dispersão: K2 O versus Magnésio

Definição 3.1 Dados n pares de valores (x1, y1), (x2, y2 ), . . ., (xn, yn ), chamamos de coeficiente de
correlação entre as duas variáveis X e Y a relação,

Pn
1 i=1 (xi
− x̄)(yi − ȳ)
Cor(X, Y ) = .
n DP(X)DP(Y )
Costuma-se usar a seguinte fórmula equivalente de cálculo,
Pn
i=1 xi yi − nx̄ȳ
Cor(X, Y ) = q P P .
( ni=1 x2i − nx̄2 )( ni=1 yi2 − nȳ 2 )

O coeficiente de correlação linear assume sempre um valor entre −1 e 1. Valores positivos


correspondem a uma associação direta e negativos correspondem a uma associação inversa. Quando
o coeficiente de correlação for igual a 1 ou −1, existe uma associação linear perfeita entre X e Y e
quando ele é igual a 0, não existe nenhuma associação linear entre as variáveis.

45
3.4 Exercı́cios
3.1 Um time de futebol está interessado em saber se as condições do tempo tem alguma influência
no resultado do jogo. Observaram as condições do tempo durante 65 partidas obtendo os seguintes
resultados:

Resultado Tempo Total


Bom Ruim
Venceu 17 5 22
Empatou 6 10 16
Perdeu 4 23 27
Total 27 38 65

a) Calcule o coeficiente de contingência e o coeficiente de contingência corrigido.


b) Com base nos resultados do item a), você diria que as condições do tempo tem um efeito do
resultado deste time? Comente.

3.2 100 animais foram divididos em dois grupos de 56 e 44 animais. No primeiro grupo, que foi
vacinado contra uma determinada doença, 47 animais não adoeceram. No segundo grupo, que não
foi vacinado, 28 animais não adoeceram.
a) Construa uma tabela de contingência com os dados acima.
b) Calcule o coeficiente de contingência e o coeficiente de contingência corrigido.
c) Você diria que estes resultados sugerem que a vacina protege contra esta doença? Justifique.

3.3 Em uma pesquisa em 4 localidades, P, Q, R, e S, verificou-se que os preços dos automóveis de


350 pessoas entrevistadas pertenciam a quatro categorias, A, B, C e D. As freqüências observadas
foram

Preço Localidade
P Q R S
A 9 10 12 19
B 13 20 18 29
C 24 29 12 25
D 34 41 18 37

a) Encontre as freqüências que seriam esperadas caso não houvesse nenhuma associação entre
localidade e preço do automóvel.
b) Calcule o coeficiente de contingência e comente.

3.4 Uma companhia que fabrica máquinas de lavar, conduziu uma pesquisa com 500 donas de
casa que compraram destas máquinas em um determinado ano. Apenas 150 destas donas de casa
responderam à pesquisa e então a companhia resolveu enviar novo questionário para as outras 350
donas de casa que não haviam respondido ao primeiro. Destas, 200 responderam e a companhia

46
enviou ainda um terceiro questionário para as demais, obtendo outras 50 respostas. A companhia
enviou então um representante às residências das 100 donas de casa restantes, conseguindo assim
as 500 respostas que pretendia. Como resultado deste trabalho, a companhia suspeita que existe
alguma associação entre o grau de satisfação da dona de casa e sua boa vontade em responder ao
questionário. Com base nos dados abaixo, você diria que esta suposição faz sentido? Justifique sua
resposta.

Satisfeita Indiferente Insatisfeita Total


Respondeu imediatamente 100 40 10 150
Respondeu segundo quest. 134 48 18 200
Respondeu terceiro quest. 21 20 9 50
Entrevista 45 42 13 100
Total 300 150 50 500

3.5 Em uma pesquisa com 5000 indivı́duos, desejava-se investigar uma possı́vel associação entre
daltonismo e sexo. Encontrou-se os seguintes resultados,

Sexo Visão normal Daltônico


Masculino 2210 190
Feminino 2540 60

Calcule o coeficiente de contingência, o coeficiente de contingência corrigido e comente.

3.6 Calcule os coeficientes de correlação entre X e Y1 e entre X e Y2 para os dados do Exemplo


3.3.

3.7 A tabela abaixo fornece a produção obtida em função da quantidade de fertilizante utilizado

Fertilizante (X) 0 1 2 3 4 5 6 7 8
Produção (Y ) 160 168 176 179 183 186 189 186 184

a) Construa um diagrama de dispersão para os dados acima e comente sobre a associação entre
as variáveis.
b) Calcule o coeficiente de correlação entre X e Y . Comente.

3.8 A tabela abaixo fornece a precipitação mensal (X) e o número médio diário de horas de sol
(Y ), observadas em uma estação metereológica em Londres em 1973

Mês JAN FEV MAR ABR MAI JUN JUL AGO SET OUT NOV DEZ
Prec (mm) 39 35 20 63 76 65 88 54 77 51 44 60
Luz (h) 1,1 2,7 4,5 5,1 5,5 7,6 5,2 5,7 4,8 2,9 2,8 1,8

47
a) Construa um diagrama de dispersão para os dados acima.
b) Calcule o coeficiente de correlação entre X e Y .
c) Construa uma nova variável, X1, da seguinte maneira: ordene os meses de 1 a 12, atribuindo
o valor 1 ao mês com mais alta precipitação.
d) Construa outra variável, Y1 , ordenando os meses de 1 a 12, atribuindo o valor 1 ao mês com
maior média de luz por dia.
e) Calcule o coeficiente de correlação entre X1 e Y1 . Comente.

3.9 As alturas H, em cm, e os pesos W , em kg, de 10 pessoas foram medidos. Encontrou-se


P P P P P 2
H = 1710, W = 760, H 2 = 293.162, HW = 130.628 e W = 59.300. Calcule o
coeficiente de correlação entre os valores de H e W .

3.10 Habilidade em matemática é o mesmo que inteligência. Para testar a validade desta afirmação,
testes de matemática e de inteligência foram aplicados em 50 garotos. Os resultados dos testes de
matemática (X) e os coeficientes de inteligência (Y ) forneceram os seguintes resultados:
X X X X X
xi = 25, yi = 140, x2i = 1713, yi2 = 6380, xi yi = 1990.

Calcule o coeficiente de correlação entre X e Y e comente.

3.11 Um professor solicitou a um aluno que calculasse os coeficientes de correlação entre duas
variáveis em quatro conjuntos de dados, A, B, C e D. O aluno encontrou os valores -0,90; 0,97;
0,02 e 0,67 mas perdeu todas as suas anotações. Com base nos diagramas de dispersão abaixo,
determine os coeficientes de correlação para cada um dos conjuntos.

48
4 Probabilidade
4.1 Introdução
A distribuição de freqüências das observações é um poderoso recurso para entender a variabilidade
de um fenômeno. Muitas vezes, com suposições adequadas e sem observar diretamente o fenômeno,
podemos criar um modelo teórico que representa a distribuição das freqüências quando o fenômeno
não é observado diretamente. Tais modelos são chamados “Modelos Probabilı́sticos”.

Exemplo 4.1 Ao estudar as proporções de ocorrência das faces de um dado, um possı́vel modelo
teórico seria: Só podem ocorrer seis faces, e a freqüência de cada face é 1/6.

Definição 4.1 Um experimento ou fenômeno aleatório é um experimento cujo resultado não pode
ser previsto com certeza.

Todo experimento ou fenômeno que envolva um elemento casual terá seu modelo probabilı́stico
especificado, no momento em que estabelecemos:

1. um espaço amostral;

2. uma probabilidade para cada ponto amostral.

Definição 4.2 O Espaço Amostral de um experimento aleatório é o conjunto de todos os resultados


possı́veis do experimento.

Exemplo 4.2 Alguns experimentos

• E1 . Lançar uma moeda e verificar se ocorre cara ou coroa.

• E2 . Escolher ao acaso uma pessoa de uma população e observar sua altura em metros.

• E3 . Usar um determinado tipo de vacina e verificar se foi eficaz ou não.

Vamos agora determinar o espaço amostral para estes experimentos.

S1 = {cara, coroa}
S2 = [0, 5; 3, 0]
S3 = { sim , não}

Definição 4.3 Um evento é um subconjunto qualquer do espaço amostral.

Dizemos que um evento ocorreu se o resultado do experimento foi um elemento desse evento.

Exemplo 4.3 Considere um lançamento de um dado. Seja A o evento “sair um número par”.
Temos então, S = {1, 2, 3, 4, 5, 6} e A = {2, 4, 6}.

49
Definição 4.4 (Freqüência relativa) Suponha que repetimos n vezes o mesmo experimento aleatório.
Se A e B são dois eventos associados a este experimento e nA e nB o número de vezes que A e B
ocorreram, respectivamente, então
nA nB
fA = e fB = ,
n n
são as freqüências relativas de A e B nas n repetições do experimento.

Propriedades da freqüência relativa

1. 0 ≤ fA ≤ 1

2. fA = 1 ⇔ nA = n

3. fA = 0 ⇔ nA = 0

4. se A ∩ B = ∅, então fA∪B = fA + fB

O Princı́pio da Regularidade Estatı́stica afirma que se um experimento for realizado sob as


mesmas condições um grande número de vezes, a freqüência relativa tende a se estabilizar. Neste
caso, definimos uma função P : S → [0, 1], que chamamos de Probabilidade, que pode ser entendida
como o limite da freqüência relativa e que satisfaz as seguintes condições,

1. 0 ≤ P (A) ≤ 1

2. P (S) = 1

3. Se A ∩ B = ∅, então P (A ∪ B) = P (A) + P (B)

Se os elementos de S são equiprováveis (isto é, tem a mesma chance de ocorrer) definiremos a
probabilidade de um evento A como sendo

número de elementos de A
P (A) = .
número de elementos de S
Exemplo 4.4 O quadro abaixo representa uma possı́vel divisão dos alunos matriculados em um
dado Instituto de Matemática.

Curso Sexo Total


Homens (H) Mulheres (M )
Matemática Pura (MP ) 70 40 110
Matemática Aplicada (MA ) 15 15 30
Estatı́stica (E) 10 20 30
Computação (C) 20 10 30
Total 115 85 200

Seja MP o evento que ocorre quando, escolhendo-se ao acaso um aluno do Instituto de Matemática,
ele for um estudante do Curso de Matemática Pura. Teremos então P (MP ) = 110/200. Temos
ainda, P (H) = 115/200, P (E) = 30/200, etc.

Considere os seguintes eventos:

50
• A ∪ B, o evento que ocorre quando pelo menos um dos eventos A ou B ocorre.

• A ∩ B, o evento que ocorre quando os dois eventos A e B ocorrem ao mesmo tempo.

Temos então alguns teoremas importantes.

Teorema 4.1 Seja ∅ o evento vazio. Então,

P (∅) = 0.

Teorema 4.2 Se Ac denota o complementar do evento A, então

P (Ac ) = 1 − P (A).

Teorema 4.3 Sejam A e B dois eventos quaisquer associados a um mesmo experimento aleatório.
Então,
P (A ∪ B) = P (A) + P (B) − P (A ∩ B).

Exemplo 4.5 Seja E um experimento e A e B dois eventos tais que P (A) = 1/2, P (B) = 1/3 e
P (A ∩ B) = 1/4. Logo,

P (Ac ) = 1 − P (A) = 1 − 1/2 = 1/2,


P (B c ) = 1 − P (B) = 1 − 1/3 = 2/3,
P (A ∪ B) = P (A) + P (B) − P (A ∩ B) = 7/12,
P (Ac ∩ B c ) = P [(A ∪ B)c ] = 1 − 7/12 = 5/12.

4.2 Probabilidade condicional e independência.


No Exemplo 4.4, vamos calcular a seguinte probabilidade: “Dado que o estudante escolhido ao acaso
esteja matriculado no curso de Estatı́stica, qual é a probabilidade de ser uma mulher?” Podemos
escrever isto da seguinte forma:

P (mulher|Estatı́stica) = 2/3.

Definição 4.5 Sejam A e B dois eventos quaisquer. Definiremos a probabilidade condicional de


A dado B como sendo
P (A ∩ B)
P (A|B) = , para P (B) > 0.
P (B)
Lê-se probabilidade condicional de A dado que B ocorreu. Quando P (B) = 0, convenciona-se
P (A|B) = 0.

Regra do produto Multiplicando ambos os lados da igualdade na Definição 4.5, obtemos

P (A ∩ B) = P (B) · P (A|B).

Esta regra é bastante útil pois nos permite calcular a probabilidade da interseção utilizando
probabilidade condicional.

51
Exemplo 4.6 Retirar sem reposição 2 bolas de uma urna que contém 7 bolas vermelhas e 3 bolas
brancas. Calcule a probabilidade de cada resultado do espaço amostral. Podemos representar o
espaço amostral como S = {BB, BV, V B, V V }. Então,

P (BB) = P (B1 ∩ B2 ) = P (B1 ) · P (B2 |B1) = 3/10 × 2/9 = 6/9,


P (BV ) = 21/90,
P (V B) = 21/90,
P (V V ) = 42/90

Eventos Independentes
Sejam A e B dois eventos quaisquer, associados a um experimento aleatório. Dizemos que A e
B são independentes se
P (A ∩ B) = P (A) × P (B).
Se A e B são independentes, temos então que P (A|B) = P (A) pois

P (A ∩ B) P (A) × P (B)
P (A|B) = = = P (A).
P (B) P (B)
Teorema de Bayes: um exemplo

Considere a seguinte situação: Uma companhia produz circuitos integrados em três fábricas,
I, II e III. a fábrica I produz 40% dos circuitos, enquanto II e III produzem 30% cada uma. As
probabilidades de que um circuito integrado produzido por estas fábricas não funcione são 0.01,
0.04 e 0.03, respectivamente. Escolhido um circuito da produção conjunta das três fábricas, qual é
a probabilidade de o mesmo não funcionar?
Considere os seguintes eventos: B = “o circuito não funciona”, Ci = “o circuito é produzido
pela fábrica i, i = I, II, III”. Queremos encontrar P (B), sabendo que

P (I) = 0, 4, P (B|I) = 0, 01
P (II) = 0, 3, P (B|II) = 0, 04
P (III) = 0, 3, P (B|III) = 0, 03

Como C1 , C2 e C3 são eventos mutuamente exclusivos e reunidos formam o espaço amostral com-
pleto, podemos escrever o evento B da seguinte forma :

B = (C1 ∩ B) ∪ (C2 ∩ B) ∪ (C3 ∩ B),


e teremos então,
P (B) = P (C1 ∩ B) + P (C2 ∩ B) + P (C3 ∩ B).
Pela definição de probabilidade condicional, sabemos que P (B|Ci ) = P (B ∩ Ci )/P (Ci ), o que
nos permite escrever que
P (B ∩ Ci ) = P (B|Ci ) · P (Ci ).
Logo,

P (B) = P (B|C1 ) · P (C1 ) + P (B|C2 ) · P (C2 ) + P (B|C3 ) · P (C3 )

52
= 0, 4 × 0, 01 + 0, 3 × 0, 04 + 0, 3 × 0, 03 = 0, 025

Suponha agora que o circuito escolhido seja defeituoso e queremos determinar a probabilidade
dele ter sido produzido pela fábrica I. Queremos então calcular a seguinte probabilidade: P (C1 /B).
Pela definição de probabilidade condicional temos então,

P (C1 ∩ B) P (C1 ∩ B) 0, 4 × 0, 001


P (C1 |B) = = = = 0, 16
P (B) P (C1 ∩ B) + P (C2 ∩ B) + P (C3 ∩ B) 0, 025

53
4.3 Exercı́cios
4.1 Defina o espaço amostral para cada experimento dado abaixo.
a) Jogue um dado e observe o número mostrado na face de cima.
b) Jogue uma moeda 4 vezes e observe o número de caras obtido.
c) Jogue uma moeda 4 vezes e observe a seqüência obtida de caras e coroas.
d)Em uma linha de produção, fabrique peças em série e conte o número de peças defeituosas
produzidas em um perı́odo de 24 horas.
e) Uma asa de avião é fixada por um grande número de rebites. Conte o número de rebites
defeituosos.
f ) Uma lâmpada é fabricada. Em seguida é ensaiada quanto à duração de vida, pela colocação
em um soquete e anotação do tempo decorrido ( em horas) até queimar.
g) Um lote de 10 peças contém 3 defeituosas. As peças são retiradas uma a uma (sem reposição
da peça retirada) até que a última peça defeituosa seja encontrada. O número total de peças do
lote é contado.
h) Peças são fabricadas até que 10 peças perfeitas sejam produzidas. O número total de peças
fabricadas é contado.
i) Um mı́ssil é lançado. Em um momento especı́fico t, suas três componentes de velocidade
x, y, z, são observadas.
j) Um mı́ssil recém-lançado é observado nos instantes t1 , t2, t3 . . . tn . Em cada um desses in-
stantes, a altura do mı́ssel acima do solo é registrada.
l) A resistência à tração de uma barra metálica é medida.
m) De uma urna que só contém bolas pretas, retira-se uma bola e verifica-se sua cor.

4.2 ♠ Defina um espaço amostral para cada um dos seguintes experimentos aleatórios:
a) Lançamento de dois dados. Anota-se a configuração obtida.
b) Numa linha de produção conta-se o número de peças defeituosas num intervalo de uma hora.
c) Investigam-se famı́lias com 4 crianças, anotando-se a configuração segundo o sexo.
d) Numa entrevista telefônica com 250 assinantes, pergunta-se se o proprietário tem ou não
máquina de lavar.
e) Mede-se a duração de lâmpadas, deixando-as acesas até que queimem.
f ) Um fichário com 10 nomes contém 3 nomes de mulheres. Seleciona-se ficha após ficha, até o
último nome de mulher ser selecionado, e anota-se o número de fichas selecionadas.
g) Lança-se uma moeda até aparecer cara e anota-se o número de lançamentos.
h) Um relógio mecânico pode parar a qualquer momento por falha técnica. Mede-se o ângulo
(em graus) que o ponteiro dos segundos forma com o eixo imaginário orientado do centro ao número
12.
i) Mesmo enunciado anterior, mas supondo que o relógio seja elétrico, onde o ponteiro dos
segundos move-se continuamente.
j) De um grupo de 5 pessoas A, B, C, D, E, sorteiam-se duas, uma após a outra, com reposição,
e anota-se a configuração formada.
l) Mesmo enunciado que j, sem reposição.
m) Mesmo enunciado que j, mas os dois selecionados simultaneamente.

54
4.3 ♠ Duas moedas são lançadas. Dê dois espaços amostrais para este experimento. Represente
um deles como o produto cartesiano de dois outros espaços amostrais. Liste e calcule a probabilidade
dos eventos:
a) Pelo menos uma cara;
b) Duas caras;
c) O complementar do evento em (b).

4.4 ♠ Expresse em termos de operações entre eventos:


a) A ocorre mas B não ocorre.
b) exatamente um dos eventos A e B ocorre.
c) nenhum dos dois eventos A e B ocorre.

4.5 ♠ Dentre 6 números positivos e 8 negativos, 2 números são escolhidos ao acaso (sem reposição)
e multiplicados. Qual a probabilidade de que o produto seja positivo?

4.6 ♠ Considere o lançamento de dois dados. Considere os eventos A = soma de dois números
igual a 9 e B = número do primeiro dado maior ou igual a 4. Enumere os elementos de A e B.
Enumere os elementos e calcule a probabilidade dos eventos A ∪ B, A ∩ B e Ac .

4.7 ♠ Que suposições deveriam ser feitas para que os resultados dos experimentos abaixo possam
ser considerados equiprováveis?
a) Lançamento de um dado.
b) Opinião de moradores de uma cidade sobre um projeto governamental.

4.8 ♠ Considere uma urna contendo três bolas pretas e cinco bolas vermelhas. Retire duas bolas
da urna. Obtenha os resultados possı́veis e as respectivas probabilidades se as retiradas são feitas:
a) Com reposição;
b) Sem reposição.

4.9 ♠ No problema anterior, calcule as probabilidades dos eventos:


a) bola preta na primeira e segunda extrações;
b) bola preta na segunda extração.
c) bola vermelha na primeira extração.

4.10 ♠ A probabilidade de que A resolva um problema é de 2/3 e a probabilidade de que B resolva


é de 3/4. Se ambos tentarem independentemente, qual a probabilidade do problema se resolvido?

4.11 ♠ Um dado é viciado, de tal forma que a probabilidade de sair um certo ponto é proporcional
ao seu valor (por exemplo, o ponto 6 é 3 vezes mais provável de sair do que o ponto 2). Calcular
a) a probabilidade de sair 5, sabendo-se que o ponto que saiu é ı́mpar.
b) a probabilidade de tirar um número par, sabendo-se que saiu um número maior que 3.

55
4.12 ♠ As probabilidades de que dois eventos independentes ocorram são p e q, respectivamente.
Qual a probabilidade de que
a) nenhum destes eventos ocorra?
b) pelo menos um destes eventos ocorra?

4.13 ♠ Duas lâmpadas queimadas foram acidentalmente misturadas com 6 lâmpadas boas. Se
vamos testando as lâmpadas, uma por uma, até encontrar as 2 defeituosas, qual é a probabilidade
de que a última defeituosa seja encontrada no quarto teste?

4.14 ♠ Prove que se A e B são independentes, também o serão Ac e B c , A e B c e Ac e B.

4.15 ♠ Se P (A)=1/3, P (B c )=1/4, A e B podem se disjuntos (mutuamente exclusivos)?


(Sugestão: P (A) = P (A ∩ B) + P (A ∩ B) e A ∩ B c ⊂ B c .)

4.16 ♣ Uma caixa contém 4 válvulas defeituosas e 6 perfeitas. Duas válvulas são extraı́das juntas.
Uma delas é ensaiada e se verifica ser perfeita. Qual a probabilidade de que a outra válvula também
seja perfeita?

4.17 ♣ No problema anterior, as válvulas são verificadas extraindo-se uma válvula ao acaso,
ensaiando-a e repetindo-se o procedimento até que todas as 4 válvulas defeituosas sejam encon-
tradas. Qual será a probabilidade de que quarta válvula defeituosa seja encontrada:
a) No quinto ensaio?
b) No décimo ensaio?

4.18 ♣ Suponha que temos duas urnas 1 e 2, cada uma delas com duas gavetas. A urna 1 contém
uma moeda de ouro em uma gaveta e uma moeda de prata na outra gaveta enquanto a urna 2
contém uma moeda de ouro em cada gaveta. Uma urna é escolhida ao acaso; a seguir uma de suas
gavetas é aberta ao acaso. Verifica-se que a moeda encontrada nessa gaveta é de ouro. Qual é a
probabilidade de que a moeda provenha da urna 2?

4.19 ♣ Uma bolsa contém três moedas, uma das quais foi cunhada com duas caras, enquanto as
duas outras moedas são normais e não viciadas. Uma moeda é tirada ao acaso da bolsa e jogada
quatro vezes, em sequência. Se sair cara toda vez, qual será a probabilidade de que essa seja a
moeda de duas caras?

4.20 ♣ Um dado é atirado n vezes. Qual é a probabilidade de que “6” apareça ao menos uma
vez em n vezes?

56
4.21 ♣ Sabe-se que na fabricação de um certo artigo, defeitos de um tipo ocorrem com probabil-
idade 0,1 e defeitos de outro tipo com probabilidade 0,05. Qual será a probabilidade de que:
a) Um artigo não tenha ambos os tipos de defeitos?
b) Um artigo seja defeituoso?
c) Um artigo tenha apenas um tipo de defeito, sabido que é defeituoso?

4.22 ♣ Suponha que A e B sejam eventos tais que P (A) = x, P (B) = y, e P (A ∩ B) = z.


Expresse cada uma das seguintes probabilidades em termos de x, y e z.
a) P (Ac ∩ B c )
b) P (Ac ∪ B)
c) P (Ac ∩ B).

4.23 ♣ Suponha que A, B e C sejam eventos tais que P (A) = P (B) = P (C) = 1/4, P (A ∩ B) =
P (C ∩ B) = 0 e P (A ∩ C) =1/8. Calcule a probabilidade de que ao menos um dos eventos A, B
ou C ocorra.

4.24 Admita que a probabilidade de nascimento de criança do sexo masculino seja 1/2. Em uma
famı́lia com 2 crianças, qual a probabilidade de que ambas sejam meninas dado que:
a) a mais velha é menina.
b) pelo menos uma é menina.

4.25 Suponha que você tenha feito uma aposta simples na loto, isto é, escolheu 5 dezenas.
a) Qual é a probabilidade de ganhar a quina?
b) Qual a probabilidade de acertar a quadra?
c) Qual a probabilidade de acertar o terno?

4.26 Um atirador faz 12 tentativas independentes para acertar no alvo. Qual é a probabilidade
de que ele acerte o alvo ao menos uma vez se ele possui probabilidade 9/10 de acertar em cada
tentativa?

4.27 Um novo teste é proposto para detectar uma forma particular de câncer, que incide em cêrca
de 1% das mulheres com mais de 40 anos. Quando o teste é aplicado em mulheres nesta faixa etária
sabidamente doentes, em 95% dos casos ele é sensı́vel, isto é, acusa a presença do câncer. Quando
aplicado em mulheres sadias, o teste acusa a doença em 3% dos casos ( falso positivo). Represente
por D: {presença de câncer} e por B: {o resultado do teste é positivo} ( acusa a doença). Calcule
P (D|B) e interprete o resultado.

4.28 Cada um de 3 jogadores arremessa uma moeda equilibrada. Se o resultado de um dos


arremessos diferir dos outros dois, o jogo termina. Em caso contrário, os jogadores recomeçam o
jogo. Qual a probabilidade de que o jogo termine logo na 1a rodada?

57
4.29 Sabe-se que a ocorrência de uma determinada caracterı́stica oftalmológica está associada à
cor dos olhos. A tabela abaixo fornece os resultados de exames em 300 pacientes de um determinado
hospital:

Caracterı́stica Cor dos olhos


oftalmológica Azul Castanho Outros
Presente 70 30 20
Ausente 20 110 50

a) Uma pessoa deste grupo é escolhida ao acaso e verifica-se que tem olhos azuis. Qual a
probabilidade de que ela tenha a caracterı́tica oftalmológica?
b) Uma outra pessoa é escolhida ao acaso e verifica-se que tem a caracterı́stica oftalmológica.
Qual a probabilidade de que ela tenha olhos castanhos?

4.30 Um pesquisador está estudando 3 drogas idênticas na aparência e numeradas de 1 a 3.


Quando as drogas são injetadas em cobaias, a probabilidade de que uma antitoxina se desenvolva
é 1/4 para a droga 1, 1/8 para a droga 2 e 1/3 para a droga 3. Existem dois frascos da droga 1,
três da droga 2 e um da droga 3. Por descuido, os rótulos dos frascos se perderam e o pesquisador
escolhe um deles ao acaso. Quando a droga é injetada na cobaia, a antitoxina não se forma. Qual
é a probabilidade de que ele tenha usado a droga 1? A droga 2? A droga 3?

4.31 Numa determinada população as frequências relativas nos grupos sanguı́neos ABO estão
distribuı́das da seguinte maneira: 39% têm o antı́geno A, 48% têm o antı́geno B e 15% têm ambos
os antı́genos.
a) Qual a frequência relativa dos indivı́duos com ausência de ambos os antı́genos (grupo O)?
b) Se um indivı́duo é selecionado aleatoriamente e possui o antı́geno B, qual a probabilidade
de que o antı́geno A :
i) esteja presente? ii) esteja ausente?

4.32 Sabe-se que a enxaqueca é herdada através de um gen dominante. Foi constatado que numa
determinada famı́lia (pai, mãe e filho), apenas o pai não sofria de enxaqueca. Se o filho se casar
com uma pessoa que não sofre de enxaqueca, qual a probabilidade de que, tendo dois filhos,
a) Pelo menos um deles tenha enxaqueca?
b) Um ou outro, mas não ambos, tenha enxaqueca?

4.33 Admita que 5 em cada 100 homens sejam daltônicos e que entre as mulheres esta proporção
seja de 25 em 10.000. Uma pessoa é escolhida ao acaso na população e verifica-se ser daltônica.
Qual é a probabilidade de que seja um homem? ( Admita que as populações masculina e feminina
tenham o mesmo tamanho).

4.34 Cada vez que injetamos uma dose de fenobirtal numa cobaia, ela pode ou não ter um choque
provocado por excesso de ceruplastina no sangue. Isto depende da dose, do seguinte modo:

58
Dose Prob. de ter
(mg) o choque
100 0.20
200 0.40
300 0.70
500 0.95

Um laboratório dispõe de 3 cobaias para conduzir o seguinte experimento: a droga será injetada
nas cobaias até que uma delas tenha o choque. (Isto é, o experimento pára quando ocorrer um
choque pela primeira vez ou quando todas as três cobaias tiverem sido usadas). Qual a menor dose
que pode ser utilizada para que a probabilidade de que ocorra um choque seja pelo menos 0.6?

59
5 Variáveis Aleatórias Discretas
5.1 Introdução
Quando estudamos técnicas de descrição de dados, vimos que os recursos para tratar variáveis
quantitativas são muito mais ricos que os utilizados para analisar variáveis qualitativas. Devido a
isso, algumas vezes podemos usar de artifı́cios para transformar variáveis qualitativas em variáveis
quantitativas. Em um questionário, por exemplo, uma pergunta que admite apenas as respostas
SIM ou NÃO pode ser transformada em respostas do tipo 0 ou 1. Mais especificamente, se S =
{ SIM, NÃO }, podemos definir uma função real,
X : S −→ IR,
de tal forma que X(NÃO)= 0 e X(SIM)= 1.

Definição 5.1 Uma variável aleatória X é uma função real cujo domı́nio é o espaço amostral
associado a um experimento aleatório.

Uma variável aleatória pode ser


• Discreta Se sua imagem for um conjunto finito ou infinito enumerável de valores;

• Contı́nua Se sua imagem for um intervalo ou união de intervalos.


Nesta seção, vamos apresentar as propriedades das variáveis aleatórias discretas e para isso
vamos considerar, primeiramente, o exemplo

Exemplo 5.1 De uma urna contendo sete bolas brancas e três bolas vermelhas, são feitas duas
extrações, sem reposição. Vamos definir a variável aleatória X: número de bolas brancas obtidas
nas duas extrações. A cada resultado do experimento, está associado um valor da variável aleatória
(v.a.) X, e cada um desses resultados tem uma probabilidade associada, o que nos permite escrever:

Resultado valor de X probabilidade


3
VV X=0 10 × 29 = 6/90
3 7
VB X=1 10 × 9 = 21/90
7
BV X=1 10 × 39 = 21/90
7
BB X=2 10 × 69 = 42/90

Desta forma, podemos dizer que os seguintes eventos são equivalentes,


{X = 0} ≡ {V V },
{X = 1} ≡ {V B} ∪ {BV },
{X = 2} ≡ {V V },

e portanto temos as seguintes probabilidades,


P (X = 0) = P ({V V }) = 6/90,
P (X = 1) = P ({V B} ∪ {BV }) = 42/90,
P (X = 2) = P ({V V }) = 42/90.

60
Figura 8: Função de probabilidade da v. a. X, do Exemplo 5.1

De um modo geral, se A = {ω1, ω2 , . . .} ⊂ Ω é tal que X(ωj ) = xi , para ωj ∈ A e X(ωj ) 6= xi ,


para ωi ∈ Ac , então P (X = xi ) = P (A).

Definição 5.2 (Função de Probabilidade) A função de probabilidade de uma variável aleatória X,


é uma função que define a probabilidade de ocorrência de cada resultado xi desta variável, isto é,
se X assume os valores {x1, x2, . . . , xn }, então
pX (xi ) = P (X = xi ) = pi , i = 1, . . . , n.

A função de probabilidade satisfaz as seguintes condições,


1. pX (xi ) ≥ 0, para todo xi ;
Pn
2. i=1 pX (xi ) = 1.
Observação Uma variável aleatória discreta pode assumir valores em um conjunto infinito enu-
merável.
(Cont. do Exemplo 5.1) A função de probabilidade da variável aleatória X do Exemplo 5.1
pode então ser escrita como,


 6/90, se x = 0

 42/90, se x = 1
p(x) =

 42/90, se x=2


0, caso contrário.
A Figura 8 mostra o gráfico desta função.
Podemos definir algumas caracterı́sticas das variáveis aleatórias discretas, análogas às carac-
terı́sticas de uma distribuição de frequências.
Seja X uma variável aleatória discreta, assumindo valores no conjunto RX = {x1 , x2, . . .}.

• Valor Esperado
O valor esperado de X, ou esperança matemática de X ou ainda média de X é o valor
X
E(X) = xi p(xi ).
xi ∈RX

61
• Variância
A variância de X é o valor
X
Var(X) = (xi − E(X))2 p(xi ).
xi ∈RX

Vale X
Var(X) = x2i p(xi) − E(X)2.
xi ∈RX

O desvio padrão de X, como no caso de uma distribuição de frequências, é definido como


p
DP (X) = Var(X).

• Função de distribuição acumulada


A função de distribuição ou função de distribuição acumulada de X é dada por

FX (x) = P (X ≤ x), para todo x ∈ IR.

A função de distribuição satisfaz as seguintes propriedades,

1. 0 ≤ F (x) ≤ 1;
2. limx→−∞ F (x) = 0;
3. limx→∞ F (x) = 1;
4. limh→0 {F (x + h) − F (x)} = p(x);
5. Se b > a, então F (b) ≥ F (a).

Observação A propriedade 5 nos diz que F é não decrescente.

Cont. do Exemplo 5.1


Vamos calcular a esperança, a variância, o desvio padrão e obter a função de distribuição da variável
aleatória X do Exemplo 5.1. Temos,

• Esperança
3
X 6 42 42 126
E(X) = xi p(xi ) = 0 × +1× +2× = = 1, 4.
i=1
90 90 90 90

• Variância
3
X 6 42 42
Var(X) = (xi − E(X))2 p(xi ) = (0 − 1, 4)2 × + (1 − 1, 4)2 × + (2 − 1, 4)2 × = 0, 42.
i=1
90 90 90

Ou então,
3
X 6 42 42
Var(X) = x2i p(xi ) − E(X)2 = 02 × + 12 × + 22 × − (1, 4)2 = 0, 42.
i=1
90 90 90

O desvio padrão é então, 0, 42 ' 0, 648.

62
Figura 9: Função de distribuição da v.a. do Exercı́cio 5.1

• Função de distribuição
A função de distribuição de X é dada por


 0, se x<0

 6/90, se 0≤x<1
F (x) =

 48/90, se 1≤x<2


1 se x ≥ 1.
O gráfico da função de distribuição de uma variável aleatória discreta tem sempre a forma
de uma escada. A altura dos degraus em um ponto é igual à probabilidade naquele ponto.
A Figura 9 mostra o caso do Exemplo 5.1.

5.2 Modelos probabilı́sticos para variáveis aleatórias discretas


Nesta seção, vamos estudar alguns modelos probabilı́sticos especiais, que ocorrem com muita
frequência na prática.

Definição 5.3 (Experimento de Bernoulli) Um experimento (ou ensaio) de Bernoulli é um expe-


rimento que admite apenas dois tipos de resultados, que chamaremos sucesso e fracasso.

Exemplo 5.2 Em todos os casos abaixo, temos experimentos de Bernoulli.

• Lançar uma moeda e obervar a face voltada para cima. Os possı́veis resultados são cara
(sucesso) e coroa (fracasso);

• Lançar um dado e observar se ocorre a face número 5 (sucesso) ou ocorre outra face (fracasso);

• Uma peça é escolhida ao acaso de um lote contendo 500 peças e observa-se se a peça é
defeituosa (sucesso) ou se a peça é perfeita (fracasso);

• Escolhe-se uma pessoa ao acaso e observa-se o sexo da pessoa escolhida. Temos também dois
resultados, feminino (sucesso) ou masculino (fracasso).

63
Observação Se a probabilidade de ocorrência de sucesso é igual a p, dizemos que o experimento é
um experimento de Bernoulli com parâmetro p.

A partir de um experimento de Bernoulli, podemos definir uma série de variáveis aleatórias.

Definição 5.4 Variável aleatória de Bernoulli


Considere um experimento de Bernoulli com parâmetro p. Então a variável aleatória definida
por
X(sucesso) = 1 e X(fracasso) = 0,
é chamada variável aleatória de Bernoulli com parâmetro p.

A função de probabilidade de X é dada por



1 − p, se x = 0
p(x) = ,
p, se x = 1

sua esperança é dada por E(X) = 0 × (1 − p) + 1 × p = p, e sua variância é dada por Var(X) =
02 × (1 − p) + 1 × p − p2 = p − p2 = p(1 − p). A função de distribuição de X é

0 se x < 0
F (x) = 1 − p, se 0 ≤ x < 1

1, se x ≥ 1.

Definição 5.5 ( Distribuição Binomial)


Seja X o número de sucessos em n repetições independentes de um ensaio de Bernoulli com
parâmetro p. Então X tem distribuição binomial com parâmetros n e p.

A função de probabilidade de uma variável aletória binomial, de parâmetros n e p (notação:


X ∼ B(n, p)) é dada por
 n x
x p (1 − p)n−x para x = 0, 1, . . ., n,
p(x) =
0 caso contrário.
A função de distribuição de X é dada por

 0, se x < 0
P [x] n k
F (x) = k=0 k p (1 − p)n−k , para 0 ≤ x ≤ n

1 se x ≥ n,

onde [x] denota o maior inteiro menor ou igual a x.


A esperança de X é !
Xn
n x
E(X) = x p (1 − p)n−x = np,
x=0
x
e sua variância é dada por np(1 − p).

Exemplo 5.3 Um dado é lançado três vezes. Seja X o número de vezes que aparece o número 5
nas três repetições. Descreva a distribuição da probabilidade da variável aleatória X.

64
Vamos definir os seguintes eventos

A = {sucesso} = { sair o número 5 } = {5}


Ac = {f racasso} = { sair um número 6= 5} = {1, 2, 3, 4, 6}.

Logo, P (A) = p = 1/6 e P (Ac ) = 1 − p = 5/6. Podemos assumir que as repetições são
independentes e desta forma, X tem uma distribuição binomial com parâmetros n = 3 e p = 1/6.
Isto é, sua função de probabilidade é dada por
 3 x 3−x ,
p(x) = x (1/6) (5/6) se x = 0, 1, 2, 3
0 caso contrário.
Sua esperança é 3 × 1/6 = 1/2 e sua variância é 3 × 1/6 × 5/6 = 5/12. (Exercı́cio: determine a
função de distribuição de X).

Definição 5.6 (Distribuição de Poisson) Dizemos que uma variável aleatória tem distribuição de
Poisson com parâmetro λ, se ela assume valores no conjunto {0, 1, . . . , } e sua função de probabi-
lidade é dada por  −λ k
e λ
p(x) = k! se k = 0, 1, 2, . . .,
0 caso contrário.

Usamos a notação X ∼ Po(λ).

A distribuição de Poisson é muito utilizada para modelar o que chamamos eventos raros. Ela
também pode ser pensada como sendo uma aproximação para a distribuição binomial quando

n → ∞, p → 0, mas np → λ.

Alguns exemplos onde a distribuição de Poisson pode ser empregada são

1. X1: o número de chamadas recebidas por uma central telefônica durante um perı́odo de 30
minutos;

2. X2: o número de bactérias em um litro de água não purificada;

3. X3: o número de partı́culas radiativas que, em um experimento de laboratório, entram em


um contador durante um milissegundo;

4. X4: o número de acidentes com automóveis particulares em determinado trecho da estrada,


num perı́odo de 24 horas;

5. X5: o número de rochas em uma determinada superfı́cie;

6. X6: o número de falhas em uma máquina durante um dia.

Repare que em todos os exemplos acima, a variável aleatória resulta de uma contagem. A dis-
tribuição de Poisson é também largamente empregada quando se deseja contar o número de eventos
de um certo tipo que ocorrem em um intervalo de tempo, ou superfı́cie ou volume. O nome desta
distribuição está associado ao matemático francês S. Denis Poisson (1781-1840), que a estudou em

65
um livro onde trata da aplicação da teoria das probabilidades a justiça comum.

Se X ∼ Po(λ), então sua função de distribuição é dada por



0, se x < 0
F (x) = P[x] e−λ λk ,
k=0 k! , se x ≥ 0

sua esperança é igual a λ e sua variância também é igual a λ.

Exemplo 5.4 Um sistema PBX recebe uma média de 5 chamadas por minuto. Supondo que o
número de chamadas recebidas tenha uma distribuição de Poisson, obtenha a probabilidade de que
o PBX
a) não receba nenhuma chamada durante um intervalo de um minuto;
b) não receba nenhuma chamada durante um intervalo de dois minutos;
c) não receba mais que uma chamada em um intervalo de um minuto;
d) receba mais que duas chamadas em dois minutos.

Solução: a) Temos X ∼ Po(5). Logo, a probabilidade desejada é

e−5 50
P (X = 0) = = e−5 ' 0, 0067.
0!
b) Para resolver o item b), basta notar que em média, o PBX recebe 10 chamadas a cada
dois minutos. Logo, podemos pensar que a variável aleatória Y , o número de chamadas em dois
minutos, tem uma distribuição Po(10). Então,

e−10 100
P (Y = 0) = = e−10 ' 0.000045.
0!
c) Queremos P (X ≤ 1). Temos

e−5 50 e−5 51
P (X ≥ 1) = P (X = 0) + P (X = 1) = + = e−5 + e−5 × 5 ' 0, 04043.
0! 1!
d) Queremos P (Y ≥ 2). Temos

P (Y > 2) = P (Y = 3) + P (Y = 4) + · · · = 1 − P (Y ≤ 2)
= 1 − {P (Y = 0) + P (Y = 1) + P (Y = 2)} ' 0.00277.

Observação As distribuições Binomial e Poisson estão tabeladas (ver Seção C).

66
5.3 Exercı́cios
5.1 ♠ Considere uma urna contendo 3 bolas vermelhas e 5 pretas. Retire 3 bolas, sem reposição
e defina a variável aleatória X igual ao número de bolas pretas. Obtenha a distribuição de X.

5.2 ♠ Repita o problema anterior, mas considerando extrações com reposição.

5.3 ♠ Suponha que uma moeda perfeita é lançada até que apareça cara pela primeira vez. Seja
X o número de lançamentos até que isto aconteça. Obtenha a distribuição de X. (Observe que,
neste problema, pelo menos teoricamente, X pode assumir um número infinito de valores.)

5.4 ♠ Uma moeda perfeita é lançada 4 vezes. Seja Y o número de caras obtidas. Obtenha a
distribuição de Y.

5.5 ♠ Repita o problema anterior, considerando agora que a moeda é viciada, sendo a probabili-
dade de cara dada por p, 0 < p < 1, p 6= 1/2.

5.6 ♠ Calcule a média e a variância da variável aleatória Y definida no problema acima.

5.7 ♠ Generalize o Exercı́cio 5.4, para n lançamentos da moeda.

5.8 ♠ Suponha que a v.a. V tenha a seguinte distribuição:

v 0 1
p q 1−q

Obtenha E(V ) e V ar(V ).

5.9 ♠ O tempo T , em minutos, necessário para um operário processar certa peça, é uma v.a.
com a seguinte distribuição de probabilidade:

T 2 3 4 5 6 7
p 0,1 0,1 0,3 0,2 0,2 0,1

a) Calcule o tempo médio de processamento. b) Calcule o desvio padrão de T .


Para cada peça processada, o operário ganha um fixo de 2,00 u.m. (unidade monetária), mas
se ele processa a peça em menos de 6 minutos, ganha 0,50 u.m. por cada minuto poupado. Por
exemplo, se ele processa a peça em 4 minutos, recebe a quantia adicional de 1,00 u.m.
b) Encontre a distribuição, a média e a variância da v.a. G: quantia em u.m. ganha por peça.

67
5.10 O número de jornais que um certo jornaleiro é capaz de vender num dia é uma variável
aleatória discreta com lei de probabilidade dada por:

 Ax para x = 1, 2, . . ., 50
P (X = x) = A(101 − x) x = 51, 52, . . ., 100

0 outros valores
a) Calcule o valor de A.
b) Calcule a probabilidade de vender:
i) Exatamente 50 jornais. ii) Mais de 50 jornais iii)Entre 26 e 75 jornais (inclusive).

5.11 ♠ Das variáveis abaixo descritas, assinale quais são binomiais, e para estas dê os respectivos
campos de definição e função de probabilidade. Quando julgar que a variável não é binomial, aponte
as razões de sua conclusão.
a) De uma urna com 10 bolas brancas e 20 pretas, vamos extrair, com reposição, cinco bolas.
X é o número de bolas brancas nas 5 extrações.
b) Refaça o problema anterior, mas desta vez as n extrações são sem reposição.
c) De 5 urnas com bolas pretas e brancas, vamos extrair de cada uma delas uma bola. Suponha
que X é o número de bolas brancas obtidas no final.
d) Vamos realizar uma pesquisa em 10 cidades brasileiras, escolhendo ao acaso um habitante
de cada uma delas, e classificando-o em pró ou contra um certo projeto federal. Suponha que X é
o número de indivı́duos contra o projeto no final da pesquisa.
e) Em uma indústria existem 100 máquinas que fabricam determinada peça. Cada peça é
classificada como sendo boa ou defeituosa. Escolhemos ao acaso um instante de tempo, e verificamos
uma peça de cada uma das máquinas. Suponha que X seja o número de peças defeituosas.

5.12 Se X é uma variável aleatória com distribuição binomial com parâmetros n e p, calcule
P (X = k) para cada conjunto de valores de n, p, e k dados na tabela abaixo:

n 2 2 2 3 4 4 4 4 4 4 4
p 0.4 0.4 0.4 0.4 0.4 0.4 0.5 0.6 0.3 0.2 1
k 0 1 2 0 0 1 1 1 1 1 1
P (X = k)

5.13 ♠ Na manufatura de certo artigo, é sabido que 1 entre 10 dos artigos é defeituoso. Qual a
probabilidade de que uma amostra casual de tamanho 4 contenha:
a) nenhum defeituoso? b) não mais do que dois defeituosos?
c) exatamente um defeituoso? d) exatamente dois defeituosos?

5.14 ♠ Um fabricante de peças de automóveis garante que uma caixa de suas peças conterá, no
máximo, 2 defeituosas. Se a caixa contém 18 peças e a experiência tem demonstrado que esse
processo de fabricação produz 5% das peças defeituosas, qual a probabilidade de que uma caixa
satisfaça a garantia?

68
5.15 ♠ Certo curso de treinamento aumenta a produtividade de uma certa população de fun-
cionários em 80% dos casos. Se 10 funcionários quaisquer participam deste curso, encontre a
probabilidade de:
a) exatamente 7 funcionários aumentarem a produtividade;
b) não mais do que 8 funcionários aumentaram a produtivdade;
c) pelo menos 3 funcionários não aumentaram a produtividade.

5.16 ♠ Deteminado tipo de parafuso é vendido em caixas com 1000 peças. É uma caracterı́stica
da fabricação produzir 10% defeituosos. Normalmente, cada caixa é vendida por 13,50 u.m. Um
comprador faz a seguinte proposta: de cada caixa, ele escolhe uma amostra de 20 peças: se a
caixa tiver 0 defeituso, ele paga 20,00 u.m.; 1 ou 2 defeituosos, ele paga 10,00 u.m.; 3 ou mais
defeituosos, ele paga 8,00 u.m. Qual alternativa é a mais vantajosa para o fabricante? (Justificar
estatisticamente).

5.17 ♠ Uma fábrica produz válvulas, das quais 20% são defeituosas. As válvulas são vendidas
em caixas com 10 peças. Se a caixa não tiver nenhuma defeituosa, seu preço de venda é 10,00 u.m.;
tendo uma, o preço é 8,00 u.m.; duas ou três, o preço é 6,00 u.m.; mais do que três, o preço é 2,00
u.m. Qual o preço médio de uma caixa?

5.18 ♠ Um industrial fabrica peças, das quais 1/5 são defeituosas. Dois compradores, A e B, clas-
sificaram as partidas adquiridas em categorias I e II, pagando 1,20 u.m. e 0,80 u.m. respectivamente
do seguinte modo:
Comprador A: retira uma amostra de 5 peças; se encontrar mais de uma defeituosa, classifica
como II.
Comprador B: retira amostra de 10 peças; se encontrar mais de 2 defeituosas, classifica como
II.
Em média, qual comprador oferece mais lucro?

5.19 O daltonismo aparece em 10% das pessoas de uma certa população; explique como você
obteria o tamanho mı́nimo necessário para que uma amostra (com reposição) desta população
tivesse pelo menos 2 pessoas daltônicas com probabilidade maior ou igual a 0.95. (Assuma que
você tivesse à sua disposição tabelas adequadas).

5.20 Em uma certa população, cerca de 40% dos eleitores são democratas. Você pode determinar
o tamanho da amostra n e este número de eleitores é selecionado ao acaso, com reposição, dessa
população. Você ganha um prêmio se houver exatamente 2 democratas na amostra. Que valor de
n lhe dá a maior chance? Qual a sua chance para este valor de n?

5.21 Em um exame do tipo múltipla escolha, com 3 opções para cada uma das 5 questões, qual
é a probabilidade de que um aluno acerte 4 ou mais questões, chutando todas elas?

69
5.22 A VARIG sabe que 5% dos passageiros que fazem a reserva e compram a passagem para
um certo vôo não aparecem para viajar. Devido a isto, sua polı́tica é vender 52 passagens para o
vôo, que é feito num avião de 50 lugares. Qual a probabilidade de que cada passageiro que apareça
com a passagem tenha lugar no avião?

5.23 Suponha que 20 coelhos tenham sido usados em um estudo sobre agentes coaguladores de
sangue. Inicialmente, um anticoagulante foi ministrado a 10 coelhos que foram, posteriormente,
colocados em uma mesma gaiola com os animais que não receberam a droga. Supondo que os
coelhos não sejam distinguı́veis, encontre a probabilidade de que entre 12 coelhos selecionados ao
acaso, 6 tenham tomado a droga e 6 não.

5.24 Admita que a proporção de sexos seja 1:1. Determine a probabilidade de que uma famı́lia
selecionada aleatoriamente, com 5 crianças tenha:
a) exatamente uma menina b) pelo menos uma menina c) não mais de uma menina.

5.25 Um produtor de sementes afirma que 80% das sementes de certo tipo germinam. Você planta
5 destas sementes, compradas deste produtor. Qual a probabilidade de :
a) Exatamente 2 sementes germinarem?
b) Pelo menos 3 sementes germinarem?
c) No máximo 2 sementes germinarem?
d) Suponha que 100 pessoas estejam em situação análoga à sua, isto é, cada uma plantou 5
destas sementes.
i) Para quantas pessoas esperamos que exatamente 2 sementes germinem?
ii) Pelo menos 3 germinem? iii) No máximo 3 germinem?
e) Suponha que após certo tempo, você tenha verificado que no máximo duas das sementes que
plantou germinaram. Isto leva a descrer da afirmação do produtor de que 80% destas sementes
germinam? Porque?

5.26 Dois indivı́duos, A e B, discordam quanto à proveniência de 12 insetos. O indivı́duo A afirma


que os 12 insetos são provenientes do cruzamento de hı́bridos do tipo Aa, enquanto o indivı́duo B
afirma que estes provêm de cruzamentos onde um dos genitores é da forma Aa e o outro é da forma
aa. Seja X a variável aleatória que conta o número de homozigotos (aa) entre os 12 insetos.
a) Se A estiver com a razão, qual a distribuição de probabilidade de X? E se for B?
b) Suponha que usaremos o seguinte critério para decidir quem está com razão: se 6 ou mais
insetos forem do tipo aa daremos razão a B, caso contrário daremos razão a A. Qual a probabilidade
de cometer um erro dizendo que A (B) está com a razão quando na verdade B (A) está certo?

5.27 Alega-se que um suplemento vitamı́nico auxilia cangurus a aprender a sair de um labirinto
de paredes altas. Para testar a veracidade desta afirmação, 16 cangurus são divididos em 8 pares.
Em cada par, um canguru é escolhido ao acaso para receber o suplemento vitamı́nico e o outro é
alimentado com uma dieta normal. Os tempos de aprendizado são então cronometrados e observa-
se que em 6 dos 8 pares, o canguru que recebeu a vitamina aprendeu mais rápido. Se a vitamina
não tem efeito, de maneira que cada um dos animais tem a mesma chance de ser o mais rápido,
qual é a probabilidade de que 6 ou mais animais tratados aprendam mais rápido, apenas por acaso?

70
5.28 Os motores de um avião operam independentemente e cada um deles pode falhar em vôo,
com probabilidade q < 1. Suponha que o vôo decorre com inteira segurança se pelo menos a metade
dos motores funcionam. Determine a probabilidade de completa segurança de vôo, no caso de:
a) Um quadrimotor b) Um bimotor.
Para que valores de q seria preferı́vel um bimotor a um quadrimotor?

5.29 Um certo tratamento é capaz de imunizar 78% dos coelhos contra uma determinada doença.
Uma nova amostra de 50 coelhos é testada. Seja X o número de animais que se tornarão imunes.
Qual é a esperança e o desvio padrão de X?

5.30 Ao examinarmos uma lâmina ao microscópio, suponha que o número de bactérias percebidas
em uma área igual à do campo visual do aparelho siga uma distribuição de Poisson, com número
médio de bactérias igual a 2,5. Se uma tal área da lâmina é escolhida ao acaso, qual a probabilidade
de não conter mais que 5 bactérias? Nenhuma bactéria?

5.31 Oito ratos experimentais se movem aleatoriamente sobre uma superfı́cie que é dividida em
vinte quadrantes de mesmo tamanho, numerados 1,2,...20. Uma fotografia é tirada. Admitindo-se
a distribuição de Poisson,
a) Qual é a probabilidade de que exatamente um rato seja encontrado no quadrante no 1?
b) Quantos quadrantes devem conter 0, 1, 2,... ratos? (Sugestão: calcular o número médio de
ratos, por quadrante, e usar uma tabela de probabilidade de Poisson.)

71
6 Variáveis aleatórias contı́nuas
6.1 Introdução
Na seção anterior, vimos que uma variável aleatória X é uma função real definida em um espaço
amostral associado a um experimento aleatório. Algumas vezes, o conjunto dos valores possı́veis da
v.a. X não é um conjunto finito ou enumerável, como acontecia no caso discreto. Vamos considerar
o seguinte exemplo.

Exemplo 6.1 Suponha que a distribuição de uma dada população segundo a altura, em metros,
seja a seguinte:

Altura(m) % ∆i fi dip xi xi fi
1, 50 ` 1, 60 20 0,10 0,2 2 1,55 0,31
1, 60 ` 1, 80 50 0,20 0,5 2,5 1,70 0,85
1, 80 ` 1, 90 30 0,10 0,3 3 1,85 0.555
Total 100 – 1 – – 1,715

Suponha que uma pessoa seja escolhida ao acaso desta população e seja X a altura da pessoa
escolhida. Então X é uma variável aleatória pois associa um número a um resultado de um
experimento aleatório.
Por meio do histograma da distribuição acima, podemos atribuir probabilidades a eventos asso-
ciados a este experimento. Por exemplo, suponha que desejamos obter as seguintes probabilidades:

a) probabilidade da altura da pessoa escolhida ser menor que 1,60m (ou P (X < 1, 60));
b) probabilidade da altura da pessoa escolhida estar entre 1,75m e 1,85m
(ou P (1, 75 < X < 1, 85)).
c) probabilidade da altura da pessoa escolhida ser igual a 1,75m (P (X = 1, 75)).
Observe que se uma pessoa é escolhida ao acaso da população, então a probabilidade de que
a altura dela esteja em determinado intervalo, é igual à proporção de pessoas com altura naquele
intervalo. Interpretando a área abaixo do histograma entre dois valores como a proporção de
pessoas na população com altura entre estes dois valores, fica simples encontrar as probabilidades
desejadas.
Em a) temos que P (X < 1, 60) é dada pela proporção de pessoas com altura inferior a 1,60m,
que corresponde à área do histograma até 1,6. Em b), temos que P (1, 75 < X < 1, 85) é dada pela
proporção de pessoas na população com altura entre 1,75m e 1,85m, que é dada pela área abaixo
do histograma entre 1,75 e 1,85. A Figura 10 mostra o histograma da distribuição. Em c), temos
que a área abaixo do histograma no intervalo desejado é igual a zero e portanto a probabilidade de
que a altura seja igual a 1,75m é zero!
A variável aleatória X do Exemplo 6.1 é um exemplo de uma variável contı́nua. O histograma
da distribuição, se ignorarmos os lados dos blocos, pode ser interpretado como sendo o gráfico da
seguinte função f , 
 2 se 1, 5 ≤ x < 1, 6


2, 5 se 1, 6 ≤ x < 1, 8
f (x) =

3
 se 1, 8 ≤ x < 1, 9
0 caso contrário

72
Figura 10: Histograma da distribuição de alturas do Exemplo 6.1

que chamaremos de função densidade de probabilidade da variável aleatória X e que tem as seguintes
propriedades,

1. f (x) ≥ 0 para todo x ; (quer dizer que o gráfico de f está todo acima do eixo dos x)

2. a área abaixo do gráfico de f é igual a 1 (igual à área total abaixo do histograma de proporção);

3. a probabilidade de X estar em um determinado intervalo é igual à área abaixo de f neste


intervalo.

Observação 1 É importante não confundir variável aleatória contı́nua com variável contı́nua, como
foi definido anteriormente. Por exemplo, se estivermos observando a variável altura em um grupo de
5 estudantes, a caracterı́stica observada em cada um é uma variável contı́nua pois pode, a princı́pio,
ser qualquer valor em um intervalo. Suponha agora que estas alturas tenham sido medidas (com
precisão), tendo sido obtidos os seguintes valores, em metros: 1,65; 1,67;1,68;1,70;1,82. Se um estu-
dante for escolhido ao acaso deste grupo e definimos X como sendo a altura do estudante escolhido,
então X é uma variável aleatória discreta, pois pode assumir apenas um dos cinco valores acima,
cada um com probabilidade 1/5.

Observação 2 Quando utilizamos um histograma para representar uma distribuição de uma po-
pulação, estamos em geral utilizando uma aproximação ou um modelo teórico para ela. Nenhuma
população finita ou enumerável pode ter, de fato, uma distribuição contı́nua, embora muitas vezes
seja possı́vel encontrar uma distribuição contı́nua que se aproxima da verdadeira, como no caso do
histograma. Se houvesse um número suficientemente grande de observações, poderı́amos ir dimi-
nuindo os intervalos de classe e o histograma iria ficando cada vez menos irregular, até atingir um
caso limite com uma curva bem mais suave. Desta forma, qualquer curva que esteja toda acima
do eixo dos x e que delimite uma área total igual a 1, poderia ser um histograma alisado de uma
população e portanto poderia ser o gráfico de uma função de densidade de uma v.a. X.

73
Figura 11: Gráfico da função densidade, Exemplo 6.2

Exemplo 6.2 Verifique que a função abaixo representa a função de densidade de alguma variável
aleatória, 
 4x, se 0 ≤ x < 1/2
f (x) = −4x + 4, 1/2 ≤ x < 1

o outros valores
Solução Temos,

1. f (x) ≥ 0 para todo x;

2. Área total abaixo da curva é igual à área do triângulo

(base) × (altura) 1×2


= = 1.
2 2

Logo, f (x) representa a função densidade de uma variável aleatória X e P (X > 1/2) é a área
hachurada na figura = (1−1/2)×2
2 = 1/2.

Nem sempre é tão simples encontrar a área abaixo do gráfico de uma função. Por exemplo,
como poderı́amos determinar a área delimitada pelo gráfico de uma função quadrática? Em casos
como este, para verificarmos se a área total abaixo da curva vale 1, teremos que utilizar algumas
ferramentas do Cálculo.

Definição 6.1 A integral definida de uma função positiva f em um intervalo [a,b], representa a
área abaixo do gráfico da função neste intervalo.

Exemplo 6.3 Podemos calcular a área hachurada no gráfico da Figura 12 por meio da integral da
função F no intervalo [a, b], que denotaremos por
Z b
f (x)dx
a

74
Figura 12: Gráfico de f do Exemplo 6.3

6.2 Valor esperado e variância


Podemos definir medidas de posição e dispersão tais como valor esperado e variância para uma
variável contı́nua e para isso necessitamos também de ferramentas do Cálculo.
Definição 6.2 Se X é uma variável aleatória contı́nua com função densidade f , então a média de
X, ou seu valor esperado é dado por
Z ∞
E(X) = xf (x)dx
−∞
se a integral imprópria acima convergir.
Definição 6.3 Se X é uma variável aleatória contı́nua com função densidade f , e média E(X),
então a variância de X é dada por
Z ∞
Var(X) = (x − E(X))2f (x)dx
−∞
se a integral imprópria acima convergir.
Tanto o valor esperado quanto a variância de uma variável aleatória satisfazem propriedades
similares às propriedades da média e variância de um conjunto de dados e são válidas para variáveis
discretas ou contı́nuas. Temos
1. Se Y = aX + b e a e b são constantes, então,
E(Y ) = aE(X) + b e Var(Y ) = a2 Var(X).

2. Var(X) ≥ 0. Se Var(X) = 0, então X é constante, isto é, P (X = a) = 1, para alguma


constante a.

3. Se denotarmos por µ o valor esperado de X e por σ 2 sua variância, então a variável aleatória
Z definida por
X−µ
Z= ,
σ
tem média 0 e variância 1. Dizemos neste caso que Z é a padronização de X.

75
6.3 Modelos probabilı́sticos
6.3.1 Distribuição Normal
A equação da curva normal foi publicada pela primeira vez em 12 de novembro de 1733, por
Abraham De Moivre (1667–1774) que trabalhava na solução de problemas relacionados com jogos.
Por volta de 1870, o matemático belga Adolph Quetelet teve a idéia de usar esta curva como um
histograma ideal, ao qual histogramas obtidos para conjuntos de dados pudessem ser comparados.

Definição 6.4 Dizemos que uma variável aleatória contı́nua tem distribuição Normal com parâmetros
µ e σ 2 , se o gráfico de sua função de densidade de probabilidade for uma curva normal. Mais es-
pecificamente, quando sua função de densidade de probabilidade for dada pela equação
1 1 x−µ 2
f (x) = √ e− 2 ( σ ) , −∞ < x < ∞,
2πσ 2
em que e = 2, 71828 . . ., π = 3, 14159 . . .

Os parâmetros da distribuição µ e σ 2 são, respectivamente, a média e a variância da variável


aleatória.
Observação Denotamos por N (µ, σ 2) a variável aleatória Normal com média µ e variância σ 2 .

6.3.2 Algumas caracterı́sticas da distribuição Normal


1. A curva Normal é simétrica em torno de sua média µ;

2. A área total abaixo da curva é 1 (é uma densidade de probabilidade). Devido à simetria,
50% da área fica à esquerda de µ e 50% fica à direita.

3. A média, a mediana e a moda são iguais;

4. A distribuição Normal fica inteiramente especificada para cada escolha do par µ e σ 2 (µ pode
assumir qualquer valor real e σ 2 é, obviamente, positivo).

5. Qualquer combinação linear de uma variável aleatória Normal também é uma variável aleatória
Normal. Mais especificamente, se X ∼ N (µ, σ 2) e Y = aX + b para constantes quaisquer a
e b, então Y ∼ N (aµ + b, a2σ 2).
2
6. Se X ∼ N (µX , σX ) e Y ∼ N (µY , σY2 ) são duas variáveis aleatórias “independentes”, então
aX + bY ∼ N (aµX + bµY , a2σX2
+ b2σY2 ).

Definição 6.5 Dizemos que uma variável aleatória X tem distribuição Normal Padrão ou Normal
reduzida se X ∼ N (0, 1), isto é, se X tiver uma distribuição Normal com média 0 e variância 1.
A função de densidade da Normal Padrão é
1 2
f (x) = √ e−x /2, −∞ < x < ∞

76
A curva Normal Padrão está tabelada e para determinar a área abaixo da curva entre dois
pontos quaisquer, xo ≤ x1 , não precisamos calcular a integral
Z x1 1 2
√ e−x /2 dx,
xo 2π
mesmo porque ela não pode ser calculada exatamente e aproximações só são possı́veis por meio de
métodos numéricos. Para obter áreas sob curvas Normais quaisquer, podemos usar o fato 5 acima,
com a = 1/σ e b = µ/σ, isto é,

X−µ X µ
Se X ∼ N (µ, σ 2), teremos Z = = − ∼ N (0, 1),
σ σ σ
e consultar a tabela da Normal padrão.

6.3.3 Uso da tabela da Normal padrão


A tabela da distribuição Normal padrão fornece os valores da área abaixo da curva N (0, 1) entre
os valores 0 e z, para z ≥ 0. Isto é, fornece a probabilidade de uma v.a. Z ∼ N (0, 1) tomar valores
entre 0 e z.
Como utilizar a Tabela III de “Tabelas Estatı́sticas”:
Z z 1 2
Valor Tabelado = P (0 ≤ Z ≤ z) = √ e−x /2
0 2π

z 0 1 2 3 4 5 6 7 8 9
0.0 .0000 .0040 .0080 .0120 .0160 .0199 .0239 .0279 .0319 .0359
0.1 .0398 .0438 .0478 .0517 .0557 .0596 .0636 .0675 .0714 .0753
.. ..
. .
1.6 .4452 .4463 .4474 .4484 .4495 .4505 .4515 .4525 4535 .4545
.. ..
. .
1.9 .4713 .4719 .4726 .4732 .4738 .4744 .4750 .4756 .4761 .4767
.. ..
. .
3.8 .4999 .4999 .4999 .4999 .4999 .4999 .4999 .4999 .4999 .4999

Na linha da tabela temos a parte inteira e a primeira decimal de z;


na coluna da tabela temos a segunda decimal de z;

no corpo da tabela temos P (0 ≤ Z ≤ z).


Por exemplo, se z = 0, 13, cruzamos o valor 0.1 da linha com o valor 3 na coluna obtemos 0.0517
(na tabela, o 0 antes do ponto decimal foi omitido). Esta é, portanto, a área sob a curva Normal
entre 0 e 0,13.
A tabela só fornece áreas à direita do 0 (valores positivos de z), mas podemos encontrar áreas
também à esquerda do 0, usando a simetria da curva e o fato de que P (Z ≥ 0) = 0.5.

Exemplo 6.4 Vamos calcular algumas probabilidades envolvendo a distribuição normal.

77
1. P (−1, 64 ≤ Z ≤ 0) = P (0 ≤ Z ≤ 1, 64) = 0.4495 (Figura 13 a)

2. P (Z ≥ 1, 64) = 0, 5 − 0.4495 = 0.0505 (Figura 13 b).

3. P (Z ≤ 1, 64) = P (Z ≤ 0) + P (0 ≤ Z ≤ 1, 64) = 0, 5 + 0, 4495 = 0, 9495 (Figura 13 c)

4. P (Z ≤ −1, 64) = P (Z ≥ 1, 64) = 0, 0505 (por simetria) (Figura 13 d)

Figura 13:

5. P (|Z| ≤ 1, 64) = P (−1, 64 ≤ Z ≤ 1, 64) = 2P (0 ≤ Z ≤ 1, 64) = 2(0, 4495) = 0, 8990


(Figura 14 a)

6. P (1, 64 ≤ Z ≤ 1, 96) = P (0 ≤ Z ≤ 1, 96) − P (0 ≤ Z ≤ 1, 64) = 0, 4750 − 0, 4495 = 0, 0255


(Figura 14 b)

7. P (−1, 64 ≤ Z ≤ 1, 96) = P (0 ≤ Z ≤ 1, 64) + P (0 ≤ Z ≤ 1, 96) = 0, 4495 + 0, 4750 = 0, 9245


(Figura 14 c)

Exemplo 6.5 Vamos determinar o valor de z tal que P (0 ≤ Z ≤ z) = 0, 0753. Agora, conhecemos
o valor tabelado e procuramos o valor de z que corresponde a ele. No corpo da tabela o valor 0,0753
está na linha 0.1 e na coluna 9. Portanto o valor de z é 0,19 (Figura 14 d).
Exemplo 6.6 Seja X ∼ N (4, σ 2 = 64). Calcule as seguintes probabilidades: P (X > 6) e
P (|X| ≥ 2). Temos
   
X −µ 6−µ X −4 6−4
P (X > 6) = P > =P > =
σ σ 8 8
P (Z > 0, 25) = 0, 5 − 0, 0987 = 0, 4013
e
 
−2 − µ X−µ 2−µ
P (|X| > 2) = 1 − P (|X| ≤ 2) = 1 − P (−2 ≤ X ≤ 2) = 1 − P ≤ ≤
σ σ σ
 
−2 − 4 X −4 2−4
1−P ≤ ≤ = 1 − P (−0, 75 ≤ Z ≤ −0, 25) = 1 − (0, 2734 − 0, 0987) =
8 8 8
0,8253. (Z denota a normal padrão)

78
Figura 14:

79
6.4 Exercı́cios
6.1 ♠ Uma v.a. X tem distribuição triangular no intervalo [0,1] se a sua função de densidade de
probabilidade é dada por: 


0, x<0

 Cx, 0 ≤ x ≤ 1/2
f (x) =

 C(1 − x), 1/2 ≤ x ≤ 1


0, x>1
a) Que valor deve ter a constante C, de modo que f (x) seja uma função de densidade?
b) Faça o gráfico de f (x).
c) Determine P (X ≤ 1/2), P (X > 1/2) e P (1/4 ≤ X ≤ 3/4).
d) Obtenha E(X) .
Sugestão .: Use o fato de que o gráfico de f (x) pode ser interpretado como o histograma da
distribuição e que a área do triângulo é = (base x altura)/2.

6.2 ♠ Suponha que estamos atirando dardos em uma alvo circular de raio 10 cm, e seja X a
distância do ponto atingido pelo dardo ao centro do alvo. A função de densidade de X é:

kx, se 0 ≤ 10
f (x) =
0 nos demais valores
a) Qual a probabilidade de acertar a mosca, se ela é um cı́rculo de 1 cm de raio?
b) Mostre que a probabilidade de acertar qualquer cı́rculo concêntrico é proporcional à sua área.

6.3 Se X ∼ N (0, 1), calcule:


a) P (X > 0, 55) b) P (X > −0, 55) c) P (X < −2, 33)
d) P (−1, 96 < X < 1, 96) e) P (−2, 58 < X < 2, 58) f ) P (−1, 65 < X < 1, 65)
g) P (X = 0, 74) h) P (0 < X < 1, 43) i) P (−1, 43 < X < 0)
j) P (−1, 43 < X < 1, 43) k) P (|X| > 1) l) P (X < −2 ou X > 1)

6.4 Determine o valor de z nas expressões abaixo, assumindo Z ∼ N (0, 1).


a) P (Z < z) = 0, 0055 b) P (Z > z) = 0, 0384 c) P (−2, 67 ≤ Z ≤ z) = 0, 9718
d) P (Z ≤ z) = 0, 1251 e) P (−z ≤ Z ≤ z) = 0, 8132 f ) P (−z ≤ Z ≤ 2, 98) = 0, 1117

6.5 Determinar a área subentendida pela curva normal :


a) à esquerda de −1, 78; b) à esquerda de 0,56; c) à direita de −1, 45;
d) à direita de 2,16; e) entre −0, 80 e 1,53;
f ) à esquerda de −2, 52 e à direita de 1,83; g) à direita de −2, 52 e à esquerda de 1,83.

6.6 ♠ Se X : N (10, 4) , calcular:


a) P (8 < X < 10), c) P (X > 10),
b) P (9 ≤ X ≤ 12), d) P (X < 8 ou X > 11)

80
6.7 ♠ Na distribuição X : N (100, 100), encontre:
a) P (X < 115) b) P (X ≥ 80),
c) P (|X − 100| ≤ 10), d) o valor a, tal que P (100 − a ≤ X ≤ 100 + a) = 0, 95.

6.8 ♠ Na distribuição X : N (µ, σ 2), encontre:


a) P (X ≤ µ + 2σ), b) P (|X − µ| ≤ σ),
c) o número a, tal que P (µ − aσ ≤ X ≤ µ + aσ) = 0, 99,
d) o número a, tal que P (X > a) = 0, 90.

6.9 ♣ Suponha que X tenha distribuição N (0, 25). Calcule P (1 < X 2 < 4).

6.10 ♠ Suponha que as amplitudes de vida de dois aparelhos elétricos, D1 e D2, tenham dis-
tribuições N (42, 36) e N (45, 9), respectivamente. Se o aparelho é para ser usado por um perı́odo
de 45 horas, qual aparelho deve ser preferido? E se for por um perı́odo de 49 horas?

6.11 ♠ O diâmetro X de rolamentos de esfera fabricados por certa fábrica tem distribuição
N (0, 6140; (0, 0025)2). O lucro T de cada esfera depende de seu diâmetro, e T = 0, 10 se a
esfera é boa; (0, 6100 < X < 0, 6180);
T = 0, 05 se a esfera é recuperável (0, 6080 < X < 0, 6100) ou (0, 6180 < X < 0, 6200);
T = −0, 10 se a esfera é defeituosa (X < 0, 6080 ouX > 0, 62). Calcular:
a) As probabilidades de as esferas serem boas, recuperáveis e defeituosas.
b) E(T ) e V ar(T ).

6.12 ♠ As notas de Estatı́stica Econômica dos alunos de uma determinada universidade distri-
buem-se de acordo com uma distribuição normal, com média 6,4 e desvio padrão 0,8. O professor
atribui graus A, B e C da seguinte forma:

Nota Grau
x<5 C
5 ≤ x < 7, 5 B
7, 5 ≤ x ≤ 10 A

Em uma classe de 80 alunos, qual o número esperado de alunos com grau A? B? C?

6.13 ♠ O peso bruto de latas de conserva é uma v.a. normal com média 1.000 g e desvio padrão
20 g. as latas têm peso médio de 100 g e devio padrão de 10 g, também com distribuição normal
de peso.
a) Qual a probabilidade de uma lata conter menos de 850 g de peso lı́quido?
b) Qual a probabilidade de uma lata conter mais de 920 g de peso lı́quido?

81
6.14 ♠ A distribuição dos pesos de coelhos criados numa granja pode muito bem ser representada
por uma distribuição normal, com média de 5 kg e desvio padrão de 0,8 kg. Uma abatedouro
comprará 5.000 coelhos e pretende classificá-los de acordo com o peso, do seguinte modo: 20% dos
mais leves como pequenos, os 55% seguintes como médios, os 15% seguintes como grandes e os 10
% mais pesados como extras. Quais os limites de peso para cada classificação?

6.15 ♠ Uma enchedora automática de garrafas de refrigerantes está regulada para que o volume
médio de lı́quido em cada garrafa seja de 1.000 cm3 e o desvio padrão de 10 cm3 . Pode-se admitir
que a distribuição da variável seja normal.
a) Qual a porcentagem de garrafas em que o volume de lı́quido é menor que 990 cm3 ?
b) Qual a porcentagem de garrafas em que o volume não se desvia da média em mais de 2 desvios
padrões?
c) O que acontecerá com a porcentagem do item (b) se a máquina for regulada de forma que a
média seja 1.200 cm3 e o desvio padrão 20 cm3 ?

6.16 A precipitação pluviométrica média em certa cidade, no mês de dezembro, é de 8,9 cm.
Admitindo a distribuição normal com desvio padrão 2,5 cm, determinar a probabilidade de que, no
mês de dezembro próximo, a precipitação seja:
a) inferior a 1,6 cm b) superior a 12 cm
c) superior a 5 cm mas não superior a 7,5 cm.

6.17 ♠ As vendas de um determinado produto têm distribuição aproximadamente normal, com


média 500 e desvio padrão 50. Se a empresa decide fabricar 600 unidades no mês em estudo, qual é
a probabilidade de que não possa atender a todos os pedidos desse mês, por estar com a produção
esgotada?

6.18 ♠ As alturas de 10.000 alunos de um colégio têm distribuição aproximadamente normal, com
média 170 cm e desvio padrão 5 cm.
a) Qual o número esperado de alunos com altura superior a 1,65 m?
b) Qual o intervalo simétrico em torno da média, que conterá 75% das alturas dos alunos?

6.19 Suponha que a vida, em horas, de um equipamento eletrônico produzido por um determinado
processo tenha distribuição normal com média µ = 160 horas e desvio padrão σ. Qual é o máximo
valor possı́vel para σ se a vida X de um destes equipamentos deve ter um probabilidade de 0,80 de
estar entre 120 e 200 horas?

6.20 ♦ Suponha que a altura, em centı́metros, de um homem de 21 anos de idade seja um


fenômeno aleatório com resultados numéricos que obedece uma lei de probabilidades normal com
média µ = 170 e desvio padrão σ = 5. Qual é a probabilidade condicional de que a altura de um
homem de 21 anos de idade seja maior que 170 cm, dado que é maior que 160 cm?

82
6.21 ♦ Se as taxas de colesterol para uma dada população estão distribuı́das aproximadamente
como uma normal com média de 200mg/100 ml e desvio padrão de 20 mg/100 ml encontre a
probabilidade de que um indivı́duo escolhido ao acaso desta população tenha sua taxa de colesterol:
a) Entre 180 e 200 mg/100 ml b) Maior que 225 mg/100 ml
c) Menor que 150 mg/100 ml d) Entre 190 e 210 mg/100 ml

6.22 ♣ Sabe-se que a precipitação anual de chuva, em certa localidade, é uma variável aleatória
normalmente distribuı́da, com média igual a 29,5 cm e desvio padrão 2,5 cm. Quantos centı́metros
de chuva (anualmente) são ultrapassados em cerca de 5 por cento do tempo?

6.23 ♣ Suponha que a temperatura (medida em graus centı́grados) seja normalmente distribuı́da,
com média 10o e variância 4o . Qual é a probabilidade de que a temperatura T esteja entre 48o e
53o Fahrenheit? ((F o − 32) × 9 = C o /5)

6.24 ♣ Sabe-se que os erros, em certo dispositivo para medir comprimentos, são normalmente
distribuı́dos com média zero e desvio padrão 1 unidade. Qual é a probabilidade de que o erro na
medida seja maior que 1 unidade? 2 unidades? 3 unidades?

6.25 ♣ Suponha que X, o comprimento de uma barra, tenha distribuição N (10, 2). Em vez
de medir o valor de X, somente serão especificadas certas exigências que devem ser atendidas.
Especificamente, cada barra fabricada será classificada como sendo do tipo A, se X < 8 e como
sendo do tipo B, caso contrário. Se 10 destas barras forem fabricadas, qual é a probabilidade de que
um igual número de barras caia em cada uma das categorias acima? (Sugestão: Calcule primeiro
a probabilidade de uma barra pertencer a uma das categorias acima; depois use a distribuição
binomial).

6.26 Os registros indicam que o tempo para se fazer um teste é aproximadamente normal, com
média 80 minutos e desvio padrão 5 minutos.
a) Qual é a porcentagem de candidatos que levam menos de 85 minutos para concluir o teste?
b) Se o tempo máximo concedido para a realização do teste é de 1 hora e 35 minutos, qual é a
porcentagem de candidatos que não conseguirá terminar o teste? c) Qual é o número esperado de
pessoas, entre 150 que se submetem ao teste, que entregará o teste até 1 hora e 10 minutos?

83
7 Distribuições Amostrais
Nesta seção vamos apresentar alguns conceitos básicos sobre inferência estatı́stica.

7.1 Introdução
Definição 7.1 População - É um conjunto de indivı́duos (ou objetos), tendo pelo menos uma
variável em comum observável.

(Em geral, representamos a população por sua distribuição).

Definição 7.2 Amostra - É qualquer subconjunto da população.

No caso mais comum, escolhe-se ao acaso um subconjunto da população de tal maneira que
cada elemento da amostra seja uma variável aleatória com a mesma distribuição da população.
A amostra assim obtida é chamada Amostra Aleatória (ou casual) Simples (a.a.s.). ( Obs.: Se a
população for finita, a única maneira de se escolher uma amostra com esta caracterı́stica é fazendo
uma escolha com reposição). Notação para uma amostra aleatória de tamanho n: (X1, . . . , Xn).

Definição 7.3 Inferência Estatı́stica - Conjunto de técnicas estatı́sticas que têm como objetivo
produzir afirmações sobre uma dada caracterı́stica da população a partir de informações colhidas
de uma amostra. Os dois problemas básicos da Inferência Estatı́stica são: Estimação e Teste de
Hipóteses.

Definição 7.4 Parâmetros - São caracterı́sticas da população. Ex.: Média populacional, Variância
populacional, Mediana populacional, etc.

Definição 7.5 Estatı́stica É qualquer função da amostra (X1, . . . , Xn).

( Obs.: Uma estatı́stica é uma variável aleatória, pois é função de variáveis aleatórias
(T = f (X1, . . . , Xn )). As inferências sobre os parâmetros serão baseadas em estatı́sticas.

Definição 7.6 Estimador- Se θ é um parâmetro de uma distribuição (população) e empregamos


uma estatı́stica T baseada em uma amostra desta distribuição para estimar este parâmetro, dizemos
que T é um Estimador de θ.

Definição 7.7 Estimativa - O valor de um estimador, observado na amostra.

Tabela 7.1 - Notação usual para os principais parâmetros e seus estimadores


Média Variância D. Padrão No elem. Proporção
População
(parâmetro) µ σ2 σ N p
Amostra √
(Estatı́stica) X̄ σ̂ 2 ou S 2 σ̂ 2 ou S n p̂

84
Obs.: X̄ = X1 + . n. . + Xn é a média amostral;
Pn
σ̂ 2 = (1/n) i=1 (Xi − X̄)2 ;
1 P n
S 2 = n−1 i=1 (Xi − X̄)
2 é geralmente chamada de variância amostral é a estatı́stica mais

utilizada como estimador de σ 2. Em geral, as calculadoras cientı́ficas fornecem o valor de s2 como


a variância de um conjunto de valores.
Outras estatı́sticas : Mediana da amostra, Máximo e Mı́nimo da amostra, Percentis, etc.

Definição 7.8 Distribuição Amostral - A distribuição amostral de uma determinada estatı́stica


é a distribuição de todos os possı́veis valores que ela pode assumir, calculados a partir de todas as
possı́veis amostras de mesmo tamanho.

A média aritmética e a variância da distribuição amostral de uma estatı́stica T são, respectiva-


mente, o valor esperado (Esperança ou E(T )) e Variância (σT2 ) da estatı́stica T .

Definição 7.9 Estimadores não Viciados (ou não viesados)- Um estimador T de um parâmetro
θ é não viciado se E(T ) = θ.

Isto quer dizer que se considerarmos todas as amostras possı́veis de tamanho n e calcularmos
o estimador T para todas elas, a média aritmética dos valores obtidos será o próprio parâmetro θ.
Observações
1 (IMPORTANTE!) Ao utilizarmos uma amostra aleatória de tamanho n para fazermos inferências
sobre parâmetros da população de onde esta amostra foi retirada, calculamos estatı́sticas que serão
estimadores para estes parâmetros. No caso especı́fico da variância, poderı́amos utilizar, por exem-
plo os seguintes estimadores de σ 2, a variância populacional:
Pn Pn Pn
2 i=1 (Xi − X̄)2 2 i=1 (Xi− X̄)2 − X̄)2
i=1 (Xi
σ̂ = , S = , T= , etc.
n n−1 n−2
Embora a estatı́stica σ̂ 2 acima pareça o estimador mais natural para a variância, S 2 (a variância
amostral) é o mais utilizado por ser não viciado, isto é, E(S 2) = σ 2.
2- Note que a variância de um conjunto de n valores é sempre dada por
Pn n
− x̄)2 X
i=1 (xi
= (1/n) x2i − x̄2
n i=1
Pn
onde x̄ = (1/n) i=1 xi . Ou, equivalentemente, por
k
X k
X
(xi − x̄)2 fi = x2i fi − x̄2
i=1 i=1
P
onde x̄ = ki=1 xi fi . Esta é, portanto, a única maneira pela qual podemos calcular a variância de
uma população (σ 2), caso tenhamos acesso integral a ela. (Observe ainda que podemos reescrever

85
as fórmulas acima utilizando a notação da Tabela 7.1, isto é, para uma população de tamanho N ,
temos :
N
X N
X
σ 2 = (1/N ) x2i − µ2 , ou σ2 = x2i fi − µ2
i=1 i=1

3 -X̄, a média amostral, é um estimador não viciado da média populacional, isto é, E(X̄) = µ.

Definição 7.10 Estimadores Consistentes Dizemos que Tn é um estimador consistente para


o parâmetro θ se
1. limn→∞ E(Tn) = θ e

2. limn→∞ V ar(Tn ) = 0 .

Na definição acima, o ı́ndice n em Tn representa o tamanho da amostra considerada.

7.2 Distribuição Amostral da Média


Considere uma população com média µ e variância σ 2. Se (X1, . . . , Xn) é uma amostra aleatória
simples desta população, a média amostral X̄ tem as seguintes propriedades:
σ2
E(X̄) = µ e V ar(X̄) = .
n
Populações Normais
Se a população de interesse tem distribuição Normal com média µ e variância σ 2, então
σ2
X̄ ∼ N (µ,
).
n
Como conseqüência, temos os seguintes resultados para uma população Normal,
1.
X̄ − µ
√ ∼ N (0, 1),
σ/ n
2. Se e é a variável aletória que mede a diferença entre a estatı́stica X̄ e o parâmetro µ, isto é,
e = X̄ − µ, então, !
σ2
e ∼ N 0, .
n

(e é chamado erro amostral da média).


Na maioria dos aplicações práticas, deseja-se estimar tanto a média quanto a variância de uma
dada população. Desta forma, o seguinte resultado é bastante importante.
Seja X1 , . . . , Xn uma amostra aleatória simples retirada de uma população Normal de média µ
e variância σ 2. Então a estatı́stica
X̄ − µ
t= √
S/ n
tem uma distribuição t de Student com n − 1 graus de liberdade.

A distribuição t está tabelada. Algumas propriedades:

86
1. A distribuição tn (t de Student com n graus de liberdade) é simétrica em torno de 0;

2. E(tn ) = 0 e Var(tn ) = n/(n − 2), se n > 2;

3. tn → N (0, 1) quando n → ∞ (quer dizer, a função de densidade de tn se aproxima da função


de densidade de uma normal padrão, quando n cresce).

Populações não Normais

Suponha agora que a população de interesse não tenha distribuição normal. Neste caso, podemos
utilizar o seguinte teorema,

Teorema 7.1 Teorema Central do Limite Seja X1 , . . . Xn uma amostra aleatória simples ex-
traı́da de uma população com média µ e variância σ 2. Então,

X̄ − µ
√ ' N (0, 1).
σ/ n

Isto quer dizer que a distribuição amostral de X̄ se aproxima da distribuição normal à medida
que n cresce. A velocidade de convergência vai depender da distribuição da população da qual a
amostra foi retirada. Quanto mais próxima da Normal for a população original, mais rápida será
esta convergência. Como regra prática, aceita-se que para amostras aleatórias com mais de 30
elementos a aproximação já pode ser considerada muito boa.

Consequências:
X̄ −
√ µ , então Z tem distribuição aproximadamente Normal Padrão (Z ' N (0, 1)) .
i) Se Z =
σ/ n
ii) O erro amostral da média e = X̄ − µ, tem distribuição aproximadamente Normal com média 0
2 2
e variância σn . (e ' N (0, σn )).

Exemplo: Solução do exercı́cio 7.1:

Solução a):
µ = 1(1/3) + 2(1/3) + 3(1/3) = 2;
3
X 3
X
σ2 = (xi − µ)2 fi = x2i fi − µ2 = 12 (1/3) + 22(1/3) + 32 (1/3) − 22 = 2/3
i=1 i=1

b), c) e d): (Obs.: nas tabelas abaixo, x̄, v 2 e s2 representam os diferentes valores dos
estimadores X̄, σ̂ 2e S 2 , respectivamente.)

87
Tabela 7.2 n=2
Amostra Prob. x̄ v2 s2
1 (1,1) 1/9 1 0,0 0,0
2 (1,2) 1/9 3/2 0,25 0,5
3 (1,3) 1/9 4/2 1,0 2,0
4 (2,1) 1/9 3/2 0,25 0,5
5 (2,2) 1/9 2 0,0 0,0
6 (2,3) 1/9 5/2 0,25 0,5
7 (3,1) 1/9 2 1,0 2,0
8 (3,2) 1/9 5/2 0,25 0,5
9 (3,3) 1/9 3 0,0 0,0

e) e f ) (parte)

Tabela 7.3 Distribuição da Média amostral (X̄)


x̄ 1 3/2 2 5/2 3
P (X̄ = x̄) 1/9 2/9 3/9 2/9 1/9

2 ) de X̄ :
Valor esperado (E(X̄)) e Variância (σX̄
1 32 3 52 1
E(X̄) = 1 + +2 + +3 = 2 (= µ)
9 2 9 9 2 9 9
 1  3 2  2  3  5 2  2   1 
2 2 2 2 1  2/3 σ2 
V ar(X̄) = σX̄ = 1 + +2 + +3 − 22 = = =
9 2 9 9 2 9 9 3 2 n

Tabela 7.4 Distribuição de σ̂ 2 e de S 2 (n = 2)


v2 P (σ̂ 2 = v 2 ) s2 P (S 2 = s2 )
0 3/9 0 3/9
0.25 4/9 0.5 4/9
1.0 2/9 2 2/9

3 4
1 2 
E(σ̂ 2) = 0 + 0, 25 = (6= σ 2)
+ 1, 0
9 9 9 3
3 4 2  2
E(S 2) = 0 + 0, 5 + 2, 0 = (= σ 2)
9 9 9 3

88
Tabela 7.5 n = 3
Amostra Prob. x̄ v2 Amostra Prob. x̄ v2
1 (1,1,1) 1/27 1 0 15 (2,2,3) 1/27 7/3 2/9
2 (1,1,2) 1/27 4/3 2/9 16 (2,3,1) 1/27 2 6/9
3 (1,1,3) 1/27 5/3 8/9 17 (2,3,2) 1/27 7/3 2/9
4 (1,2,1) 1/27 4/3 2/9 18 (2,3,3) 1/27 8/3 2/9
5 (1,2,2) 1/27 5/3 2/9 19 (3,1,1) 1/27 5/3 8/9
6 (1,2,3) 1/27 2 6/9 20 (3,1,2) 1/27 2 6/9
7 (1,3,1) 1/27 5/3 8/9 21 (3,1,3) 1/27 7/3 8/9
8 (1,3,2) 1/27 2 6/9 22 (3,2,1) 1/27 2 6/9
9 (1,3,3) 1/27 7/3 8/9 23 (3,2,2) 1/27 7/3 2/9
10 (2,1,1) 1/27 4/3 2/9 24 (3,2,3) 1/27 8/3 2/9
11 (2,1,2) 1/27 5/3 2/9 25 (3,3,1) 1/27 7/3 8/9
12 (2,1,3) 1/27 2 6/9 26 (3,3,2) 1/27 8/3 2/9
13 (2,2,1) 1/27 5/3 2/9 27 (3,3,3) 1/27 3 0
14 (2,2,2) 1/27 2 0

Tabela 7.6 Distribuição de X̄, (n = 3)


x̄ 1 4/3 5/3 2 7/3 8/3 3
P (X̄ = x̄) 1/27 3/27 6/27 7/27 6/27 3/27 1/27

1  4  3  1
E(X̄) = 1 + + ...+3 = 2 (= µ)
27 3 27 27
1  4 2  3  1 2 σ2
2
V ar(X̄) = σX̄ = 12 + + . . . + 32 − 22 = (= )
27 3 27 27 9 n

Tabela 7.7 Distribuição de σ̂ 2 e de S 2 (n = 3)


v 2 P (σˆ2 = v 2) s2 P (s2 = v 2 )
0 3/27 0 3/27
2/9 12/27 3/9 12/27
6/9 6/27 9/9 6/27
8/9 6/27 12/9 6/27

3  2 2  12   6 2  6   8 2  6  4
E(σ̂ 2) = 0 + + + = (6= σ 2 )
27 9 27 9 27 9 27 9
3  3 2  12     12 2 6 
2 6 2
E(S 2) = 0 + +1 + = (= σ 2)
27 9 27 27 9 27 3

89
7.3 Exercı́cios
7.1 Considere uma população onde a caracterı́stica a ser observada assume apenas 3 valores: 1,
2 e 3, na mesma proporção, isto é temos a seguinte distribuição:

xi 1 2 3
fi 1/3 1/3 1/3

a) Calcule a média e a variância desta população.


b) Obtenha a lista de todas as amostras distintas de tamanho 2 que podem ser obtidas desta
população.
c) Calcule a probabilidade de que uma amostra aleatória simples de tamanho 2 escolhida desta
população, seja igual a cada uma das amostras da lista obtida no item a).
d) Para cada amostra, calcule a média aritmética (x̄), a a variância amostral (s2 ) e σ̂ 2 .
e) Obtenha a distribuição amostral (exata) de cada uma destas estatı́sticas e calcule a Esperança
e Variância destas distribuições.
f ) Verifique os resultados sobre as propriedades destes estimadores para este exemplo.
g) Repita o exercı́cio para n = 3.
h) Represente graficamente a distribuição da população e distribuição amostral da média aritmética
para n = 2 e n = 3.

7.2 ♦ Suponha que uma população consista dos seguintes valores: 1, 3, 5, 7, 9. Construa a dis-
tribuição amostral de X̄ baseada em amostras de tamanho 2 selecionadas sem reposição. Encontre
a média e a variância da distribuição amostral.

7.3 ♦ Dada uma população normalmente distribuı́da com média 100 e desvio padrão 20, encontre
a seguintes probabilidades baseadas em uma amostra de tamanho 16:
a) P (X̄ ≥ 100) b) P (96 ≤ X̄ ≤ 108) c) P (X̄ ≤ 110).

7.4 ♠ Uma variável aleatória X tem distribuição normal, com média 100 e desvio padrão 10.
a) Qual a P (90 < X < 110)?
b) Se X̄ é a média de uma amostra de 16 elementos retirados dessa população, calcule
P (90 < X̄ < 110).
c) Desenhe, num único gráfico, as distribuições de X e X̄.
d) Que tamanho deveria ter a amostra para que P (90 < X̄ < 110) = 95%?

7.5 ♠ A máquina de empacotar um determinado produto o faz segundo uma distribuição normal,
com média µ e desvio padrão 10g.
a) Em quanto deve ser regulado o peso médio µ para que apenas 10% dos pacotes tenham menos
do que 500g?
b) Com a máquina assim regulada, qual a probabilidade de que o peso total de 4 pacotes escolhidos
ao acaso seja inferior a 2kg?

90
7.6 ♠ No exercı́cio anterior, e após a máquina estar regulada, programou-se uma carta de controle
de qualidade. De hora em hora, será retirada uma amostra de 4 pacotes, e estes serão pesados. Se
a média da amostra for inferior a 495 g ou superior a 520 g, pára-se a produção para reajustar a
máquina, isto é, reajustar o peso médio.
a) Qual a probabilidade de ser feita uma parada desnecessária?
b) Se o peso médio da máquina desregulou-se para 500 g, qual a probabilidade de continuar-se a
produção fora dos padrões desejados?

7.7 ♠ A capacidade máxima de um elevador é de 500 kg. Se a distribuição X dos pesos dos
usuários é suposta N (70, 100):
a) Qual a probabilidade de 7 passageiros ultrapassarem esse limite?
b) E seis passageiros?

7.8 ♠ Uma variável X tem distribuição normal, com média 10 e desvio padrão 4. Aos participantes
de um jogo, é permitido observar uma amostra de qualquer tamanho e calcular a média amostral.
Ganha um prêmio aquele cuja média amostral for maior que 12.
a) Se um participante escolher uma amostra de tamanho 16, qual a probabilidade de ele ganhar
um prêmio?
b) Escolha um tamanho de amostra diferente de 16 para participar do jogo. Qual a probabilidade
de você ganhar um prêmio?
c) Baseado nos resultados acima, qua o melhor tamanho de amostra para participar do jogo?

7.9 ∇ A análise de ocorrência de um mineral numa região é uma variável aleatória com média 4
e variância 3/2. A unidade de medida é a porcentagem de mineral por unidade de volume. Para
uma amostra de tamanho 20:
a) Que dizer da distribuição de X̄?
b) Que tamanho deveria ter a amostra para que P (3, 5 < X̄ ≤ 4, 5) = 0, 95?

7.10 ♠ Se uma amostra com 36 observações é tomada de uma população, qual deve ser o tamanho
de uma outra amostra para que o erro padrão desta amostra seja 2/3 do erro padrão da média da
primeira amostra?

7.11 ♠ Definimos a variável e = X̄ − µ, como sendo o erro amostral da média. Suponha que a
variância dos salários de uma certa região seja 400 unidades ao quadrado.
a) Determine E(e) e V ar(e).
b) Que proporção das amostras de tamanho 25 terão erro amostral absoluto maior do que 2
unidades?
c) E que proproção das amostras de tamanho 100?
d) Neste último caso, qual o valor de d, tal que P (|e| > d) = 1%?
e) Qual deve ser o tamanho da amostra para que 95% dos erros amostrais absolutos sejam inferiores
a uma unidade?

91
7.12 ♠ A distribuição dos comprimentos dos elos de uma corrente de bicicleta é normal, com
média 2cm e variância igual a 0,01 cm2 . Para que uma corrente se ajuste à bicicleta, deve ter
comprimento total entre 58 e 61 cm.
a) Qual a probabilidade de uma corrente com 30 elos não se ajustar à bicicleta?
b) E uma corrente com 29 elos?

7.13 ♠ Cada seção usada para construção de um oleoduto tem um comprimento médio de 5 m e
desvio padrão de 20 cm. O comprimento total do oleoduto será de 8 km.
a) Se a firma construtora do oleoduto encomendar 1.600 seções, qual a probabilidade de terem que
comprar mais do que uma seção adicional ( isto é, das 1.600 seções somarem 7.995 m ou menos)?
b) Qual a probabilidade do uso exato de 1599 seções, isto é, a soma das 1599 seções estar entre
8.000 e 8.005 m?

7.14 ♠ Uma empresa fabrica cilindros com 50 mm de diâmetro. O desvio padrão dos diâmetros
dos cilindros é 2,5 mm. Os diâmetros de uma amostra de 4 cilindros são medidos a cada hora. A
média da amostra é usada para decidir se o processo de fabricação está operando satisfatoriamente.
Aplica-se a seguinte regra de decisão: se o diâmetro médio da amostra de 4 cilindros é igual a 53.7
mm ou mais, ou igual a 46,3 mm ou menos, deve-se parar o processo. Se o diâmetro médio estiver
entre 46,3 e 53,7 mm, o processo deve continuar.
a) Qual a probabilidade de se parar o processo se a média µ continuar com 50 mm?
b) Qual a probabilidade do processo continuar se a média se deslocar para µ = 53, 7?

7.15 ♦ Suponha que em uma certa população de pessoas dependentes de uma certa droga, a
duração média desta dependência seja de 5 anos e o desvio padrão de 3 anos. Qual é a probabili-
dade de que uma amostra aleatória de 36 indivı́duos desta população forneça uma duração média
de dependência entre 4 e 6 anos?

7.16 ♦ Suponha que o tempo de resposta de indivı́duos sadios a um certo estı́mulo seja uma
variável aleatória com distribuição normal com média 15 segundos e uma variância de 16. Qual é
a probabilidade de que uma amostra aleatória de 16 indivı́duos forneça uma média de tempo de
resposta de 12 segundos ou mais?

7.17 ♦ Se as taxas de ácido úrico em homens adultos sadios tem distribuição aproximadamente
normal com média 5.7 mg e desvio padrão 1 mg (%), encontre a probabilidade de que uma amostra
de tamanho 9 forneça uma média :
a) Maior que 6. b) Entre 5 e 6. c) Menor que 5.2

7.18 Denotando por tn a distribuição t com n graus de liberdade, encontre x tal que
a) P (t1 > x) = 0.05 b) P (t5 ≤ x) = 0.95 c) P (t20 ≤ x) = 0.90
d) P (t20 > x) = 0.15 e) P (|t15 | > x) = 0.10)

92
8 Intervalos de Confiança
Quando usamos uma estatı́stica T como estimador para um parâmetro θ, estamos usando um
estimador pontual para este parâmetro, o que não nos permite julgar qual a possı́vel magnitude do
erro que estamos cometendo. Para contornar este problema, em geral fazemos uso dos Intervalos
de confiança, baseados na distribuição amostral do estimador pontual do parâmetro em questão.

8.1 Intervalos de confiança para a média populacional


A construção de intervalos de confiança para µ é feita a partir da distribuição amostral de X̄, o
estimador pontual mais comum para a média populacional.

8.1.1 σ 2 conhecido
Para construir intervalos de confiança para µ, devemos ter um modelo para a distribuição da
população de interesse (ou para a distribuição da caracterı́stica de interesse). Vamos considerar
duas situações:

1. populações normais e

2. populações não normais.

Quando a distribuição da população é normal, temos como obter a distribuição amostral da


média amostral (ver Seção 7) e para outras distribuições vamos utilizar distribuições amostrais
aproximadas.

População Normal
Considere uma população Normal com média µ desconhecida e variância σ 2 conhecida. Dada
uma amostra aleatória simples X1, . . . , Xn, calculamos a estimativa pontual X̄ para µ, o que nos
leva a cometer um erro X̄ − µ, de magnitude desconhecida. Como

X̄ − µ
√ ∼ N (0, 1) temos X̄ − µ ∼ N (0, σ 2/n),
σ/ n

o que nos permite determinar a probabilidade de cometer erros de determinada magnitude (nı́vel
de confiança). Por exemplo:

σ
P (|X̄ − µ| < 1, 96 √ ) = 0, 95, ou
n
σ σ
P (−1, 96 √ < X̄ − µ < 1, 96 √ ) = 0, 95, ou
n n
σ σ
P (X̄ − 1, 96 √ < µ < X̄ + 1, 96 √ ) = 0, 95. (2)
n n
Como µ não é uma variável aleatória( X̄ é), devemos interpretar a expressão em (2) como segue.

93
Se construirmos intervalos da forma (x̄−1, 96 √σn , x̄+1, 96 √σn ) para todas as amostras possı́veis
de tamanho n, 95% deles conterão a média populacional. Este exemplo pode ser generalizado. O
intervalo  
σ σ
X̄ − zα/2 √ , X̄ + zα/2 √
n n
é um intervalo de (1 − α)100% de confiança para a média populacional µ,com base em uma amostra
aleatória simples de tamanho n da distribuição. Dizemos que 1 − α é o Nı́vel de Confiança do
intervalo, em que zα/2 é tal que P (|Z| < zα/2 ) = 1 − α com Z ∼ N (0, 1).
Fixado o nı́vel de confiança 1 − α, procuramos o valor zα/2 que corresponda ao valor tabelado
(0, 5 − α/2 ) na curva Normal Padrão. Veja figura abaixo:

Figura 15:

Populações não normais


Na maioria dos casos onde a distribuição não é Normal, não é possı́vel determinar intervalos com
confiança exata. No entanto, o Teorema Central do Limite nos dá uma garantia de que intervalos
construı́dos a partir da distribuição Normal, terão confiança aproximada 1−α. A Tabela 8.1 mostra
as expressões para os intervalos neste caso.

8.1.2 σ 2 desconhecido
Na maioria das aplicações práticas não conhecemos a variância σ 2 da distribuição de interesse e neste
caso, precisamos estimar esta variância. Os resultados sobre a distribuição amostral de X̄ e inter-
valos de confiança para a média continuam válidos se substituirmos σ 2 por um “bom” estimador σ̂ 2.

População Normal
O intervalo de confiança para a média neste caso se baseia no fato de que a estatı́stica
 
S
t = (X̄ − µ)/ √
n

tem distribuição t de Student com (n − 1) graus de liberdade. Esta distribuição tem uma forma
semelhante à da N(0,1), é simétrica em torno de zero e também está tabelada. S é o estimador
usual, não viciado de σ 2 ( ver Seção 8).
Várias tabelas da distribuição t de Student não fornecem valores crı́ticos para n > 30. Mas neste
caso, podemos usar o fato de que a distribuição de t = (X̄ − µ)/( √Sn ) se aproxima da distribuição

94
N (0, 1) a medida que o tamanho da amostra cresce. Então, um intervalo de confiança para µ, de
confiança aproximada 1 − α, é o mesmo obtido com variância conhecida, apenas substituindo σ 2
por s2 (veja Tabela 8.1).

Outras Distribuições
Quando a distribuição da população não é normal e a variância não é conhecida, podemos
ainda assim construir intervalos de confiança aproximada utilizando a distribuição normal, desde
que tenhamos um “bom” estimador de σ 2. Estimadores consistentes, isto é, que se aproximam de
σ 2 quando o tamanho da amostra cresce, são bons estimadores. A escolha do melhor estimador vai
depender da distribuição da população.
Podemos ilustrar esta situação, construindo um intervalo de confiança para a proporção popu-
lacional.

Exemplo 8.1 Suponha que p seja a proporção com que uma certa caracterı́stica aparece em uma
dada população. Podemos então modelar esta população segundo uma distribuição de Bernoulli com
parâmetro p. Cada elemento da população poderá assumir apenas os valores 1 (se a caracterı́stica
estiver presente) ou 0 (caso contrário). A média populacional será p e a variância populacional
p(1 − p). Ao considerarmos uma amostra aleatória simples de tamanho n desta população, teremos

1 se a caracterı́stica estiver presente no i-ésimo elemento da amostra
Xi =
0 caso contrário.
P
Logo, ni=1 Xi será o número de elementos na amostra que tem a caracterı́stica e X̄ será a
proporção amostral, que denotaremos p̂. O estimador p̂(1 − p̂) é um “bom” estimador de σ 2 .
Temos então que
p̂ − p
q ' N (0, 1),
p̂(1−p̂)
n
isto é, a distribuição amostral de p̂ se aproxima da curva normal quando n cresce. O intervalo de
confiança para p está na Tabela 8.1.

Amostra Piloto A amplitude ou comprimento de um intervalo de confiança, que denotaremos


por d, pode ser fixada a priori. Ela é, na verdade, a precisão da estimativa obtida e pode ser usada
para determinar o tamanho da amostra necessário para se obter a precisão desejada. Para isso, no
entanto, é preciso que se conheça a variância da população ou que se tenha uma estimativa desta
variância. Quando a variância é desconhecida, pode-se utilizar uma amostra piloto de tamanho
pequeno para se obter uma estimativa da variância e a partir desta estimativa, determina-se o
tamanho da amostra. No caso de proporções, o tamanho da amostra seria obtido a partir de
s
d p̂(1 − p̂)
= zα/2 × ,
2 n
o que nos daria
2 p̂(1 − p̂)
zα/2
n= .
d2 /4
Neste caso pode-se utilizar o fato de que p(1 − p) ≤ 1/4 (vale a igualdade quando p = 1/2).
2 /d2 ,
Substuindo p̂(1 − p̂) por 1/4 na expressão para n, obtemos uma amostra de tamanho n = zα/2
que corresponde a uma confiança maior ou igual à desejada.

95
Tabela 8.1 Intervalo de Confiança para a média populacional, µ

Distribuição Intervalo (1- α) Amplitute


População
Normal
1 2
σ conhecido (x̄ − zα/2 √σn , x̄ + zα/2 √σn ) 2zα/2 √σn
2 σ 2 desconhecido (x̄ − zα/2 √sn , x̄ + zα/2 √sn ) 2zα/2 √sn
n ≥ 30
3 σ2 desconhecido (x̄ − tα/2 √sn , x̄ + tα/2 √sn ) 2tα/2 √sn
n < 30
Outras distribuições
4 σ 2 conhecido (x̄ − zα/2 √σn , x̄ + zα/2 √σn ) 2zα/2 √σn
n ≥ 30
5 σ 2 desconhecido (x̄ − zα/2 √σ̂n , x̄ + zα/2 √σ̂n ) 2zα/2 √σ̂n
n ≥ 30  
q q q
p̂(1−p̂) p̂(1−p̂) p̂(1−p̂)
6 Proporção p̂ − zα/2 n , p̂ + zα/2 n 2zα/2 n

σ̂ 2 é um bom estimador da variância σ 2


zα/2 é o valor na distribuição N (0, 1) que deixa uma área α/2 à sua direita.
tα/2 é o valor na distribuição t de Student com n − 1 graus de liberdade, que deixa uma área
α/2 à sua direita.

Exemplo 8.2 Vamos considerar novamente o Exercı́cio 7.1.

A tabela 2 fornece os limites inferiores (li) e superiores (ls) dos possı́veis intervalos de 95% de
confiança, construı́dos usando o caso 4 da Tabela 8.1 (variância conhecida, distribuição não Normal)
para n = 3, no exemplo em que a população assume os valores 1, 2 e 3 na mesma proporção (Veja
Tabelas 1 e 2, da aula Distribuições Amostrais). Temos µ = 2 e σ 2 = 2/3. Observe que na
verdade, (25/27)100%, ou 92, 59% e não 95% dos intervalos contém a verdadeira média, mas isto
se deve a dois fatos:

1. usamos uma distribuição amostral aproximada, a Normal, para construir o intervalo. Esta
aproximação é boa para amostras grandes (pelo menos 30, veja a Tabela 8.1) mas foi utilizada
para n = 3;

2. No exemplo, X̄ é uma variável aleatória discreta. Neste caso, nem sempre é possı́vel obter
intervalos com nı́vel de confiança exato, fixado antes.

Neste exemplo, os intervalos obtidos tem nı́vel de confiança 92, 59%, que corresponde à proporção
25/27 de intervalos que contêm a média populacional, µ = 2.

96
Tabela 8.2 Distribuição de X̄ e Intervalos de confiança para µ, Exercı́cio 7.1.
x̄ 1 4/3 5/3 2 7/3 8/3 3
P (X̄ = x̄) 1/27 3/27 6/27 7/27 6/27 3/27 1/27
li(0,95) 0,08 0,41 0,74 1,08 1,41 1,74 2,08
ls(0,95) 1,92 2,25 2,59 2,92 3,26 3,59 3,92

Exemplo 8.3 Solução do Exercı́cio 8.3

Temos o caso 5 do Quadro 1: distribuição desconhecida, n > 30 e variância desconhecida.


Admitindo que o desvio padrão da amostra seja um bom estimador do desvio padrão verdadeiro,
σ, temos:
a) A confiança desejada é 99% ou o nı́vel de confiança é 1 − α = 0, 99. Logo, α = 1 − 0, 99 = 0, 01
ou α/2 = 0, 005. Devemos então procurar na tabela da N(0,1) o valor de zα/2 que deixa uma área
de 0,005 à sua direita (um número tal que seu valor tabelado seja 0,495 ou o mais próximo disto).
Obtemos z0,005 = 2, 58, e o intervalo de 99% de confiança é

σ̂ 100
x̄ ± zα/2 × √ = 800 ± 2, 58 √ = 800 ± 12, 9 = (787, 1; 812, 9)
n 400

b) Queremos obter a confiança do intervalo (800 ± 0, 98). Neste caso, a amplitude do intervalo é
2 × 0, 98 ou, equivalentemente,
100 0, 98
0, 98 = zα/2 √ = zα/2 × 5 ⇒ zα/2 = = 0, 196 ' 0, 20.
n 5

O valor tabelado de zα/2 é VT(0,20)=0,0793 o que nos dá

0, 5 − α/2 = 0, 0793 ⇒ 1 − α ' 0, 158 ' 0, 16 ou 16%

Logo, o intervalo acima tem apenas 16% de confiança.


c) Queremos determinar o tamanho de amostra necessário para que tenhamos 95% de confiança no
intervalo 800 ± 7, 84.
O valor de zα/2 que corresponde à confiança 95% é z0,0025 = 1, 96. Temos então

100
7, 84 = 1, 96 × √ .
n

Resolvendo para n, temos


√ 1, 96 × 100
n= = 25 o que nos dá n = 625.
7, 84
æ

97
8.2 Exercı́cios
8.1 ♠ Calcule o intervalo de confiança para a média populacional em cada um dos casos abaixo.

Média Amostral Tamanho da amostra Desvio Padrão Coeficiente de


da População Confiança
170 cm 100 15 cm 95%
165 cm 184 30 cm 85%
180 cm 225 30 cm 70%

8.2 Calcule o intervalo de confiança para a média populacional em cada um dos casos abaixo.

Média Amostral Tamanho da amostra Desvio Padrão Coeficiente de


da Amostra Confiança
170 cm 16 15 cm 95%
165 cm 25 30 cm 85%
180 cm 36 30 cm 70%

8.3 ♠ De 50.000 válvulas fabricadas por uma companhia, retira-se uma amostra de 400 válvulas
e obtém-se a vida média de 800 horas e desvio padrão de 100 horas.
a) Qual o intervalo de confiança de 99% para a vida média da população?
b) Com que confiança dir-se-ia que a vida média é 800 ±0,98?
c) Que tamanho deve ter a amostra para que seja de 95% a confiança na estimativa 800 ± 7,84?
(Que suposições você fez para responder às questões acima?)

8.4 Em uma amostra aleatória de 25 crianças de uma determinada comunidade, encontrou-se


altura média 150 cm e desvio padrão 5 cm. Admitindo que a distribuição das alturas das crianças
é Normal, determine um intervalo de 95% de confiança para a altura média da população.

8.5 ♠ Uma amostra aleatória de 625 donas-de-casa revela que 70% delas preferem a marca X de
detergente. Construir um intervalo de confiança para p= proporção das donas-de-casa que preferem
X, com coeficiente de confiança γ = 90%.

8.6 ♠ Da experiência passada, sabe-se que o desvio padrão da altura de crianças de 5a série do
1o grau é 5 cm.
a) Colhendo uma amostra de 36 dessas crianças, observou-se a média de 150 cm. Qual o intervalo
de confiança de 95% para a média populacional?
b) Que tamanho deve ter a amostra para que o intervalo 150± 0,98 tenha 95% de confiança?
c) Refaça os itens
√ a) e b) supondo que o desvio padrão de 5 cm seja uma estimativa obtida através
da amostra ( S 2 ).

98
8.7 ∇ O intervalo [35, 21; 35, 99] é o intervalo com confiança 95%, construı́do a partir de uma
amostra de tamanho 100, para a média µ de uma população Normal com desvio padrão igual a 2.
a) Qual o valor encontrado para a média desta amostra?
b) Se utilizássemos esta mesma amostra, mas uma confiança de 90%, qual seria o novo intervalo de
confiança?

8.8 Num certo grupo de pacientes, o nı́vel de colesterol no sangue é uma variável aleatória com
distribuição Normal, de média desconhecida e variância 64 (mg/ml)2.
a) Para uma amostra de 49 indivı́duos que forneceu nı́vel médio de colesterol de 120 mg/ml, construa
o intervalo de confiança de 88% para µ.
b) Se você desejasse diminuir a amplitude do intervalo encontrado em a), quais seriam suas alter-
nativas?

8.9 Um pesquisador deseja estimar a proporção de ratos nos quais se desenvolve um certo tipo de
tumor quando são submetidos a radiação. Ele deseja que sua estimativa não se desvie da proporção
verdadeira por mais de 0,02 com uma probabilidade de pelo menos 90%.
a) Quantos animais ele precisa examinar para satisfazer essas exigências?
b) Como seria possı́vel diminuir o tamanho da amostra utilizando a informação adicional de que
em geral esse tipo de radiação não afeta mais que 20% dos ratos?

8.10 Um pesquisador está estudando a resistência de um determinado material sob determinadas


condições. Ele sabe que essa variável é normalmente distribuı́da com desvio padrão de 2 unidades.
a) Utilizando os valores 4,9; 7,0; 8,1; 5,4; 5,6; 6,8; 7,2; 5,7; 6.2, unidades, obtidos de uma amostra
de tamanho 9, determine o intervalo de confiança para a resistência média com um coeficiente de
confiança γ = 0, 90.
b) Qual o tamanho da amostra necessário para que o erro cometido, ao estimarmos a resistência
média, não seja superior a 0,001 unidades com probabilidade 0,90?
c) Refaça o item a), supondo que o desvio padrão não fosse conhecido.

8.11 Encontre o coeficiente de confiança de um intervalo de confiança para p̂, se n = 100, p̂ = 0, 60


e a amplitude do intervalo deve ser igual a 0,090.

8.12 Suponha que uma amostra de tamanho n = 100 de uma distribuição normal N (µ, σ 2)
forneceu X̄ = 510, 6. Supondo σ 2 conhecido e igual a 16, obtenha um intervalo de confiança
para µ com coeficiente de confiança 90%.

8.13 A dosagem de certa substância no sangue segue uma distribuição Normal com média µ e
desvio padrão 15 mg/l. Se uma amostra de tamanho 25 for coletada, determine:
a) A probabilidade de |X̄ − µ| ser inferior a 5.
b) O intervalo para µ com confiança 98%, se temos x̄ = 98 mg/l.

99
8.14 Qual dever ser o tamanho de uma amostra cujo desvio padrão é igual a 10 para que a
diferença da média amostral para a média da população, em valor absoluto, seja menor que 1, com
coeficiente de confiança igual a:
a) 95% b) 99%

8.15 Uma população tem desvio padrão igual a 10.


a) Que tamanho deve ter uma amostra para que, com probabilidade 8% o erro em estimar a média
seja superior a 1 unidade?
b) Supondo-se escolhida a amostra no caso anterior, qual o intervalo de confiança, se x̄ = 50?

8.16 ♦ Alguns estudos sobre o Mal de Alzheimer mostraram um aumento na produção de 14CO2
em pacientes com esta doença. Em um destes estudos os seguintes valores de 14CO2 foram obtidas
de 16 biopsias corticais:

1009 1280 1180 1255 1547 2352 1956 1080


1776 1767 1680 2050 1452 2857 3100 1621

a) Assuma que a população destes valores seja normalmente distribuı́da com um desvio padrão de
350 e construa um intervalo de confiança de 95% para a média populacional.
b) Repita o item a) supondo que a variância populacional seja desconhecida.
P
(Dados: i x2i = 54.351.114)

8.17 • A velocidade da luz foi medida 2.500 vezes em um experimento. Foi encontrada uma média
de 299.774 km por segundo, com um desvio padrão de 14 km por segundo. Assuma a distribuição
Normal para estas medidas. Encontre um intervalo com aproximadamente 95% de confiança para
a velocidade da luz.

8.18 • Falso ou verdadeiro: Se a distribuição da população não for Normal, não podemos usar
esta curva para obter intervalos de confiança. Justifique sua resposta.

8.19 • Um procedimento de pesagem produz erros de medida que seguem o seguinte histograma:

A média dos desvios é 0 e o desvio padrão é 6 microgramas. Um objeto foi pesado 4 vezes e
deseja-se construir um intervalo de confiança para o peso do objeto. Pode-se usar a curva Normal?
E a distribuição de Student? Justifique suas respostas. E se fossem feitas 100 medidas?

100
8.20 ♠ Antes de uma eleição, um determinado partido está interessado em estimar a proporção
p de eleitores favoráveis ao seu candidato. Uma amostra piloto de tamanho 100 revelou que 60%
dos eleitores eram favoráveis ao candidato em questão.
a) Determine o tamanho da amostra necessário para que o erro cometido na estimação seja de, no
máximo, 0,01 com probabilidade de 80%.
b) Se na amostra final, com tamanho igual ao obtido em a), observou-se que 55% dos eleitores
eram favoráveis ao candidato em questão, construa um intervalo de confiança para a proporção p.
(Utilize γ = 0, 95)

8.21 ♠ Suponha que estejamos interessados em estimar a porcentagem de consumidores de um


certo produto. Se uma amostra de tamanho 300 forneceu 100 indivı́duos que consomem o dado
produto, determine:
a) O intervalo de confiança de p, com coeficiente de confiança de 95% (interprete o resultado).
b) O tamanho da amostra necessário para que o erro da estimativa não exceda a 0,02 unidades com
probabilidade de 95% (interprete o resultado).

8.22 ♠ Antes de uma eleição em que existiam 2 candidatos A e B, foi feita uma pesquisa com
400 eleitores escolhidos ao acaso e verificou-se que 208 deles pretendiam votar no candidato A.
Construa um intervalo de confiança com coeficiente γ = 0, 95% para a porcentagem de eleitores
favoráveis ao candidato A na época das eleições.

8.23 ♦ Uma pesquisa, com uma amostra de 150 domicı́lios em uma comunidade urbana, revelou
que em 87% dos casos, pelo menos um membro do domicı́lio tinha algum tipo de suguro de saúde.
Construa intervalos de 90, 95 e 99% de confiança para p, a verdadeira proporção de domicı́lios na
comunidade com a caracterı́stica de interesse.

8.24 ♦ Em um estudo desenvolvido para verificar a relação entre uma certa droga e uma certa
anomalia em embriões de galinha, injetou-se a droga em 50 ovos fertilizados no quarto dia de
incubação. No vigésimo dia de incubação, os embriões foram examinados e em 12 dele foi constatada
a anomalia. Encontre intervalos de 90, 95 e 99% de confiança para p.

8.25 Considere um experimento em que dois grupos de ratos (fêmeas) foram alimentados com
dietas apresentando alto e baixo conteúdo de proteı́na. A tabela abaixo dá o ganho de peso em
gramas para cada rato entre o 28o e o 84o de vida.

Alto conteúdo 123 134 146 104 119 124 161 107 83 113 129 97
Baixo conteúdo 70 118 101 85 107 132 94
Suponha que o ganho de peso possa ser modelado segundo uma distribuição normal com a
mesma variância σ 2 para ambas as dietas.
a) Crie um critério para decidir se estas dietas são equivalentes, com base no intervalo de confiança
para a diferença entre as médias.
b) Construa intervalos de confiança de nı́vel 90%, 95% e 99% para a diferença entre as médias de
ganho de peso. Utilize o critério em a) para decidir sobre a equivalência das duas dietas, para cada
um destes intervalos. Comente.

101
8.26 Dadas duas amostras extraı́das de populações normais de mesma variância, com
n1 = 10 x̄1 = 73 s1 = 5, 9
n2 = 13 x̄2 = 57 s2 = 5, 0,
Construa um intervalo de confiança para a diferença entre as médias.

8.27 Para comparar as possibilidades de produção de dois tipos de batata, plantaram-se sementes
de cada tipo em lotes distintos. As safras, em unidades adequadas, foram:

A 35 28 30 41 44 32 34 33 38 36 35
B 42 30 28 36 42 34 52 40 41 35 41

Suponha que a distribuição normal seja adequada para modelar estas produções.
a) Construa intervalos de confiança de nı́vel 90%, 95% e 99% para a diferença entre as médias de
2 2
produção, supondo que as variâncias populacionais sejam σA = 16 e σB = 36.
b) Repita o item a), supondo que as variâncias sejam desconhecidas porém iguais.
c) Comente sobre a equivalência entre as duas variedades.

102
A Notação de Somatório
A.1 Definições

Índices
O sı́mbolo xi (lê-se x ı́ndice i) representa qualquer um dos valores x1 , x2, . . ., xn . A letra i neste
caso é chamada ı́ndice.

Somatório
O sı́mbolo
n
X
xi (3)
i=1

é utilizado para representar a soma dos valores x com ı́ndices indo de 1 até n, isto é
n
X
xi = x 1 + x 2 + · · · + x n .
i=1

Dizemos soma de xi para i variando de 1 a n ou somatório


X
de xi , i variando de 1 a n. O sı́mbolo
P P
em (3) pode ser abreviado para xi , ou i xi ou xi , quando não houver dúvida sobre quais
i
ı́ndices estão envolvidos na soma.

A notação de somatório pode ser utilizada para representar somas parciais dos valores xi , 1 =
1, . . . , n. Por exemplo,
5
X
xi = x 2 + x 3 + x 4 + x 5 .
i=2

Várias expressões podem ser simplificadas utilizando-se a notação de somatório. Por exemplo,
k
X
X 1 Y1 + X 2 Y2 + · · · + X k Yk = X i Yi
i=1
k
X
2X2Y23 + 3X3Y33 + · · · + kXk Y k3 = iXi Yi3
i=2
7
X
1 + X32 + X54 + X76 + · · · + X15
14
= 2i
X2i+1 (X10 = 1)
i=0

No terceiro caso, repare que podemos representar os números ı́mpares como 2i + 1,


i = 0, 1, 2, 3, . . . e os pares como 2i, i = 0, 1, 2, 3, . . ..

Propriedades
Como o somatório é apenas uma notação para uma soma, ele satisfaz as seguintes propriedades:
n
X Pn
• 1) c = nc, onde c é uma constante. ( i=1 c = c + c + · · · + c, n vezes).
i=1

103
n
X Pn
• 2) axi = ax1 + · · · + axn = a(x1 + · · · xn ) = a i=1 xi .
i=1
n
X Pn
• 3) (axi + b) = a i=1 xi + nb.
i=1
n
X Pn Pn
• 4) (xi + yi ) = i=1 xi + i=1 yi .
i=1

Como consequência, temos que


n
X n
X n
X
(axi + b)2 = a x2i + 2ab xi + nb2.
i=1 i=1 i=1

A.2 Somatório duplo


Algumas vezes podemos usar dois ou mais ı́ndices para indentificar uma quantidade. Por exemplo,
imagine que a variável x seja a produção obtida em um experimento, no qual considerou-se 3
variedades de cana de açúcar, sob 4 nı́veis diferentes de adubação. Neste caso, é mais conveniente
utilizar dois ı́ndices para representar a produção em cada caso. Podemos utilizar, por exemplo,
o ı́ndice i representando a variedade de cana de açúcar e o ı́ndice j representando o nı́vel do adubo.
Desta forma, xij representa a produção da variedade i sob o nı́vel j de adubação. Podemos escrever
então
xij , i = 1, 2, 3, j = 1, 2, 3, 4.
Um somatório duplo inclui os dois ı́ndices,
n1 X
X n2 n1
X
xij = (xi1 + xi2 + · · · xin2 )
i=1 j=1 i=1
Xn1 n1
X n1
X
= xi1 + xi2 + · · · + xin2
i=1 i=1 i=1
= (x11 + · · · + xn1 1) + (x12 + · · · + xn1 2 ) + · · · + (x1n2 + · · · + xn1 n2 )

–♣–

A.3 Exercı́cios
P
A.1 Denote ni=1 xi /n por x̄. Para x1 = 6, x2 = 3, x3 = 1, x4 = 5, x5 = 2 e k = 5 , calcule as
seguintes quantidades:

104
Pk Pk
(a) i=1 xi (g) i=1 x2i

Pk P5
(b) i=1 3(xi ) (h) (1/5) i=1 xi

P5 P5
(c) i=1 (xi − x̄) (i) i=1 (xi − x̄)3

Pk P5
(d) i=1 (xi − 1)(xi + 1) (j) j=1 xj (xj − 1)

P5 2 P4
(e) i=2 (3xi + 2xi ) (k) i=1 xi (xi+1 + 2)2
X5  5 2
2 1 X
xi − xi
i=1
5 i=1
(f ) 4
A.2 Seja {x1 , x2 ,...,xk} um conjunto de valores. Expresse o seguinte usando o sinal de somatório
P
:

(a) Soma de todos os números.


(b) Soma dos primeiros (k − 1) números.
(c) Soma dos quadrados dos números.
(d) Soma dos quadrados dos desvios em relação a 10.
(e) Média aritmética dos números.
(f ) Soma dos quadrados dos desvios em relação à média, dividida por k − 1
P
A.3 Use o sinal de somatório, , para escrever as somas abaixo em forma compacta:

(a) Z1 + Z2 + . . . + Z6 (k) X2 + X4 + X6 + . . . + X40

(b) Y12 + Y22 + .... + Ym2 (l) X2 Y3 + X4 Y6 + X6 Y9 + . . . X40Y60

a2 a3 ak
(c) X1Y1 + X2Y2 + ... + Xk Yk (m) 1 + a + 2! + 3! +...+ k!

(d) X1f1 + X2f2 + ... + Xn fn (n) 2 + 6 + 10 + 14 + 18 + 22

(e) X12Y1 + X22Y2 + ... + Xk2Yk (o) 1 + X32 + X54 + X76 + . . . X15
14

(f ) 2X2Y23 + 3X3Y33 + ... + kXk Yk3 (p) X0Y1 + X12Y2 + X23Y3 + . . . + Xn−1
n
Yn
2 n
(g) a0 + a1 X1 + a2 X2 + ... + an Xn

(h) 1 + 4 + 9 + 16 + 25 + 36

e−λ λ2 e−λ λ3 e−λ λ20


(i) e−λ + e−λ λ + 2! + 3! + ...+ 20!

n 2 n−2 n  n−2 2
(j) q n + npq n−1 + 2 p q +...+ n−2 p q + npn−1 q + pn
m m!
(OBS.: k = k!(m−k)! , m! = m(m − 1)(m − 2) . . . 2.1, 0! = 1 )

105
A.4 Usando álgebra elementar, mostre os seguintes resultados e dê exemplos numéricos.
1 P
Se x̄ = k xi , então
k
X
(a) (xi − x̄) = 0.
i=1

k
X k
X  k 2
2 1 X
(b) (xi − x̄) = x2i − xi
i=1 i=1
k i=1
Pc Pc
Se x̄ = (1/k) i=1 xi fi ek= i=1 fi , então
c
X
(c) (xi − x̄)fi = 0
i=1
c
X c
X c
X
(d ) (xi + 1)2fi = x2i fi + 2 xi fi + k
i=1 i=1 i=1
c
X c
X  c 2
2 1 X
(e) (xi − x̄) fi = x2i fi − xi fi
i=1 i=1
k i=1

A.5 Considere um experimento realizado com camundongos em um labirinto. Quatro camundon-


gos em cada uma de cinco ninhadas foram tratados com três concentrações de um alucinógino e um
placebo. Estes quatro nı́veis da droga foram aleatoriamente distribuı́dos entre os animais de cada
ninhada. A variável de interesse foi o tempo necessário para completar uma volta no labirinto, e
estes valores são fornecidos em segundos.

Ninhada
Nı́vel da droga 1 2 3 4 5 Total
placebo 4 6 5 5 4 24
Conc. 1 7 6 8 6 7 34
Conc. 2 9 9 10 9 8 45
Conc. 3 15 21 20 19 16 91

Expresse usando o sı́mbolo de somatório e calcule seu valor:


(a) O tempo total gasto pelos camundongos que tomaram placebo.
(b) O tempo total gasto pelos camundongos da 3a ninhada.
(c) O tempo total gasto no experimento.
(d) O tempo total gasto pelos camundongos que não tomaram placebo.
(e) O tempo total gasto pelas ninhadas de ordem ı́mpar que não tomaram placebo.

A.6 Desenvolva os seguintes somatórios:


Pn P4 j j+1 Pk
(a) i=1 (bi − Xi ) (b) j=1 2j xj yj (c) i=1 (−1)
i
xi yi+1

Pi P5
(d) k=1 Xki (e) n=0 (−1)
n+1
n

106
A.7 Considere os dois conjuntos de dados abaixo:

i 1 2 3 4 5 6 7 8 9 10
xi 6 10 12 14 16 18 22 24 26 32
yi 40 42 46 51 57 60 70 75 80 82

a) Calcule:
Pn Pn P P P
i=1 xi i=1 yi n xi yi − xi yi
x̄ = , ȳ = , a = ȳ − bx̄, b= P 2 P 2
n n n xi − ( xi )
b) Obtenha dois outros conjuntos de dados, usando as seguintes transformações: zi = xi − x̄ e
ti = yi − ȳ e calcule:

P P P P P
z i ti (xi − x̄)2 (yi − ȳ)2 (zi − z̄)2 (ti − t̄)2
b∗ = P 2 , s2x = , s2y = , s2z = , s2t = .
zi n−1 n−1 n−1 n−1

A.8 Considere os seguintes conjuntos de valores:

i xi yi
1 4 -8
2 3 2
3 0 2
4 1 3

P4 3
X
i=1 xi yi
− x̄ȳ
Obtenha : a) b) (x2i − ixi),
DP (X).DP (Y ) i=1
em que sP
n
n
i=1 (xi − x̄)2 1X
DP (X) = , e x̄ = xi .
n n i=1

107
B Respostas de alguns exercı́cios selecionados
1.4 a) Conjunto 1
1 6
1 7 7
1 8 8 8 8 8 8 8 8 8 8 8 8 8 8
1 9 9 9 9 9 9 9 9 9 9 9 9
2 0 0 0 0 0 0 0 0 0
2 1 1 1
2 2 2 2 2
2 3
2 4 4
2
2
2 7
2
2 9

Conjunto 2
15 1 3 4 4
15∗ 5 5 5 6 7 8 8 9
16 0 0 0 0 0 0 0 1 1 1 1 1 2 2 3 3 3 3 4 4 4 4
16∗ 5 5 6 6 7 8 8 8 8 9 9 9
17 0 1 2 4
17∗
1.5
a) M: 40,2% b) M: 46,4% c) M: 179 cm d) M:177,5 cm
F: 34,8% F: 53,6% F: 170 cm F:168 cm
1.6
a) M: 58% b) M: 42% c) M: 178 cm d) M:176 cm
F: 346% F: 66% F: 169 cm F:168 cm
1.7 Sim/não.
1.10 a) Conjunto 8 (Ração A)
0
1
2 6 6 7 7 7 7 8 8 8 8 9 9 9 9
3 0 0 0 0 1 1 1 2 2 3 3 4 4 4 4 5 5 5 5 6
4 3 4
5
6 0 1 5 6

108
Conjunto 9 (Ração B)
0 3 4 8 9
1
2 5 6
3 3 4 4 4 4 5 5 5 5 6 6 7 7 8 8 8 9 9 9 9
4 0 0 0 0 1 1 1 1 2 2 2 2 3 3
5
6
1.11
A:(1055;1175] B:(1010,7;1055] C:(975;1010,7] D: [925,975]

2.1 a) x̄ = 0, 66 erros por página b) 0,5 c) 0,84 e) 330

2.2 Med=2,6 x̄ = 2, 59, DP=0,043

2.5 a) Med=2 b) Moda=2

2.6 a) x̄ = 6, 91, Med=3 b) Var=28,4, DP=5,3

2.7 b) x̄ = 3, 65, Var=5,13, DP=2,26 c) Q1=2, Med=2,75


d) Sim. Nova média = 2x̄=7,3 e nova variância = 4×5,13= 20,52

2.8 a) Nova média = 2x̄, novo desvio padrão = 2DP, nova mediana = 2Med.
b) Nova média = x̄ + 10, novo desvio padrão = DP, nova mediana = Med +10.

2.10 a)

Classes xi Porcentagem
0`1 0,5 20
1`2 1,5 50
2`3 2,5 20
3`5 4,0 10

c) x̄ = 1, 75, Med=1,6 e) 1,1

109
2.12 1) 15,9 3) 16,78

2.13 x̄ = 5, 9, Var=6,19, Moda=8, Med=6

3.1 C= 0, 44, , C∗ = 0, 62

3.2 C= 0, 42

3.4 C∗ = 0, 18

3.8 0,62

3.9 0,60

4.3 a) 3/4 b) 1/4 c) 3/4

4.4 a) A ∩ B c b)(A ∪ B c ) ∩ (Ac ∩ B) c) Ac ∩ B c

4.5 P(Produto> 0) = 43/91

4.6 P (A ∪ B) = 19/36 P (A ∩ B) = 1/12 P (Ac ) = 8/9

4.8 a) com reposição P(P P ) = 9/64, P(V V ) = 25/64, P(V P ) = 15/64, P(P V ) = 15/64.
b) sem reposição P(P P ) = 6/56, P(V V ) = 20/56, P(V P ) = 15/56, P(P V ) = 15/56.

4.9 a) com reposição: 9/64; sem reposição: 6/56


b) com reposição: 9/64; sem reposição: 6/56
c) com reposição: 40/64; sem reposição: 35/56

110
4.10 P(problema ser resolvido)=11/12

4.11 a) 5/9 b) 2/3

4.12 a) 1 − p − q + pq b) p + q − pq

4.16 5/9

4.17 a) 0,0768 b) 0,0836

4.18 2/3

4.19 8/9

4.20 !  0  n−0
n 1 5
1− = 1 − (5/6)n
0 6 6

4.22 a) 1 − x − y + z b) 1 − x + z c)y − z

4.23 P(A ∪ B ∪ C) = 5/8

4.27 0,24

4.28 3/4

4.29 a) 7/9 b) 1/4

4.31 a) 0,28 b) i) 0,15 ii) 0,33

6.3 a) 0,2912 b) 0,7088 i) 0,4236 j) 0,8472 k) 0,3174 l) 0,1814


6.4 a) z = −2, 54 b) z = 1, 77 c) z = 1, 97 e) z = 1, 32
6.6 a) 0,3413 b) 0,5328 c) 0,4672
6.7 c) 0,6826 d) a = 19, 6.
6.8 a) 0,0227 b) 0,6826 c) a = 2, 57 d) a = µ − 1, 28σ

111
6.12 A: 3; B: 70; C: 7
6.14 4,33; 5,54; 6,02
6.17 0,023
6.18 a) 9413 b) (164,25; 175,75)
6.24 0,3174; 0,0454; 0,0026
6.26 a) 84,13% b) 0,13% d) 3

7.4 a) 68% b) ≈ 100% d) 4


7.7 a) 35,20% b) 0,05%
7.12 a) 4,75% b) 50%
7.13 a) 26,44% b) 16,01%
7.15 0,9974
7.16 0,9987

8.1
170 ± 2, 96
165 ± 3, 18
180 ± 2, 08
8.3 a) [787,1; 812,9] b) 16% c) 625
8.6 a) [148,37; 151,63]
8.7 a)X̄ = 35, 6 b) [35,27;35,93]
8.8 [118,23; 121,77]
8.16
a) 1747, 625 ± 1, 96 × 350/4 = [1747, 625 ± 171, 5]
b) 1747, 625 ± 2, 131 × 604, 65/4 = [1747, 625 ± 322, 13]

A.1
a)17 b) 51 c) 0 d) 70 e) 111 f) 4,3
g) 75 h) 3,4 i) 5,06 j) 58 k)306
A.2 Pk Pk−1 Pk
a) i=1 xi b) i=1 xi c) x2i
Pi=1
Pk 2 Pk k
(xi−x̄)2
d) i=1 (xi − 10) e)x̄ = ( i=1 xi )/k f) i=1
k−1

A.3

112
P6 Pm Pk Pn
a) i=1 zi b) i=1 yi2 c) i=1 xi yi d) i=1 xi fi
Pk Pk Pn P6
e) i=1 x2i yi f) 3
i=2 (xi yi )ki g) i=0 xii ai h) i=1 x2i

P20 Pn   P20 P20


e−λ λi n
i) i=0 i!
j) i=0 i
pi q n−i k) i=1 x2i l) i=1 x2iy3i

Pk ai P5 P6 2i Pn
m) i=0 i! n) i=0 (4xi + 2) o) i=1 x2i−1 p) i=1 xii−1 yi
A.5
P5 P4
a) j=1 x1j = 24s b) i=1 xi3 = 43s c)194s d)170s e)100s
A.6
a) (b1 − X1 ) + (b2 − X2 ) + · · · + (bn − Xn )
b) 2x1 y12 + 4x22y23 + 8x33 y34 + 16x44 y45
c) −x1y2 + x2y3 + · · · + (−1)k xk yk+1
d) X1i + X2i + X3 + · · · + Xii
e) 0 + 1 − 2 + 3 − 4 + 5

113
A.7
a) x̄ = 18 ȳ = 60, 3 a = 25, 74 b=1,92

2
b) SX = 64 SZ2 = 64
A.9
a) −3, 17 b) 15

114
C Tabelas e formulários
Pn Pn Pn
i=1 xi i=1 (xi − x̄)2 i=1 x2i DP (X)
x̄ = , Var = = − x̄2 , CV (X) =
n n n x̄
Dados agrupados:
Pk k Pk Pk k
i=1 xi n i X i=1 (xi − x̄)2 ni i=1 x2i ni X
x̄ = = xi fi , Var = = − x̄2 = x2i fi − x̄2
n i=1 n n i=1

Posição dos quantis: k = s(n+1)


r
Dados discrepantes: > Q3 + 32 IQ ou < Q1 − 32 IQ, onde IQ = Q3 − Q1.
s
2
X (oij − eij )2 χ2 C
Análise bidimensional: χ = , C= , C∗ = q ,
i,j eij χ2 + n t−1
t

oij : valor observado na linha i e coluna j; eij : valor esperado = ( total da linha i)×(total da coluna j)
,
total geral
t: mı́nimo entre o número de linhas e o número de colunas.
Pn n P
1 i=1 (xi− x̄)(yi − ȳ) xi yi − nx̄ȳ
corr(X, Y ) = = q P i=1 P
n DP (X)DP (Y ) ( x2i − nx̄2 )( yi2 − nȳ 2)

.......................................................................................
P (A|B) = P (A ∩ B)/P (B), P (A1 ∩ A2 ∩ · · · ∩ An ) = P (A1 )P (A2 |A1) · · · P (An |A1 ∩ A2 · · · ∩ An−1 )
P (A ∪ B) = P (A) + P (B) − P (A ∩ B), P (Ac ) = 1 − P (A)

Se X é uma variável aleatória discreta:


P P P 2
p(x) = P (X = x), i p(xi ) = 1, F (x) = P (X ≤ x), E(X) = i xi p(xi ), Var(X) = i xi p(xi ) −
2
E(X) .

Binomial: X ∼ B(n, p) : p(x) = nx px (1 − p)n−x , x = 0, 1, . . ., n; E(X) = np; Var(X) = np(1 − p).
−λ x
Poisson: X ∼ P o(λ) : p(x) = e x!λ , E(X) = λ; Var(X) = λ.
R
Se X é uma variável contı́nua: P (a ≤ X ≤ b) = ab f (x)dx,
Rx R∞ R∞ 2
F (x) = P (X ≤ x) = −∞ f (t)dt, E(X) = −∞ xf (x)dx, Var(X) = −∞ x f (x)dx − E(X)2.
Normal: X ∼ N (µ, σ 2), E(X) = µ, Var(X) = σ 2, X − µ ∼ N (0, 1).
σ

.............................................................................................

115
Pn Pn
2 − X̄)2
i=1 (Xi
2
i=1 Xi n (m − 1)S12 + (n − 1)S22
S = = − X̄ 2 Sp2 =
n−1 n−1 n−1 m+n−2
Intervalos de Confiança

População Dist. amostral Intervalo (1- α)


Normal
2
σ conhecido X̄ ∼ N (µ, σ 2/n) (x̄ ∓ zα/2 √σn )
. √
σ 2 desconhecido (X̄ − µ) (S/ n) ' N (0, 1) (x̄ ∓ zα/2 √sn )
n ≥ 30 . √
σ2 desconhecido (X̄ − µ) (S/ n) ∼ tn−1 (x̄ ∓ tα/2 √sn )
n < 30
Outras distribuições . √
σ 2 conhecido (X̄ − µ) (σ/ n) ' N (0, 1) (x̄ ∓ zα/2 √σn )
n ≥ 30 . √
2
σ desconhecido (X̄ − µ) (σ̂/ n) ' N (0, 1) (x̄ ∓ zα/2 √σ̂n )
n ≥ 30
.q   q 
p̂(1−p̂) p̂(1−p̂)
Proporção (p̂ − p) n ' N (0, 1) p̂ ∓ zα/2 n

Dif. de médias
(Normal) q   
q
 . σ12 σ22 σ12 σ22
variâncias conhecidas (X̄ − Ȳ ) − (µ1 − µ2 ) m + n ∼ N (0, 1) X̄ − Ȳ ) ∓ zα/2 m + n
  . q   q 
1 1 1 1
variâncias desc. (X̄ − Ȳ ) − (µ1 − µ2 ) Sp m + n ∼ tn+m−2 X̄ − Ȳ ) ∓ tα/2 Sp m + n
(iguais)

116
Tabela C.1 Distribuição Binomial

Corpo da tábua: P (X = k)
!
n
P (X = k) = pk (1 − p)n−k , k = 0, 1, . . ., n
k

n = 2
k↓ 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 ← p
0 .902 .810 .722 .640 .562 .490 .423 .360 .303 .250 2
1 .095 .180 .255 .320 .375 .420 .455 .480 .495 .500 1
2 .003 .010 .023 .040 .063 .090 .122 .160 .202 .250 0
p→ 0.95 0.90 0.85 0.80 0.75 0.70 0.65 0.60 0.55 0.50 k ↑

n = 3
k↓ 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 ← p
0 .857 .729 .614 .512 .422 .343 .275 .216 .166 .125 3
1 .135 .243 .325 .384 .422 .441 .444 .432 .408 .375 2
2 .007 .027 .057 .096 .141 .189 .239 .288 .334 .375 1
3 0+ .001 .003 .008 .016 .027 .043 .064 .091 .125 0
p→ 0.95 0.90 0.85 0.80 0.75 0.70 0.65 0.60 0.55 0.50 k ↑

n = 4
k↓ 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 ← p
0 .815 .656 .522 .410 .316 .240 .179 .130 .092 .063 4
1 .171 .292 .368 .410 .422 .412 .384 .346 .299 .250 3
2 .014 .049 .098 .154 .211 .265 .311 .346 .368 .375 2
3 0+ .004 .011 .026 .047 .076 .111 .154 .200 .250 1
4 0+ 0+ .001 .002 .004 .008 .015 .026 .041 .063 0
p→ 0.95 0.90 0.85 0.80 0.75 0.70 0.65 0.60 0.55 0.50 k ↑

n = 5
k↓ 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 ← p
0 .774 .590 .444 .328 .237 .168 .116 .078 .050 .031 5
1 .204 .328 .392 .410 .396 .360 .312 .259 .206 .156 4
2 .021 .073 .138 .205 .264 .309 .336 .346 .337 .312 3
3 .001 .008 .024 .051 .088 .132 .181 .230 .276 .312 2
4 0+ 0+ .002 .006 .015 .028 .049 .077 .113 .156 1
5 0+ 0+ 0+ 0+ .001 .002 .005 .010 .018 .031 0
p→ 0.95 0.90 0.85 0.80 0.75 0.70 0.65 0.60 0.55 0.50 k ↑

117
Tabela C.1 (Cont.)
Corpo da tábua: P (X = k), k = 0, 1, . . ., n

n = 6
k↓ 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 ← p
0 .735 .531 .377 .262 .178 .118 .075 .047 .028 .016 6
1 .232 .354 .399 .393 .356 .303 .244 .187 .136 .094 5
2 .031 .098 .176 .246 .297 .324 .328 .311 .278 .234 4
3 .002 .015 .041 .082 .132 .185 .235 .276 .303 .312 3
4 0+ .001 .005 .015 .033 .060 .095 .138 .186 .234 2
5 0+ 0+ 0+ .002 .004 .010 .020 .037 .061 .094 1
6 0+ 0+ 0+ 0+ 0+ .001 .002 .004 .008 .016 0
p→ 0.95 0.90 0.85 0.80 0.75 0.70 0.65 0.60 0.55 0.50 k ↑

n = 7
k↓ 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 ← p
0 .698 .478 .321 .210 .133 .082 .049 .028 .015 .008 7
1 .257 .372 .396 .367 .311 .247 .185 .131 .087 .055 6
2 .041 .124 .210 .275 .311 .318 .298 .261 .214 .164 5
3 .004 .023 .062 .115 .173 .227 .268 .290 .292 .273 4
4 0+ .003 .011 .029 .058 .097 .144 .194 .239 .273 3
5 0+ 0+ .001 .004 .012 .025 .047 .077 .117 .164 2
6 0+ 0+ 0+ 0+ .001 .004 .008 .017 .032 .055 1
7 0+ 0+ 0+ 0+ 0+ 0+ .001 .002 .004 .008 0
p→ 0.95 0.90 0.85 0.80 0.75 0.70 0.65 0.60 0.55 0.50 k ↑

n = 8
k↓ 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 ← p
0 .663 .430 .272 .168 .100 .058 .032 .017 .008 .004 8
1 .279 .383 .385 .336 .267 .198 .137 .090 .055 .031 7
2 .051 .149 .238 .294 .311 .296 .259 .209 .157 .109 6
3 .005 .033 .084 .147 .208 .254 .279 .279 .257 .219 5
4 0+ .005 .018 .046 .087 .136 .188 .232 .263 .273 4
5 0+ 0+ .003 .009 .023 .047 .081 .124 .172 .219 3
6 0+ 0+ 0+ .001 .004 .010 .022 .041 .070 .109 2
7 0+ 0+ 0+ 0+ 0+ .001 .003 .008 .016 .031 1
8 0+ 0+ 0+ 0+ 0+ 0+ 0+ .001 .002 .004 0
p→ 0.95 0.90 0.85 0.80 0.75 0.70 0.65 0.60 0.55 0.50 k ↑
Tabela C.1 (Cont.)
Corpo da tábua: P (X = k), k = 0, 1, . . ., n

n = 9
k↓ 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 ← p
0 .630 .387 .232 .134 .075 .040 .021 .010 .005 .002 9
1 .299 .387 .368 .302 .225 .156 .100 .060 .034 .018 8
2 .063 .172 .260 .302 .300 .267 .216 .161 .111 .070 7
3 .008 .045 .107 .176 .234 .267 .272 .251 .212 .164 6
4 .001 .007 .028 .066 .117 .172 .219 .251 .260 .246 5
5 0+ .001 .005 .017 .039 .074 .118 .167 .213 .246 4
6 0+ 0+ .001 .003 .009 .021 .042 .074 .116 .164 3
7 0+ 0+ 0+ 0+ .001 .004 .010 .021 .041 .070 2
8 0+ 0+ 0+ 0+ 0+ 0+ .001 .004 .008 .018 1
9 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ .001 .002 0
p→ 0.95 0.90 0.85 0.80 0.75 0.70 0.65 0.60 0.55 0.50 k ↑

n = 10
k↓ 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 ← p
0 .599 .349 .197 .107 .056 .028 .013 .006 .003 .001 10
1 .315 .387 .347 .268 .188 .121 .072 .040 .021 .010 9
2 .075 .194 .276 .302 .282 .233 .176 .121 .076 .044 8
3 .010 .057 .130 .201 .250 .267 .252 .215 .166 .117 7
4 .001 .011 .040 .088 .146 .200 .238 .251 .238 .205 6
5 0+ .001 .008 .026 .058 .103 .154 .201 .234 .246 5
6 0+ 0+ .001 .006 .016 .037 .069 .111 .160 .205 4
7 0+ 0+ 0+ .001 .003 .009 .021 .042 .075 .117 3
8 0+ 0+ 0+ 0+ 0+ .001 .004 .011 .023 .044 2
9 0+ 0+ 0+ 0+ 0+ 0+ .001 .002 .004 .010 1
10 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ .001 0
p→ 0.95 0.90 0.85 0.80 0.75 0.70 0.65 0.60 0.55 0.50 k ↑
Tabela C.1(Cont.)
Corpo da tábua: P (X = k), k = 0, 1, . . ., n

n = 12
k↓ 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 ← p
0 .540 .282 .142 .069 .032 .014 .006 .002 .001 0+ 12
1 .341 .377 .301 .206 .127 .071 .037 .017 .008 .003 11
2 .099 .230 .292 .283 .232 .168 .109 .064 .034 .016 10
3 .017 .085 .172 .236 .258 .240 .195 .142 .092 .054 9
4 .002 .021 .068 .133 .194 .231 .237 .213 .170 .121 8
5 0+ .004 .019 .053 .103 .158 .204 .227 .222 .193 7
6 0+ 0+ .004 .016 .040 .079 .128 .177 .212 .226 6
7 0+ 0+ .001 .003 .011 .029 .059 .101 .149 .193 5
8 0+ 0+ 0+ .001 .002 .008 .020 .042 .076 .121 4
9 0+ 0+ 0+ 0+ 0+ .001 .005 .012 .028 .054 3
10 0+ 0+ 0+ 0+ 0+ 0+ .001 .002 .007 .016 2
11 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ .001 .003 1
12 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0
p→ 0.95 0.90 0.85 0.80 0.75 0.70 0.65 0.60 0.55 0.50 k ↑

n = 14
k↓ 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 ← p
0 .488 .229 .103 .044 .018 .007 .002 .001 0+ 0+ 14
1 .359 .356 .254 .154 .083 .041 .018 .007 .003 .001 13
2 .123 .257 .291 .250 .180 .113 .063 .032 .014 .006 12
3 .026 .114 .206 .250 .240 .194 .137 .085 .046 .022 11
4 .004 .035 .100 .172 .220 .229 .202 .155 .104 .061 10
5 0+ .008 .035 .086 .147 .196 .218 .207 .170 .122 9
6 0+ .001 .009 .032 .073 .126 .176 .207 .209 .183 8
7 0+ 0+ .002 .009 .028 .062 .108 .157 .195 .209 7
8 0+ 0+ 0+ .002 .008 .023 .051 .092 .140 .183 6
9 0+ 0+ 0+ 0+ .002 .007 .018 .041 .076 .122 5
10 0+ 0+ 0+ 0+ 0+ .001 .005 .014 .031 .061 4
11 0+ 0+ 0+ 0+ 0+ 0+ .001 .003 .009 .022 3
12 0+ 0+ 0+ 0+ 0+ 0+ 0+ .001 .002 .006 2
13 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ .001 1
14 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0 + 0
p→ 0.95 0.90 0.85 0.80 0.75 0.70 0.65 0.60 0.55 0.50 k ↑
Tabela C.1 (Cont.)
Corpo da tábua: P (X = k), k = 0, 1, . . ., n

n = 16
k↓ 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 ← p
0 .440 .185 .074 .028 .010 .003 .001 0+ 0+ 0+ 16
1 .371 .329 .210 .113 .053 .023 .009 .003 .001 0+ 15
2 .146 .275 .277 .211 .134 .073 .035 .015 .006 .002 14
3 .036 .142 .229 .246 .208 .146 .089 .047 .022 .009 13
4 .006 .051 .131 .200 .225 .204 .155 .101 .057 .028 12
5 .001 .014 .056 .120 .180 .210 .201 .162 .112 .067 11
6 0+ .003 .018 .055 .110 .165 .198 .198 .168 .122 10
7 0+ 0+ .005 .020 .052 .101 .152 .189 .197 .175 9
8 0+ 0+ .001 .006 .020 .049 .092 .142 .181 .196 8
9 0+ 0+ 0+ .001 .006 .019 .044 .084 .132 .175 7
10 0+ 0+ 0+ 0+ .001 .006 .017 .039 .075 .122 6
11 0+ 0+ 0+ 0+ 0+ .001 .005 .014 .034 .067 5
12 0+ 0+ 0+ 0+ 0+ 0+ .001 .004 .011 .028 4
13 0+ 0+ 0+ 0+ 0+ 0+ 0+ .001 .003 .009 3
14 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ .001 .002 2
15 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0 + 1
16 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0
p→ 0.95 0.90 0.85 0.80 0.75 0.70 0.65 0.60 0.55 0.50 k ↑

n = 18
k↓ 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 ← p
0 .397 .150 .054 .018 .006 .002 0+ 0+ 0+ 0+ 18
1 .376 .300 .170 .081 .034 .013 .004 .001 0+ 0 + 17
2 .168 .284 .256 .172 .096 .046 .019 .007 .002 .001 16
3 .047 .168 .241 .230 .170 .105 .055 .025 .009 .003 15
4 .009 .070 .159 .215 .213 .168 .110 .061 .029 .012 14
5 .001 .022 .079 .151 .199 .202 .166 .115 .067 .033 13
6 0+ .005 .030 .082 .144 .187 .194 .166 .118 .071 12
7 0+ .001 .009 .035 .082 .138 .179 .189 .166 .121 11
8 0+ 0+ .002 .012 .038 .081 .133 .173 .186 .167 10
9 0+ 0+ 0+ .003 .014 .039 .079 .128 .169 .185 9
10 0+ 0+ 0+ .001 .004 .015 .038 .077 .125 .167 8
11 0+ 0+ 0+ 0+ .001 .005 .015 .037 .074 .121 7
12 0+ 0+ 0+ 0+ 0+ .001 .005 .015 .035 .071 6
13 0+ 0+ 0+ 0+ 0+ 0+ .001 .004 .013 .033 5
14 0+ 0+ 0+ 0+ 0+ 0+ 0+ .001 .004 .012 4
15 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ .001 .003 3
16 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ .001 2
17 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0 + 1
18 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0 + 0
Tabela C.1 (Cont.)
Corpo da tábua: P (X = k), k = 0, 1, . . ., n

n = 20
k↓ 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 ← p
0 .358 .122 .039 .012 .003 .001 0+ 0+ 0+ 0+ 20
1 .377 .270 .137 .058 .021 .007 .002 0+ 0+ 0+ 19
+
2 .189 .285 .229 .137 .067 .028 .010 .003 .001 0 18
3 .060 .190 .243 .205 .134 .072 .032 .012 .004 .001 17
4 .013 .090 .182 .218 .190 .130 .074 .035 .014 .005 16
5 .002 .032 .103 .175 .202 .179 .127 .075 .036 .015 15
6 0+ .009 .045 .109 .169 .192 .171 .124 .075 .037 14
7 0+ .002 .016 .055 .112 .164 .184 .166 .122 .074 13
8 0+ 0+ .005 .022 .061 .114 .161 .180 .162 .120 12
9 0+ 0+ .001 .007 .027 .065 .116 .160 .177 .160 11
10 0+ 0+ 0+ .002 .010 .031 .069 .117 .159 .176 10
11 0+ 0+ 0+ 0+ .003 .012 .034 .071 .119 .160 9
12 0+ 0+ 0+ 0+ .001 .004 .014 .035 .073 .120 8
13 0+ 0+ 0+ 0+ 0+ .001 .004 .015 .037 .074 7
14 0+ 0+ 0+ 0+ 0+ 0+ .001 .005 .015 .037 6
15 0+ 0+ 0+ 0+ 0+ 0+ 0+ .001 .005 .015 5
16 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ .001 .005 4
17 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ .001 3
18 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0 + 2
19 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 1
20 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0 +
0
p→ 0.95 0.90 0.85 0.80 0.75 0.70 0.65 0.60 0.55 0.50 k ↑
Tabela C.2 Distribuição de Poisson

Corpo da tábua: P (X = k), k = 0, 1, . . .

e−α αk
P (X = k) =
k!

α
k↓ 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 0.55 0.60 0.65
0 .951 .905 .861 .819 .779 .741 .705 .670 .638 .607 .577 .549 .522
1 .048 .090 .129 .164 .195 .222 .247 .268 .287 .303 .317 .329 .339
2 .001 .005 .010 .016 .024 .033 .043 .054 .065 .076 .087 .099 .110
3 0+ 0+ 0+ .001 .002 .003 .005 .007 .010 .013 .016 .020 .024
4 0+ 0+ 0+ 0+ 0+ 0+ 0+ .001 .001 .002 .002 .003 .004
≥5 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 001

α
k↓ 0.70 0.75 0.80 0.85 0.90 0.95 1.00 1.05 1.10 1.15 1.20 1.25 1.40
0 .497 .472 .449 .427 .407 .387 .368 .350 .333 .317 .301 .287 .247
1 .348 .354 .359 .363 .366 .367 .368 .367 .366 .364 .361 .358 .345
2 .122 .133 .144 .154 .165 .175 .184 .193 .201 .209 .217 .224 .242
3 .028 .033 .038 .044 .049 .055 .061 .068 .074 .080 .087 .093 .113
4 .005 .006 .008 .009 .011 .013 .015 .018 .020 .023 .026 .029 .039
5 .001 .001 .001 .002 .002 .002 .003 .004 .004 .005 .006 .007 .011
6 0+ 0+ 0+ 0+ 0+ 0+ .001 .001 .001 .001 .001 .002 .003
7 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ .001
8 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+
Tabela C.2 (Cont.)

α
k↓ 1.8 2.0 2.5 3.0 3.5 4.0 4.5 5.0 6.0 7.0 8.0 9.0 10.0
0 .165 .135 .082 .050 .030 .018 .011 .007 .002 .001 0+ 0+ 0+
1 .298 .271 .205 .149 .106 .073 .050 .034 .015 .006 .003 .001 0+
2 .268 .271 .257 .224 .185 .147 .112 .084 .045 .022 .011 .005 .002
3 .161 .180 .214 .224 .216 .195 .169 .140 .089 .052 .029 .015 .008
4 .072 .090 .134 .168 .189 .195 .190 .175 .134 .091 .057 .034 .019
5 .026 .036 .067 .101 .132 .156 .171 .175 .161 .128 .092 .061 .038
6 .008 .012 .028 .050 .077 .104 .128 .146 .161 .149 .122 .091 .063
7 .002 .003 .010 .022 .039 .060 .082 .104 .138 .149 .140 .117 .090
8 0+ .001 .003 .008 .017 .030 .046 .065 .103 .130 .140 .132 .113
9 0+ 0+ .001 .003 .007 .013 .023 .036 .069 .101 .124 .132 .125
10 0+ 0+ 0+ .001 .002 .005 .010 .018 .041 .071 .099 .119 .125
11 0+ 0+ 0+ 0+ .001 .002 .004 .008 .023 .045 .072 .097 .114
12 0+ 0+ 0+ 0+ 0+ .001 .002 .003 .011 .026 .048 .073 .095
13 0+ 0+ 0+ 0+ 0+ 0+ .001 .001 .005 .014 .030 .050 .073
14 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ .002 .007 .017 .032 .052
15 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ .001 .003 .009 .019 .035
16 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ .001 .005 .011 .022
17 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ .001 .002 .006 .013
18 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ .001 .003 .007
19 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ .001 .004
20 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ .001 .002
21 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ .001
22 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+
Tabela C.3 Normal Padrão

Z z 2
e−x /2 dx
Valor Tabelado = P (0 ≤ Z ≤ z) = √
0 2π

z 0 1 2 3 4 5 6 7 8 9
0.0 .0000 .0040 .0080 .0120 .0160 .0199 .0239 .0279 .0319 .0359
0.1 .0398 .0438 .0478 .0517 .0557 .0596 .0636 .0675 .0714 .0753
0.2 .0793 .0832 .0871 .0910 .0948 .0987 .1026 .1064 .1103 .1141
0.3 .1179 .1217 .1255 .1293 .1331 .1368 .1406 .1443 .1480 .1517
0.4 .1554 .1591 .1628 .1664 .1700 .1736 .1772 .1808 .1844 .1879
0.5 .1915 .1950 .1985 .2019 .2054 .2088 .2123 .2157 .2190 .2224
0.6 .2257 .2291 .2324 .2357 .2389 .2422 .2454 .2486 .2517 .2549
0.7 .2580 .2611 .2642 .2673 .2704 .2734 .2764 .2794 .2823 .2852
0.8 .2881 .2910 .2939 .2967 .2995 .3023 .3051 .3078 .3106 .3133
0.9 .3159 .3186 .3212 .3238 .3264 .3289 .3315 .3340 .3365 .3389
1.0 .3413 .3438 .3461 .3485 .3508 .3531 .3554 .3577 .3599 .3621
1.1 .3643 .3665 .3686 .3708 .3729 .3749 .3770 .3790 .3810 .3830
1.2 .3849 .3869 .3888 .3907 .3925 .3944 .3962 .3980 .3997 .4015
1.3 .4032 .4049 .4066 .4082 .4099 .4115 .4131 .4147 .4162 .4177
1.4 .4192 .4207 .4222 .4236 .4251 .4265 .4279 .4292 .4306 .4319
1.5 .4332 .4345 .4357 .4370 .4382 .4394 .4406 .4418 .4429 .4441
1.6 .4452 .4463 .4474 .4484 .4495 .4505 .4515 .4525 .4535 .4545
1.7 .4554 .4564 .4573 .4582 .4591 .4599 .4608 .4616 .4625 .4633
1.8 .4641 .4649 .4656 .4664 .4671 .4678 .4686 .4693 .4699 .4706
1.9 .4713 .4719 .4726 .4732 .4738 .4744 .4750 .4756 .4761 .4767
2.0 .4772 .4778 .4783 .4788 .4793 .4798 .4803 .4808 .4812 .4817
2.1 .4821 .4826 .4830 .4834 .4838 .4842 .4846 .4850 .4854 .4857
2.2 .4861 .4864 .4868 .4871 .4875 .4878 .4881 .4884 .4887 .4890
2.3 .4893 .4896 .4898 .4901 .4904 .4906 .4909 .4911 .4913 .4916
2.4 .4918 .4920 .4922 .4925 .4927 .4929 .4931 .4932 .4934 .4936
2.5 .4938 .4940 .4941 .4943 .4945 .4946 .4948 .4949 .4951 .4952
2.6 .4953 .4955 .4956 .4957 .4959 .4960 .4961 .4962 .4963 .4964
2.7 .4965 .4966 .4967 .4968 .4969 .4970 .4971 .4972 .4973 .4974
2.8 .4974 .4975 .4976 .4977 .4977 .4978 .4979 .4979 .4980 .4981
2.9 .4981 .4982 .4982 .4983 .4984 .4984 .4985 .4985 .4986 .4986
3.0 .4987 .4987 .4987 .4988 .4988 .4989 .4989 .4989 .4990 .4990
3.1 .4990 .4991 .4991 .4991 .4992 .4992 .4992 .4992 .4993 .4993
3.2 .4993 .4993 .4994 .4994 .4994 .4994 .4994 .4995 .4995 .4995
3.3 .4995 .4995 .4995 .4996 .4996 .4996 .4996 .4996 .4996 .4997
3.4 .4997 .4997 .4997 .4997 .4997 .4997 .4997 .4997 .4997 .4998
3.5 .4998 .4998 .4998 .4998 .4998 .4998 .4998 .4998 .4998 .4998
3.6 .4998 .4998 .4999 .4999 .4999 .4999 .4999 .4999 .4999 .4999
3.7 .4999 .4999 .4999 .4999 .4999 .4999 .4999 .4999 .4999 .4999
3.8 .4999 .4999 .4999 .4999 .4999 .4999 .4999 .4999 .4999 .4999
Tabela C.4 Distribuição t de Student
Valores crı́ticos de t tais que P (−tc < t < tc ) = 1 − p
p −→ 0.001 0.002 0.01 0.02 0.03 0.04 0.05 0.06 0.10 0.15 0.20 0.30 0.40 0.60
g.l. ↓
1 636.61 318.32 63.66 31.82 21.20 15.89 12.71 10.58 6.31 4.17 3.08 1.96 1.38 0.73
2 31.60 22.33 9.92 6.96 5.64 4.85 4.30 3.90 2.92 2.28 1.89 1.39 1.06 0.62
3 12.92 10.21 5.84 4.54 3.90 3.48 3.18 2.95 2.35 1.92 1.64 1.25 0.98 0.58
4 8.61 7.17 4.60 3.75 3.30 3.00 2.78 2.60 2.13 1.78 1.53 1.19 0.94 0.57
5 6.87 5.89 4.03 3.36 3.00 2.76 2.57 2.42 2.02 1.70 1.48 1.16 0.92 0.56
6 5.96 5.21 3.71 3.14 2.83 2.61 2.45 2.31 1.94 1.65 1.44 1.13 0.91 0.55
7 5.41 4.79 3.50 3.00 2.71 2.52 2.36 2.24 1.89 1.62 1.41 1.12 0.90 0.55
8 5.04 4.50 3.36 2.90 2.63 2.45 2.31 2.19 1.86 1.59 1.40 1.11 0.89 0.55
9 4.78 4.30 3.25 2.82 2.57 2.40 2.26 2.15 1.83 1.57 1.38 1.10 0.88 0.54
10 4.59 4.14 3.17 2.76 2.53 2.36 2.23 2.12 1.81 1.56 1.37 1.09 0.88 0.54
11 4.44 4.02 3.11 2.72 2.49 2.33 2.20 2.10 1.80 1.55 1.36 1.09 0.88 0.54
12 4.32 3.93 3.05 2.68 2.46 2.30 2.18 2.08 1.78 1.54 1.36 1.08 0.87 0.54
13 4.22 3.85 3.01 2.65 2.44 2.28 2.16 2.06 1.77 1.53 1.35 1.08 0.87 0.54
14 4.14 3.79 2.98 2.62 2.41 2.26 2.14 2.05 1.76 1.52 1.35 1.08 0.87 0.54
15 4.07 3.73 2.95 2.60 2.40 2.25 2.13 2.03 1.75 1.52 1.34 1.07 0.87 0.54
16 4.01 3.69 2.92 2.58 2.38 2.24 2.12 2.02 1.75 1.51 1.34 1.07 0.86 0.54
17 3.97 3.65 2.90 2.57 2.37 2.22 2.11 2.02 1.74 1.51 1.33 1.07 0.86 0.53
18 3.92 3.61 2.88 2.55 2.36 2.21 2.10 2.01 1.73 1.50 1.33 1.07 0.86 0.53
19 3.88 3.58 2.86 2.54 2.35 2.20 2.09 2.00 1.73 1.50 1.33 1.07 0.86 0.53
20 3.85 3.55 2.85 2.53 2.34 2.20 2.09 1.99 1.72 1.50 1.33 1.06 0.86 0.53
21 3.82 3.53 2.83 2.52 2.33 2.19 2.08 1.99 1.72 1.49 1.32 1.06 0.86 0.53
22 3.79 3.51 2.82 2.51 2.32 2.18 2.07 1.98 1.72 1.49 1.32 1.06 0.86 0.53
23 3.77 3.48 2.81 2.50 2.31 2.18 2.07 1.98 1.71 1.49 1.32 1.06 0.86 0.53
24 3.75 3.47 2.80 2.49 2.31 2.17 2.06 1.97 1.71 1.49 1.32 1.06 0.86 0.53
25 3.73 3.45 2.79 2.49 2.30 2.17 2.06 1.97 1.71 1.49 1.32 1.06 0.86 0.53
26 3.71 3.44 2.78 2.48 2.30 2.16 2.06 1.97 1.71 1.48 1.31 1.06 0.86 0.53
27 3.69 3.42 2.77 2.47 2.29 2.16 2.05 1.96 1.70 1.48 1.31 1.06 0.86 0.53
28 3.67 3.41 2.76 2.47 2.29 2.15 2.05 1.96 1.70 1.48 1.31 1.06 0.85 0.53
29 3.66 3.40 2.76 2.46 2.28 2.15 2.05 1.96 1.70 1.48 1.31 1.06 0.85 0.53
30 3.65 3.39 2.75 2.46 2.28 2.15 2.04 1.95 1.70 1.48 1.31 1.05 0.85 0.53
31 3.63 3.37 2.74 2.45 2.27 2.14 2.04 1.95 1.70 1.48 1.31 1.05 0.85 0.53
32 3.62 3.37 2.74 2.45 2.27 2.14 2.04 1.95 1.69 1.47 1.31 1.05 0.85 0.53
33 3.61 3.36 2.73 2.44 2.27 2.14 2.03 1.95 1.69 1.47 1.31 1.05 0.85 0.53
34 3.60 3.35 2.73 2.44 2.27 2.14 2.03 1.95 1.69 1.47 1.31 1.05 0.85 0.53
35 3.59 3.34 2.72 2.44 2.26 2.13 2.03 1.94 1.69 1.47 1.31 1.05 0.85 0.53
40 3.55 3.31 2.70 2.42 2.25 2.12 2.02 1.94 1.68 1.47 1.30 1.05 0.85 0.53
45 3.52 3.28 2.69 2.41 2.24 2.11 2.01 1.93 1.68 1.46 1.30 1.05 0.85 0.53
50 3.50 3.26 2.68 2.40 2.23 2.11 2.01 1.92 1.68 1.46 1.30 1.05 0.85 0.53
55 3.48 3.25 2.67 2.40 2.23 2.10 2.00 1.92 1.67 1.46 1.30 1.05 0.85 0.53
60 3.46 3.23 2.66 2.39 2.22 2.10 2.00 1.92 1.67 1.46 1.30 1.05 0.85 0.53
65 3.45 3.22 2.65 2.39 2.22 2.10 2.00 1.91 1.67 1.46 1.29 1.04 0.85 0.53
120 3.37 3.16 2.62 2.36 2.20 2.08 1.98 1.90 1.66 1.45 1.29 1.04 0.84 0.53
∞ 3.29 3.09 2.58 2.33 2.17 2.05 1.96 1.88 1.65 1.44 1.28 1.04 0.84 0.52

Você também pode gostar