Você está na página 1de 109

Estatstica

e
Probabilidade
Professores:
Daniela Carine Ramires de Oliveira
Marcos Santos de Oliveira

ndice
1.

2.

3.

Introduo Estatstica

1.1.
1.2.
1.3.
1.4.

1
1
2
2

Variveis

2.1.
2.2.
2.3.

3
3
5

3.4.

5.

Definio de Varivel
Classificao das Variveis
Exerccios

Amostragem
3.1.
3.2.
3.3.

4.

O que Estatstica?
Estatstica na Prtica
Um pouco da histria da Estatstica
Exerccios

Por que fazer Amostragem?


Quando o uso de amostragem no interessante?
Tipos de Amostragem
3.3.1. Amostragem Aleatria Simples (AAS)
3.3.2. Amostragem Sistemtica (AS)
3.3.3. Amostragem Estratificada (AE)
3.3.4. Amostragem por Conglomerado (AC)
Exerccios

6
6
6
6
7
8
9
10

Tabulao de Variveis

11

4.1.
4.2.
4.3.
4.4.

11
12
13
14

Variveis Qualitativas Unidimensionais


Variveis Quantitativas Unidimensionais
Variveis Qualitativas e Quantitativas Bidimensionais
Exerccios

Medidas de Posio

15

5.1.
5.2.
5.3.
5.4.
5.5.

15
15
15
16
18

Prof. Daniela

Mnimo e Mximo
Moda
Mdia
Mediana
Exerccios
ii

____/____/____

6.

7.

Medidas de Disperso

19

6.1.
6.2.
6.3.
6.4.
6.5.

19
19
19
21
21

Estatstica Grfica

22

7.1.

22
22
23
23
25
25
26
26
27
28
29
31

7.2.

7.3
8.

Motivao
Amplitude
Varincia e Desvio Padro
Intervalo Interquartil
Exerccios

Grficos para as Variveis Qualitativas


7.1.1. Grfico em Barras
7.1.2. Grfico de Composio em Setores (Pizza)
7.1.3. Grfico de Pareto
Grficos para as Variveis Quantitativas
7.2.1. Grfico em Barras
7.2.2. Grfico de Pontos
7.2.3. Histograma
7.2.4. Grfico em Linhas (ou Grfico Temporal)
7.2.5. Ramo-e-Folhas
7.2.6. Desenho Esquemtico ou Diagrama de Caixas (Box-Plot)
Exerccios

Correlao e Regresso

32

8.1.
8.2.
8.3.
8.4.
8.5.
8.6.

32
32
35
37
39
40

Estudo da relao entre variveis


Diagrama de Disperso
Coeficiente de Correlao
Regresso Linear Simples
Coeficiente de Determinao
Exerccios

Lista de Exerccios 1

41

9.

Probabilidade

44

9.1.
9.2.
9.3.
9.4.
9.5.

Processo ou Experimento Aleatrio


Espao Amostral ()
Evento
Exerccios
Introduo Probabilidade

44
44
45
46
47

iii

____/____/____

Prof. Daniela

9.6.
9.7.
9.8.
9.9.
9.10.
9.11.
9.12.
9.13.
10.

11.

Definio Clssica
Definio Freqentista
Definio Subjetiva
Definio Moderna
Probabilidade Condicional
Independncia de Eventos
Regra da Probabilidade Total
Teorema de Bayes

48
49
51
51
52
53
54
54

Varivel Aleatria Discreta

56

10.1.
10.2.
10.3.
10.4.
10.5.
10.6.
10.7.
10.8.
10.9
10.10.
10.11.

56
57
58
58
58
59
60
60
61
61
62

Introduo
Esperana Matemtica (Mdia)
Varincia
Exerccio
Modelo Bernoulli
Modelo Binomial
Exerccios
Distribuio Hipergeomtrica
Exerccio
Distribuio Poisson
Exerccios

Varivel Aleatria Contnua

63

11.1.
11.2.
11.3.
11.4.

65
66
69
73

Esperana e Varincia
Distribuio Normal
Tabela da Distribuio Normal Padro
Exerccios

Lista de Exerccios 2

74

12.

Estimao

77

12.1.
12.2.
12.3.
12.4.
12.5.
12.6.
12.7.

77
77
79
79
81
81
83

Prof. Daniela

Inferncia Estatstica
Estimao Pontual e Intervalar para Proporo
Exerccios
Estimativa Pontual e Intervalar para a Mdia Populacional
Exerccios
Estimativa para a Mdia Populacional com Varincia Desconhecida
Exerccio

iv

____/____/____

13.

Testes de Hipteses

84

13.1.
13.2.
13.3.
13.4.
13.5.
13.6.
13.7.
13.8
13.9
13.10.

84
84
84
85
85
87
88
90
91
93

Introduo
Formulao das Hipteses
Tipos de Erros possveis nos Testes de Hipteses
Nvel de Significncia de um Teste de Hiptese ()
Teste de Hipteses para a Proporo
Exerccios
Teste de Hipteses para Mdia com Varincia Conhecida
Exerccios
Teste de Hipteses para Mdia com Varincia Desconhecida
Exerccios

Lista de Exerccios 3

94

Apndice
A
B
C
D

Prof. Daniela

Gabarito da Lista de Exerccios 1


Gabarito da Lista de Exerccios 2
Gabarito da Lista de Exerccios 3
Aula no Laboratrio de Computao

95
101
102
104

____/____/____

1. INTRODUO ESTATSTICA
1.1. O que Estatstica?
Estatstica uma cincia que nos permite coletar, organizar, descrever, analisar e interpretar
dados oriundos de estudos ou experimentos, realizados em qualquer rea do conhecimento.
Estamos denominando por dados a um (ou mais) conjunto de valores, numricos ou no. A
aplicabilidade das tcnicas a serem discutidas se d nas mais variadas reas das atividades
humanas. Assim, o principal objetivo da Estatstica nos auxiliar a tomar decises ou tirar
concluses em situaes de incerteza, a partir de informaes numricas.
1.2. Estatstica na Prtica
Tcnicas de amostragem

Populao
(Caractersticas)

Amostra
Planejamento de Experimentos
Anlise
descritiva
descritiva

Concluses
sobre as
caractersticas
da populao

Inferncia Estatstica

Clculo de Probabilidades

Informaes
contidas nos
dados

Populao: o conjunto de todos os elementos que nos interessa estudar. Deve ser notado que na
terminologia estatstica, populao refere-se no somente a uma coleo de indivduos, mas ao alvo
no qual reside nosso interesse. Exemplos: todos os clientes de um banco, todos os alunos de uma
faculdade, todos os automveis da Ford, todo o sangue no corpo de uma pessoa, etc.
Tcnicas de Amostragem: ferramentas que nos auxiliam a coletar amostras.
Planejamento de Experimentos: cria esquemas e teorias para verificao de hipteses cientficas.
Amostra: qualquer subconjunto da populao.
Anlise Descritiva: Conjunto de tcnicas destinadas a descrever e resumir os dados a fim de
tirarmos concluses a respeito de caractersticas de interesse.
Probabilidade: Teoria utilizada para se estudar a incerteza associada a fenmenos aleatrios.
Inferncia Estatstica: Tcnicas que possibilitam a extrapolao, a um grande conjunto de dados
(populao), das informaes e concluses obtidas a partir de um subconjunto de valores
(amostra).
Oliveira, D. C. R. e Oliveira, M. S.

____/____/____

1.3. Um pouco da histria da Estatstica


5000 AC
2000 AC
695
1654
1763
1930
1959
1996
1997
2001

Registros egpcios de presos de guerra;


Censo Chins;
Primeira utilizao da mdia ponderada pelos rabes na contagem de moedas;
Pierre de Fermat e Blaise Pascal estabelecem os Princpios do Clculo das
Probabilidades;
Inferncia Estatstica (Reverendo Bayes);
Controle de Qualidade nas indstrias;
Estudo retrospectivo de doenas (Mantel & Haenszel);
Profundidade da Regresso (Rousseeuw e Hubert);
Modelos Fatoriais;
100 anos da Biometrika.

Maiores detalhes sobre a histria da Estatstica no site: http://www.redeabe.org.br/historia.htm


1.4. Exerccios Parte I A1
1) Para as situaes descritas a seguir, identifique a populao e a amostra correspondente.
(a) Para avaliar a eficcia de uma campanha de vacinao no Estado de Minas Gerais, 200 mes de
recm-nascidos durante o primeiro semestre de um dado ano, em uma dada maternidade em Belo
Horizonte, foram perguntadas a respeito da ltima vez que vacinaram seus filhos.
Populao:
Amostra:
(b) Uma amostra de sangue foi retirada de um paciente com suspeita de anemia.
Populao:
Amostra:
(c) Para verificar a audincia de um programa de TV, 563 indivduos foram entrevistados por
telefone com relao ao canal em que estavam sintonizados.
Populao:
Amostra:

Oliveira, D. C. R. e Oliveira, M. S.

____/____/____

2. VARIVEIS
2.1. Definio de Varivel
Qualquer caracterstica associada a uma populao chamada de varivel.
Porque o nome varivel? Porque ela varia de alguma forma.
Exemplos: Idade: pode variar de 0, 1 , 2, ... anos
Sexo: pode ser masculino ou feminino
Estado Civil: pode ser solteiro, casado, divorciado, etc.
2.2. Classificao das Variveis
As variveis podem ser classificadas como Qualitativas ou Quantitativas.
Algumas variveis como sexo, grau de instruo, estado civil, regio de procedncia,
apresentam como possveis resultados uma qualidade (ou atributo) do indivduo pesquisado, logo,
estas variveis so chamadas de variveis Qualitativas.
As variveis como nmero de filhos, salrio, idade, apresentam como possveis resultados
nmeros resultantes de uma contagem ou mensurao, logo, estas variveis so chamadas de
variveis Quantitativas.
Exemplo: Um pesquisador est interessado em fazer um levantamento sobre alguns aspectos
socio-econmicos dos empregados da seo de oramentos de uma empresa. Usando informaes
obtidas do departamento pessoal, ele elaborou a Tabela 2.1.
Tabela 2.1: Informaes sobre estado civil, grau de instruo, nmero de filhos, salrio (expresso
como frao do salrio mnimo), idade (medida em anos e meses) e procedncia de 36 empregados
da seo de oramentos de uma Empresa.
Idade
N
1
2
...
35
36

Estado Civil
Solteiro
Casado
...
Casado
Casado

Grau de Instruo
Fundamental
Fundamental
...
Mdio
Superior

N de Filhos
...
1
...
2
3

Salrio
4,00
4,56
...
19,40
23,30

Anos
26
32
...
48
42

Meses
3
10
...
11
2

Regio de Procedncia
Interior
Capital
...
Capital
Interior

Fonte: Bussab e Morettin (2002)


Observaes sobre a Tabela 2.1.
De modo geral, para cada elemento investigado numa pesquisa, tem-se associado um (ou
mais de um) resultado correspondendo realizao de uma caracterstica (ou caractersticas). Por
exemplo, considerando a varivel estado civil, para cada empregado pode-se associar um dos
resultados, solteiro ou casado (note que poderia haver outras possibilidades, como separado,
divorciado, mas somente as duas mencionadas foram consideradas no estudo).

Oliveira, D. C. R. e Oliveira, M. S.

____/____/____

Dentre as variveis Qualitativas, ainda podemos fazer uma distino entre dois tipos:
Varivel Qualitativa Nominal: para a qual no existe nenhuma ordenao nos possveis
resultados.
Exemplo: Regio de Procedncia, etc.
Varivel Qualitativa Ordinal: para a qual existe uma ordem natural nos seus resultados.
Exemplo: Grau de instruo, etc.
As variveis Quantitativas tambm podem sofrer uma classificao dicotmica:
Varivel Quantitativa Discreta: cujos possveis valores formam um conjunto finito ou
enumervel de nmeros, e que resultam, freqentemente, de uma contagem.
Exemplo: N de Filhos, etc.
Varivel Quantitativa Contnua: cujos possveis valores pertencem a um intervalo de nmeros
reais e que resultam de uma mensurao.
Exemplo: Salrio, etc.
Resumindo
Como as variveis so classificadas e outros exemplos:
Qualitativa

Nominal
Ordinal

Sexo, Cor dos Olhos.


Estado Civil, Classe social.

Quantitativa

Discreta
Contnua

Nmeros de carros.
Peso, altura.

Para cada tipo de varivel existem tcnicas apropriadas para resumir as informaes dos
dados obtidos da amostra. Por exemplo, a utilizao de uma tabela uma forma de escrever os
dados de uma forma resumida.
Em algumas situaes podem-se atribuir valores numricos s vrias qualidades ou
atributos de uma varivel qualitativa e depois se proceder anlise como se esta fosse quantitativa,
desde que o procedimento seja passvel de interpretao.
Existe um tipo de varivel qualitativa para a qual essa quantificao muito til: a chamada
varivel dicotmica. Para essa varivel podem ocorrer somente duas realizaes, usualmente
chamadas de sucesso e fracasso.
Exemplos: Sexo (Masculino ou Feminino), Hbito de Fumar (Sim ou No), etc.

Oliveira, D. C. R. e Oliveira, M. S.

____/____/____

2.3. Exerccios Parte I A1


1) Um questionrio foi aplicado aos alunos do primeiro ano de uma escola fornecendo as seguintes
informaes:
ID:
Identificao do aluno;
Turma:
Turma a que o aluno foi alocado (A ou B);
Sexo:
Feminino (F) ou Masculino (M);
Idade:
Idade;
Alt:
Altura;
Peso:
Peso;
Filh:
Nmero de filhos na famlia;
Fuma:
Hbito de fumar (sim ou no);
Toler:
Tolerncia ao cigarro: (I) Indiferente, (P) Incomoda Pouco e (M) Incomoda Muito;
Exer:
Horas de atividade fsica, por semana;
Cine:
Nmero de vezes que vai ao cinema por semana;
OpCine:
Opinio a respeito das salas de cinema na cidade: (B) regular a boa e (M) muito boa
TV:
Horas gastas assistindo TV, por semana
OpTV:
Opinio da programao na TV: (R) Ruim, (M) Mdia, (B) Boa e (N) no sabe.
Tabela 2.2: Informaes do questionrio estudantil.
ID Turma Sexo Idade Alt Peso Filh Fuma Toler Exer Cine Opcine Tv
1
A
F
17
1,60 60,5
2
No
P
0
1
B
16,5
2
A
F
18
1,69 55,0
1
No
M
0
1
B
7
...
...
...
...
...
...
...
...
...
...
...
...
...
49
B
M
17
1,80 71,0
1
No
P
7
0
M
14
50
B
M
18
1,83 86,0
1
No
P
7
7
M
20
Fonte: Magalhes e Lima (2004).

OpTV
R
R
...
R
B

Classifique as variveis da Tabela 2.2. como


Varivel Qualitativa Nominal:

Varivel Qualitativa Ordinal:

Varivel Quantitativa Discreta:

Varivel Quantitativa Contnua:

Oliveira, D. C. R. e Oliveira, M. S.

____/____/____

3. AMOSTRAGEM
A amostragem naturalmente usada em nossa vida diria. Por exemplo, para verificar o
tempero de um alimento em preparao, podemos provar (observar) uma pequena poro deste
alimento. Estamos fazendo uma amostragem, ou seja, extraindo do todo (populao), uma parte
(amostra) com propsito de avaliarmos sobre a qualidade do tempero de todo o alimento.
3.1. Por que fazer Amostragem?
Existem vrias razes para o uso de amostragem em levantamento de grandes populaes.
Algumas delas so:
Economia: Em geral, torna-se bem mais econmico o levantamento de somente uma parte
da populao.
Tempo: Numa pesquisa eleitoral, a trs dias de uma eleio presidencial, no haveria tempo
suficiente para pesquisar toda a populao de eleitores do pas.
Operacionalidade: mais fcil realizar operaes de pequena escala. Um dos problemas
tpicos nos grandes censos o controle dos entrevistadores.
3.2. Quando o uso de amostragem no interessante?

Populao pequena: No h necessidade de utilizar tcnicas estatsticas, pois neste caso


aconselhvel realizar o censo (anlise de toda a populao).
Caracterstica de fcil mensurao: Talvez a populao no seja to pequena, mas a
varivel que se quer observar de to fcil mensurao, que no compensa investir num
plano de amostragem. Por exemplo, para verificar a porcentagem de funcionrios
favorveis mudana no horrio de um turno de trabalho, podemos entrevistar toda a
populao no prprio local de trabalho. Esta atitude pode ser politicamente mais
recomendvel.
Necessidade de alta preciso: A cada dez anos o IBGE realiza um Censo1 Demogrfico
para estudar diversas caracterstica da populao brasileira. Dentre estas caractersticas tmse o nmero total de habitantes, que fundamental para o planejamento do pas. Desta
forma, o nmero de habitantes precisa ser avaliado com grande preciso e, por isto, se
pesquisa toda a populao.

3.3. Tipos de Amostragem


3.3.1. Amostragem Aleatria Simples (AAS)
A tcnica de Amostragem Aleatria Simples (ou Amostragem Casual Simples) o mtodo
mais simples e um dos mais importantes para a seleo de uma amostra. Para a seleo de uma
AAS precisamos ter uma lista completa dos elementos da populao. Este tipo de amostragem
consiste em selecionar a amostra atravs de um sorteio. Sua principal caracterstica est no fato de
todos os elementos da populao ter igual probabilidade de serem escolhidos.
1

Censo: estudo de todos os elementos da populao.

Oliveira, D. C. R. e Oliveira, M. S.

____/____/____

Procedimento para o uso deste mtodo:


1) Numerar todos os elementos da populao (N elementos);
2) Efetuar sucessivos sorteios at completar o tamanho da amostra (n).

Para realizar este sorteio, podemos utilizar urnas, tabelas de nmeros aleatrios ou algum
software que gere nmeros aleatrios. A Tabela abaixo foi feita usando o Excel.
Tabela de Nmeros Aleatrios
6
9
5
5
8

1
4
0
8
0

0
4
4
9
4

9
7
0
3
8

2
4
5
4
9

6
0
0
2
6

2
9
5
7
3

9
9
5
0
2

8
9
7
1
5

5
3
9
5
8

1
8
0
2
1

1
2
0
8
2

9
1
5
9
5

5
3
8
6
8

7
2
1
2
7

7
2
7
4
4

7
4
2
7
6

9
0
6
5
3

0
3
3
0
2

4
3
0
3
1

5
1
3
0
4

7
9
8
0
8

0
7
1
4
9

0
2
1
5
6

9
5
5
8
5

1
5
4
6
4

2
6
8
6
1

9
9
9
8
2

5
8
0
7
3

9
2
4
9
2

8
1
1
0
0

3
6
3
2
1

5
9
6
5
4

3
4
9
8
5

8
2
1
9
2

7
1
7
6
3

0
6
3
2
6

2
6
5
4
9

0
3
4
8
8

2
9
8
5
0

1
3
8
0
9

2
1
5
8
0

8
4
1
5
1

7
5
8
8
2

5
8
9
9
5

6
7
6
6
9

3
6
5
3
0

2
9
4
2
3

1
3
7
1
6

0
2
3
4
8

8
0
1
5
2

5
1
0
2
0

6
4
2
5
3

4
5
5
8
5

9
6
8
9
8

7
9
9
6
4

3
8
6
3
6

2
7
3
2
1

1
4
2
1
3

0
5
0
4
0

5
9
4
8
5

9
8
7
5
8

4
7
8
2
7

7
4
9
3
9

6
5
6
0
6

4
6
3
2
3

1
3
2
5
2

2
2
0
7
0

3
1
1
4
1

3
5
4
0
8

0
9
8
8
9

1
4
2
5
6

2
5
3
6
3

5
6
6
3
2

8
0
8
1
5

9
2
9
2
8

7
5
5
5
4

4
8
2
2
1

1
0
0
3
0

0
0
1
0
3

1
2
5
9
6

9
7
6
2
3

1
9
1
5
3

5
1
9
1
1

8
2
4
2
2

9
3
5
3
5

6
5
9
5
8

3
8
6
8
7

2
9
3
9
0

1
6
2
4
3

7
0
1
3
9

8
1
4
2
4

9
5
7
1
7

6
4
8
4
8

5
2
9
7
4

2
0
6
0
1

0
3
3
2
0

3
6
0
3
1

2
9
1
0
3

5
8
5
0
6

9
2
1
4
8

6
5
4
5
7

3
8
5
6
4

2
0
8
3
1

0
2
9
0
2

1
1
6
0
3

5
4
3
1
0

8
8
2
4
2

9
0
1
5
5

6
9
4
2
8

2
5
0
9
6

1
2
2
3
1

5
0
1
0
0

4
3
3
2
2

7
2
6
5
5

9
1
5
8
4

9
2
4
9
6

4
4
7
2
7

0
8
8
6
8

2
9
9
4
9

Exemplo: Estamos interessados em estudar a qualidade da gasolina nos postos de uma


determinada cidade. Essa cidade possui N = 40 postos. A empresa que estudar a qualidade pode
investigar apenas uma amostra de n = 4 postos. Para selecionarmos uma amostra, utilizando a
amostragem casual simples, basta escolhermos uma posio de qualquer linha da tabela de
nmeros aleatrios e extrairmos conjuntos de dois algarismos (pois N, que o tamanho da
populao, possui 2 casas decimais), at completarmos os 4 elementos da amostra. Se o nmero
sorteado no existir, simplesmente no consideramos e prosseguimos o processo.
Escolhendo a primeira linha da Tabela de Nmeros Aleatrios, temos a seguinte amostra de
4 elementos:
{09, 26, 29, 11}.
Exemplo: Considere agora, uma populao com 500 elementos e, deseja-se retirar dessa populao
10 elementos. Obtenha uma AAS utilizando a primeira linha da Tabela de Nmeros Aleatrios.
3.3.2. Amostragem Sistemtica (AS)
utilizada quando a populao est naturalmente ordenada, como listas telefnicas, fichas
de cadastramento, produo de garrafas da cervejas, etc.
Procedimento para o uso deste mtodo:
1) Seja N o tamanho da populao e n o tamanho amostral. Calcula-se o intervalo da
amostragem i = N/n (considera-se apenas a parte inteira do nmero).
Oliveira, D. C. R. e Oliveira, M. S.

____/____/____

2) Sorteia-se, utilizando a tabela de nmeros aleatrios, um nmero x entre 1 e i formando a


amostra: x, (x + i), (x + 2*i), ... , (x + (n-1)*i).
Exemplo: Numa turma com N = 36 alunos, deseja-se retirar uma amostra de n = 5 elementos para
verificar uma caracterstica de interesse. Utilize a tcnica de amostragem sistemtica para retirar
essa amostra.
1) Calcular: i = N/n = 36/5 = 7,2. Considerando a parte inteira do nmero, temos que i = 7;
2) Sortear um nmero entre 1 e 7 da Tabela de Nmeros Aleatrios. Escolhendo a ltima linha e a
primeira coluna, temos que o primeiro nmero que est entre 1 e 7 6. Logo a amostra ser
composta dos elementos:
{06, 13, 20, 27, 34}
Exemplo: Considere agora, uma populao com 500 elementos e, deseja-se retirar dessa populao
10 elementos. Obtenha uma AS utilizando a primeira linha da Tabela de Nmeros Aleatrios,
quando for necessrio.
3.3.3. Amostragem Estratificada (AE)
A populao dividida em subgrupos, denominados estratos (por exemplo, por sexo, renda,
bairro, etc.) e a AAS utilizada na seleo de uma amostra de cada estrato. Esses estratos devem
ser internamente mais homogneos do que a populao toda, com respeito s variveis em estudo.
Aqui, um conhecimento prvio sobre a populao em estudo fundamental.
Estrato 1
Estrato 2
...
Estrato k

...

Subgrupo 1 da amostra
Subgrupo 2 da amostra
...
Subgrupo k da amostra

Amostra
Estratificada

A AE tem as seguintes caractersticas:


dentro de cada estrato h uma grande homogeneidade (pequena variabilidade);
entre os estratos h uma grande heterogeneidade (grande variabilidade).
Em geral, utiliza-se a AE proporcional. Neste caso, a proporcionalidade do tamanho da
amostra de cada estrato da populao mantida na amostra. Por exemplo, se um estrato
corresponde a 20% do tamanho da populao, ele tambm deve corresponder a 20% da amostra.
Exemplo: Com o objetivo de realizar uma pesquisa de opinio sobre a gesto atual da reitoria em
uma determinada universidade, realizaremos um levantamento por amostragem. A populao
composta por 100 professores, 100 servidores tcnicos administrativos e 300 alunos, que
identificaremos da seguinte forma:
Populao
Professores

P001 P002 P100

Servidores

S001 S002 ... S100

Alunos

A001 A002 ... A300

Oliveira, D. C. R. e Oliveira, M. S.

____/____/____

Supondo que a opinio sobre a gesto atual da reitoria possa ser relativamente homogneo
dentro de cada categoria, realizaremos uma amostragem estratificada proporcional por categoria,
para obter uma amostra global de tamanho n = 10. A tabela a seguir mostra as relaes de
proporcionalidade.
Estrato

Proporo na Populao Tamanho do subgrupo na amostra

Professores 100/500 = 0,20 (ou 20%)

np = ( 0,20)*10 = 2

Servidores 100/500 = 0,20 (ou 20%)

ns = ( 0,20)*10 = 2

Alunos

300/500 = 0,60 (ou 60%)

na = ( 0,60)*10 = 6

Para selecionar aleatoriamente dois professores, podemos usar a Tabela de Nmeros


Aleatrios, tomando dois nmeros com trs algarismos. Usando, por exemplo a primeira linha da
tabela de nmeros aleatrios, temos os seguintes professores selecionados: {P045, P020}. Para os
servidores, usando a segunda linha da tabela, temos: {S055, S058}. Usando a terceira linha da
tabela, temos a seguinte amostra de alunos: {A050, A136, A270, A152, A247, A004}. A amostra
{P045, P020, S055, S058, A050, A136, A270, A152, A247, A004} uma amostra estratificada
proporcional da comunidade da universidade. Cada indivduo desta amostra dever ser pesquisado
para se obter a opinio em relao gesto atual da reitoria.
3.3.4. Amostragem por Conglomerado (AC)
A populao dividida em subpopulaes (conglomerados) distintas (quarteires,
residncias, famlias, bairros, etc.). Alguns dos conglomerados so selecionados segundo a AAS e
todos os indivduos nos conglomerados selecionados so observados. Em geral, menos eficiente
que a AAS ou AE, mas por outro lado bem mais econmica. Tal procedimento amostral
adequado quando possvel dividir a populao em um grande nmero de pequenas
subpopulaes.
A AC tem as seguintes caractersticas:
dentro de cada conglomerado h uma grande heterogeneidade (grande
variabilidade);
entre os conglomerados h uma pequena variabilidade (grande homogeneidade).
Exemplo: Realizao de uma pesquisa eleitoral em uma cidade com 12 zonas eleitorais. Usando a
tcnica de amostragem por conglomerados, podemos selecionar aleatoriamente 2 zonas eleitorais e,
em seguida, entrevistar todos os eleitores dessas zonas selecionadas
5
3

Zona

11

12
10

4
8

Entrevistar todos os
eleitores dessas zonas
Oliveira, D. C. R. e Oliveira, M. S.

____/____/____

Obs.: fcil confundir amostragem estratificada com amostragem por conglomerado, porque
ambas envolvem a formao de subgrupos. A diferena que a amostragem por conglomerado usa
todos os membros de uma amostra de conglomerados, enquanto a amostragem estratificada usa
uma amostra de membros de todos os estratos.
Curiosidade
Tambm podemos encontrar na prtica a Tcnica de Amostragem de Convenincia que
simplesmente usa resultados que sejam muito fceis de obter.
Ei! Voc a favor
da pena de m orte?

3.4. Exerccios Parte I A1


1) Um administrador especialista em avaliar atravs de sistemas informatizados as aes da
BOVESPA, est interessado em fazer uma pesquisa nos preos das aes, para indicar aos seus
clientes se hoje um dia favorvel a fazer investimentos. Ele sabe que existe N = 500 aes em
venda. Como o tempo de estudo de cada ao de aproximadamente 10 minutos, decidiu-se
verificar apenas n = 25 aes. Utilizando as tcnicas de amostragem aleatria simples, quais aes
sero selecionadas (Use a primeira linha da tabela de nmeros aleatrios)?
2) Um gerente de controle de qualidade estudar fontes de computador que passam numa esteira
transportadora dentro da empresa onde trabalha. Sabendo que por dia passam N = 85 fontes e na
amostra dever ter n = 10 fontes, quais sero as fontes selecionadas utilizando a tcnica de
amostragem sistemtica? (Quando for necessrio utilizar a Tabela de Nmeros Aleatrios utilize a
primeira linha)
3) Num depsito em uma determinada empresa produtora de materiais eletrnicos possui N = 100
computadores que esto separados em duas qualidades. N1 = 40 computadores Pentium 3 e N2 =
60 computadores Pentium 4. O custo para verificar se cada computador est sob controle muito
alto. O administrador responsvel disse que a empresa tem condies de verificar apenas n = 12
computadores. Utilizando a tcnica de amostragem estratificada proporcional, quais computadores
sero selecionados? (Quando for necessrio utilizar a Tabela de Nmeros Aleatrios utilize a
primeira linha)

Oliveira, D. C. R. e Oliveira, M. S.

10

____/____/____

4. TABULAO DE VARIVEIS
4.1. Variveis Qualitativas Unidimensionais
Quando se estuda uma varivel, o maior interesse do pesquisador conhecer o
comportamento dessa varivel, analisando a ocorrncia de seus possveis resultados.
A tabela a seguir apresenta a distribuio de freqncias da varivel grau de instruo dos
dados da Tabela 2.1.
Tabela 4.1: Freqncias e Porcentagens dos 36 empregados da seo de oramentos da
Companhia MB segundo o grau de instruo.
Grau de Instruo Freqncia (ni) Proporo (fi) Porcentagem (100 x fi)
Fundamental
12
Mdio
18
Superior
6
n = 36
1,0000
Total
Fonte: Bussab e Morettin (2002)
Interpretao da Tabela 4.1.: Nota-se que dos 36 empregados da seo de oramentos, 33,33%
tem nvel fundamental, 50% nvel mdio e apenas 16,67% nvel superior.
Notao: Usaremos a notao ni para indicar a freqncia (absoluta) de cada classificao ou
categoria da varivel. A notao fi = ni/n para indicar a proporo (ou freqncia relativa) de cada
categoria, sendo o n o nmero total de observaes.
As propores so muito teis quando se querem comparar resultados de duas pesquisas
distintas. O prximo exemplo ilustra este fato.
Exemplo: Suponhamos que se queira comparar a varivel grau de instruo para empregados da
seo de oramentos com a mesma varivel para todos os empregados da Companhia MB.
Digamos que a empresa tenha 2000 empregados e que a distribuio de freqncias seja a tabela
abaixo:
Tabela 4.2: Freqncias e Porcentagens dos 2000 empregados da Companhia MB, segundo o grau
de instruo.
Grau de Instruo
Freqncia (ni) Proporo (fi) Porcentagem (100 x fi)
Fundamental
650
Mdio
1020
0,5100
Superior
n = 2000
1,0000
Total
Fonte: Bussab e Morettin (2002)
Comparao entre a Tabela 4.1. e a Tabela 4.2.: No podemos comparar diretamente as colunas
das freqncias (ni) das duas tabelas pois os totais de empregados so diferentes nos dois casos (n =
36 e n = 2000). Mas as colunas das porcentagens (ou propores) so comparveis, pois reduzimos
as freqncias relativas a um mesmo total.
Oliveira, D. C. R. e Oliveira, M. S.

11

____/____/____

4.2. Variveis Quantitativas Unidimensionais


A construo de tabelas de freqncias para variveis quantitativas necessita de certos
cuidados. Por exemplo, a construo da tabela de freqncias para a varivel Salrio da Tabela 2.1.,
usando o mesmo procedimento que o grau de instruo, no resumir as 36 observaes num grupo
menor, pois no existem observaes iguais.
Soluo: Agrupar os dados por faixas de salrio. Assim, construmos uma tabela chamada Tabela
de Classes de Freqncias.
Exemplo: Distribuio de Freqncias dos salrios dos 36 empregados da seo de oramentos da
Companhia MB por faixas de salrio:
Tabela 4.3: Freqncias e Porcentagens dos 36 empregados da seo de oramentos da
Companhia MB por faixas de salrio.
Classe de Salrio Freqncia (ni) Proporo (fi) Porcentagem (100 x fi)
04 |-- 08
10
0,2778
27,78%
08 |-- 12
12
12 |-- 16
8
16 |-- 20
5
20 |-- 24
1
36
1,0000
Total
Obs.: Procedendo desse modo, ao resumir os dados referentes a uma varivel quantitativa, perde-se
alguma informao. Por exemplo, no sabemos quais so os oito salrios da classe de 12 a 16, a
no ser que investiguemos a tabela original. Sem perda de muita preciso, poderamos supor que
todos os oito salrios daquela classe fossem iguais ao ponto mdio da referida classe, isto , 14.
Nmero de Classes
A escolha dos intervalos arbitrria. A familiaridade do pesquisador com os dados que lhe
indicar quantas e quais classes (intervalos) devem ser usadas. Entretanto, deve-se observar que,
com um nmero pequeno de classes, perde-se informao, e com um nmero grande de classes, o
objetivo de resumir os dados fica prejudicado.
Soluo: Normalmente, sugere-se o uso de 4 a 8 classes com a mesma amplitude.
Dentre muitas regras citadas na literatura, duas tem sido universalmente adotadas, caso o
pesquisador no tenha idia alguma sobre o nmero de classes adotar. O nmero ideal de classes
um nmero inteiro prximo de:
Regra 1:

C = 1 + 3,2 x log n

Regra 2:

C= n

onde n o nmero de elementos pesquisado.


As duas regras so equivalentes para n 80. A partir da, a Regra 2 fornece valores que
crescem rapidamente e desse modo a Regra 1, proposta por Sturges tem sido preferida.
Oliveira, D. C. R. e Oliveira, M. S.

12

____/____/____

4.3. Variveis Qualitativas e Quantitativas Bidimensionais

As tabelas usadas neste caso so conhecidas como tabela de dupla entrada, tabela de
associao, tabela de contingncia ou distribuies conjuntas de freqncias.
Tabela 4.4: Distribuio dos funcionrios da empresa MB, segundo o
conceito em Metodologia e a Seo a que pertence.
Seo
Conceito em Metodologia
Total por
Seo
A
B
C
Dep. Pessoal
3
1
3
7
Sc. Tcnica
0
4
3
7
Sec. Venda
4
3
4
11
7
8
10
25
Total por Conceito

Tabela 4.5: Vendas dos Produtos A, B, C, no supermercado Glria, no


Primeiro semestre de 2005.
Meses
Vendas em 1000 R$
Total por
Ms
A
B
C
Janeiro
40,0
25,2
8,1
73,3
Fevereiro
40,1
28,0
10,0
78,1
Maro
35,1
28,0
15,4
78,5
Abril
28,2
20,2
22,3
70,7
Maio
14,1
25,6
28,1
67,8
Junho
5,0
30,0
35,2
70,2
162,5
157,0
119,1
438,6
Total por Produto
Fonte: Dados Hipotticos.

Tabela 4.6: Distribuio dos alunos da Faculdade Vitria, segundo suas


notas em Matemtica e Estatstica.
Estatstica
Matemtica
Totais em
Estatstica
0 |- 4
4 |- 7
7 |- 10
0 |- 4
32
25
5
62
4 |- 7
20
183
82
285
7 |- 10
7
27
19
53
59
235
106
400
Totais em
Matemtica
Fonte: Dados Hipotticos.

Oliveira, D. C. R. e Oliveira, M. S.

13

____/____/____

4.4. Exerccios Parte I A1


Tabela 4.7: Conjuntos de dados da empresa MB Indstria e Comrcio
Func.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

Seo*
P
P
P
P
P
P
P
T
T
T
T
T
T
T
V
V
V
V
V
V
V
V
V
V
V

Admin.
Direito
Redao
Estat.
Ingls
Metodologia
Poltica
8,0
9,0
8,6
9,0
B
A
9,0
8,0
9,0
7,0
9,0
B
C
6,5
8,0
9,0
8,0
8,0
D
B
9,0
6,0
9,0
8,6
8,0
D
C
6,0
8,0
9,0
8,0
9,0
A
A
6,5
8,0
9,0
8,5
10,0
B
A
6,5
8,0
9,0
8,2
8,0
D
C
9,0
10,0
9,0
7,5
8,0
B
C
6,0
8,0
9,0
9,4
9,0
B
B
10,0
10,0
9,0
7,9
8,0
B
C
9,0
8,0
9,0
8,6
10,0
C
B
10,0
8,0
9,0
8,3
7,0
D
B
6,5
6,0
9,0
7,0
7,0
B
C
6,0
10,0
9,0
8,6
9,0
A
B
10,0
8,0
9,0
8,6
9,0
C
B
10,0
8,0
9,0
9,5
7,0
A
A
9,0
8,0
9,0
6,3
8,0
D
C
10,0
6,0
9,0
7,6
9,0
C
C
6,0
6,0
9,0
6,8
4,0
D
C
6,0
6,0
9,0
7,5
7,0
C
B
6,0
8,0
9,0
7,7
7,0
D
B
6,5
6,0
9,0
8,7
8,0
C
A
6,0
8,0
9,0
7,3
10,0
C
C
9,0
8,0
9,0
8,5
9,0
A
A
6,5
8,0
9,0
7,0
9,0
B
A
9,0
(*) P = Departamento Pessoal; T = Seo Tcnica e V = Seo de Vendas.
Fonte: Bussab e Morettin (2002)

Economia
8,5
8,0
8,5
8,5
9,0
9,5
7,0
8,5
8,0
7,5
8,5
8,0
8,5
7,5
7,0
7,5
7,5
8,5
9,5
8,5
8,0
9,0
7,0
9,0
8,5

1) Baseado na Tabela 4.7., construa a distribuio de freqncias da varivel Metodologia, com as


freqncias absoluta e relativa, as porcentagens, d um ttulo e interprete.
2) Ainda baseado na Tabela 4.7., construa uma Tabela de Classes de Freqncias para a varivel
Redao, com as freqncias absoluta e relativa, as porcentagens, d um ttulo e interprete.
3) Construa uma tabela de dupla entrada para as variveis seo e conceito tirado em Ingls da
Tabela 4.7.
4) Construa uma tabela de contingncia para as variveis seo e notas em estatstica da Tabela
4.7.
5) Construa uma tabela de contingncia para as variveis notas em redao e poltica da Tabela
4.7.

Oliveira, D. C. R. e Oliveira, M. S.

14

____/____/____

5. MEDIDAS DE POSIO
5.1. Mnimo e Mximo

O mnimo a menor observao do conjunto de dados, enquanto que o mximo a maior


observao.
Exemplo: Considere o seguinte conjunto de dados: 4, 5, 4, 6, 5, 8, 4. Logo,
Min = __
e
Max = __.
5.2. Moda

Valor ou atributo que ocorre com maior freqncia.


Exemplo (a): 2, 5, 2, 7, 8
Moda = __ .
Exemplo (b): 3, 4, 2, 2, 4, 5
Moda = __ e __.
Exemplo (c): 1, 2, 3, 4, 5
Moda = no tem

Conjunto _ _ _ _ _ _ _
Conjunto _ _ _ _ _ _

Moda para dados agrupados em Tabelas de Freqncias


Exemplo: Uma empresa de segurana deseja estudar qual o nmero de ligaes a cobrar mais
freqentes que so recebidas em um determinado bairro de classe alta da cidade de So Paulo no
ms de maro. Foram selecionadas 30 residncias e observadas 10 ligaes em cada residncia. O
resultado foi:

Nmeros de Ligaes a Cobrar (xi)


0
1
2
3
Total

Nmero de Residncias (ni)


2
5
15
8
30

Moda = __.
Interpretao: __ ligaes a cobrar foi o que ocorreu com maior freqncia.
5.3. Mdia

Valor que representa o centro do conjunto de dados.


Considere n observaes de um conjunto de dados representados por x1, x2, ..., xn. A mdia
desse conjunto obtida pela soma das n observaes dividido por n, ou seja,
n

i
x1 + x 2 + x3 + L + x n
i =1
=
x=
n
n
Exemplo: Considere o seguinte conjunto de notas: 2, 5, 3, 7, 8. A mdia das notas ___.

Oliveira, D. C. R. e Oliveira, M. S.

15

(5.1)

____/____/____

Mdia para dados agrupados em Tabelas de Freqncias


Exemplo: Considere novamente o exemplo da empresa de segurana, mas suponha que o interesse
seja estudar o nmero mdio de ligaes a cobrar recebido em um determinado bairro de classe
alta da cidade de So Paulo no ms de maro.

Nmeros de Ligaes a Cobrar (xi)


0
1
2
3
Total

Nmero de Residncias (ni)


2
5
15
8
30

Nesse caso, a mdia calculada levando em conta as freqncias de cada valor da varivel,
da seguinte forma:
v

x=

x n
i =1

,
(5.2)
n
onde v a quantidade de resultados que a varivel contm e ni a respectiva freqncia da i-sima
classe. Assim, para o exemplo temos:
n

x n

0 x 2 + 1x5 + 2 x15 + 3x8


= ___.
n
30
Logo, o nmero mdio de ligaes a cobrar recebido em um determinado bairro de classe alta da
cidade de So Paulo no ms de maro ___.
x=

i =1

5.4. Mediana

o valor que divide os dados, isto , metade dos dados ser maior ou igual que a mediana e
metade ser menor ou igual.
Considere a seguinte srie de valores: 5, 2, 6, 13, 9, 15, 10.
De acordo com a definio de mediana, o primeiro passo a ser dado ordenar o conjunto de
valores: 2, 5, 6, 9, 10, 13, 15. O valor que divide a srie em duas partes iguais 9. Logo, a mediana
9.
Mtodo prtico para o clculo da Mediana para dados em Rol
1) Ordenar os valores do menor para o maior, isto , x(1),...., x(n), onde x(1) o mnimo e x(n) o
mximo.
n +1
.
2) Calcular em que posio estar a mediana nos dados ordenados atravs da frmula: p =
2
3) O valor da mediana ser:
(a) Se p for um nmero inteiro, ento a mediana ser o valor que est na posio p nos dados
ordenados, isto
Mediana = x(p)
Oliveira, D. C. R. e Oliveira, M. S.

16

____/____/____

(b) Se p no for inteiro, considere p- e p+ os inteiros imediatamente abaixo e acima de p,


respectivamente. A mediana ser a mdia dos valores que esto nas posies p- e p+ nos dados
ordenados, ou seja,

Mediana =

x (P ) + x (P+ )
2

Exemplo: Calcule a mediana da seguinte srie de dados: 1, 3, 0, 0, 2, 4, 1, 2, 5


1 ordenar a srie:
__, __, __, __, __, __, __, __, __.
n = __ . Logo, P = (n + 1)/2 dado por P = (__+1)/2 = 5, ou seja, o 5 elemento da srie ordenada
ser a mediana. Assim, mediana = __ .
Exemplo: Calcule a mediana da seguinte srie de dados: 1, 3, 0, 0, 2, 4, 1, 3, 5, 6
1 ordenar a srie: __, __, __, __, __, __, __, __, __, __.
n = __. P = (n + 1)/2 dado por P = (__+1)/2 = 5.5, logo, P- = 5 e P+ = 6, ou seja, o 5 e o 6
elementos da srie ordenada, que representam os seguintes valores: __ e __, respectivamente. Pela
definio, a mediana ser a mdia aritmtica do 5 e 6 termos da srie, ou seja,
Mediana = (2+3)/2 = 2,5.
Notas:
1) Quando o nmero de elementos da srie estatstica for mpar, haver coincidncia da mediana
com um dos elementos da srie.
2) Quando o nmero de elementos da srie estatstica for par, a mediana ser sempre a mdia
aritmtica dos 2 elementos centrais da srie.
3) Em uma srie de dados, a mediana, a mdia e a moda no tm, necessariamente, o mesmo valor.
4) A mediana, depende da posio e no dos valores dos elementos na srie ordenada. Essa uma
diferena marcante entre mediana e mdia (que se deixa influenciar, e muito, pelos valores
extremos). Vejamos:
Na srie: 5, 7, 10, 13, 15
Mdia = 10 e Mediana = 10;
Na srie: 5, 7, 10, 13, 65
Mdia = 20 e Mediana = 10,
isto , a mdia do segundo conjunto de valores maior do que a do primeiro, por influncia dos
valores extremos, ao passo que a mediana permanece a mesma.

Mediana para dados agrupados em Tabelas de Freqncias

Nesse caso, utilizamos a freqncia acumulada para identificar qual o valor da mediana.
Exemplo: Considere novamente o exemplo da empresa de segurana que desejava estudar qual o
nmero de ligaes a cobrar mais freqentes recebidas em um determinado bairro de classe alta da
cidade de So Paulo no ms de maro. Vamos introduzir uma nova coluna na tabela dos dados
referentes a freqncia acumulada.
Oliveira, D. C. R. e Oliveira, M. S.

17

____/____/____

Nmeros de Ligaes a Cobrar (xi)


0
1
2
3
Total

Nmero de Residncias (ni)


2
5
15
8
30

Freqncia Acumulada (Fi)

Como o rol par, pois n = __, a mediana a mdia dos valores que esto nas posies 15 e 16.
Ambos valores que esto nestas posies so __ ligaes a cobrar recebida por residncia, pois F3
a primeira freqncia acumulada que contm os elementos 15 e 16.

5.5. Exerccios Parte I A1

1) Os tempos de sobrevivncia (em meses) de um tipo de bateria esto listados a seguir.


5, 21, 21, 23, 23, 25, 27, 29, 30, 31, 32, 32, 32, 34, 35, 36, 38, 38, 38, 42, 43, 44, 60.
Calcule o mnimo, mximo, moda, mdia e mediana.
2) Um artigo em Computers and Industrial Engineering (2001, p.51) descreve os dados de tempos
de falha (em horas) para motores de jatos. Alguns desses dados esto a seguir.
Mquina #
1
2
3
4
5
6
7
8
9
10
11
12
13

Tabela 5.1: Dados Brutos (em horas)


Tempo de Falha Mquina # Tempo de Falha
150
14
171
291
15
197
93
16
200
53
17
262
2
18
255
65
19
286
183
20
206
144
21
179
223
22
232
197
23
165
187
24
155
197
25
203
213

Obtenha mnimo, mximo, moda, mdia e mediana dos tempos de falhas das mquinas e interprete
os resultados.
3) As idades dos 20 ingressantes num certo curso de ps-graduao em finanas de uma
universidade foram as seguintes: 22, 22, 22, 22, 23, 23, 24, 24, 24, 24, 25, 25, 26, 26, 26, 26, 27,
28, 35 e 40. Construa uma tabela de freqncias e calcule o mnimo, mximo, moda, mdia e
mediana das idades organizadas nessa tabela.

Oliveira, D. C. R. e Oliveira, M. S.

18

____/____/____

6. MEDIDAS DE DISPERSO
6.1. Motivao

Para preencher uma nica vaga existente em uma empresa, 50 candidatos foram submetidos
a 6 provas sobre conhecimentos especficos de interesse da empresa. Trs destes candidatos
destacaram-se com as notas descritas na tabela abaixo:
Tabela 6.1: Distribuio das Notas
Provas
Candidatos
1
2
3
4
5
A
7,0 7,5 8,0 8,0 8,5
B
6,0 7,0 8,0 8,0 9,0
C
7,5 8,0 8,0 8,0 8,0
Fonte: Dados Hipotticos

6
9,0
10,0
8,5

Que candidato escolher? Um critrio inicial poderia ser o de escolher o que tem a maior mdia,
mas:
Candidatos
A
B
C
Mdia
De modo anlogo, nem adianta pensar em moda ou mediana, pois:
Candidatos
A
B
C
Moda
Mediana
Soluo: Um segundo critrio de escolha pode ser escolher o candidato que apresentou notas mais
homogneas, isto , aquele que apresentou menor disperso das notas.
6.2. Amplitude

A amplitude definida pelo intervalo entre o valor mximo e o valor mnimo da srie de
dados, ou seja,
Amplitude = Mximo Mnimo
(6.1)
Exemplo: Para os trs candidatos temos:
Candidatos
A
B
C
Amplitude
6.3. Varincia e Desvio Padro

A varincia mede a disperso dos dados em torno de sua mdia.


n

( x x ) 2 + ( x 2 x ) 2 + ( x3 x ) 2 + L + ( x n x ) 2
=
s2 = 1
n 1
Oliveira, D. C. R. e Oliveira, M. S.

19

(x
i =1

x)2

n 1

(6.2)
____/____/____

O desvio padro simplesmente a raiz quadrada positiva da varincia


s = s2

(6.3)

Exemplo: Vamos calcular a varincia e o desvio padro para os trs candidatos:

Candidato A
s A2 =

7,0

7,5

Notas
8,0 8,0

8,5

Mdia
8,0

9,0

(7 8) 2 + (7,5 8) 2 + (8 8) 2 + (8 8) 2 + (8,5 8) 2 + (9 8) 2 2,5


=
= 0,5
6 1
5

Candidato B

6,0

7,0

s B2 =

Notas
8,0 8,0

9,0

Candidato C

7,5

8,0

sC2 =

Mdia
8,0

10,0

6 1
Notas
8,0 8,0

8,0

sB =

Mdia
8,0

8,5
=

6 1

s A = 0,5 0,7

sC =

Resumindo
Tabela 6.2: Medidas de Posio e Disperso dos 3 melhores candidatos
Candidatos Mdia Moda Mediana Amplitude Varincia
Desvio Padro
A
8,0
8,0
8,0
B
8,0
8,0
8,0
C
8,0
8,0
8,0
Frmula alternativa para o clculo da varincia
Podemos calcular a varincia atravs da seguinte frmula alternativa:

s2 =

1 n 2
2
xi n ( x )
n 1 i =1

(6.4)

.
A frmula (6.4) obtida atravs de algumas manipulaes algbricas na frmula (6.2). Esta
tem a facilidade de apenas necessitar da informao da mdia ( x ) e da soma dos valores ao
2
quadrado da varivel xi .

Oliveira, D. C. R. e Oliveira, M. S.

20

____/____/____

6.4. Intervalo Interquartil


O intervalo interquartil a diferena entre o terceiro quartil (Q3) e o primeiro quartil (Q1),
ou seja,
(6.5)
IQ = Q3 Q1.
Essa medida nos d a informao da amplitude dos 50% pontos centrais do conjunto de
dados ordenados.

6.5. Exerccios Parte I A1


1) Considere o seguinte conjunto de dados: 2, 3, 5, 7, 10. Utilize a frmula alternativa para calcular
a varincia, sabendo que a mdia 5,4.
2) Foram coletados aleatoriamente 5 empregados de 3 empresas (A, B e C) e perguntado para cada
um deles o seu salrio (em salrios mnimos). Se estas 3 empresas estivessem oferecendo emprego,
em qual delas voc trabalharia sendo que o resultado da pesquisa com os 15 funcionrios
entrevistados foi:
Empresa A Empresa B Empresa C
5,5
4
5
6
5
6
6
6
6
6
6
6
6,5
9
7
Obs: Obtenha a Amplitude, Varincia, Desvio Padro e o Intervalo-Interquartil de cada empresa
para tomar sua deciso.
3) Um laboratrio clnico precisa decidir comprar um dentre trs aparelhos (A, B, C) para dosagem
de sangue. Para isto o responsvel pelas anlises preparou uma substncia de concentrao
conhecida (10 mg/ml) e extraiu vrias amostras para serem dosadas pelos trs aparelhos. Os
resultados obtidos em cada um deles foram os seguintes:
A 5 10 7 15 16 12 4
8 10 13
B 10 9 10 9 11 8
9
7
8
9
C 10 11 9 10 10 9 11 12 8 10
Em medidas clnicas trs termos so utilizados freqentemente:
Preciso: refere-se disperso dos resultados
No-viciado: refere-se tendncia de um conjunto de medidas produzir um resultado igual ao
verdadeiro valor
Exato: refere-se ao instrumento preciso e no-viciado
(a) Descreva os trs instrumentos em termos das definies acima.
(b) Qual instrumento lhe parece recomendvel? Justifique sua resposta.

Oliveira, D. C. R. e Oliveira, M. S.

21

____/____/____

7. ESTATSTICA GRFICA
7.1. Grficos para as Variveis Qualitativas
A representao grfica da distribuio de uma varivel tem a vantagem de, rpida e
concisamente, informar sobre sua variabilidade.
Existem vrios tipos de grficos para as variveis Qualitativas. Aqui sero ilustrados trs
deles: Grficos em Barras, o de Composio em Setores (Pizza) e o Grfico de Pareto.

7.1.1. Grfico em Barras


O grfico em Barras consiste em construir retngulos ou barras, em que uma das dimenses
proporcional magnitude a ser representada (ni), sendo a outra arbitrria, porm igual para todas
as barras. Essas barras so dispostas paralelamente uma s outras, horizontalmente ou
verticalmente. No exemplo a seguir temos o grfico em barras (verticais) para a varivel Grau de
Instruo.

Tabela 7.1: Freqncias e Porcentagens dos 36 empregados da seo de oramentos da


Companhia MB segundo o grau de instruo.
Grau de Instruo Freqncia (ni) Proporo (fi) Porcentagem (100 x fi)
Fundamental
12
0,3333
33,33%
Mdio
18
0,5000
50,00%
Superior
6
0,1667
16,67%
n = 36
1,0000
100,00%
Total
Fonte: Bussab e Morettin (2002)

18

18
16
14

Freqncia (ni)

12

12
10
8
6

4
2
0
Fundamental

Mdio
Grau de Instruo

Superior

Figura 7.1: Grfico em Barras para a varivel Grau de Instruo


Oliveira, D. C. R. e Oliveira, M. S.

22

____/____/____

7.1.2. Grfico de Composio em Setores (Pizza)


O grfico de composio em setores (pizza), destina-se a representar a composio,
usualmente em porcentagem, de partes de um todo. Consiste num crculo de raio arbitrrio,
representando o todo, dividido em setores, que correspondem s partes de maneira proporcional.
Para o exemplo anterior temos o seguinte grfico:
50%
Fundamental
Mdio

33%
Superior

17%

Figura 7.2: Grfico em Setores para a varivel Grau de Instruo

500

100

400

80

300

60

200

40

100

20

Modelo-Avies
Count
Percent
Cum %

MD-737 MD-777 MD-757 MD-767 MD-717 MD-747


281
55
45
44
32
25
57,5
11,2
9,2
9,0
6,5
5,1
57,5
68,7
77,9
86,9
93,5
98,6

MD-11
4
0,8
99,4

MD-90
3
0,6
100,0

Porcentagem Acumulada

Frequencia Absoluta

7.1.3. Grfico de Pareto


O grfico de Pareto um grfico de barras representando a freqncia absoluta com um
grfico de linha, representando a porcentagem acumulada. Ele exibe a freqncia absoluta e a
porcentagem acumulada no eixo vertical e as categorias da classificao no eixo horizontal (Ver
Figura 7.3 a seguir). Organizamos sempre as categorias em ordem decrescente da freqncia de
ocorrncia, isto , a de maior freqncia absoluta fica esquerda, seguida pela segunda de maior
freqncia, e assim por diante.

Figura 7.3: Produo de avies em 2000. (Fonte: Boeing Commercial Airplane Company)
Oliveira, D. C. R. e Oliveira, M. S.

23

____/____/____

90

100

Nmero de Defeitos

80
70

80

60
50
40
30

60
30

20
10

Tipo de Defeito

40

21
6

20
4

ia
as
es
as
as
os
as
iv
tr
nc
nt
ur
ad
o
ad

o
t
u
e
r
h
c
i
l
n
O
a
/g
q
ifi
an
sa
co
as
ap
br
/r
se
s
d
l
o
s
u
l
a
d
te
ro
de
en
m
o
ar
fu
/f
ra
a
s
n
P
s
r
o
e
e
e
F
s
d
rt
Fo
lh
r te
ta
ta
Pa
l
a
n
P
E
Fa
Count
30
21
6
6
5
5
4
4
Percent
37,0 25,9
7,4
7,4
6,2
6,2
4,9
4,9
Cum %
37,0 63,0 70,4 77,8 84,0 90,1 95,1 100,0
o
rn

Porcentagem Acumulada

A Figura 7.3 apresenta um grfico de Pareto para a produo de avies de transporte da


Boeing Commercial Airplane Company no ano de 2000. Note que o 737 foi o modelo mais popular,
seguido pelos 777, 757, 767, 717, 747, MD-11 e o MD-90. A linha no grfico de Pareto conecta as
porcentagens acumuladas dos k modelos produzidos com maior freqncia (k = 1, 2, 3, 4, 5). Nesse
exemplo, os dois modelos produzidos com maior freqncia respondem aproximadamente 69% do
total dos avies produzidos em 2000.

Figura 7.4: Grfico de Pareto dos defeitos em elementos estruturais da porta.

Os grficos de Pareto so muito teis na anlise dos dados defeituosos em sistemas de


produo. A Figura 7.4 apresenta um grfico de Pareto que mostra a freqncia com que vrios
tipos de defeitos ocorrem em peas de metal usadas em um componente estrutural da moldura de
uma porta de automvel. Note como o grfico de Pareto reala os relativamente poucos defeitos
que so responsveis pela maioria dos defeitos observados na pea. O grfico de Pareto parte
importante no programa de melhora da qualidade, porque permite que a gerncia e a engenharia
concentrem sua ateno nos defeitos mais crticos do produto ou processo. Uma vez identificados
esses defeitos crticos, devem-se desenvolver e implementar aes corretivas para reduzi-los ou
elimin-los.

Curiosidade: O grfico de Pareto tem esse nome em homenagem ao economista italiano Vilfredo
Pareto que estabeleceu a teoria de que, em certas economias, a maior parte da riqueza (80%)
pertence minoria da populao (20%).

Oliveira, D. C. R. e Oliveira, M. S.

24

____/____/____

7.2. Grficos para as Variveis Quantitativas


Para variveis Quantitativas podemos considerar uma variedade maior de representaes
grficas.

7.2.1. Grfico em Barras


O grfico em Barras para as variveis quantitativas construdo da mesma forma ao das
variveis qualitativas.
Como ilustrao, considere a varivel Nmero de Filhos dos empregados casados da
seo de oramentos da Companhia MB. A Tabela 7.2 apresenta os dados.

Tabela 7.2: Freqncias e Porcentagens dos empregados da seo de oramentos da Companhia


MB, segundo o nmero de filhos.
Nmeros de Filhos (xi) Freqncia (ni) Porcentagem (100 x fi)
0
4
20
1
5
25
2
7
35
3
3
15
4
0
0
5
1
5
Total
n = 20
100
Fonte: Bussab e Morettin (2002)

Figura 7.5: Grfico de Barras para a varivel Nmeros de Filhos

Oliveira, D. C. R. e Oliveira, M. S.

25

____/____/____

7.2.2. Grfico de Pontos ou Grfico de Disperso Unidimensional (ou Dot-Plot)


Quando os dados consistem em um pequeno conjunto de nmeros, estes podem ser
representados traando-se uma reta com uma escala que abranja todas as mensuraes observadas e
grafando-se as respectivas freqncias como pontos acima da reta. Por esse motivo, tambm
conhecido como grfico de pontos.

Exemplo: Considere a varivel tempo, em segundos, entre carros que passam por um cruzamento,
viajando na mesma direo: 6, 3, 5, 6, 4, 3, 5, 4, 6, 3, 4, 5, 2, 10.

4
5
6
7
8
Figura 7.6: Grfico de Disperso Dot Plot

10

7.2.3. Histograma
O Histograma utilizado para representar a distribuio de freqncia. um grfico de
barras contguas, com bases proporcionais aos intervalos de classes e a rea de cada retngulo
proporcional respectiva freqncia relativa. Indicaremos a amplitude do i-simo intervalo por ai.
Para que a rea do retngulo respectivo seja proporcional a fi, a sua altura deve ser proporcional a
di = fi/ai, que chamada de densidade de freqncia da i-sima classe. Quanto mais dados tivermos
em cada classe, mais alto deve ser o retngulo. Com essa conveno, a rea total do histograma
ser 1 (um).

Exemplo: Considerando a varivel Salrio dos empregados da seo de oramentos da Companhia


MB, temos os seguintes dados:
Tabela 7.3: Freqncias e Porcentagens dos 36 empregados da seo de oramentos da
Companhia MB, por faixas de salrio
Classe de Freqncia Proporo Porcentagem Densidade de Freqncia
Salrio
(ni)
(fi)
(100 x fi)
(di = fi/ai)
04 |-- 08
10
0,2778
27,78
0,0695
08 |-- 12
12
0,3333
33,33
0,0833
12 |-- 16
8
0,2222
22,22
0,0556
16 |-- 20
5
0,1389
13,89
0,0347
20 |-- 24
1
0,0278
2,78
0,0070
n = 36
1,0000
100,00
Total

Oliveira, D. C. R. e Oliveira, M. S.

26

____/____/____

0,09

Densidade de Freqncia

0,08

0,0833

0,07
0,06

0,0695

0,05

0,0556

0,04
0,03

0,0347

0,02
0,01

0,007

04 |-- 08

08 |-- 12

12 |-- 16
Classes de Salrios

16 |-- 20

20 |-- 24

Figura 7.7: Histograma da varivel Salrio


7.2.4. Grfico em Linhas (ou Grfico Temporal)
um grfico utilizado para representar observaes feitas ao longo do tempo, em intervalos
iguais ou no. Tais conjuntos de dados constituem as chamadas sries histricas, ou sries
temporais. Traduzem o comportamento de um fenmeno em certo intervalo de tempo.

Tabela 7.4: Dvida Externa do Brasil de 1956 a 2006, em Milhes de Dlares.


Ano
Dvida
Ano
Dvida
Ano
Dvida
1956
2736
1957
2491
1958
2870
1959
3160
1960
3738
1961
3291
1962
3533
1963
3612
1964
3294
1965
3823
1966
3771
1967
3440
1968
4092
1969
4635
1970
6240
1971
8284
1972
11464
Fonte: IPEADATA
Oliveira, D. C. R. e Oliveira, M. S.

1973
1974
1975
1976
1977
1978
1979
1980
1981
1982
1983
1984
1985
1986
1987
1988
1989

14857
20032
25115
32145
37951
52187
55803
64259
73963
85487
93745
102127
105171
111203
121188
113511
115506

27

1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006

123439
123910
135949
145726
148295
159256
179935
199998
241644
241468
236156
226067
227689
235414
220182
187987
191999

____/____/____

250000

Dvida em Milhes de Dlares

200000

150000

100000

50000

20
0

20
0

20
0

20
0

19
9

19
9

19
9

19
9

19
9

19
8

19
8

19
8

19
8

19
8

19
7

19
7

19
7

19
7

19
7

19
6

19
6

19
6

19
6

19
6

19
5

19
5

Ano

Figura 7.8: Grfico de Linhas para a varivel Dvida Externa do Brasil no perodo 1956 a 2006
7.2.5. Ramo-e-Folhas
Suponha que os dados sejam representados por x1, x2, ..., xn, e que cada nmero xi consista
em, pelo menos, dois dgitos. Para construir um diagrama ramo-e-folhas dividimos cada nmero xi
em duas partes: um ramo, que consiste em um ou mais dos dgitos lderes, e uma folha, que
consiste nos dgitos restantes. Por exemplo, se os dados representam porcentagens de defeitos
(valores entre 0 e 100), em lotes de placas de semicondutores, ento poderamos dividir o valor 76
no ramo 7 e na folha 6. Em geral, devemos escolher poucos ramos em comparao com o nmero
de observaes. Usualmente, utilizado entre 5 e 20 ramos. Uma vez escolhido um conjunto de
ramos, eles so listados ao longo da margem esquerda do diagrama e, ao lado de cada ramo, so
listadas todas as folhas que correspondem aos valores dos dados observados.

Tabela 7.5: Fora de ruptura em libras por polegada para 100 garrafas
descartveis de 1 litro de refrigerante.
176 221 242 253 261 265 271 278 286 301
187 223 243 254 262 265 272 278 287 307
197 228 245 254 263 267 274 280 290 308
200 231 246 257 263 267 274 280 293 317
205 231 248 258 264 268 274 280 294 318
208 234 248 258 264 268 274 280 296 321
210 235 250 260 265 269 275 281 298 328
214 235 250 260 265 269 276 281 299 334
215 235 250 260 265 270 276 283 299 337
220 242 251 260 265 271 277 283 300 346
Fonte: Hines et al. (2006), p. 157.
Oliveira, D. C. R. e Oliveira, M. S.

28

____/____/____

1 17 6
2 18 7
3 19 7
6 20 058
9 21 045
13 22 0138
19 23 114555
26 24 2235688
36 25 0001344788
(22) 26 0000123344555555778899
42 27 01124444566788
28 28 0000113367
18 29 0346899
11 30 0178
7 31 78
5 32 18
3 33 47
1 34 6
Figura 7.9: Diagrama ramo-e-folhas para os dados da fora de ruptura de garrafas da Tabela 7.5.
O ramo-e-folhas resultante est representado na Figura 7.9. A inspeo dessa representao
revela imediatamente que a maioria das foras de ruptura fica entre 220 e 308 psi, e que o valor
central est em algum ponto entre 260 e 270 psi. Alm disso, as foras de ruptura esto distribudas
de maneira aproximadamente simtrica em torno do valor central. Assim, o ramo-e-folhas, como o
histograma, nos permite determinar rapidamente algumas caractersticas importantes dos dados que
no eram to imediatamente bvias na apresentao original da Tabela 7.5. Note que, aqui, os
nmeros originais no se perdem, como ocorre em um histograma. Atravs do ramo-e-folhas
podemos calcular qualquer medida de posio e disperso.

7.2.6. Desenho Esquemtico ou Diagrama de Caixas (Box-Plot)


Representa os dados utilizando os trs quartis (Q1, Q2 ou mediana e Q3), o mnimo e o
mximo em uma caixa retangular, alinhada verticalmente. A caixa inclui o intervalo-interquartil
para o clculo das linhas extremas.
* (Outlier ou Ponto Discrepante ou Ponto Aberrante)
Q 3 + 1,5 (Q 3 -Q 1)

M x im o

Q3
75%

M ed ian a

50%

Q1

25%

M n im o
Q 1 -1 ,5 (Q 3 -Q 1 )

Figura 7.10: Desenho esquemtico geral.


Oliveira, D. C. R. e Oliveira, M. S.

29

____/____/____

O diagrama de caixas ou desenho esquemtico ou box-plot til na comparao de duas ou


mais amostras. Para ilustrar considere os dados da Tabela 7.6, retirados de Hines et al (2006), que
representam leituras de viscosidade em trs misturas diferentes de uma matria-prima usada em
uma linha de produo. Um dos objetivos do estudo que Hines et al discutem comparar as trs
misturas.

Tabela 7.6: Medidas de viscosidade para trs misturas


Mistura 1 Mistura 2 Mistura 3
22,02
21,49
20,33
23,5
22,56
20,49
23,83
22,67
21,67
25,38
22,78
21,95
25,49
24,18
22,28
25,9
24,46
22,45
26,67
24,62
27,00
A Figura 7.11 a seguir apresenta os box-plot para os dados da viscosidade. Essa
apresentao permite uma interpretao fcil dos dados. A mistura 1 tem viscosidade mais alta do
que a mistura 2, e esta tem viscosidade mais alta que a mistura 3. A distribuio da viscosidade no
simtrica, porque as linhas superior e inferior e os comprimentos das caixas superior e inferior
em torno da linha mediana no so iguais. O valor da viscosidade mxima da mistura 3 parece alta,
em comparao com os demais valores da mistura 3 e, tambm, maior que os valores das demais
misturas 1 e 2. Essa observao um outlier, e ela exige exame e anlise mais aprofundados.
27

27
26,67

Viscosidade (centipoise)

26

25,9
25,38

25

24,62
24,46

24
23,5

23

22,78

22,45

22,56

22

22,02

21,95
21,49

21
20,49
20,33

20
Mistura 1

Mistura 2

Mistura 3

Figura 7.11: Diagramas de caixas para os dados de viscosidade da mistura na Tabela 7.6.

Oliveira, D. C. R. e Oliveira, M. S.

30

____/____/____

7.3. Exerccios Parte I A1


1) Faa o grfico de barras, o de composio em setores e o de Pareto para os dados fornecidos na
Tabela 7.7.
Tabela 7.7: Defeitos em elementos estruturais da porta
Tipo de Defeito
Frequncia Absoluta
Partes Salientes
5
Fora do Contorno
30
Partes mal aparadas
25
Total
60
2) Observe a sua conta de luz de 2007 e construa um grfico temporal e um grfico de barras,
colocando no eixo x, os meses (janeiro, ..., dezembro) e no eixo y, consumo de energia (em kWh).
3) Desenhe o ramo-e-folhas, box-plot e o dot plot para os dados das taxas mdias geomtricas de
incremento anual (por 100 habitantes) dos 30 maiores municpios do Brasil abaixo:
3,67
1,82
3,73
4,10
4,30
1,28
8,14
2,43
4,17
5,36
3,96
6,54
5,84
7,35
3,63
2,93
2,82
8,45
5,28
5,41
7,77
4,65
1,88
2,12
4,26
2,78
5,54
0,90
5,09
4,07
4) Construa uma tabela de classes de freqncias para os dados do exerccio 3, com intervalos de
amplitude 1, de 0 a 10, isto :
Taxas
[0, 1)
[1, 2)
[2, 3)
[3, 4)
[4, 5)
[5, 6)
[6, 7)
[7, 8)
[8, 9)
[9, 10]

Freqncia Absoluta

Proporo

Densidade

em seguida, faa o histograma.

Oliveira, D. C. R. e Oliveira, M. S.

31

____/____/____

8. CORRELAO E REGRESSO
8.1. Estudo da relao entre variveis
O objetivo investigar a presena ou ausncia de relao linear sob trs pontos de vista:
(a) Inspeo visual: diagrama de disperso
(b) Quantificando a fora dessa relao: coeficiente de correlao.
(c) Explicitando a forma dessa relao: ajuste de uma reta.

Exemplos: 1) Idade e altura das crianas;


2) Tempo de prtica de esportes e ritmo cardaco;
3) Tempo de estudo e nota na prova;
4) Taxa de desemprego e taxa de criminalidade;
5) Expectativa de vida e taxa de analfabetismo.
8.2. Diagrama de Disperso
Utilizado para estudar a relao entre duas variveis quantitativas, fornecendo uma
representao grfica das duas variveis.

Exemplo: Nota na Prova e Tempo de Estudo


X: tempo de estudo (em horas)
Y: nota obtida na prova

Tabela 8.1: Pares de observaes (Xi, Yi)


Tempo
Nota
3,0
4,5
7,0
6,5
2,0
3,7
1,5
4,0
12,0
9,3
Construo do Grfico de Disperso
No Excel podemos fazer:
Coluna A: Valores de X (Tempo)
Coluna B: Valores de Y (Notas)
Selecione as duas colunas e clique no cone Assistente de Grfico. Selecione o grfico de
Disperso (XY).
Oliveira, D. C. R. e Oliveira, M. S.

32

____/____/____

10
9
8
7

Nota

6
5
4
3
2
1
0

10

12

14

Tempo

Figura 8.1: Diagrama de Disperso para as variveis Tempo e Nota

Exemplo: Estudo da Renda Bruta Mensal pela Porcentagem da Renda Bruta Anual gasta com
Assistncia Mdica.
Numa pesquisa feita com 11 famlias com renda bruta mensal entre 10 e 60 salrios
mnimos mediram-se:
X: renda bruta mensal (em salrios mnimos)
Y: porcentagem da renda bruta anual gasta com assistncia mdica

Tabela 8.2
X
12
16
18
20
28
30

Oliveira, D. C. R. e Oliveira, M. S.

Y
7,2
7,4
7,0
6,5
6,6
6,7

X
40
48
50
54
32

33

Y
6,0
5,6
6,0
5,5
6,5

____/____/____

Porcentagem da Renda Bruta Anual gasta com Assist. Mdica

10

20

30

40

50

60

Renda Bruta Mensal (em sal. mnimos)

Figura 8.2: Diagrama de Disperso para as variveis Renda Bruta Mensal e Porcentagem da
Renda Bruta Anual gasta com Assistncia Mdica.
Nesta Figura 8.2, temos o diagrama de disperso de X (Renda Bruta Mensal) e Y
(Porcentagem da Renda Bruta Anual gasta com Assist. Mdica). Podemos notar que, conforme
aumenta a renda bruta mensal, a porcentagem da renda bruta anual gasta com assistncia mdica
diminui. Nota-se tambm uma tendncia linear decrescente.
Fazendo apenas uma mudana na escala do eixo Y da Figura 8.2, obtemos a Figura 8.3, que
ilustra com maior clareza essa tendncia linear decrescente.

Porcentagem da Renda Bruta Anual gasta com Assist. Mdica

7,5

6,5

5,5

10

20

30

40

50

60

Renda Bruta Mensal (em sal. mnimos)

Figura 8.3: Diagrama de Disperso para as variveis Renda Bruta Mensal e Porcentagem da
Renda Bruta Anual gasta com Assistncia Mdica.
Oliveira, D. C. R. e Oliveira, M. S.

34

____/____/____

8.3. Coeficiente de Correlao


O coeficiente de correlao linear definido como:
n

(X

r=

onde

i =1

X )(Yi Y )

(n 1) S x S y

X Y

i i

i =1

nXY

(n 1) S x S y

(9.1)

X e Y so as mdias amostrais das variveis X e Y , respectivamente.


S x e S y so os desvios padro das variveis X e Y , respectivamente
n

Recordando: S x =

(X
i =1

X )2

n 1

e Sy =

(Y

i =1

Y )2

n 1

Propriedades do coeficiente de correlao linear

O valor do coeficiente de correlao linear situa no intervalo [-1, 1], ou seja,


1 r 1
Classificao da correlao
1. r = 1
indica correlao linear positiva e perfeita;
indica correlao linear negativa e perfeita;
2. r = 1
3. r = 0
indica inexistncia de correlao linear;
4. 1 r 0 indica correlao linear negativa;
5. 0 r 1 indica correlao linear positiva.
Grficos - Exemplos da classificao da correlao

r = 1 , correlao linear positiva e perfeita

r = 1 , correlao linear negativa e perfeita

r 0 , inexistncia de correlao linear


40

30

20

10
10

20

30

40

Oliveira, D. C. R. e Oliveira, M. S.

50

35

____/____/____

-1 r 0, correlao linear negativa

0 r 1, correlao linear positiva.

O valor do coeficiente de correlao no depende da escala que medimos as variveis. Para


as duas figuras abaixo o valor do coeficiente de correlao r = 0,46 .
Y

Z=Y/10+0,8

O coeficiente de correlao linear mede apenas o grau de associao LINEAR.


Y

r 0,01
O coeficiente de correlao linear sensvel a valores discrepantes.

r = 0.91

r =0

Oliveira, D. C. R. e Oliveira, M. S.

36

____/____/____

Exemplo: Considere o Estudo da Renda Bruta Mensal pela Porcentagem da Renda Bruta Anual
gasta com Assistncia Mdica. Obter o coeficiente de correlao com os dados da Tabela 8.2.
Medidas Descritivas com os dados da Tabela 8.2
Mdia X
31,63636
Mdia Y
6,454545
Desvio de X 14,63744
Desvio de Y
0,62348
n
11
Soma XY
2160,4
n

r=

X i Yi nXY

i =1

(n 1)S x S y

2160,4 11.31,636363.6,454545
= -0,9399564
10.14,63744.0,62348

Podemos observar uma correlao negativa entre a renda bruta mensal e a


porcentagem da renda bruta anual gasta com assistncia mdica, isto quanto maior for a renda
bruta mensal, menor a porcentagem de sua renda gasta com assistncia mdica.
8.4. Regresso Linear Simples

Objetivo: ajustar uma reta entre duas variveis quantitativas.


Reta Ajustada
A reta ajustada de duas variveis quantitativas Y e X dado por
)
Y = a + bX

Definio de a e b
a: intercepto;
b: inclinao da reta.
Interpretao de b: Para cada aumento de uma unidade em X, temos um aumento mdio de b
unidades em Y.

Podemos calcular a e b utilizando o mtodo de mnimos quadrados, que visa encontrar os


valores de a e b, que minimiza a soma dos quadrados dos erros (ou desvios)
n

i =1

i =1

SQ(a, b) = ei2 = {Yi (a + bX i )}2


O problema agora se restringe a encontrar o mnimo de uma funo de duas variveis, a e b.
Derivando e igualando a zero, observamos que as solues de a e b devem satisfazer:

b=

a = Y bX
Oliveira, D. C. R. e Oliveira, M. S.

i =1

37

X i Yi nXY

(n 1) S x2
____/____/____

Reta Ajustada - Uso do Excel


Coluna A: varivel Y;
Coluna B: varivel X.
Para pedir reta que se ajusta aos dados devemos utilizar os seguintes comandos:
=INTERCEPO(A1:An;B1:Bn): Mostrar o intercepto (a);
=INCLINAO(A1:An;B1:Bn):
Mostrar a inclinao (b).
Exemplo: Consumo de cerveja e temperatura
As variveis foram observadas em nove localidades com as mesmas caractersticas
demogrficas e scio-econmicas.
Y: consumo de cerveja em um dia (em 100 litros)
X: temperatura mxima (em C)
Os dados amostrais esto dispostos na Tabela 8.3.

Temperatura
16
31
38
39
37
A correlao entre X e Y :
X=

Sx =

Tabela 8.3
Consumo
Temperatura
290
36
374
36
393
22
425
15
406

Y=

Sy =

Consumo
370
365
320
270

X Y
i =1

i i

A reta ajustada para este exemplo :


450
430
410
y = 5,2194x + 200,42

Consumo de Cerveja

390
370
350
330
310
290
270
250
10

15

20

25

30

35

40

45

Temperatura Mxima

Figura 8.4: Diagrama de Disperso para as variveis Temperatura Mxima e Consumo de Cerveja,
juntamente com a Reta de Regresso
Oliveira, D. C. R. e Oliveira, M. S.

38

____/____/____

(a) Qual a interpretao de b para o exemplo consumo de cerveja e temperatura?

(b) Qual o consumo previsto para uma temperatura de 25C?


8.5. Coeficiente de Determinao

A quantidade r2 = (quadrado do coeficiente de correlao x 100%) chama-se coeficiente de


determinao e , em geral, usada para julgar-se a adequao de um modelo de regresso.
Claramente, 0 r2 100. Na prtica, nos referimos a r2 de modo mais informal como a quantidade
de variabilidade nos dados explicada pelo, ou devido ao, modelo de regresso.
Exemplo: Considere o estudo da renda bruta mensal pela porcentagem da renda bruta anual gasta
com assistncia mdica, onde o coeficiente de correlao deu aproximadamente -0,9399, com os
dados da Tabela 8.2, logo, o coeficiente de determinao ser r2 88,35%, isto , 88,35% da
variabilidade nos dados explicada pelo modelo de regresso y = 7,7212 0,04x.

porcentagem da renda bruta anual gasta com assistncia mdica

7,5

6,5

5,5
y = -0,04x + 7,7212
2
R = 0,8835
5
10

15

20

25

30

35

40

45

50

55

60

renda bruta mensal (em salrios mnimos)

Oliveira, D. C. R. e Oliveira, M. S.

39

____/____/____

8.6. Exerccios Parte I A1

1) Considere o exemplo das variveis Nota na Prova e Tempo de Estudo


X : tempo de estudo (em horas)
Y : nota obtida na prova

Tempo
Nota

3
4,5

7
6,5

2
3,7

1,5
4

12
9,3

(a) Faa o Grfico de Disperso.


(b) Obtenha o Coeficiente de Correlao.
(c) Calcule a Reta de Regresso e represente no Grfico de Disperso.
(d) Obtenha o coeficiente de determinao.

Oliveira, D. C. R. e Oliveira, M. S.

40

____/____/____

Lista de Exerccios 1
1) Identifique a populao e a amostra correspondente : A fim de avaliar a inteno de voto para
presidente dos brasileiros, 122 pessoas foram entrevistadas em Braslia.
2) Classifique as seguintes variveis:
a) Conceitos obtidos na Disciplina Estatstica (R:Ruim, M:Mdio, B:Bom e O:timo);
b) Bacias Hidrogrficas (A:Amaznica, P:Platina, SF:So Francisco, N:do Nordeste, L:do Leste,
S:do Sul);
c) Nmero de sementes germinadas (0, 1, 2, 3, 4, 5);
d) Renda;
3) Selecione uma amostra de tamanho 10 dentre 80 funcionrios, utilizando as tcnicas de
amostragem aleatria simples e sistemtica. Depois, levando em conta que o sexo dos funcionrios
importante na pesquisa, obtenha uma amostra de mesmo tamanho utilizando amostragem
estratificada proporcional considerando que dos 80 funcionrios, 30 so mulheres e 50 so homens.
(Utilize a primeira linha da tabela de nmeros aleatrios, quando for necessrio)
4) Uma certa cidade possui N = 200 zonas eleitorais. Uma empresa destinada a fazer uma pesquisa
eleitoral vai selecionar aleatoriamente n = 15 zonas e entrevistar todos os elementos que esto
dentro dessas zonas eleitorais, isto , foi utilizada amostragem por conglomerado. Apresentem
quais sero as 15 zonas eleitorais amostradas. (Utilize a primeira linha da tabela de nmeros
aleatrios, quando for necessrio)
5) Os dados a seguir referem-se aos conceitos obtidos de n = 60 alunos, na disciplina de Estatstica
na Escola E.
Tabela 1: Dados Brutos
R : Ruim
M : Mdio
B: Bom
O : timo
M R M M M R B B M M R B M M M M R B B R
B M R M B M R M R M B M R M R M B M B M
B B B B O M M M M M B B B B B B B O B O
a) Organize os dados abaixo em uma Tabela de Freqncias, com ttulo, freqncias absoluta e
relativa, porcentagens e interpretao.
b) Faa os grficos de barras,o de composio em setores e o de Pareto para os dados da Tabela 1.
6) Os dados abaixo se referem ao comprimento de 31 canos PVC vendidos em uma loja de material
de construo.
Tabela 2: Dados Brutos (em m)
19,5 20,0 14,1 16,1 10,0 16,0 22,0 20,5 15,0 16,7 22,0
12,5 16,3 15,3 16,0 13,8 19,7 17,0 14,1 18,8 12,3
15,5 14,7 20,3 17,4 19,5 17,9 18,2 16,9 19,3 16,9

a) Obtenha as medidas de posio: mnimo, mximo, mdia, moda, mediana, Q1 e Q3.


b) Obtenha as medidas de disperso: amplitude, varincia, desvio-padro e intervalo-interquartil.
Oliveira, D. C. R. e Oliveira, M. S.

41

____/____/____

c) Organize os dados da Tabela 2 em uma Tabela de Classes de Freqncias, com ttulo,


freqncias absoluta e relativa, porcentagem e interpretao. Utilize uma amplitude de 2 para as
classes.
d) Faa o histograma utilizando os dados agrupados em (c), baseados na Tabela 2.
e) Construa o dot-plot, box-plot e o ramo-e-folhas para os dados da Tabela 2.
7) Medidas da pulsao de 15 ndios nativos dos Alpes Peruanos esto apresentadas a seguir:
Tabela 3: Medidas da pulsao
64
64
68
68
76
60
72
68
80
60
72
88
60
88
60
a) Calcule: Mdia, Mediana. Comente os resultados;
b) Calcule: Mnimo, Q1, Q3 e Mximo. Interprete estas 4 estatsticas;
c) Calcule: Varincia e Desvio Padro. Comente.
d) Construa o grfico de barras para os dados de pulsao dos ndios.
8) Um rgo do governo do estado est interessado em determinar padres sobre o investimento
em educao, por habitante, realizado pelas prefeituras. De um levantamento de dez cidades, foram
obtidos os valores (codificados) da tabela abaixo:
Tabela 4: Valores codificados do investimento em educao
A
B
C
D
E
F
G
H
I
J
Cidade
7
19 15 14 16 19 18
Investimento 20 16 14
a) Calcule a mdia e o desvio-padro das observaes;
b) Recebero um programa especial s cidades com valores de investimento inferiores mdia
menos duas vezes o desvio padro. Alguma cidade receber o programa?
c) Ser considerado como investimento bsico a mdia das observaes compreendidas entre a
mdia original menos dois desvios padro e a mdia original mais dois desvios padro. Calcule o
investimento bsico e compare com a mdia obtida no item a). Justifique a diferena encontrada.
9) Trs medicamentos para cicatrizao esto sendo testados e um experimento feito para estudar
o tempo (em dias) do completo fechamento em cortes provenientes de cirurgia. Os resultados
abaixo mostram o tempo de cicatrizao em cobaias submetidas a um dos trs tratamentos (A, B,
C):
Tabela 5: Tempo (em dias) do completo fechamento em
cortes provenientes de cirurgia
A 13 14 15 13 15 14 15 15 14 14
B 14 12 13 13 14 14 13 14
C 12 12 13 13 12 13 11 11
Analise os dados descritivamente utilizando todas as medidas apresentadas em aula e comente.
10) A seguir, temos informaes do nmero de peixes-boi mortos e o nmero de barcos de turismo
(em milhares) que circulam em seu habitat na Flrida-EUA.
Tabela 6: Dados Brutos
Barcos(X) 68
68
67
70
71
73
76
81
83
84
Mortes(Y) 53
38
35
49
42
60
54
67
82
78
Oliveira, D. C. R. e Oliveira, M. S.

42

____/____/____

a) Observe o diagrama de disperso e comente sobre a relao linear dessas duas variveis.
b) Verifique se a correlao significativa (atravs do coeficiente de correlao (r)).
c) Obtenha a reta de regresso, considerando o nmero de peixes mortos a varivel dependente e o
nmero de barcos como a varivel independente.
d) Interprete o coeficiente de determinao (r2).
11) esperado que a massa muscular de uma pessoa diminua com a idade. Para estudar essa
relao uma nutricionista selecionou 18 mulheres com idade entre 40 e 79 anos, e observou em
cada uma delas a idade (X) e a massa muscular (Y).
Tabela 7: Dados Brutos
X 71 64 43 67 56 73 68 56 76 65 45 58 45 53 49 78 73 68
Y 82 91 100 68 87 73 78 80 65 84 116 76 97 100 105 77 73 78
a) Faa o diagrama de disperso dos dados.
b) Calcule o coeficiente de correlao linear entre X e Y e interprete-o.
c) Ajuste uma reta de regresso para mostrar a relao linear entre as variveis Y: massa muscular
(dependente) e X: idade (independente) e interprete os coeficientes.
18

Alguns resultados: n = 18;

X
i =1

18

X Y
i =1

i i

= 1108 ;

18

X
i =1

2
i

= 70362 ;

18

Y
i =1

= 1530 ;

18

Y
i =1

= 133300 e

= 91964 .

Observao: O gabarito da Lista de Exerccios 1 encontra-se no Apndice A

Oliveira, D. C. R. e Oliveira, M. S.

43

____/____/____

9. PROBABILIDADE
9.1. Processo ou Experimento Aleatrio
Definio 1: Qualquer fenmeno que gere resultado incerto ou casual chamado de Processo ou
Experimento Aleatrio.
Exemplos:
1) Jogar uma moeda duas vezes e observar a seqncia obtida de caras e coroas;

2) Jogar um dado e observar o nmero mostrado na face superior;

3) Peso de Animais;

4) Nmero de filhos de um casal.

9.2. Espao Amostral ()


Definio 2: Espao amostral () o conjunto de todos os resultados possveis de um experimento
aleatrio.
Exemplos: Obtenha o espao amostral dos seguintes experimentos:
1) Jogar um dado e observar o resultado:
= {1, 2, 3, 4, 5, 6}.
2) Lanar uma moeda duas vezes e observar as faces obtidas:
3) Uma urna contm 10 bolas azuis e 10 brancas. 3 bolas so retiradas ao acaso e as cores so
anotadas:
4) Dois dados so lanados simultaneamente e estamos interessados na soma das faces observadas:
5) Uma moeda lanada consecutivamente at o aparecimento da 1 cara:
6) Uma mquina produz 20 peas por hora. Ao final da primeira hora de produo, observa-se o n
de defeituosas:
7) Medio do tempo de vida de uma lmpada antes de se queimar:

Oliveira, D. C. R. e Oliveira, M. S.

44

____/____/____

9.3. Evento
Definio 3: Evento qualquer subconjunto do espao amostral.
Exemplos:
(a) Alguns eventos do experimento 1: A = {5}, B = {2, 4, 6}, etc.
(b) Alguns eventos do experimento 2:
Existem dois eventos especiais: espao todo () e o conjunto vazio ().

Operaes com Eventos


Sejam A e B dois eventos de um mesmo espao amostral:
O evento interseo de A e B, denotado AB, o evento em que A e B ocorrem
simultaneamente.
A

O evento unio de A e B, denotado AB, o evento em que A ocorre ou B ocorre (ou ambos).
A

O evento complementar de A, denotado Ac, o evento em que A no ocorre.


A

Exemplos: Operaes com Eventos. Seja 1 = {1, 2, 3, 4, 5, 6} e considere os seguintes eventos


A = {2, 4, 6}, B = {4, 5, 6} e C = {1, 3, 5}.
Faa as seguintes operaes:
AB=
AC =
AB=
A Bc =
Eventos Disjuntos
Definio 4: Dois eventos A e B so mutuamente exclusivos ou disjuntos se eles no podem
ocorrer simultaneamente (A B = ).
A

Exemplo:

A = o resultado do dado foi 4, e


B = o resultado do dado foi 5 A B =

Aps essas quatro definies, estamos preparados para calcular probabilidades.

Oliveira, D. C. R. e Oliveira, M. S.

45

____/____/____

9.4. Exerccios Parte II A2


1) Determine o espao amostral dos seguintes experimentos:
(a) Lanar 2 dados e observar as faces superiores;

(b) Lanar 2 dados e observar a soma das faces superiores;

2) Considere o seuinte espao amostral: = = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10}


Defina os eventos:
A = nmero par:
B = nmero mpar:
C = mltiplo de 3:
D = maior ou igual a 6:
E = maior que 8:
F = menor que 5:
G = menor ou igual a 3:
Obtenha os seguintes eventos:
(a) A B =

(e) C D =

(b) A B =

(f) E F =

(c) (A B)c =

(g) (A G)c =

(d) (A B)c =

(h) (Ec B)c =

Oliveira, D. C. R. e Oliveira, M. S.

46

____/____/____

9.5. Introduo Probabilidade


A rea de Probabilidade comeou a ser desenvolvida no sculo XVII antes ainda da
formalizao da rea da Estatstica, em questes propostas em jogos de azar.

1654 Pierre de Fermat (1601-1665) e Blaise Pascal (1623-1662), na Frana, estabelecem os


Princpios do Clculo das Probabilidades.

1656 - Huygens (1629-1695) publica o primeiro


Tratado de Probabilidade.

No entanto, fcil perceber que o termo probabilidade j est enraizado no senso comum,
pois as pessoas vivem o cotidiano calculando implicitamente algumas probabilidades, tais como:
9 situaes de sua vida pessoal;
9 organizando-se em relaes a horrios a cumprir, levando em conta as circunstncias do
trfego;
9 agasalhando-se ao sair de casa se a previso do tempo indicar uma frente fria.
Em resumo, prevenindo-se em situaes de risco.
Como podemos definir Probabilidade?

Probabilidade uma medida que quantifica a sua incerteza frente a


um possvel acontecimento futuro.
H vrias maneiras de se medir a incerteza e costume se pensar na seguinte diviso:
1) Mtodo Clssico
3) Mtodo Subjetivo
2) Mtodo Freqentista
4) Mtodo Moderno ou Axiomtico
O primeiro devido a Laplace e o mais conhecido, pois relaciona eventos favorveis com
eventos possveis. O segundo consiste em repetir um experimento vrias vezes. O terceiro
baseado na opinio pessoal e o ltimo devido a Kolmogorov e baseia-se no princpio de que
qualquer experimento pode ser modelado.
Oliveira, D. C. R. e Oliveira, M. S.

47

____/____/____

9.6. Definio Clssica


Definio 5 (Clssica): Dado um conjunto de N eventos equiprovveis, a probabilidade de
ocorrncia de um determinado evento A, dado pela razo
n
P ( A) =
N
onde n o nmero de elementos em A e N o nmero de elementos em .

Exemplo: Considere o lanamento de uma moeda equilibrada, nesse caso o espao amostral
associado = {Cara, Coroa}. Ento, pela definio clssica, a probabilidade de ocorrncia do
evento cara P(cara) =
.
Exemplo: Populao Residente em So Joo del Rei em 2006
Idade
Menor 1
Masculino
600
572
Feminino
Total
1172

1a4
2592
2457
5049

5 a 9 10 a 14 15 a 19 20 a 29 30 a 39 40 a 49 50 a 59 60 a 69 70 a 79 80 e mais
3411
3491
3774
7027
6699
5528
3300
2222
1085
397
3257
3482
3692
7059
7096
5863
3894
2910
1781
763
6668
6973
7466
14086
13795
11391
7194
5132
2866
1160

Total
40126
42826
82952

Fonte: DATASUS (http://www.datasus.gov.br)

= conjunto de 82.952 habitantes residentes em So Joo del Rei em 2006 por faixa etria.
Possveis eventos de interesse:
M = Indivduo sorteado do sexo masculino
F = Indivduo sorteado do sexo feminino
A = Indivduo sorteado tem mais que 80 anos
B = Indivduo sorteado tem entre 15 e 29 anos
M A = Indivduo sorteado do sexo masculino e tem mais de 80 anos
F B = Indivduo sorteado do sexo feminino ou tem entre 15 e 29 anos

20,00

16,69

17,51

Distribuio da Faixa Etria da Cidade de So Joo del Rei em 2006, por Sexo

13,78

16,48

16,00

16,57

18,00

13,69

1,78

2,00

0,99

4,16

2,70

6,79

5,54

8,22

1,50
1,34

4,00

Masculino
Feminino

9,09

5,74

6,00

8,62

7,61

8,00

8,13

10,00

8,70

8,50

9,41

12,00

6,46

Porcentagem

14,00

0,00
Menos
que 1

1a4

5a9

10 a 14 15 a 19 20 a 29 30 a 39 40 a 49 50 a 59 60 a 69 70 a 79

acima
de 80

Grupos de Idade

Oliveira, D. C. R. e Oliveira, M. S.

48

____/____/____

Exerccio Parte II A2: Suponha que um indivduo escolhido aleatoriamente na cidade de So


Joo del Rei em 2006. Determine a probabilidade de ocorrer cada um dos eventos definidos.

9.7. Definio Freqentista


Definio 6 (Freqentista): A probabilidade de ocorrncia de um determinado evento igual
freqncia relativa de ocorrncia de tal evento, quando o processo aleatrio que o gerou for
repetido infinitas vezes.
Exemplo: Atividade Prtica do lanamento da moeda.
Passo 1 Agrupem-se 2 a 2 e peguem uma moeda chamem o valor numrico da moeda de
COROA (K ) e a outra face de CARA (C). Suponham que haja interesse em saber se a sua moeda
honesta (isto significa saber se a probabilidade de CARA de sua moeda ou, em termos
percentuais, se a probabilidade de sair Cara 50%).
Passo 2 Um membro do grupo vai lanar a moeda e o outro vai marcar os resultados na planilha
anexa, seguindo as seguintes instrues:
a) Jogar a moeda uma vez e anotar C ou K no espao adequado (linha 2) da planilha.
b) Repetir este procedimento 30 vezes, preenchendo um a um todos os espaos da linha 2.
Passo 3 Continuando com a planilha, trocar de lugar com o parceiro, voltar para os itens a) e b)
das instrues e continuar mais 30 jogadas at perfazer 60.
Passo 4 Voltar ao primeiro da dupla e, ainda com a planilha, seguir as instrues:
c) Depois do registro na linha 2 de todos os resultados como C ou K, passar para a linha 3: chamar
CARA de 1 e COROA de 0 e colocar estes valores na planilha, abaixo de cada resultado j obtido
na linha 2. Cada membro do grupo deve fazer metade um faz a linha de cima e o outro a linha de
baixo.
d) Agora a linha 4 da planilha deve ser preenchida em cada posio deve ser colocado o nmero
acumulado de CARAS, at aquela jogada (verifique que a jogada est explicitada na linha 1- que
a linha n). Discutir com outro membro do grupo para ver se est claro se no, pergunte! A linha
de baixo continuao do acumulado da linha de cima.
e) Finalmente chegamos ltima linha linha 5: colocar a freqncia relativa (m/n) de CARAS em
cada momento o que isto? Discuta com o outro membro do grupo (desprezar as entradas
assinaladas com X).

Oliveira, D. C. R. e Oliveira, M. S.

49

____/____/____

1)
2)
3)
4)
5)

Jogada(n)
C ou K
1 ou 0
Caras Acumuladas (m)
Frequncia Relativa (m/n)

1)
2)
3)
4)
5)

Jogada(n)
C ou K
1 ou 0
Caras Acumuladas (m)
Frequncia Relativa (m/n)

31 32 33

10

12

14

17

40

20

47

25

50

30

55

60

Passo 5 depois de completar a 1a parte da planilha, construir a seguinte tabela, usando as linhas 4
e 5 da planilha:
n
m/n

10

20

30

40

50

60

Passo 6 Completar o grfico, usando os valores da tabela recm construda, do seguinte modo:
Eixo Y valores m/n
Eixo X valores da linha 1: (n)

m/n

Grfico da Atividade Prtica - Parte II A2

1,0
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
1 2 3 4 5 6 7 8 9 10 20
n

30

40

50

60

Passo 7 Comparar os resultados com os colegas e interpretar o resultado comentando sobre a


honestidade da sua moeda.
Concluso: Com isto chegamos a uma possvel definio freqentista de probabilidade, ou seja,
probabilidade o valor em que a freqncia relativa se estabiliza aps um nmero muito grande de
ensaios.
Oliveira, D. C. R. e Oliveira, M. S.

50

____/____/____

9.8. Definio Subjetiva


Definio 7 (Subjetiva): Cada indivduo, baseado em informaes anteriores e na sua opinio
pessoal a respeito de um evento em questo, pode ter uma resposta para a probabilidade desse
evento.
Exemplo: Um mdico experiente consegue calcular uma probabilidade do indivduo ter uma
determinada doena baseado nos sintomas que o indivduo apresenta.
9.9. Definio Moderna
Definio 8 (Moderna): Probabilidade uma funo P(.), que associa a cada evento do espao
amostral , um nmero real, pertencente ao intervalo [0, 1], satisfazendo os seguintes axiomas:
(1) 0 P(A) 1.
(2) P() = 1.
(3) Se A e B so eventos mutuamente exclusivos: P(AB) = P(A) + P(B).

Exemplos:
Segue alguns exemplos de funes j descobertas na literatura para calcular
probabilidades, que sero discutidas em detalhes nos captulos posteriores.
1) Distribuio Bernoulli

P(X = x ) = p x (1 p )1 x , x = 0, 1.
2) Distribuio Binomial
n
nx
P(X = x ) = p x (1 p ) , x = 0, 1, ..., n.
p

3) Distribuio Hipergeomtrica
r N r

x n x , 0 x mnimo(r, n).
P(X = x ) =
N

n
4) Distribuio Poisson

P(X = x ) =

e x
, x = 0, 1, ...
x!

5) Distribuio Normal
1

(x )

1
2
f (x) =
e 2
, - < x< +
2
Oliveira, D. C. R. e Oliveira, M. S.

51

____/____/____

6) Distribuio t de Student

[(k + 1) / 2] x 2
1+
f (x) =
k
[k / 2] k
7) Distribuio Qui-Quadrado
f (x) =

1
k
k/2 22

(k +1) / 2

, - < x< +

k
1 x
2

e 2,x>0

Propriedades
P1: P() = 0, onde o conjunto vazio.
P2: Se Ac for o evento complementar de A, ento P(Ac) = 1 P(A).
P3: Se A e B forem dois eventos quaisquer, ento P(A B) = P(A) + P(B) P(A B).
P4: Se A B, ento P(A) P(B).
Nos captulos posteriores veremos algumas distribuies de probabilidade para
variveis discretas e contnuas comumente utilizadas.
9.10. Probabilidade Condicional
A probabilidade condicional surge, por exemplo, quando se deseja calcular a probabilidade
de um evento A ocorrer sabendo que um evento B j ocorreu.
Sejam A e B dois eventos associados a um mesmo espao amostral . Denota-se por
P(A|B) a probabilidade condicionada do evento A, quando o evento B tiver ocorrido.
Sempre que calculamos P(A|B), estamos essencialmente calculando P(A) em relao ao
espao amostral reduzido devido a B ter ocorrido, em lugar de faz-lo em relao ao espao
amostral original .
Assim, uma definio mais formal de probabilidade condicional dada pela definio 9.
Definio 9 (Probabilidade Condicional): Dados dois eventos A e B, a probabilidade condicional
de A dado que ocorreu B representada por P(A | B) e definida por
P( A B)
P( A | B) =
,
P( B) > 0
P ( B)
Da definio de probabilidade condicional, obtemos a regra do produto de probabilidades.

P( A B) = P( B)P( A | B)
Exemplo: Voltando ao Exemplo da Populao Residente em So Joo del Rei em 2006, temos:
Idade
Menor 1
Masculino
600
Feminino
572
Total
1172

1a4
2592
2457
5049

5 a 9 10 a 14 15 a 19 20 a 29 30 a 39 40 a 49 50 a 59 60 a 69 70 a 79 80 e mais
3411
3491
3774
7027
6699
5528
3300
2222
1085
397
3257
3482
3692
7059
7096
5863
3894
2910
1781
763
6668
6973
7466
14086
13795
11391
7194
5132
2866
1160

Total
40126
42826
82952

Fonte: DATASUS (http://www.datasus.gov.br)


Oliveira, D. C. R. e Oliveira, M. S.

52

____/____/____

Se soubermos que um indivduo sorteado do sexo masculino, qual a probabilidade de


que ele tenha idade entre 30 e 39 anos?
B = indivduo do sexo masculino e A = tem idade entre 30 e 39 anos
6699
P(A B) 82952
6699
P(A | B) =
=
=
= 0,167
40126 40126
P(B)
82952

Exerccio Parte II A2: Na Segunda Guerra Mundial, houve um esforo de pesquisa


operacional na Inglaterra direcionado a estabelecer padres de busca de submarinos alemes pelas
patrulhas areas. Por algum tempo, houve uma tendncia em concentrar os vos em reas prximas
costa, uma vez que se acreditava que mais avistamentos tinham ocorrido ali. O grupo de pesquisa
estudou os registros de 1000 patrulhas, obtendo os seguintes resultados (os dados so fictcios):
Prximo costa (B1) Alto-mar (B2) Total
Houve avistamento (A1)
80
20
100
No houve avistamento (A2)
820
80
900
Total de Patrulhas
900
100
1000
(a) Dado que a patrulha estava prximo costa, qual a probabilidade de que houve avistamento?
(b) Dado que a patrulha estava em alto-mar, qual a probabilidade de que houve avistamento?
(c) Os resultados de (a) e (b) indicam uma estratgia de busca contrria prtica anterior?

9.11. Independncia de Eventos


Definio 10: Dois eventos A e B so independentes se a ocorrncia de um no altera a
probabilidade de ocorrncia do outro, isto , P(A|B) = P(A) ou P(B|A) = P(B), ou ainda, a seguinte
forma equivalente:
P(AB) = P(A) P(B)

Exemplo: Joaninha tem probabilidade de 0,8 de passar no vestibular enquanto que Joozinho tem
probabilidade de 0,6. Qual a probabilidade dos dois passarem no vestibular? Qual a suposio a ser
feita nesse caso para calcular a probabilidade?
Sejam os eventos: A: Joaninha passa no vestibular e B: Joozinho passa no vestibular
P(AB) = 0,8.0,6 = 0,48
Exerccio Parte II A2: O campo da Engenharia da confiabilidade se desenvolveu rapidamente
a partir do incio da dcada de 1960. Um tipo de problema encontrado o de se estimar a
confiabilidade de um sistema a partir das confiabilidades dos subsistemas. A confiabilidade
definida, aqui, como a probabilidade do funcionamento apropriado durante um certo perodo de
tempo. Considere a estrutura de um sistema em srie simples, como o da figura a seguir:
Sistema

Subsistema 1
Oliveira, D. C. R. e Oliveira, M. S.

Subsistema 2
53

____/____/____

O sistema funciona se e somente se o subsistema 1 e o subsistema 2 funcionarem. Se os


subsistemas sobrevivem independentemente, a confiabilidade do subsistema 1 de 0,90 e do
subsistema 2 de 0,80, qual a confiabilidade do sistema?

9.12. Regra da Probabilidade Total


Se A e B so eventos, temos duas maneiras de A ocorrer:
A e B ocorrem (A B)
ou
A e Bc ocorrem (A Bc)
Assim temos que:
A = (A B) (A Bc)
pela Regra da Soma temos:
P(A) = P(A B) + P(A Bc)
e finalmente pela Regra do Produto temos:

P(A) = P(B).P(A | B) + P(Bc).P(A | Bc)


Exemplo: O Cruzeiro ganha com probabilidade 0.7 se chove e 0.8 se no chove. Em maio a
probabilidade de chuva de 0.3. Qual a probabilidade do Cruzeiro ganhar uma partida no ms de
maio?
A: Cruzeiro vencer; B: chove; Bc: No chove
P(A) = P(B).P(A | B) + P(Bc).P(A | Bc) = 0,3.0,7 + 0,7.0,8 = 0,77
Exerccio Parte II A2: Em um centro de mquinas, h quatro mquinas automticas de
parafusos. Uma anlise dos registros de inspeo passados fornece os seguintes dados:
Mquina Percentual de Produo Percentual de Defeituosos Produzidos
1
15
4
2
30
3
3
20
5
4
35
2
As mquinas 2 e 4 so mais novas e, assim, a maior parte da produo foi atribuda a elas.
Suponha que o estoque atual reflita as porcentagens de produo indicadas. Se um parafuso
selecionado aleatoriamente do estoque, qual a probabilidade de que seja defeituoso?
9.13. Teorema de Bayes
Finalmente, uma das relaes mais importantes envolvendo probabilidades condicionais
dada pelo Teorema de Bayes. Thomas Bayes (1702-1761) afirmou que as probabilidades devem ser
revistas quando conhecemos algo mais sobre os dados. A verso mais simples desse teorema
dada pela frmula
P(A B) P(B | A) P(A)
P(A | B) =
=
P(B)
P(B)
A forma geral do Teorema de Bayes pode ser introduzida da seguinte forma:
Considere a seqncia {C1, C2, ..., Cn} como sendo uma partio do espao amostral , isto
, Ci Cj = sempre que i j e C1 C2 ... Cn = .
Considere um evento qualquer A em . Suponha que sejam conhecidas as probabilidades
de cada partio (P(Ci)) e as probabilidades condicionais P(A|Ci).
Oliveira, D. C. R. e Oliveira, M. S.

54

____/____/____

Logo, temos o seguinte teorema:


Teorema: A probabilidade de ocorrncia do evento Ci, supondo a ocorrncia do evento A, dado
por
P(C i )(A | C i )
P (C i | A ) =
n
P(C j )(A | C j )
j=1

para todo i = 1, 2, ..., n.

Curiosidade
O teorema de Bayes, que aparentemente poderia ser encarado como mais um resultado na teoria de
probabilidades, tem importncia fundamental, pois fornece a base para uma abordagem da
inferncia estatstica conhecida como inferncia bayesiana.
Como estamos falando do Thomas Bayes, no podemos deixar de fazer um breve
comentrio sobre o que chamamos de probabilidades subjetivas, ou seja, cada indivduo, baseado
em informaes anteriores e na sua opinio pessoal a respeito de um evento em questo, pode ter
uma resposta para a probabilidade desse evento. A inferncia Bayesiana toma como uma de suas
bases o fato de que todas as probabilidades so subjetivas. O teorema de Bayes tem um papel
importante nesse tipo de inferncia, pois passa a ser visto como um mecanismo de atualizao de
opinies, ou seja, o indivduo aprende B e passa a ter opinio P(A|B) sobre A.
As probabilidades associadas a eventos de modo subjetivo tm propriedades anlogas as
que foram mencionadas nesse texto.
Exemplo:
Nveis Histricos de Qualidade de Dois Fornecedores

% de Peas Boas

% de Peas Ruins

Fornecedor 1

98

Fornecedor 2

95

Considere uma empresa fabricante que recebe embarques de peas de dois diferentes
fornecedores. Atualmente, 65% das peas compradas pela empresa so do fornecedor 1 e o
restante, 35%, so do fornecedor 2. Dado que uma pea selecionada seja defeituosa, qual a
probabilidade dela ter vindo do fornecedor 2?
P ( F2 | D ) =

P(D | F2) P(F2)


P(D | F2) P(F2)
0,05.0,35
0,0175
=
=
=
0,57
P ( D)
P(D | F1) P(F1) + P(D | F2) P(F2) 0,02.0,65 + 0,05.0,35 0,0305

Exerccio Parte II A2: Em um centro de mquinas, h quatro mquinas automticas de


parafusos. Uma anlise dos registros de inspeo passados fornece os seguintes dados:
Mquina Percentual de Produo Percentual de Defeituosos Produzidos
1
15
4
2
30
3
3
20
5
4
35
2
Suponha que o estoque atual reflita as porcentagens de produo indicadas. Se um parafuso
selecionado aleatoriamente do estoque e ele defeituoso, qual a probabilidade de que seja da
mquina 2?
Oliveira, D. C. R. e Oliveira, M. S.

55

____/____/____

10. VARIVEL ALEATRIA DISCRETA


Exemplos
1. Lana-se uma moeda 10 vezes e anota-se o nmero de caras. Este nmero pode ser 0, 1, 2 ...10.
2. Em uma pesquisa de mercado feita com 200 pessoas, perguntam-se estes compram um
determinado produto. O nmero de pessoas que compram o produto varia de 0 a 200.
3. Conta-se o n de acidentes que ocorrem em uma rodovia num feriado prolongado. O nmero de
acidentes em questo pode ser: 0, 1, 2 Como no temos um valor que limite esse nmero,
supomos que o nmero de acidentes qualquer inteiro no negativo.
4. Nmero de chamadas telefnicas que chegam a uma central em um intervalo de tempo.

10.1. Introduo
Vamos incorporar o conceito de probabilidade ao estudo de variveis associadas a
caractersticas em uma populao. Muitos experimentos produzem resultados no-numricos.
Antes de analis-los, conveniente transformar seus resultados em nmeros. Isto feito atravs da
varivel aleatria que uma funo que associa um valor numrico a cada ponto do espao
amostral.
Para entender melhor o conceito, considere o seguinte exemplo.
Exemplo: Observa-se o sexo das crianas em famlias com trs filhos. O espao amostral
= {(MMM), (MMF), (MFM), (FMM), (MFF), (FMF), (FFM),(FFF)}
Uma varivel aleatria de interesse : X = {n. de crianas do sexo masculino}. A cada evento
simples, ou ponto de , associamos um nmero, que o valor assumido pela varivel aleatria X:
Evento
X

MMM
3

MMF
2

MFM
2

FMM
2

MFF
1

FMF
1

FFM
1

FFF
0

Poderamos tambm ter considerado o n. de crianas do sexo feminino. Os valores de X, na


mesma ordem, seriam ento 0, 1, 1, 1, 2, 2, 2, 3.

Obs: A expresso varivel aleatria ser abreviada por v.a..


Definio: uma v.a. discreta quando o conjunto de valores possveis for finito ou infinito
numervel.
Exemplos: Nmero de filhos, Nmero de bactrias numa lmina, nmero de lmpadas em uma
residncia, etc.
O passo fundamental para entendermos uma v.a. discreta associar a cada valor a sua
probabilidade, obtendo o que se chamamos de distribuio de probabilidade.
X
P(X=x)
Oliveira, D. C. R. e Oliveira, M. S.

x1
P(X=x1)

x2
P(X=x2)
56

...
...

xn
P(X=xn)
____/____/____

A funo de probabilidade (P()) deve satisfazer: 0 P(X=xi) 1 p/ xi e

n
i =1

P ( X = xi ) = 1

Exemplo: Um certo departamento da UFSJ formado por 35 professores, sendo 21 homens e 14


mulheres. Uma comisso de 3 professores ser constituda, sorteando-se, ao acaso, trs membros
do departamento. Qual a probabilidade da comisso ser formada por pelo menos duas mulheres?
Seja X = { n. de mulheres na comisso}.

Espao Amostral

HHH

HHM

HMH

MHH

HMM

MHM

MMH

MMM

Probabilidade
21 20 19
x x
= 0,203
35 34 33
21 20 14
x x
= 0,150
35 34 33

Distribuio de Probabilidade
X
P(X)

0
1
2
3
0,203 0,450 0,291 0,056

Assim, P(X 2) = P(X = 2) + P(X = 3)


21 14 13
x x
= 0,097
35 34 33

= 0,291+ 0,056
= 0,347

14 13 12
x x
= 0,056
35 34 33

10.2. Esperana Matemtica (Mdia)


Assim como definimos a mdia de uma distribuio de freqncias como a soma dos
produtos dos diversos valores observados pelas respectivas freqncias relativas, natural
definirmos agora a mdia de uma v.a., ou de sua distribuio de probabilidade, como a soma dos
produtos dos diversos valores de xi da v.a. pelas respectivas probabilidades P(xi).
A mdia de uma v.a. X tambm chamada valor esperado ou esperana matemtica, ou
simplesmente esperana de X. representada por E(X) e se define como
n

E (X) = x 1 P(X = x 1 ) + x 2 P(X = x 2 ) + L + x n P(X = x n ) = x i P(X = x i )


i =1

uma mdia ponderada dos xi, em que os pesos so as probabilidades associadas.


Exemplo: Um lojista mantm extensos registros das vendas dirias de certo aparelho. O quadro a
seguir d o nmero xi de aparelhos vendidos em uma semana e a respectiva probabilidade:

Nmero xi
0
1
2
3
4
5
Probabilidade P(X = xi)
0,1
0,1
0,2
0,3
0,2
0,1
Se for de R$ 20,00 o lucro por unidade vendida, qual o lucro esperado nas vendas de uma semana?
Oliveira, D. C. R. e Oliveira, M. S.

57

____/____/____

Soluo: Calculemos inicialmente E(X), que o nmero esperado de aparelhos vendidos em uma
semana:
E(X) = (0)(0,1) + (1)(0,1) + (2)(0,2) + (3)(0,3) + (4)(0,2) + (5)(0,1) = 2,70.
Para x unidades vendidas o lucro 20x. Logo, o lucro esperado de R$ 54,00.
10.3. Varincia
Assim como a mdia uma medida de posio de uma v.a., natural que procuremos uma
medida de disperso dessa varivel em relao mdia. Essa medida a varincia, a ser
representada por 2 e definida por
n

2 = Var (X) = ( x i E (X)) 2 P(X = x i )


i =1

Desenvolvendo o termo quadrtico do somatrio, obtemos uma expresso mais fcil de calcular a
varincia dada por:
2 = Var (X) = E(X 2 ) [E (X)]2
n

onde E(X 2 ) = x i2 P(X = x i ) .


i =1

Desvio Padro
O desvio padro () a raiz quadrada positiva da varincia. Tem sobre essa ltima a
vantagem de exprimir a disperso na mesma unidade de medida da v.a.:

= 2
10.4. Exerccio Parte II A2
1) A distribuio de X: n de crianas por domiclio numa determinada regio dada pela tabela
abaixo:
X
0
1
2
3
4
5
P(X = x)
0,10
0,15
0,25
0,30
0,15
0,05
Calcule:
(a) O nmero mdio de crianas por domiclio, X.
(b) O desvio padro de X, X.
(c) A probabilidade P{X - X X X + X}.

10.5. Distribuio Bernoulli


Na prtica existem muitos experimentos que admitem apenas dois resultados.
Exemplos:
1) Uma pea classificada como boa ou defeituosa;
2) Um entrevistado concorda ou no com a afirmao feita;
3) O resultado de um exame mdico para deteco de uma doena positivo ou negativo;
4) No lanamento de um dado ocorre ou no a face 5.
Oliveira, D. C. R. e Oliveira, M. S.

58

____/____/____

Situaes com alternativas dicotmicas podem ser representadas genericamente por


respostas do tipo sucesso-fracasso.
Esses experimentos recebem o nome de ensaio de Bernoulli e originam uma v.a. com
distribuio Bernoulli.
Varivel Aleatria de Bernoulli
uma v.a. X que assume apenas dois valores: 1 se ocorrer sucesso, e 0 se ocorrer fracasso,
e, sendo p a probabilidade de sucesso, 0 < p < 1.
Denotamos por X ~ Bernoulli (p) uma v. a. com distribuio de Bernoulli com parmetro p.

1, se ocorrer sucesso
X=
0, se ocorrer fracasso
e funo de probabilidade,
X
P(X=x)

1
p

0
1-p

Segue-se que
E(X) = p

Var(X) = p(1-p)

Repeties independentes de um ensaio de Bernoulli do origem ao modelo binomial.


10.6. Distribuio Binomial
Experimento Binomial: o experimento
(a) que consiste em n ensaios de Bernoulli;
(b) cujos ensaios so independentes; e
(c) para o qual a probabilidade de sucesso em cada ensaio sempre igual a p, 0 < p < 1.
A v.a. X, correspondente ao nmero de sucessos num experimento binomial, tem
distribuio binomial com parmetros n e p, com funo de probabilidade dada por:
n
P(X = x ) = p x (1 p) n x , x = 0, 1, K , n
x
n
n!
onde =
, n!= n (n 1)(n 2) L (2)(1) e 0!= 1 .
x x! (n x )!

Notao: X ~ B(n; p).


Mdia e Varincia da Binomial
A Mdia e a Varincia so dadas, respectivamente, por:
E(X) = np
Oliveira, D. C. R. e Oliveira, M. S.

e
59

Var(X) = np(1-p)
____/____/____

Exemplo: Suponha que 20% dos clientes de uma empresa sejam inadimplentes. Se 10 pessoas
dessa populao forem escolhidas ao acaso e com reposio, determine:
(a) O n esperado de inadimplentes.
(b) A probabilidade de selecionar exatamente 3 pessoas inadimplentes.
(c) A probabilidade de selecionar no mximo 3 inadimplentes.
10.7. Exerccios Parte II A2
1) Nos Estados Unidos, 29% dos advogados e juzes so mulheres (Statistical Abstract of the
United States, 1997). Em uma jurisdio com 30 advogados e juzes, qual o nmero esperado de
mulheres? Qual a varincia e o desvio padro?
2) O maior nmero de reclamaes dos proprietrios de automveis com dois anos de uso se
referem ao desempenho do sistema eltrico. Considere que um questionrio anual, enviado aos
proprietrios de mais de 300 marcas e modelos de automveis, revelou que 10% dos proprietrios
de automveis com dois anos de uso encontraram pontos com problemas no sistema eltrico, que
incluam o motor de arranque, o alternador, a bateria, controles diversos, luzes e radio. Qual a
probabilidade de que uma amostra de 12 proprietrios de automveis com dois anos ter
(a) exatamente dois proprietrios com problemas no sistema eltrico
(b) pelo menos dois proprietrios com problemas no sistema eltrico
(c) no mximo um proprietrio com problemas no sistema eltrico.

10.8. Distribuio Hipergeomtrica


A distribuio Hipergeomtrica est restritamente relacionada com a distribuio binomial.
A diferena chave entre as duas distribuies de probabilidade que com a distribuio
hipergeomtrica os ensaios no so independentes e a probabilidade de sucesso muda de ensaio
para ensaio, pois as selees dos elementos so feitas sem reposio, enquanto que na distribuio
binomial as selees dos elementos so feitas com reposio.
Considere um conjunto de N objetos dos quais r so do tipo I e N - r so do tipo II. Um
sorteio de n objetos (n < N) feito ao acaso e sem reposio.
Definio: A varivel aleatria discreta X que igual ao nmero de objetos do tipo I
selecionados nesse sorteio tem distribuio Hipergeomtrica.
Os valores possveis de X vo de 0 a min(r, n), uma vez que no podemos ter mais do que o
nmero de objetos existentes do tipo I, nem mais que o total de sorteados.
Sua funo de probabilidade dada por:
r N r


x n x , 0 x mnimo(r, n).
P(X = x ) =
N

n
Notao: X ~ Hipergeomtrica (N; n; r)
Esperana: E(X) = np
Varincia: Var(X) = np(1-p)(N-n)/(N-1),
onde p = r/N.
Oliveira, D. C. R. e Oliveira, M. S.

60

____/____/____

Exemplo: Uma fbrica produz peas que so embaladas em caixas com 40 unidades. Para aceitar o
lote de caixas enviado por essa fbrica, o controle de qualidade de uma empresa sorteia uma caixa
do lote e sorteia 10 peas, sem reposio, dessa mesma caixa. Se houver alguma pea defeituosa o
lote inteiro devolvido. Se a caixa sorteada tiver 4 peas defeituosas, qual a probabilidade do lote
no ser devolvido?
N = 40, n = 10 e r = 4
X: nmero de peas defeituosas
4 40 4

0 10 0

P(X = 0) =
0,3
40

10
10.9. Exerccio Parte II A2: Para fazer o controle de qualidade numa empresa, lotes com 100
peas so examinados. O nmero de peas com defeito no lote 10. Aps colher uma amostra de 5
peas sem reposio, calcule a probabilidade de que nessa amostra no haja nenhum item
defeituoso.

10.10. Distribuio Poisson


A distribuio de Poisson empregada em experimentos nos quais no se est interessado
no nmero de sucessos obtido em n tentativas, como ocorre no caso da distribuio binomial, mas
sim no nmero de sucessos ocorridos durante um intervalo contnuo, que pode ser um intervalo de
tempo, espao, etc. Alguns exemplos de variveis que podem ter a distribuio de Poisson so
(a) nmero de defeitos por centmetro quadrado;
(b) n de acidentes por dia;
(c) n de clientes por hora;
(d) n de chamadas telefnicas recebidas por minuto;
(e) n de falhas de um computador num dia de operao;
(f) n de relatrios de acidentes enviados a uma companhia de seguros numa semana.
Note-se que a unidade de medida (tempo, rea) contnua, mas a varivel aleatria de
interesse (nmero de ocorrncia) discreta. Alm disso, as falhas no so contveis. No
possvel contar os acidentes que no ocorreram, nem o nmero de defeitos por centmetros
quadrados que no ocorreram.
O limite inferior do nmero de ocorrncias, em todos as situaes dos exemplos,
________, enquanto que o limite superior ao menos teoricamente infinito, muito embora, na
maioria dos exemplos acima, seja difcil imaginar um nmero infinito de ocorrncias.
As probabilidades, calculadas agora para todos os nmeros inteiros no negativos k = 0, 1,
2, ... so dadas da seguinte forma:
e x
P(X = x ) =
, x = 0, 1, ...

x!

onde X = nmeros de sucessos em um intervalo a varivel de interesse, > 0 o nmero


mdio de sucessos da varivel X e e a constante 2,7183 (base dos logaritmos naturais).

Notao: X ~ P()
Esperana e Varincia:
Oliveira, D. C. R. e Oliveira, M. S.

E (X) = Var (X) =


61

____/____/____

Exemplo: Um departamento de conserto de mquinas recebe uma mdia de cinco chamadas por
hora. Supondo que a distribuio de Poisson seja adequada nessa situao, obter a probabilidade de
que, em uma hora selecionada aleatoriamente, sejam recebidas exatamente trs chamadas:

10.11. Exerccios Parte II A2


1) Numa central telefnica, o nmero de chamadas chega segundo uma distribuio Poisson, com a
mdia de oito chamadas por minuto. Determine qual a probabilidade de que num minuto se tenha:
(a) duas ou mais chamadas;

(b) menos que duas chamadas;

(c) entre sete (inclusive) e nove (exclusive) chamadas.

Oliveira, D. C. R. e Oliveira, M. S.

62

____/____/____

11. VARIVEL ALEATRIA CONTNUA


At aqui estudamos variveis aleatrias discretas que so caracterizadas por ter uma
distribuio de probabilidade dada por uma tabela que associa a cada um de seus valores uma
probabilidade. Esta probabilidade um nmero entre 0 e 1 cuja soma igual a 1.

Definio: Seja X uma varivel aleatria. Suponha que os possveis valores de X seja um intervalo
que possui infinitos valores, ento diremos que X uma varivel aleatria contnua.
Exemplos:
1. Mede-se a altura de uma mulher em uma cidade. O valor encontrado um nmero real. Aqui
tambm sabemos que esse nmero no passa de 3 metros, mas conveniente considerar qualquer
n real positivo.
2. Em um exame fsico para selecionar um jogador de futebol medido o peso de cada candidato;
aqui tambm consideramos que o resultado pode ser qualquer nmero real positivo.
3. Em campanhas preventivas de hipertenso arterial comum de tempos em tempos medir-se o
nvel de colesterol. O valor de cada medida pode ser um nmero real no negativo.
4. Para pacientes que se apresentam num hospital a primeira atitude medir-se a temperatura; o
valor da temperatura um nmero real que se pode considerar compreendido entre 35 e 42C.
5. Retira-se uma lmpada da linha de produo e coloca-se a mesma em um soquete acendendo-a;
observa-se a mesma at que se queime. O tempo de durao da lmpada um n real no negativo.
Nos exemplos de 1 a 5, o nmero observado no experimento aleatrio um nmero
real e resulta em geral de uma medio:
altura das mulheres;
peso do atleta;
nvel de colesterol;
temperatura;
tempo de durao da lmpada.
Uma varivel aleatria contnua assume seus valores em um intervalo.
Como so atribudas probabilidades nesse caso?
Exemplo: Suponha que observamos o peso, em kg, de 1500 pessoas adultas selecionadas
aleatoriamente numa populao. O histograma por densidade desses valores apresentado abaixo.

Oliveira, D. C. R. e Oliveira, M. S.

63

____/____/____

A anlise do histograma indica que:


a distribuio dos valores da varivel PESO aproximadamente simtrica em torno de 70kg;
a maioria dos valores encontra-se no intervalo (55;85);
existe uma pequena proporo de valores abaixo de 48kg e acima de 92kg.

Seja X = {peso em kg} de uma pessoa adulta escolhida ao acaso da populao.


Como se distribuem os valores da varivel aleatria X, ou seja, qual a distribuio
de probabilidades de X?

Para as variveis contnuas as probabilidades so atribudas por meio de uma funo


cuja rea entre a mesma e o eixo das abscissas (X) igual a um.

P(a X b) = rea hachurada


Esta funo f(x) denominada funo densidade de probabilidade da varivel
aleatria contnua X.
A rea sob uma curva delimitada por dois valores a e b, como mostra a figura,
determinada calculando-se a integral definida entre a e b da densidade de probabilidade
representada pela funo, isto ,
b

f(x)dx = P(a x b)
a

Oliveira, D. C. R. e Oliveira, M. S.

64

____/____/____

Exemplo: Um fabricante de televiso a cores oferece uma garantia de 1 ano para substituio
gratuita se o tubo de imagem falhar. Ele estima o tempo de falha (em unidades de anos), x, como
uma varivel aleatria contnua com a seguinte fdp
1 x
f (x) = e 4 , x > 0
4
= 0, caso contrrio
Qual a probabilidade de voc comprar a televiso e necessitar de uma substituio gratuita?
1

1
P( x 1) = e 4 dx =
4
0

0,2

Definio: Se X uma v.a. contnua, a funo densidade de probabilidade f(X), indicada


abreviadamente por fdp, uma funo que satisfaz s seguintes condies:
(a) f(X) 0, X;
(b) A rea sob a funo densidade de probabilidade 1, isto :

f ( x )dx = 1

(c) P(a X b) = rea sob a funo densidade de probabilidade f(x) e acima do eixo x entre os
pontos a e b, isto :
b

P(a X b) = f ( x )dx
a

(d) P(X = x0) = 0, porque:


x0

P(X = x 0 ) = f ( x )dx = 0
x0

Conseqncia:

P(a < X < b) = P(a X < b) = P(a < X b) = P(a X b)

Definio: Se X uma v.a. contnua, a funo de distribuio acumulada (fda) de X definida


como:
x

F( x ) = P(X x ) = f (s)ds

Exemplo: Considere a seguinte densidade de probabilidade: f(x) = 2x, para 0 x 1 e f(x) = 0,


fora desse intervalo. Obtenha a F(x) de X.
x<0
0,
x
x
F( x ) = 2s =s 2 = x 2 , 0 x 1
0
0
1,
x >1
11.1. Esperana e Varincia
Definio: Se X uma v. a. contnua, o valor esperado de X (ou esperana matemtica de X)
denotada por E(X) definido como:

E(X) =

x f (x ) dx

Oliveira, D. C. R. e Oliveira, M. S.

65

____/____/____

Exemplo: Para uma varivel que tm densidade f(x) = 2x, 0<x<1, ento:
1

E (X) = x 2x dx = 2 x 2 dx =

2 31 2
x 0=
3
3

Definio: A varincia de uma varivel aleatria contnua definida por:


Var(X) = E(X2) [E(X)]2, onde E(X2) =

f ( x ) dx

Exemplo: Para uma varivel que tm densidade f(x) = 2x, 0<x<1, ento:
E(X) =

2
3

E (X 2 ) = x 2 2 x dx = 2 x 3 dx =

2 41 2
x 0=
4
4

Logo, Var(X) = 2/4 (2/3)2 =1/18 = 0,056


Tambm podemos obter o Desvio Padro: 0,056 0,23

Exerccios Parte II A2:


1) O dimetro de um cabo eltrico uma varivel aleatria com fdp dada por:
f(x) = 6x(1-x) para 0 < x < 1 e f(x) = 0 fora desse intervalo. Qual a probabilidade do dimetro ser:
(a) Igual a 0,5 cm?
(b) Entre 0,10 e 0,20?
(c) Maior que 0,5?
(d) Menor que 1?
2) A quantia gasta anualmente, em milhes de reais, na manuteno do asfalto de uma cidade do
interior representada pela varivel y modelada pela funo:
f(y) = (8/9)y (4/9), se 0,5 y 2 e
f(y) = 0, caso contrrio.
Qual a probabilidade da quantia gasta ser inferior a 0,8 milhes de reais?
3) O tempo de sobrevivncia de uma bateria (em anos) pode ser modelado pela funo:
f(x) = e-x, se x 0 e f(x) = 0, caso contrrio.
(a) Qual a probabilidade da bateria sobreviver mais que 2 anos?
(b) Qual o tempo mdio de sobrevivncia da bateria?
4) O dimetro de um cabo eltrico uma v. a. com fdp dada por: f(x) = 6x(1-x) para 0 < x < 1 e
f(x) = 0 fora desse intervalo.
(a) Verifique se f(x) uma fdp, atravs do item (b) da definio 2.
(b) Obtenha a F(x).

11.2. Distribuio Normal


A distribuio Normal uma das mais importantes distribuies contnuas de
probabilidade. Foi introduzida em 1730 por DMoivre e depois foi muito utilizada em Astronomia
pelo alemo fsico/matemtico Gauss, trazendo muita confuso para vrias pessoas que por esse
motivo, acham que foi Gauss que a descobriu.
Oliveira, D. C. R. e Oliveira, M. S.

66

____/____/____

Muitos dos fenmenos aleatrios de interesse comportam-se prximos a essa distribuio


com valores muito freqentes em torno da mdia e diminuindo a freqncia medida que nos
afastamos da mdia.
Nem todos os fenmenos se ajustam distribuio Normal. Por exemplo, considere a
varivel tempo de durao, em horas, de uma lmpada de certa marca.
A experincia sugere que esta distribuio deve ser assimtrica com uma grande proporo
de valores entre 0 e 500 horas e uma pequena proporo de valores acima de 1500 horas

Obs: A distribuio utilizada nesse caso a Distribuio Exponencial.


Funo Densidade de Probabilidade da Distribuio Normal

f ( x) =

1
2

1 x

< x<

O grfico da densidade normal


Propriedades:

A curva normal simtrica em torno da mdia ;


A moda e a mediana so iguais a ;
Os pontos de inflexo so - e + ;
A rea sob a curva e acima do eixo horizontal
igual a 1.

Parmetros: : mdia ou valor esperado


2: varincia
Notao : X ~ N(, 2)

Oliveira, D. C. R. e Oliveira, M. S.

67

____/____/____

A distribuio normal depende dos parmetros e 2


Curvas normais com
mesmo desvio padro,
mas com mdias
diferentes.

___N(, 12)
___N(, 22)
___N(, 32)
12 < 22< 32

Curvas normais
com mesma mdia,
mas com desvios
padro diferentes.

Clculo de Probabilidades
P(a < X < b)

rea sob a curva e acima do eixo horizontal (x) entre a e b.

Oliveira, D. C. R. e Oliveira, M. S.

68

____/____/____

Se X ~ N( ; 2), definimos: Z =

X
.

Ento, E(Z) = 0 e Var(Z) = 1.

f(x)

f(z)
a

0 b

A varivel Z ~ N (0,1) denomina-se normal padro ou reduzida.


Portanto,
b
a X b
a
<
<
<Z<
P (a < X < b) = P
= P





Dada a v.a. Z ~N (0;1) podemos obter a v.a. X ~ N (;2) atravs da transformao inversa
X = + Z

Oliveira, D. C. R. e Oliveira, M. S.

69

____/____/____

11.3. Tabela da Distribuio Normal Padro


Denotamos: A(z) = P(Z z), para z 0.

A(z) = P(Z z) , z 0.

Parte inteira e primeira decimal de z

Probabilidades Acumuladas da Distribuio Normal (0, 1)


Segunda decimal de z
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
2.0
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
3.0
3.1
3.2
3.3
3.4
3.5
3.6
3.7
3.8
3.9

0
0.5000
0.5398
0.5793
0.6179
0.6554
0.6915
0.7257
0.7580
0.7881
0.8159
0.8413
0.8643
0.8849
0.9032
0.9192
0.9332
0.9452
0.9554
0.9641
0.9713
0.9772
0.9821
0.9861
0.9893
0.9918
0.9938
0.9953
0.9965
0.9974
0.9981
0.9987
0.9990
0.9993
0.9995
0.9997
0.9998
0.9998
0.9999
0.9999
1.0000

1
0.5040
0.5438
0.5832
0.6217
0.6591
0.6950
0.7291
0.7611
0.7910
0.8186
0.8438
0.8665
0.8869
0.9049
0.9207
0.9345
0.9463
0.9564
0.9649
0.9719
0.9778
0.9826
0.9864
0.9896
0.9920
0.9940
0.9955
0.9966
0.9975
0.9982
0.9987
0.9991
0.9993
0.9995
0.9997
0.9998
0.9998
0.9999
0.9999
1.0000

Oliveira, D. C. R. e Oliveira, M. S.

2
0.5080
0.5478
0.5871
0.6255
0.6628
0.6985
0.7324
0.7642
0.7939
0.8212
0.8461
0.8686
0.8888
0.9066
0.9222
0.9357
0.9474
0.9573
0.9656
0.9726
0.9783
0.9830
0.9868
0.9898
0.9922
0.9941
0.9956
0.9967
0.9976
0.9982
0.9987
0.9991
0.9994
0.9995
0.9997
0.9998
0.9999
0.9999
0.9999
1.0000

3
0.5120
0.5517
0.5910
0.6293
0.6664
0.7019
0.7357
0.7673
0.7967
0.8238
0.8485
0.8708
0.8907
0.9082
0.9236
0.9370
0.9484
0.9582
0.9664
0.9732
0.9788
0.9834
0.9871
0.9901
0.9925
0.9943
0.9957
0.9968
0.9977
0.9983
0.9988
0.9991
0.9994
0.9996
0.9997
0.9998
0.9999
0.9999
0.9999
1.0000

4
0.5160
0.5557
0.5948
0.6331
0.6700
0.7054
0.7389
0.7704
0.7995
0.8264
0.8508
0.8729
0.8925
0.9099
0.9251
0.9382
0.9495
0.9591
0.9671
0.9738
0.9793
0.9838
0.9875
0.9904
0.9927
0.9945
0.9959
0.9969
0.9977
0.9984
0.9988
0.9992
0.9994
0.9996
0.9997
0.9998
0.9999
0.9999
0.9999
1.0000

70

5
0.5199
0.5596
0.5987
0.6368
0.6736
0.7088
0.7422
0.7734
0.8023
0.8289
0.8531
0.8749
0.8944
0.9115
0.9265
0.9394
0.9505
0.9599
0.9678
0.9744
0.9798
0.9842
0.9878
0.9906
0.9929
0.9946
0.9960
0.9970
0.9978
0.9984
0.9989
0.9992
0.9994
0.9996
0.9997
0.9998
0.9999
0.9999
0.9999
1.0000

6
0.5239
0.5636
0.6026
0.6406
0.6772
0.7123
0.7454
0.7764
0.8051
0.8315
0.8554
0.8770
0.8962
0.9131
0.9279
0.9406
0.9515
0.9608
0.9686
0.9750
0.9803
0.9846
0.9881
0.9909
0.9931
0.9948
0.9961
0.9971
0.9979
0.9985
0.9989
0.9992
0.9994
0.9996
0.9997
0.9998
0.9999
0.9999
0.9999
1.0000

7
0.5279
0.5675
0.6064
0.6443
0.6808
0.7157
0.7486
0.7794
0.8078
0.8340
0.8577
0.8790
0.8980
0.9147
0.9292
0.9418
0.9525
0.9616
0.9693
0.9756
0.9808
0.9850
0.9884
0.9911
0.9932
0.9949
0.9962
0.9972
0.9979
0.9985
0.9989
0.9992
0.9995
0.9996
0.9997
0.9998
0.9999
0.9999
0.9999
1.0000

8
0.5319
0.5714
0.6103
0.6480
0.6844
0.7190
0.7517
0.7823
0.8106
0.8365
0.8599
0.8810
0.8997
0.9162
0.9306
0.9429
0.9535
0.9625
0.9699
0.9761
0.9812
0.9854
0.9887
0.9913
0.9934
0.9951
0.9963
0.9973
0.9980
0.9986
0.9990
0.9993
0.9995
0.9996
0.9997
0.9998
0.9999
0.9999
0.9999
1.0000

9
0.5359
0.5753
0.6141
0.6517
0.6879
0.7224
0.7549
0.7852
0.8133
0.8389
0.8621
0.8830
0.9015
0.9177
0.9319
0.9441
0.9545
0.9633
0.9706
0.9767
0.9817
0.9857
0.9890
0.9916
0.9936
0.9952
0.9964
0.9974
0.9981
0.9986
0.9990
0.9993
0.9995
0.9997
0.9998
0.9998
0.9999
0.9999
0.9999
1.0000

____/____/____

Exemplos: Seja Z ~ N (0,1), calcular:


a) P(Z 1,71) = A(1,71) = 0,9564

b) P(0 < Z 1,71) =

c) P(1,32 < Z 1,79)

d) P(Z 1,5)

e) P(Z -1,3)

f) P(-1,5 Z 1,5)

g) P(-1,32 < Z < 0)

h) P( -2,3 < Z -1,49)

i) P(-1 Z 2)

Oliveira, D. C. R. e Oliveira, M. S.

71

____/____/____

Exemplo: Seja X o gasto com lanche semanal. Aps estudar esta varivel, vimos que X ~ N (20, 64),
ento obtenha:
a) P(16 < X < 22) =

b) P(X < 18 ou X > 24) = P(X < 18) + P(X > 24) =

Como encontrar o valor z da distribuio N(0,1) tal que:


(i) P(Z z) = 0,975
z tal que A(z) = 0,975. Pela tabela, z = 1,96.

(ii) P(0 < Z z) = 0,4975

(iii) P(Z z) = 0,3

(iv) P(Z z) = 0,975

(v) P(Z z) = 0,10

(vi) P(-z Z z) = 0,80

Oliveira, D. C. R. e Oliveira, M. S.

72

____/____/____

Calcule:
a) k tal que P( X k) = 0,05

b) k tal que P( X k) = 0,025

Nota Importante: Para toda v.a. X ~ N( ; 2) temos:


(i) P( X + ) = P( 1 Z 1) = 0,6826.
(ii) P( 2 X + 2) = P( 2 Z 2) = 0,955.
(iii) P( 3 X +3) = P(3 Z 3) = 0,997.

11.4. Exerccios Parte II A2


1) O tempo gasto no exame vestibular de uma universidade tem distribuio Normal, com = 120
min e = 15 min.
(a) Sorteando-se um aluno ao acaso, qual a probabilidade dele terminar o exame antes de 100
minutos?
(b) Qual deve ser o tempo de prova, de modo a permitir que 95% dos vestibulandos terminem no
prazo estipulado?
(c) Qual o intervalo central de tempo, tal que 80% dos estudantes gastam para completar o exame?
Oliveira, D. C. R. e Oliveira, M. S.

73

____/____/____

Lista de Exerccios 2
Exerccio 01
Sendo A e B dois eventos de um mesmo espao amostral, traduza para a linguagem da teoria dos
conjuntos as seguintes situaes:
(a) Pelo menos um dos eventos ocorre.
(b) Exatamente um dos eventos ocorre.
(c) Nenhum dos eventos ocorre.
(d) A ocorre, mas B no ocorre.
Exerccio 02
Dois processadores, A e B, so colocados em teste por 50 mil horas. A probabilidade de um erro
acontecer em A 2/60, em B 1/80 e em ambos 1/100. Calcule a probabilidade de que:
(a) Pelo menos um processador apresente erro.
(b) Nenhum apresente erro.
(c) Somente A apresente erro.
Exerccio 03
A probabilidade de que um homem que possui veculo motorizado se acidente num perodo de um
ano de 0,113 e uma mulher que tenha um veculo motorizado se acidente num perodo de um ano
de 0,057. Suponha que 55% dos motoristas em Lucas Country sejam homens. No preenchimento
de um questionrio de histrico sobre desempenho ao volante, uma pessoa de Lucas Country
indicou um envolvimento em acidente com veculo motorizado durante o ltimo ano. Qual a
probabilidade de essa pessoa ser uma mulher?
Exerccio 04
Um pai leva o filho ao cinema e gasta R$15,00 nas duas entradas. O filho vai pedir para comer
pipoca com probabilidade 0,7 e pedir para comer bala com probabilidade 0,9. Os pedidos so
atendidos pelo pai com probabilidade 0,5 independentemente. Se a pipoca custa R$2,00 e a bala
R$3,00 estude a varivel aleatria despesa efetuada com a ida ao cinema construindo sua
distribuio de probabilidade.
Exerccio 05
Suponha que a probabilidade de que um item produzido por uma mquina seja defeituoso de 0,2.
Se 4 itens so produzidos por esta mquina so selecionados ao acaso, qual a probabilidade de que
no mais do que um item defeituoso seja encontrado?
Exerccio 06
Na manufatura de certo artigo, sabido que a proporo de artigos defeituosos de 0,1. Qual a
probabilidade de que uma amostra casual de tamanho 5 contenha:
(a) nenhum defeituoso:
(b) exatamente um defeituoso:
(c) no mais que 2 defeituosos:

Oliveira, D. C. R. e Oliveira, M. S.

74

____/____/____

Exerccio 07
De acordo com o Beverage Digest, a Coca Cola e a Pepsi se posicionaram como a nmero um e a
nmero dois em vendas em 1996 (The Wall Street Journal Almanac, 1998). Suponha que de um
grupo de 10 indivduos, 6 prefiram a Coca Cola e 4 prefiram a Pepsi. Uma amostra aleatria sem
reposio de 3 desses indivduos selecionada.
(a)
Qual a probabilidade de que exatamente dois prefiram a Coca Cola?
(b)
Qual a probabilidade de que a maioria (tanto dois como trs) prefira Pepsi?
Exerccio 08
Dos 25 estudantes (14 meninos e 11 meninas) na sala de aula de uma escola, 5 estudantes estavam
ausentes na quinta-feira.
(a) Qual a probabilidade de que 2 dos ausentes fossem meninas?
(b) Qual a probabilidade de que 2 dos ausentes fossem meninos?
(c) Qual a probabilidade de que todos os ausentes fossem meninos?
(d) Qual a probabilidade de que nenhum dos ausentes fosse um menino?
Exerccio 09
Num certo tipo de fabricao de fita magntica, ocorrem cortes a uma taxa de um por 2000 ps.
Qual a probabilidade de que um rolo com 2000 ps de fita magntica tenha:
(a) nenhum corte;
(b) no mximo 3 cortes;
(c) pelo menos dois cortes.
Exerccio 10
Os passageiros de uma linha area chegam s instalaes de passageiros de um grande aeroporto
internacional a uma taxa mdia de 10 por minuto.
(a)
Qual a probabilidade de nenhuma chegada em 1 minuto?
(b)
Qual a probabilidade de que 3 passageiros ou menos cheguem em um perodo de 1
minuto?
Qual a probabilidade de nenhuma chegada em um perodo de 15 minutos?
(c)
Exerccio 11
Depois de tomarmos vrias amostras, decidiu-se adotar um modelo para as medidas do permetro
do trax de uma populao de homens adultos com os parmetros: mdia = 40 polegadas e desvio
padro = 2 polegadas.
(a) Qual a probabilidade de um indivduo sorteado desta populao ter um permetro de trax
entre 40 e 43 polegadas?
(b) Qual a probabilidade de um indivduo sorteado desta populao ter um permetro de trax
maior ou igual a 43 polegadas?
(c) Qual a probabilidade de um indivduo sorteado desta populao ter um permetro de trax
menor que 35 polegadas?
(d) Qual o valor do trax que seria ultrapassado por 25% da populao?

Oliveira, D. C. R. e Oliveira, M. S.

75

____/____/____

Exerccio 12
Considere a altura de 351 mulheres idosas como seguindo uma distribuio normal com mdia =
160 cm e desvio padro = 6 cm. Sorteia-se uma mulher, qual a probabilidade de que ela tenha:
(a) Altura entre 160 cm e 165 cm?
(b) Altura menor do que 145 cm?
(c) Altura maior do que 170 cm?
Exerccio 13
O dimetro X de rolamentos de esfera fabricados por certa fbrica tem distribuio Normal com
mdia = 0,6140 e varincia = (0,0025)2. O lucro T de cada esfera depende de seu dimetro, e:
T = 0,10 se a esfera boa (0,6100 < X < 0,6180);
T = 0,05 se a esfera recupervel (0,6080 < X < 0,6100 ou 0,6180 < X < 0,6200);
T = - 0,10 se a esfera defeituosa (X < 0,6080 ou X > 0,62). Calcular:
(a) As probabilidades das esferas serem boas, recuperveis e defeituosas.
(b) A esperana do lucro ( E(T) ).

Observao: O gabarito da Lista de Exerccios 2 encontra-se no Apndice B

Oliveira, D. C. R. e Oliveira, M. S.

76

____/____/____

12. ESTIMAO
12.1. Inferncia Estatstica
A tomada de decises sobre a populao com base em estudos feitos sobre os dados da
amostra constitui o problema central da Inferncia Estatstica. A tais decises esto sempre
associados um grau de incerteza e, conseqentemente, uma probabilidade de erro. A generalizao
da amostra para a populao feita com o auxlio de um modelo estatstico para a situao em
estudo.

Parmetro:
Exemplos:

Conceitos Importantes
qualquer funo da populao ().
P (proporo), (mdia), 2 (varincia).

Exemplos:

qualquer funo da amostra ( ).


P (proporo), X (mdia), S2 (varincia).

Estimativa:
Exemplos:

valor que a estatstica (ou o estimador) assume em uma amostra (0).


p (proporo), x (mdia), s2 (varincia).

Estatstica ou Estimador:

12.2. Estimao Pontual e Intervalar para Proporo


Objetivo
Estimar uma proporo p (desconhecida) de elementos de uma populao, apresentando certa
caracterstica de interesse, a partir da informao fornecida de uma amostra.
Exemplos
p: proporo de consumidores satisfeitos com os servios prestados por uma empresa de telefonia;
p: proporo de eleitores de So Joo del-Rei que votariam em um determinado candidato, caso a
eleio para prefeito se realizasse hoje;
p: proporo de crianas de 2 a 6 anos, do estado de Minas Gerais, que no esto matriculadas em
escola de educao infantil.

Estimador Pontual
O estimador pontual para p (proporo amostral) definido por:
X
P =
n
sendo que
X denota o nmero de elementos na amostra que apresentam a caracterstica;
n denota o tamanho da amostra coletada.
O valor assumido por p na amostra denominado estimativa pontual para p.
Oliveira, D. C. R. e Oliveira, M. S.

77

____/____/____

Exemplo: Sejam, p: proporo de alunos da UFSJ que foram ao cinema pelo menos uma vez no
ltimo ms, e X: nmero de estudantes que respondem sim em uma pesquisa com n
entrevistados. Suponha que foram entrevistados n = 500 estudantes e que, desses, x = 100 teriam
afirmado que foram ao cinema pelo menos uma vez no ltimo ms. A estimativa pontual
(proporo amostral) dada por: p = ( x / n ) = (100 / 500 ) = 0 , 20 , ou seja, 20% dos estudantes
entrevistados afirmaram que foram ao cinema pelo menos uma vez no ltimo ms.
Note que, outra amostra de mesmo tamanho pode levar a uma outra estimativa pontual para
p.
Estimativa Intervalar
Idia: Se selecionarmos vrias amostras de uma populao contendo n dados, observaremos que
cada amostra ter sua respectiva proporo. A fim de obtermos uma estimativa da proporo da
populao em estudo com certo grau de confiabilidade, recorremos a um intervalo de confiana,
que delimita essa proporo.
A estimativa por intervalo de p corresponde a um intervalo determinado da seguinte
maneira:

[ p

; p + ] ,

sendo que representa o erro amostral ou margem de erro.


Na prtica o intervalo de confiana com um coeficiente de confiana dado por:

p (1 p )
p (1 p )
; p + z
IC (p,) = p z

n
n

p (1 p )
. O valor de z obtido da distribuio normal padro. Assim, os valores
n
de z que limitam os nveis de confiana, onde z tal que = P(-z Z z) na N (0,1) so:

Note que, = z

90%

95%

99%

Exemplos
1) No exemplo da UFSJ, considere agora, n = 500 e p = 0,20 . Construa um intervalo de confiana
para p com coeficiente de confiana = 0,95.
Resoluo: Como = 0,95 fornece z = 1,96, o intervalo dado por:

0,20 x0,80
0,20 x0,80
p (1 p )
p (1 p )
; p + z
; 0,20 + 1,96
p z
= 0,20 1,96
= [0,165; 0,235]
n
500
500
n

Nesse intervalo (=0,95), a estimativa pontual para p 0,20, com um erro amostral igual a
0,035.

Interpretao do IC com = 95%: Se sortearmos 100 amostras de tamanho n = 500 e


construirmos os respectivos 100 intervalos de confiana, com coeficiente de confiana de 95%,
esperamos que, aproximadamente, 95 destes intervalos contenham o verdadeiro valor de p.
Oliveira, D. C. R. e Oliveira, M. S.

78

____/____/____

2) Ainda no exemplo da UFSJ, considere k = 100 e n = 500. Qual a probabilidade da estimativa


pontual estar a uma distncia de, no mximo, 0,03 da verdadeira proporo?
Dados do problema: n = 500; p = 0,20; = 0,03 = ?
Com esses dados podemos calcular o valor de z e, assim, obter , o nvel de confiana do
intervalo.
Clculo de z:
z=

n
p (1 p )

0,03 500
0,2 x0,8

= 1,68

Logo, obtemos:
2 A(z) 1 = 2 A(1,68) 1 = 2 x 0,953 1 = 0,906 (90,6 %).
Portanto a probabilidade da estimativa pontual estar a uma distncia de no mximo 0,03 da
verdadeira proporo de 90,6 %.

12.3. Exerccios Parte III A3


1) A gerente de uma empresa quer estimar a proporo p de clientes que gostaram da ltima
exposio de arte apresentada pela empresa. Numa amostra de 300 clientes, 270 afirmaram que
gostaram da exposio. Qual seria a estimativa pontual de p?
2) Numa eleio de segundo turno, um instituto de pesquisa de opinio obteve, num levantamento
de boca de urna, que 40% (p = 0,40) dos entrevistados votaram no candidato A.
(a) Construa intervalos de confiana para a verdadeira proporo p de eleitores que votaram no
candidato A com coeficientes de confiana de 90%, 95% e 99%. Compare os intervalos. Comente.
Admita aqui que o tamanho da amostra seja n = 150.
b) Construa intervalos de confiana para p admitindo que a estimativa p = 0,40 foi obtida de
amostras de tamanho n = 100, n = 150 e n = 200. Compare os intervalos. Comente. Considere aqui
um coeficiente de confiana de 90%.

12.4. Estimativa Pontual e Intervalar para a Mdia Populacional


Objetivo
Estimar a mdia de uma varivel aleatria X, que representa uma caracterstica de interesse de
uma populao, a partir de uma amostra.
Exemplos
: quantia mdia gasta por cliente;
: salrio mdio dos empregados de um a indstria;
: tempo mdio gasto usando a Internet.
Estimativa Pontual
Vamos observar n elementos, extrados ao acaso de uma populao;
Para cada elemento selecionado, observamos o valor da varivel X de interesse.
Oliveira, D. C. R. e Oliveira, M. S.

79

____/____/____

Obtemos, ento, uma amostra aleatria de tamanho n de X, que representamos por X1, X2, ..., Xn.
Uma estimador pontual para dado pela mdia amostral,

X=

X1 + X 2 + K + X n
=
n

i =1

Xi
n

Estimativa Intervalar
Se selecionarmos vrias amostras de uma populao contendo n dados, observaremos que cada
amostra ter sua respectiva mdia. A fim de obtermos uma estimativa da mdia da populao em
estudo com certo grau de confiabilidade, recorremos a um intervalo de confiana, que delimita essa
mdia.
Uma estimador intervalar ou intervalo de confiana para tem a forma:

[X ; X + ]

sendo o erro amostral (margem de erro).


Teorema Central do Limite
Se X1, ..., Xn representa uma amostra aleatria de uma varivel X de mdia e desvio padro ,
ento para n grande

2
X ~ N ,
n

Portanto, para n grande a mdia amostral tem distribuio Normal de mdia e desvio padro

/ n

Na prtica, temos que o intervalo de confiana para com um nvel de confiana dado
por:

x z n ; x + z n

onde x a mdia amostral, o desvio padro populacional e n o tamanho amostral. Sendo

assim, temos que o erro : = z


.
n
Exemplo: No se conhece o consumo mdio de combustvel de automveis da marca T. Sabe-se,
no entanto, que o desvio padro do consumo de combustvel de automveis dessa marca 10 km/l.
Na anlise de 100 automveis da marca T, obteve-se consumo mdio de combustvel de 8 km/l.
Encontre um intervalo de confiana para o consumo mdio de combustvel dessa marca de carro.
Adote um nvel de confiana igual a 95%.
X: Consumo de combustvel da marca T;
= 10 km/l
n = 100 x = 8 km/l
= 0,95 z=1,96

10
10


;X + z
;8 + 1,96
X z
= 8 1,96
= [8 1,96 ;8 + 1,96 ] = [6,04 ;9,96 ]
n
n
100
100

Portanto, a estimativa intervalar de 95% de confiana [6,04 ;9,96 ] .


Oliveira, D. C. R. e Oliveira, M. S.

80

____/____/____

Exemplo: Deseja-se estimar o tempo mdio de estudo (em anos) da populao adulta de um
municpio. Sabe-se que o tempo de estudo tem distribuio normal com desvio padro = 2,6
anos. Foram entrevistados n = 25 indivduos, obtendo-se para essa amostra, um tempo mdio de
estudo igual h 10,5 anos. Obter um intervalo de 90% de confiana para o tempo mdio de estudo
populacional.
X: tempo de estudo, em anos
X ~ N(, 2,62)
n = 25 x = 10,5 anos
= 0,90 z=1,65
A estimativa intervalar com 90% de confiana dada por:

2 ,6
2 ,6
;X + z
;10 ,5 + 1,65
X z
= 10 ,5 1,65
= [9 ,64 ;11,36 ]
n
n
25
25

12.5. Exerccios Parte III A3


1) Estabelea um intervalo de confiana para a mdia populacional, sendo que o desvio padro
populacional 4, o tamanho amostral n = 36 e a mdia amostral igual a 30. Utilize um nvel de
confiana de 95% para a mdia.

2) Uma amostra de n = 64 elementos de uma varivel normalmente distribuda forneceu mdia


25,4, sendo que o desvio padro populacional 5,2. Determine o intervalo de confiana de 90%
para a mdia.

12.6. Estimativa para Mdia Populacional com Varincia Desconhecida


Na prtica, a varincia populacional 2 desconhecida e substituda por sua estimativa:

S2 =

n
1
( X i X )2

( n 1) i =1

Lembrar que a estimativa amostral do desvio padro s =

Oliveira, D. C. R. e Oliveira, M. S.

81

s2

____/____/____

Graus de Liberdade

Graus de Liberdade

Distribuio t Student: Valores tc tais que P(-tc t tc) = 1 - p

p = 90%
0,158
0,142
0,137
0,134
0,132

80%
0,325
0,289
0,277
0,271
0,267

70%
0,510
0,445
0,424
0,414
0,408

60%
0,727
0,617
0,584
0,569
0,559

50%
1,000
0,816
0,765
0,741
0,727

40%
1,376
1,061
0,978
0,941
0,920

30%
1,963
1,386
1,250
1,190
1,156

20%
3,078
1,886
1,638
1,533
1,476

10%
6,314
2,920
2,353
2,132
2,015

5%
12,706
4,303
3,182
2,776
2,571

4%
15,894
4,849
3,482
2,998
2,756

2%
31,821
6,965
4,541
3,747
3,365

1%
63,657
9,925
5,841
4,604
4,032

6
7
8
9
10

0,131
0,130
0,130
0,129
0,129

0,265
0,263
0,262
0,261
0,260

0,404
0,402
0,399
0,398
0,397

0,553
0,549
0,546
0,543
0,542

0,718
0,711
0,706
0,703
0,700

0,906
0,896
0,889
0,883
0,879

1,134
1,119
1,108
1,100
1,093

1,440
1,415
1,397
1,383
1,372

1,943
1,895
1,860
1,833
1,812

2,447
2,365
2,306
2,262
2,228

2,612
2,517
2,449
2,398
0,359

3,143
2,998
2,896
2,821
2,764

3,707
3,499
3,355
3,250
3,169

6
7
8
9
10

11
12
13
14
15

0,129
0,128
0,128
0,128
0,128

0,260
0,259
0,259
0,258
0,258

0,396
0,395
0,394
0,393
0,393

0,540
0,539
0,538
0,537
0,536

0,697
0,695
0,694
0,692
0,691

0,876
0,873
0,870
0,868
0,866

1,088
1,083
1,079
1,076
1,074

1,363
1,356
1,350
1,345
1,341

1,796
1,782
1,771
1,761
1,753

2,201
2,179
2,160
2,145
2,131

2,328
2,303
2,282
2,264
2,248

2,718
2,681
2,650
2,624
2,602

3,106
3,055
3,012
2,977
2,947

11
12
13
14
15

16
17
18
19
20

0,128
0,128
0,127
0,127
0,127

0,258
0,257
0,257
0,257
0,257

0,392
0,392
0,392
0,391
0,391

0,535
0,534
0,534
0,533
0,533

0,690
0,689
0,688
0,688
0,687

0,865
0,863
0,862
0,861
0,860

1,071
1,069
1,067
1,066
1,064

1,337
1,333
1,330
1,328
1,325

1,746
1,740
1,734
1,729
1,725

2,120
2,110
2,101
2,093
2,086

2,235
2,224
2,214
2,205
2,197

2,583
2,567
2,552
2,539
2,528

2,921
2,898
2,878
2,861
2,845

16
17
18
19
20

21
22
23
24
25

0,127
0,127
0,127
0,127
0,127

0,257
0,256
0,256
0,256
0,256

0,391
0,390
0,390
0,390
0,390

0,532
0,532
0,532
0,531
0,531

0,686
0,686
0,685
0,685
0,684

0,859
0,858
0,858
0,857
0,856

1,063
1,061
1,060
1,059
1,058

1,323
1,321
1,319
1,318
1,316

1,721
1,717
1,714
1,711
1,708

2,080
2,074
2,069
2,064
2,060

2,189
2,183
2,177
2,172
2,166

2,518
2,508
2,500
2,492
2,485

2,831
2,819
2,807
2,797
2,787

21
22
23
24
25

26
27
28
29
30

0,127
0,127
0,127
0,127
0,127

0,256
0,256
0,256
0,256
0,256

0,390
0,389
0,389
0,389
0,389

0,531
0,531
0,530
0,530
0,530

0,684
0,684
0,684
0,683
0,683

0,856
0,855
0,855
0,854
0,854

1,058
1,057
1,056
1,055
1,055

1,315
1,314
1,313
1,311
1,310

1,706
1,703
1,701
1,699
1,697

2,056
2,052
2,048
2,045
2,042

2,162
2,158
2,154
2,150
2,147

2,479
2,473
2,467
2,462
2,457

2,779
2,771
2,763
2,756
2,750

26
27
28
29
30

35
40
50
60
120

0,126
0,126
0,126
0,126
0,126
p = 90%

0,255
0,255
0,254
0,254
0,254
80%

0,388
0,388
0,387
0,387
0,386
70%

0,529
0,529
0,528
0,527
0,526
60%

0,682
0,681
0,679
0,679
0,677
50%

0,852
0,851
0,849
0,848
0,845
40%

1,052
1,050
1,047
1,045
1,041
30%

1,306
1,303
1,299
1,296
1,289
20%

1,690
1,684
1,676
1,671
1,658
10%

2,030
2,021
2,009
2,000
1,980
5%

2,133
2,123
2,109
2,099
2,076
4%

2,438
2,423
2,403
2,390
2,358
2%

2,724
2,704
2,678
2,660
2,617
1%

35
40
50
60
120

Exemplo:
1) Para n = 11 e p = 10%,
3) Para n = 11 e p = 1%,

temos t =
temos t =

2) Para n = 11 e p = 5%,
4) Para n = 20 e p = 15%,

1
2
3
4
5

Graus de Liberdade

Graus de Liberdade

1
2
3
4
5

temos t =
temos t =

Nessa situao, para calcularmos o intervalo de confiana substitumos a varivel z por t,


onde t possui distribuio t de Student com n-1 graus de liberdade. Assim, uma estimativa
intervalar para a mdia populacional , quando desconhecido,

s
s

x t n ; x + t n

A varivel t bem prxima da normal padro z quando a amostra maior ou igual a 25,
Oliveira, D. C. R. e Oliveira, M. S.

82

____/____/____

porm para amostras menores que esse valor essa varivel vai se afastando de z e, quanto menor
for o valor de n, maior o afastamento existente entre a varivel t e z.
A tabela que fornece os valores de t, contm na 1a. linha, a rea locada nas caudas da curva,
esquerda de t e direita de t. Na 1a. coluna, est os graus de liberdade (n-1). Na interseo dos
valores considerados, temos os valores de t correspondente.

Exemplo: Qual o intervalo de confiana para a mdia, no nvel de 95%, sendo que uma amostra de
tamanho 20 forneceu mdia 38 e desvio padro 5?
Soluo:
x = 38 , n = 20, s = 5. No nvel de 95%, obtemos o valor de t cruzando na tabela da t Student: p =
5% e gl = n-1 = 20-1 = 19 t = 2,093. Assim:
s
s
5
5

IC[, 95%] = x t
, x+t
, 38 + 2,093
= [35.66 , 40.34]
= 38 2,093
n
n
20
20

Exemplo: Estabelea limites de confiana para a mdia, no nvel de 90%, sendo que uma amostra
de tamanho 16 forneceu mdia 70 e desvio padro 6,8?
Soluo:
Temos que x = 70 , n = 16, s = 6,8 e para um nvel de 90%, obtemos o valor de t cruzando na
tabela da t Student: p = 10% e gl = n-1 = 16-1 = 15 t = 1,753. Assim:
6,8
6,8

s
s
, x +t
, 70 + 1,753
IC[ , 90%] = x t
= 70 1,753
= [ 67.02 , 72.98]
16
16
n
n

12.7. Exerccio Parte III A3


Determine o intervalo de confiana de 99% para a mdia, sendo que uma amostra de
tamanho n = 9 forneceu mdia 75 e desvio padro 7.

Oliveira, D. C. R. e Oliveira, M. S.

83

____/____/____

13. TESTES DE HIPTESES


Estimao
Qual a probabilidade de "cara"
no lanamento de uma moeda?

versus

Teste de Hipteses
A moeda honesta ou
desequilibrada?

Qual a proporo de eleitores


favorveis ao candidato A?

O candidato A tem at 50% das


intenes de voto ou tem mais?

Qual a proporo de
motoristas que tiveram sua
carteira apreendida aps a
vigncia da nova lei de trnsito?

Pelo menos 2% dos motoristas


habilitados de SP tiveram suas
carteiras apreendidas aps a entrada
da nova lei do trnsito ou no?

13.1. Introduo
Quando colhemos uma amostra de uma determinada populao, nosso objetivo tirar
concluses sobre os parmetros dessa populao. Assim, a partir das informaes amostrais
estimamos os parmetros da populao.
Entretanto, se existe algum referencial sobre valores que os parmetros de uma populao
devem assumir, podemos testar hipteses, formuladas sobre esses parmetros, de conformidade
com as informaes obtidas da amostra. Igualmente, pode-se testar a hiptese de que uma amostra
pertence a uma populao de parmetros dados ou ainda, se duas populaes tm parmetros
iguais.
13.2. Formulao das Hipteses
Para testarmos parmetros de uma populao, formulamos hipteses a respeito desses
parmetros. Essas hipteses so denominadas:
H0: Hiptese nula
Ha: Hiptese alternativa
Testar hipteses formuladas consiste em decidir se aceita ou se rejeita a hiptese nula (H0).
Quando se rejeita a hiptese nula, automaticamente est sendo aceita a hiptese alternativa (Ha).
Exemplo: Numa amostra de 100 peas produzidas por uma mquina foram encontradas 4
defeituosas. A proporo de peas defeituosas p =0,05?
Testes de Hipteses possveis:
a) H0: p = 0,05
Ha: p 0,05
Teste Bilateral

b) H0: p = 0,05
Ha: p > 0,05
Teste unilateral direita

c) H0: p = 0,05
Ha: p < 0,05
Teste unilateral esquerda

13.3. Tipos de Erros possveis nos Testes de Hipteses


Erro tipo I: () Rejeitar a hiptese H0 quando na realidade ela verdadeira. ( chamado de
nvel de significncia do teste)

Oliveira, D. C. R. e Oliveira, M. S.

84

____/____/____

Erro tipo II () Aceitar a hiptese H0 quando na realidade ela falsa.


(a) Os valores de e so as probabilidades de cada um dos erros tipo I e tipo II ocorrerem,
respectivamente, ou seja,

= P(erro tipo I) = P(rejeitar Ho dado que Ho verdadeira)


= P(erro tipo II) = P(aceitar Ho dado que Ho falsa)

13.4. Nvel de Significncia de um Teste de Hiptese ()


a probabilidade mxima que aceitamos cometer o erro do tipo I ():
Os nveis de significncia usualmente adotados so 0,10 (10%), 0,05 (5%) e 0,01 (1%).
Quando se deseja testar hipteses, o primeiro passo fixar o nvel de significncia, antes
mesmo de se colher uma amostra.
Geralmente, quanto menor for probabilidade de se cometer o erro tipo I, maior ser a
probabilidade de se cometer o erro do tipo II. A nica forma de se reduzir s probabilidades
relativas aos dois tipos de erros aumentando o tamanho da amostra, pois quanto maior for
amostra, maior ser a preciso das estimativas dos parmetros.
13.5. Teste de Hipteses para a Proporo
Exemplo 1: Numa amostra de 100 peas produzidas por uma mquina foram encontradas 4
defeituosas. Testar ao nvel de significncia de 5%, a hiptese de que a proporo de peas
defeituosas p = 0,03 ou maior.
Soluo:
Hipteses:
H0: p = 0,03
Ha: p > 0,03 (curva unilateral direita )
Para um nvel de significncia de 5% temos da Tabela da distribuio Normal Padro que o z que
fornece a rea cinza de 0,05, representada na figura, z = 1,64.
Frmula para obter o z observado na amostra:
0,01
0,04 0,03
p p
=
=
0,5103
zobs =
0,0384
0,03(1 0,03)
p(1 p)
100
100
n

Regio de
Aceitao

Regio Crtica

Concluso do Teste de Hipteses: Como zobs = 0,5103 < z = 1,64, no conseguimos rejeitar H0,
isto , aceita-se a hiptese de que a proporo de peas defeituosas igual a 0,03.
Oliveira, D. C. R. e Oliveira, M. S.

85

____/____/____

Exemplo 2: Numa amostra de 100 peas produzidas por uma mquina foram encontradas 3
defeituosas. Testar ao nvel de significncia de 5%, a hiptese de que a proporo de peas
defeituosas p = 0,08 ou menor.
Soluo:
Hipteses:
H0: p = 0,08
H: p < 0,08 (curva unilateral esquerda)
Regra de deciso para Nvel de Significncia = 0,05:

Regio de
Aceitao

0,05
Regio Crtica

Para um nvel de significncia de 0,05 temos que z = - 1,64. O valor de z observado na amostra :
0,05
p p
0,03 0,08
zobs =
=
=
1,84
p(1 p)
0,08(1 0,08)
0,0736
n
100
100
Concluso do Teste de Hipteses: Como zobs = -1,84 < z = -1,64, ento rejeito H0, ou seja, h
indcios de que a proporo de peas defeituosas menor que 0,08.

Exemplo 3: Numa amostra de 100 peas produzidas por uma mquina foram encontradas 4
defeituosas. Testar ao nvel de significncia de 5%, a hiptese de que a proporo de peas
defeituosas p = 0,05 ou diferente.
Soluo:
Hipteses:
H0: p = 0,05
Ha: p 0,05 (teste bilateral)
Regra de deciso para Nvel de Significncia = 0,05:

0,025
0,025

Regio de Aceitao

Regies Crticas

Considerando o nvel de significncia de 5%, temos que os zs que fornecem as reas cinza
representada na figura acima, z = - 1,96 e z= 1,96. O valor de z observado na amostra :
Oliveira, D. C. R. e Oliveira, M. S.

86

____/____/____

0,01
0,04 0,05
p p
=
=
0,46
0,05 . 0,95
0,05(1 0,05)
p(1 p)
100
100
n
Concluso do Teste de Hipteses: Como z = -1,96 < zobs = -0,46 < z = 1,96, ento no rejeitamos
H0, isto , aceito a hiptese de que a proporo de peas defeituosas igual a 0,05.
zobs =

13.6. Exerccios Parte III A3


1) Uma nova srie de televiso precisa provar que tem mais do que 25% de audincia de
telespectadores depois das 13 primeiras semanas de exibio para ser julgada bem-sucedida.
Considere que uma amostra de 400 famlias, 112 estavam vendo a nova srie. Com um nvel de
significncia de 10%, a srie pode ser julgada bem-sucedida com base na informao da amostra?
Qual a sua concluso do teste de hiptese?

2) Um contador acredita que os problemas de fluxo de caixa de uma empresa so o resultado direto
do lento recebimento das contas a receber. O contador afirma que pelo menos 70% das atuais
contas a receber tm mais de dois meses de idade. Uma amostra de 120 contas a receber mostrou
que 78 tm mais do que dois meses de idade. Teste a afirmao do contador a um nvel de
significncia de 5%.

Oliveira, D. C. R. e Oliveira, M. S.

87

____/____/____

13.7. Teste de Hipteses para Mdia com Varincia Conhecida


Estimao

Versus

Qual a quantidade mdia de leite


das caixinhas de leite da marca A?
Qual o peso mdio das mulheres
que estudam na UFSJ e esto no
quarto perodo de Administrao?

Teste de Hipteses
As caixinhas de leite da marca A tm em
mdia 1 litro de leite ou mais?
O peso mdio das mulheres que esto no
quarto perodo de Administrao na
UFSJ igual a 60 kg ou diferente?

Formulao das hipteses


Exemplo: Um comerciante atacadista de cereal admite uma mdia de impureza de 0,5 kg nas sacas
de 60 kg desse cereal. Ao se tomar uma amostra de certo nmero de sacas de um novo fornecedor,
obtm-se um valor para a mdia e o desvio padro, que permitiro, com certa probabilidade de
xito, decidir se a mdia de impurezas por saca do novo fornecedor igual a 0,5 kg, ou se maior
ou menor que 0,5 kg.
Testes de Hipteses possveis:
a) H0: = 0,5
Ha: 0,5

b) H0: = 0,5
Ha: > 0,5

c) H0: = 0,5
Ha: < 0,5

Teste da mdia com varincia conhecida


Exemplo 1: Uma amostra de 36 elementos de uma varivel X normalmente distribuda forneceu
mdia x = 42,3. Sabendo que a desvio padro populacional = 5,2, teste ao nvel de significncia
de 5%, a hiptese de que a mdia maior que 40.
Soluo:
Hipteses:
H0: = 40
Ha: > 40 (curva unilateral direita )
Nvel de significncia = 5% z = 1,64.
Valor de z observado na amostra:

Zobs

n
Regio de
Aceitao

42,3 40 42,3 40 2,3 . 6


=
=
= 2,65
5,2
5,2
5,2
6
36

Regio Crtica

Concluso do Teste de Hipteses: Como zobs = 2,65 > z = 1,64, ento rejeito H0, isto , aceito a
hiptese de que a mdia da populao maior que 40.
Oliveira, D. C. R. e Oliveira, M. S.

88

____/____/____

Exemplo 2: Uma amostra de 36 elementos de uma varivel X normalmente distribuda forneceu


mdia x = 42. Sabendo que o desvio padro populacional = 12. Testar ao nvel de significncia
de 5%, a hiptese de que a mdia menor que 44.
Soluo:
Hipteses:
H0: = 44
Ha: < 44 (curva unilateral esquerda )
Nvel de significncia = 5% z = 1,64.
Valor de z observado na amostra:

zobs =

42 44 42 44 2
=
=
= 1
12
12
2
6
36

Regio de
Aceitao

0,05
Regio Crtica

Concluso do Teste de Hipteses: Como zobs = -1 > z = -1,64, ento aceito H0, isto , aceito a
hiptese de que a mdia da populao igual a 44.
Exemplo 3: Uma amostra de 36 elementos de uma varivel X normalmente distribuda forneceu
mdia x = 40. Sabendo que o desvio padro populacional = 12. Testar ao nvel de significncia
de 5%, a hiptese de que a mdia diferente de 40.
Hipteses:

H0: = 40
Ha: 40 (teste bilateral)

Nvel de significncia = 5% z = -1,96 e z = 1,96.


x 40 40 40 40 0
Valor de z observado na amostra:
zobs =
=
=
= =0

12
12
2
6
n
36
0,025
0,025

Regio de Aceitao

Regies Crticas

Concluso do Teste de Hipteses: Como z = -1,96 < zobs = 0 < z = 1,96, ento aceito H0, isto ,
aceito a hiptese de que a mdia da populao igual a 40.
Oliveira, D. C. R. e Oliveira, M. S.

89

____/____/____

13.8. Exerccios Parte III A3


1) Uma mquina automtica de encher pacotes de caf enche-os segundo uma distribuio normal,
com mdia e varincia (conhecida) 400 g2. A mquina foi regulada para = 500g. Desejamos, de
meia em meia hora, colher uma amostra de 16 pacotes e verificar se a produo est sob controle,
isto , se = 500g ou no. Se uma dessas amostras apresentasse uma mdia x = 492g, voc
pararia ou no a produo? Considere um nvel de significncia de 1%.

2) Sabe-se que o consumo mensal per capita de um determinado produto tem distribuio normal,
com desvio padro (conhecido) 2 kg. A diretoria de uma firma que fabrica esse produto resolveu
que retiraria o produto da linha de produo se a mdia de consumo per capita fosse menor que 8
kg. Caso contrrio, continuaria a fabric-lo. Foi realizada uma pesquisa de mercado, tomando-se
uma amostra de 25 indivduos, e verificou-se um consumo mensal mdio de x = 7,2. Construa um
teste de hiptese adequado, utilizando um nvel de significncia de 5%, e com base na amostra
colhida, determine a deciso a ser tomada pela diretoria da firma.

Oliveira, D. C. R. e Oliveira, M. S.

90

____/____/____

13.9. Teste de Hipteses para Mdia com Varincia Desconhecida


Exemplo 1: Foi testada uma amostra de 9 cigarros de uma certa marca, com relao ao nvel de
nicotina, fornecendo mdia x = 42 mg e desvio padro s = 6 mg. Testar ao nvel de significncia de
5%, a hiptese de que a mdia maior que 40 mg.
Soluo:
Hipteses:
H0: = 40
Ha: > 40 (curva unilateral direita)
Nvel de significncia de 5%, obtemos na Tabela da t-Student o t que fornece a rea cinza de 0,05,
representada na figura.
Graus de liberdade: n 1 = 9 1 = 8.
Se o teste tiver cauda unilateral direita: p = 2 x = 2 x 0,05 = 0,10 = 10%. Ento: t = 1,860.
x 42 40 2 2
= = =1
Valor de t observado na amostra:
tobs =
=
s
6
6 2
3
n
9

Concluso do Teste de Hipteses: Como tobs = 1 < t = 1,860, ento aceito H0, isto , aceito a
hiptese de que a mdia da populao igual a 40.
Exemplo 2: Uma nova amostra de 16 cigarros da mesma marca forneceu mdia x = 40 mg e
desvio padro s = 4 mg. Testar ao nvel de significncia de 5%, a hiptese de que a mdia menor
que 44 mg.
Soluo:
Hipteses:
H0: = 44
Ha: < 44 (curva unilateral esquerda)
Nvel de significncia de 5%, obtemos na Tabela da t-Student o t que fornece a rea cinza de 0,05,
representada na figura.
Graus de liberdade: n 1 = 16 1 = 15.
Se o teste tiver cauda unilateral esquerda: p = 2 x = 2 x 0,05 = 0,10 = 10%. Ento: t = 1,753.
x 40 44 4 4
Valor de t observado na amostra:
tobs =
=
=
=
= 4
s
4
4
1
4
n
16
Oliveira, D. C. R. e Oliveira, M. S.

91

____/____/____

Concluso do Teste de Hipteses: Como tobs = -4 < t = -1,860, ento rejeito H0, isto , aceito a
hiptese de que a mdia da populao menor que 44.
Exemplo 3: Outra amostra de 16 cigarros forneceu mdia x = 42 mg e desvio padro s = 4 mg.
Testar ao nvel de significncia de 5%, a hiptese de que a mdia diferente de 40.
Hipteses:
H0: = 40
Ha: 40 (teste bilateral)
Nvel de significncia de 5%, obtemos na Tabela da t-Student o t que fornece a rea cinza de 0,05,
representada na figura.
Graus de liberdade: n 1 = 16 1 = 15.
Se o teste tiver cauda bilateral: p = = 0,05 = 5%. Ento: t = -2,131 e t = 2,131.
x 42 40 2 2
Valor de t observado na amostra:
tobs =
=
= = =2
s
4
4 1
4
n
16
Regio de Aceitao

Regio de Rejeio

Concluso do Teste de Hipteses: Como t = -2,131 < tobs = 2 < t = 2,131, ento aceito H0, isto ,
aceito a hiptese de que a mdia da populao igual a 40.

Oliveira, D. C. R. e Oliveira, M. S.

92

____/____/____

13.10. Exerccios Parte III A3


1) A experincia de muitos anos de uso de um dispositivo eletrnico, da marca A, tem mostrado
que sua vida mdia de = 286 horas. Uma amostra de n = 16 dispositivos de uma nova marca B
deu uma vida mdia de x = 290 horas com desvio padro de s = 8 horas. Testar, ao nvel de
significncia de 10%, se os dispositivos das duas marcas tm a mesma vida mdia ou se a vida
mdia do B maior que a do A.

2) A experincia de muitos anos de uso de uma lmpada, da marca A, tem mostrado que sua vida
mdia de = 300 horas. Uma amostra de n = 9 lmpadas de uma nova marca B deu uma vida
mdia de x = 290 horas com desvio padro de s = 6 horas. Testar, ao nvel de significncia de 10%,
se as lmpadas das duas marcas tm a mesma vida mdia ou se a vida mdia da B menor que a da
A.

3) Uma amostra de 16 empregados de uma empresa forneceu os seguintes resultados com relao
s alturas: mdia 173 cm e desvio padro 16 cm. Testar ao nvel de 10% as hipteses de que a
mdia da populao igual ou diferente 175cm.

Oliveira, D. C. R. e Oliveira, M. S.

93

____/____/____

Lista de Exerccios 3
Exerccio 01
Examinando 100 peas produzidas por uma mquina, foram encontradas 3 defeituosas. Obter a
estimativa intervalar, no nvel de 95%, para a proporo de peas defeituosas dessa mquina.
Exerccio 02
Uma amostra de 50 estudantes de uma Universidade mostrou que 8 destes apresentam problemas
visuais. Obter a estimativa intervalar, no nvel de 90%, para a verdadeira percentagem dos
estudantes com problemas visuais.
Exerccio 03
Uma amostra de n = 64 elementos de uma varivel normalmente distribuda forneceu mdia 25,4,
sendo que o desvio padro populacional 5,2. Determine o intervalo de confiana de 90% para a
mdia.
Exerccio 04
Determine o intervalo de confiana de 99% para a mdia do ponto de fuso de uma substncia
qumica, sendo que uma amostra de tamanho n = 9 pontos de fuso desta mesma substncia
forneceu uma mdia 75 e um desvio padro amostral igual a 7.
Exerccio 05: Uma moeda lanada 100 vezes, obteve-se 42 caras. Testar com um nvel de
significncia de 10% a hiptese de que essa moeda viciada.
Exerccio 06: Uma amostra de 50 alunos de uma escola de 1o grau apresentou 3 canhotos. Testar,
ao nvel de significncia 10%, a hiptese de que a percentagem de alunos canhotos dessa escola
diferente de 0,05.
Exerccio 07: Sabe-se que o consumo mensal per capita de um determinado produto tem
distribuio normal, com desvio padro 2 kg. A diretoria de uma firma que fabrica esse produto
resolveu que retiraria o produto da linha de produo se a mdia de consumo per capita fosse
menor que 8 kg. Caso contrrio, continuaria a fabric-lo. Foi realizada uma pesquisa de mercado,
tomando-se uma amostra de 25 indivduos, e verificou-se um consumo mensal mdio de x = 7,2.
Construa um teste de hiptese adequado, utilizando um nvel de significncia de 5%, e com base na
amostra colhida, determine a deciso a ser tomada pela diretoria.
Exerccio 08: A experincia de muitos anos de uso de uma lmpada, da marca A, tem mostrado
que sua vida mdia de = 300 horas. Uma amostra de n = 9 lmpadas de uma nova marca B deu
uma vida mdia de x = 290 horas com desvio padro de s = 6 horas. Testar, ao nvel de
significncia de 10%, se as lmpadas das duas marcas tm a mesma vida mdia ou se a vida mdia
da B menor que a da A.
Exerccio 09: Uma amostra de 16 empregados de uma empresa deu os seguintes resultados com
relao s alturas: mdia 173 cm e desvio padro 16 cm. Testar ao nvel de 10% as hipteses de que
a mdia da populao igual ou diferente 175cm.
Observao: O gabarito da Lista de Exerccios 3 encontra-se no Apndice C

Oliveira, D. C. R. e Oliveira, M. S.

94

____/____/____

APNDICE A
Gabarito da Lista de Exerccios 1
1) Populao: eleitores brasileiros.

Amostra: 122 pessoas entrevistadas em Braslia.

2) (a) Qualitativa Ordinal; (b) Qualitativa Nominal; (c) Quantitativa Discreta; (d) Quantitativa Contnua.
3) Aleatria Simples: 61, 09, 26, 29, 11, 77, 79, 04, 57, 59.
Sistemtica:N/n = 80/10 = 8; x = 6; Amostra: 6, 14, 22, 30, 38, 46, 54, 62, 70, 78.
Estratificada: Mulheres (4): 09, 26, 29, 11. Homens (6): 09, 26, 29, 11, 04, 02.
4) Zonas: 045, 020, 099, 033, 197, 166, 040, 005, 038, 115, 041, 173, 030, 025, 123.
5) (a)
Tabela: Conceitos obtidos de 60 alunos na disciplina de Estatstica na Escola E
Conceitos
Freqncia Absoluta
Proporo
Porcentagem
timo
03
0,05
05,0
Bom
22
0,367
36,7
Mdio
25
0,417
41,7
Ruim
10
0,166
16,6
Total
60
1
100
Interpretao: Podemos observar na Tabela acima que a maior proporo dos alunos da Escola E obtiveram conceito
Mdio na disciplina Estatstica (42%) e apenas 5% conquistaram o conceito timo. Alm disso, 37% concluram com
conceito Bom e 16% com conceito Ruim.
(b)
25

25
22

Frequncia Absoluta

20

15

10

10

tim o

Bom

Mdio

Ruim

Conce it o

Figura: Grfico de Barras para os Conceitos obtidos na disciplina de Estatstica de 60 alunos da Escola E.

Oliveira, D. C. R. e Oliveira, M. S.

95

____/____/____

R
16,7%

B
36,7%

O
5,0%

M
41,7%

Figura: Grfico de Composio em Setores para os Conceitos obtidos na disciplina de Estatstica de 60 alunos da
Escola E. (O : timo; B : Bom; M : Mdio; R : Ruim)

100

Freqncia Absoluta

50

80

40
60
30
40
20
20

10
0
Conceitos
Count
Percent
Cum %

Mdio
25
41,7
41,7

Bom
22
36,7
78,3

Ruim
10
16,7
95,0

timo
3
5,0
100,0

Porcentagem Acumulada

60

Figura: Grfico de Pareto para os Conceitos obtidos na disciplina de Estatstica de 60 alunos da Escola E.

Oliveira, D. C. R. e Oliveira, M. S.

96

____/____/____

6) (a) mnimo = 10; mximo = 22; mdia = 16,913; moda = 14.1, 16, 16.9, 19.5, 22; mediana = 16,9; Q1 = 15,0; Q3 = 19,5.
(b) amplitude = 12; varincia = 8,296; desvio-padro = 2,88; intervalo-interquartil = 4,5.
(c)
Tabela: Comprimento de 31 canos PVC vendidos em uma loja de material de construo
Comprimento
Freqncia Absoluta
Proporo
Porcentagem
Densidade
[10, 12)
1
0,0322581
3,2
0,0161290
[12, 14)
3
0,0967742
9,7
0,0483871
[14, 16)
6
0,1935480
19,4
0,0967742
[16, 18)
10
0,3225810
32,2
0,1612900
[18, 20)
6
0, 1935480
19,4
0,0967742
[20, 22]
5
0,1612907
16,1
0,0806452
Total
31
1
100
-----Interpretao: A maior parte dos canos tem comprimento entre 16 e 18m (32,2%), ....(descrever a coluna da
porcentagem)
(d)
0,18
0,16129

0,16
0,14

Densidade

0,12
0,0967742

0,10

0,0967742
0,0806452

0,08
0,06

0,0483871

0,04
0,016129

0,02
0,00

10

12

14

16
Comprimento

18

20

22

Figura: Histograma do comprimento de 31 canos PVC vendidos em uma loja de material de construo.

(e)

10

11

12

13

14

15
16
17
Compriment o

18

19

20

21

22

Figura: Diagrama de disperso unidimensional do comprimento de 31 canos PVC vendidos em uma loja de material de
construo.
Oliveira, D. C. R. e Oliveira, M. S.

97

____/____/____

22

20

Comprimento

18

16

14

12

10

Figura: Box-plot do comprimento de 31 canos PVC vendidos em uma loja de material de construo.
1 10 0
1 11
3 12 35
4 13 8
7 14 117
10 15 035
(7) 16 0013799
14 17 049
11 18 28
9 19 3557
5 20 035
2 21
2 22 00
Figura: Ramo-e-folhas do comprimento de 31 canos PVC vendidos em uma loja de material de construo.
7) a) Mdia = 69,87 e Mediana = 68. A mdia e a mediana foram bem diferentes. Embora 50% dos ndios tenham
pulsao abaixo de 68, os ndios com maior pulsao, fez com que o valor mdio da pulsao fosse maior, isto ,
aproximadamente 70. Quando os valores so distintos da mdia e mediana, implica que os dados so assimtricos.
(conforme mostra o grfico da alternativa (d) desse exerccio)
b) Mnimo = 60, Q1 = 60, Q3 = 76 e Mximo = 88.A menor e a maior pulsao foram 60 e 88, respectivamente. 25%
dos ndios tiveram pulsao inferior a 60 e 25% superior a 76. 50% obtiveram entre 60 e 76.
c) Varincia = 91,12 e Desvio Padro = 9,55. A variabilidade das pulsaes foi de 9,55 em torno do valor mdio da
pulsao.
d)

Freqncia Absoluta

60

64

68

72
P u ls a o

76

80

88

Figura: Grfico de barras das medidas da pulsao de 15 ndios nativos dos Alpes Peruanos.
Oliveira, D. C. R. e Oliveira, M. S.

98

____/____/____

8) (a) Mdia = 15,8; Desvio Padro 3,8.


(b) Mdia 2*Desvio 8,3. Sim, a cidade D.
(c) Fazer a mdia dos investimentos das cidades que tiver 8,3 Investimento 23,3. Ivestimento Bsico 16,8.
O valor no item (a) era menor em 1 unidade, pois a cidade D foi retirada do clculo, por no ter o investimento dentro
do intervalo pr-estabelecido. A mdia no item (a) foi menor, porque a cidade D um possvel outlier e o valor da
mdia sensvel aos valores discrepantes, isto , o seu valor influenciado por valores pequenos ou grandes.
9)
Medicamentos

A
B
C

N
De
Cobaias
10
8
8

Mnimo

Mximo

Mdia

Mediana

Q1

Q3

Amplitude

Varincia

Desvio
Padro

IQ

13
12
11

15
14
13

14,2
13,375
12,125

14
13,5
12

13,5
13
11,5

15
14
13

2
2
2

0,622
0,554
0,696

0,789
0,744
0,835

1,5
1
1,5

Embora as medidas de disperso, em geral, mostram que o medicamento C tem maior variabilidade dos dados, as
medidas de posio mostraram que o medicamento C o que fornece menor tempo de cicatrizao do completo
fechamento dos cortes provenientes de cirurgia.
10) (a)

80

Mortes

70

60

50

40

30
65

70

75
Barcos

80

85

Figura: Grfico de Disperso do nmero de peixes-boi mortos versus o nmero de barcos de turismo (em milhares) que
circulam em seu habitat na Flrida-EUA.
Podemos observar visualmente que h uma relao linear positiva entre o nmero de peixes-boi mortos com o nmero
de barcos de turismo (em milhares), isto , quanto mais barcos passar no habitat dos peixes-boi, maior ser o nmero
de mortes.
(b) r 0,922. Podemos notar atravs de r, que a correlao positiva entre X e Y significativa.
(c) Mortes = 2,27*Barcos 113
Oliveira, D. C. R. e Oliveira, M. S.

99

____/____/____

d) r2 = 84,9%. 84,9% da variao do nmero de peixes mortos explicado pelo nmero de barcos (em milhares) que
passam no seu habitat. 15,1% devido a outros fatores que no foram estudados, tais como, substncias qumicas
eliminadas no habitat dos peixe-boi, pescadores, etc.
11) (a)
120

110

Massa

100
90

80

70

60
40

50

60
Idade

70

80

Figura: Grfico de Disperso da idade versus a massa muscular de 18 mulheres com idade entre 40 e 79 anos.
(b) r = 0,837. O valor do coeficiente de correlao indica que as variveis idade e massa muscular esto relacionadas
linearmente de forma negativa, ou seja, quanto maior a idade menor a massa muscular.
(c) Y = 148,197 1,027 X. O coeficiente a = 148,197 (intercepto) no pode ser interpretado, porque a variao de X
no contm o valor 0. O coeficiente b = - 1,027 (inclinao) indica que a cada aumento de um ano na idade, espera um
decrscimo de aproximadamente 1 da massa muscular.

Oliveira, D. C. R. e Oliveira, M. S.

100

____/____/____

APNDICE B
Gabarito da Lista de Exerccios 2
1) (a) (A B)
b) (A Bc) (Ac B)
c) (A B)c
d) (A Bc)
2) a) P(AB) 0,0358
b) P((A B)c) 0,9641
c) P((A Bc)) 0,023
3) P(M|A) = 0,292
4)
X
15
17
18
20
E[X] =
P(X)
0,3575
0,1925
0,2925
0,1575
17,05
5) 0,8192
6) (a) 0,59049
(b) 0,32805
(c) 0,99144
7) (a) 0,5
(b) 0,33333
8) (a) 0,376812 (b) 0,282609
(c) 0,0376812
(d) 0,0086957
9) (a) 0,367879 (b) 0,981011
(c) 0,264242
10) (a) 0,0000454(b) 0,0103361
(c) 0
11) (a) 0,4332
(b) 0,0668
(c) 0,0062
(d) 41,34
12) (a) 0,2967
(b) 0,0062
(c) 0,0475
13) (a) boas: 0,8904
recuperveis: 0,0932
defeituosas: 0,0164
(b) E[T] 0,09

Oliveira, D. C. R. e Oliveira, M. S.

101

____/____/____

APNDICE C
Gabarito da Lista de Exerccios 3

0,03.0,97
0,03.0,97
; 0,03 + 1,96
= [0 ; 0,0634]
100
100

1) IC[P ; 95%] = 0,03 1,96

0,16.0,84
0,16.0,84
; 0,16 + 1,645
= [0,075 ; 0,245]
50
50

5,2

64

2) IC[P ; 90%] = 0,16 1,645


3) IC[ ; 90%] = 25,4 1,645

4) IC[ ; 99%] = 75 3,355

; 25,4 + 1,645

5,2
= [24.3 ; 26.5]
64

7
= [67.2 ; 82.8]
9

; 75 + 3,355

5) Hipteses: Ho: p = 0,5


Ha: p 0,5
Nvel de Significncia: = 0,10
Proporo Amostral:

p = 0,42

Estatstica do Teste: z observado =

0,42 0,5
0,5.0,5
100

= 1.6

Regra de Deciso: Pela tabela da distribuio normal, Ha e nvel de significncia:


RC = (- , -1.645] [1.645 , +)
RA = (-1.645 , 1.645)
Concluso: Como zobservado RA, ento no rejeito Ho com um nvel de significncia de 10%, ou seja, no podemos
afirmar que a moeda viciada.
6) Hipteses: Ho: p = 0,05
Ha: p 0,05
Nvel de Significncia: = 0,10

= 0,06
Proporo Amostral: p
Estatstica do Teste:

z observado =

0,06 0,05
0,05.0,95
50

0.32

Regra de Deciso: Pela tabela da distribuio normal, Ha e nvel de significncia:


RC = (- , -1.645] [1.645 , +)
RA = (-1.645 , 1.645)
Concluso: Como zobservado RA, ento no rejeito Ho com um nvel de significncia de 10%, ou seja, podemos
afirmar que 5% dos alunos dessa escola de 1 grau so canhotos.
7) Hipteses: Ho: = 8 kg
Ha: < 8 kg
Nvel de Significncia: = 0,05

Oliveira, D. C. R. e Oliveira, M. S.

102

____/____/____

Estatstica do Teste:

z observado =

7,2 8
= 2
2
25

Regra de Deciso: Pela tabela da distribuio normal, Ha e nvel de significncia:


RC = (- , -1.645]
RA = (-1.645 , +)
Concluso: Como zobservado RC, ento rejeito Ho com um nvel de significncia de 5%, ou seja, a mdia de
consumo per capita menor que 8 kg.
8) Hipteses: Ho: = 300
Ha: < 300
Nvel de Significncia: = 0,10
Estatstica do Teste: t observado

290 300
= 5
6
9

Regra de Deciso: Pela tabela da t de Student com Graus de Liberdade = 8 e p = 20%, Ha e nvel de significncia:
RC = (- , -1.397]
RA = (-1.397 , +)
Concluso: Como zobservado RC, ento rejeito Ho com um nvel de significncia de 10%, ou seja, a vida mdia de
B menor que a de A.
9) Hipteses: Ho: = 175
Ha: 175
Nvel de Significncia: = 0,10
Estatstica do Teste: t observado

173 175
= 0,5
16
16

Regra de Deciso: Pela tabela da t de Student com Graus de Liberdade = 15 e p = 10%, Ha e nvel de significncia:
RC = (- , -1.753] [1.753 , +)
RA = (-1.753 , 1.753)
Concluso: Como zobservado RA, ento no rejeito Ho com um nvel de significncia de 10%, ou seja, podemos
afirmar que a altura mdia de 175 cm.

Oliveira, D. C. R. e Oliveira, M. S.

103

____/____/____

APNDICE D - Aula no Laboratrio de Computao


1) Em certa localidade, obtiveram-se os seguintes dados sobre precipitao pluviomtrica anual, X (cm) e
colheita de algodo, Y (kg/are) para um perodo de 7 anos:
Ano 1
2
3
4
5
6
7
X
1,0 158,85 118,65 114,80 75,0 127,15 111,15
Y 520
190
208
213
310
194
160
a) Obtenha a mdia, mediana, Quartil 1, Quartil 3 e desvio-padro de X e Y.
b) Quantos pontos aberrantes voc encontrou em cada Box-plot de X e Y?
c) Construa o Dot-Plot de X no MINITAB e escreva em qual intervalo de valores de X esto a maior parte
dos dados.
d) Construa o Ramo-e-Folhas de Y no MINITAB e escreva em qual intervalo de valores de X esto a maior
parte dos dados.
e) Construa o diagrama de disperso entre X e Y no MINITAB. Qual a relao entre X e Y visualmente?
f) Obtenha o valor da correlao e a reta de regresso entre X e Y.
g) Faa o teste-t para testar, com um nvel de significncia de 5% se: Ho: = 50 contra Ha: 50.
X

h) Sabendo que o desvio de Y igual a 10, teste com um nvel de significncia de 10% as hipteses: Ho:
= 256 contra

Ha: > 256.

2) Se entrevistamos 1500 pessoas e 1050 so a favor de um candidato, teste com um nvel de significncia
de 1% se ele vencer as eleies.

3) Quando uma mquina nova est funcionando adequadamente, somente 3% dos itens produzidos
apresentam defeitos. Suponha que 5 itens so selecionadas aleatoriamente.
(a) Qual a probabilidade de encontrarmos 2 defeituosos?
(b) Qual a probabilidade de encontrarmos 3 ou mais defeituosos?
4) Para fazer o controle de qualidade numa empresa, lotes com 100 peas so examinados. Todo lote
composto por 10 peas defeituosas. Aps coletar uma amostra de 5 peas sem reposio, calcule a
probabilidade de que nessa amostra no haja nenhum item defeituoso?
5) Durante o perodo de tempo em que reservas por telefone esto sendo feitas na universidade local, as
chamadas chegam razo de uma a cada dois minutos.
(a) Qual a probabilidade de 3 chamadas em 2 minutos?
(b) Qual a probabilidade de 2 ou mais chamadas em um perodo de 4 minutos?

Oliveira, D. C. R. e Oliveira, M. S.

104

____/____/____

Você também pode gostar