Escolar Documentos
Profissional Documentos
Cultura Documentos
Apostila Estatistica
Apostila Estatistica
e
Probabilidade
Professores:
Daniela Carine Ramires de Oliveira
Marcos Santos de Oliveira
ndice
1.
2.
3.
Introduo Estatstica
1.1.
1.2.
1.3.
1.4.
1
1
2
2
Variveis
2.1.
2.2.
2.3.
3
3
5
3.4.
5.
Definio de Varivel
Classificao das Variveis
Exerccios
Amostragem
3.1.
3.2.
3.3.
4.
O que Estatstica?
Estatstica na Prtica
Um pouco da histria da Estatstica
Exerccios
6
6
6
6
7
8
9
10
Tabulao de Variveis
11
4.1.
4.2.
4.3.
4.4.
11
12
13
14
Medidas de Posio
15
5.1.
5.2.
5.3.
5.4.
5.5.
15
15
15
16
18
Prof. Daniela
Mnimo e Mximo
Moda
Mdia
Mediana
Exerccios
ii
____/____/____
6.
7.
Medidas de Disperso
19
6.1.
6.2.
6.3.
6.4.
6.5.
19
19
19
21
21
Estatstica Grfica
22
7.1.
22
22
23
23
25
25
26
26
27
28
29
31
7.2.
7.3
8.
Motivao
Amplitude
Varincia e Desvio Padro
Intervalo Interquartil
Exerccios
Correlao e Regresso
32
8.1.
8.2.
8.3.
8.4.
8.5.
8.6.
32
32
35
37
39
40
Lista de Exerccios 1
41
9.
Probabilidade
44
9.1.
9.2.
9.3.
9.4.
9.5.
44
44
45
46
47
iii
____/____/____
Prof. Daniela
9.6.
9.7.
9.8.
9.9.
9.10.
9.11.
9.12.
9.13.
10.
11.
Definio Clssica
Definio Freqentista
Definio Subjetiva
Definio Moderna
Probabilidade Condicional
Independncia de Eventos
Regra da Probabilidade Total
Teorema de Bayes
48
49
51
51
52
53
54
54
56
10.1.
10.2.
10.3.
10.4.
10.5.
10.6.
10.7.
10.8.
10.9
10.10.
10.11.
56
57
58
58
58
59
60
60
61
61
62
Introduo
Esperana Matemtica (Mdia)
Varincia
Exerccio
Modelo Bernoulli
Modelo Binomial
Exerccios
Distribuio Hipergeomtrica
Exerccio
Distribuio Poisson
Exerccios
63
11.1.
11.2.
11.3.
11.4.
65
66
69
73
Esperana e Varincia
Distribuio Normal
Tabela da Distribuio Normal Padro
Exerccios
Lista de Exerccios 2
74
12.
Estimao
77
12.1.
12.2.
12.3.
12.4.
12.5.
12.6.
12.7.
77
77
79
79
81
81
83
Prof. Daniela
Inferncia Estatstica
Estimao Pontual e Intervalar para Proporo
Exerccios
Estimativa Pontual e Intervalar para a Mdia Populacional
Exerccios
Estimativa para a Mdia Populacional com Varincia Desconhecida
Exerccio
iv
____/____/____
13.
Testes de Hipteses
84
13.1.
13.2.
13.3.
13.4.
13.5.
13.6.
13.7.
13.8
13.9
13.10.
84
84
84
85
85
87
88
90
91
93
Introduo
Formulao das Hipteses
Tipos de Erros possveis nos Testes de Hipteses
Nvel de Significncia de um Teste de Hiptese ()
Teste de Hipteses para a Proporo
Exerccios
Teste de Hipteses para Mdia com Varincia Conhecida
Exerccios
Teste de Hipteses para Mdia com Varincia Desconhecida
Exerccios
Lista de Exerccios 3
94
Apndice
A
B
C
D
Prof. Daniela
95
101
102
104
____/____/____
1. INTRODUO ESTATSTICA
1.1. O que Estatstica?
Estatstica uma cincia que nos permite coletar, organizar, descrever, analisar e interpretar
dados oriundos de estudos ou experimentos, realizados em qualquer rea do conhecimento.
Estamos denominando por dados a um (ou mais) conjunto de valores, numricos ou no. A
aplicabilidade das tcnicas a serem discutidas se d nas mais variadas reas das atividades
humanas. Assim, o principal objetivo da Estatstica nos auxiliar a tomar decises ou tirar
concluses em situaes de incerteza, a partir de informaes numricas.
1.2. Estatstica na Prtica
Tcnicas de amostragem
Populao
(Caractersticas)
Amostra
Planejamento de Experimentos
Anlise
descritiva
descritiva
Concluses
sobre as
caractersticas
da populao
Inferncia Estatstica
Clculo de Probabilidades
Informaes
contidas nos
dados
Populao: o conjunto de todos os elementos que nos interessa estudar. Deve ser notado que na
terminologia estatstica, populao refere-se no somente a uma coleo de indivduos, mas ao alvo
no qual reside nosso interesse. Exemplos: todos os clientes de um banco, todos os alunos de uma
faculdade, todos os automveis da Ford, todo o sangue no corpo de uma pessoa, etc.
Tcnicas de Amostragem: ferramentas que nos auxiliam a coletar amostras.
Planejamento de Experimentos: cria esquemas e teorias para verificao de hipteses cientficas.
Amostra: qualquer subconjunto da populao.
Anlise Descritiva: Conjunto de tcnicas destinadas a descrever e resumir os dados a fim de
tirarmos concluses a respeito de caractersticas de interesse.
Probabilidade: Teoria utilizada para se estudar a incerteza associada a fenmenos aleatrios.
Inferncia Estatstica: Tcnicas que possibilitam a extrapolao, a um grande conjunto de dados
(populao), das informaes e concluses obtidas a partir de um subconjunto de valores
(amostra).
Oliveira, D. C. R. e Oliveira, M. S.
____/____/____
Oliveira, D. C. R. e Oliveira, M. S.
____/____/____
2. VARIVEIS
2.1. Definio de Varivel
Qualquer caracterstica associada a uma populao chamada de varivel.
Porque o nome varivel? Porque ela varia de alguma forma.
Exemplos: Idade: pode variar de 0, 1 , 2, ... anos
Sexo: pode ser masculino ou feminino
Estado Civil: pode ser solteiro, casado, divorciado, etc.
2.2. Classificao das Variveis
As variveis podem ser classificadas como Qualitativas ou Quantitativas.
Algumas variveis como sexo, grau de instruo, estado civil, regio de procedncia,
apresentam como possveis resultados uma qualidade (ou atributo) do indivduo pesquisado, logo,
estas variveis so chamadas de variveis Qualitativas.
As variveis como nmero de filhos, salrio, idade, apresentam como possveis resultados
nmeros resultantes de uma contagem ou mensurao, logo, estas variveis so chamadas de
variveis Quantitativas.
Exemplo: Um pesquisador est interessado em fazer um levantamento sobre alguns aspectos
socio-econmicos dos empregados da seo de oramentos de uma empresa. Usando informaes
obtidas do departamento pessoal, ele elaborou a Tabela 2.1.
Tabela 2.1: Informaes sobre estado civil, grau de instruo, nmero de filhos, salrio (expresso
como frao do salrio mnimo), idade (medida em anos e meses) e procedncia de 36 empregados
da seo de oramentos de uma Empresa.
Idade
N
1
2
...
35
36
Estado Civil
Solteiro
Casado
...
Casado
Casado
Grau de Instruo
Fundamental
Fundamental
...
Mdio
Superior
N de Filhos
...
1
...
2
3
Salrio
4,00
4,56
...
19,40
23,30
Anos
26
32
...
48
42
Meses
3
10
...
11
2
Regio de Procedncia
Interior
Capital
...
Capital
Interior
Oliveira, D. C. R. e Oliveira, M. S.
____/____/____
Dentre as variveis Qualitativas, ainda podemos fazer uma distino entre dois tipos:
Varivel Qualitativa Nominal: para a qual no existe nenhuma ordenao nos possveis
resultados.
Exemplo: Regio de Procedncia, etc.
Varivel Qualitativa Ordinal: para a qual existe uma ordem natural nos seus resultados.
Exemplo: Grau de instruo, etc.
As variveis Quantitativas tambm podem sofrer uma classificao dicotmica:
Varivel Quantitativa Discreta: cujos possveis valores formam um conjunto finito ou
enumervel de nmeros, e que resultam, freqentemente, de uma contagem.
Exemplo: N de Filhos, etc.
Varivel Quantitativa Contnua: cujos possveis valores pertencem a um intervalo de nmeros
reais e que resultam de uma mensurao.
Exemplo: Salrio, etc.
Resumindo
Como as variveis so classificadas e outros exemplos:
Qualitativa
Nominal
Ordinal
Quantitativa
Discreta
Contnua
Nmeros de carros.
Peso, altura.
Para cada tipo de varivel existem tcnicas apropriadas para resumir as informaes dos
dados obtidos da amostra. Por exemplo, a utilizao de uma tabela uma forma de escrever os
dados de uma forma resumida.
Em algumas situaes podem-se atribuir valores numricos s vrias qualidades ou
atributos de uma varivel qualitativa e depois se proceder anlise como se esta fosse quantitativa,
desde que o procedimento seja passvel de interpretao.
Existe um tipo de varivel qualitativa para a qual essa quantificao muito til: a chamada
varivel dicotmica. Para essa varivel podem ocorrer somente duas realizaes, usualmente
chamadas de sucesso e fracasso.
Exemplos: Sexo (Masculino ou Feminino), Hbito de Fumar (Sim ou No), etc.
Oliveira, D. C. R. e Oliveira, M. S.
____/____/____
OpTV
R
R
...
R
B
Oliveira, D. C. R. e Oliveira, M. S.
____/____/____
3. AMOSTRAGEM
A amostragem naturalmente usada em nossa vida diria. Por exemplo, para verificar o
tempero de um alimento em preparao, podemos provar (observar) uma pequena poro deste
alimento. Estamos fazendo uma amostragem, ou seja, extraindo do todo (populao), uma parte
(amostra) com propsito de avaliarmos sobre a qualidade do tempero de todo o alimento.
3.1. Por que fazer Amostragem?
Existem vrias razes para o uso de amostragem em levantamento de grandes populaes.
Algumas delas so:
Economia: Em geral, torna-se bem mais econmico o levantamento de somente uma parte
da populao.
Tempo: Numa pesquisa eleitoral, a trs dias de uma eleio presidencial, no haveria tempo
suficiente para pesquisar toda a populao de eleitores do pas.
Operacionalidade: mais fcil realizar operaes de pequena escala. Um dos problemas
tpicos nos grandes censos o controle dos entrevistadores.
3.2. Quando o uso de amostragem no interessante?
Oliveira, D. C. R. e Oliveira, M. S.
____/____/____
Para realizar este sorteio, podemos utilizar urnas, tabelas de nmeros aleatrios ou algum
software que gere nmeros aleatrios. A Tabela abaixo foi feita usando o Excel.
Tabela de Nmeros Aleatrios
6
9
5
5
8
1
4
0
8
0
0
4
4
9
4
9
7
0
3
8
2
4
5
4
9
6
0
0
2
6
2
9
5
7
3
9
9
5
0
2
8
9
7
1
5
5
3
9
5
8
1
8
0
2
1
1
2
0
8
2
9
1
5
9
5
5
3
8
6
8
7
2
1
2
7
7
2
7
4
4
7
4
2
7
6
9
0
6
5
3
0
3
3
0
2
4
3
0
3
1
5
1
3
0
4
7
9
8
0
8
0
7
1
4
9
0
2
1
5
6
9
5
5
8
5
1
5
4
6
4
2
6
8
6
1
9
9
9
8
2
5
8
0
7
3
9
2
4
9
2
8
1
1
0
0
3
6
3
2
1
5
9
6
5
4
3
4
9
8
5
8
2
1
9
2
7
1
7
6
3
0
6
3
2
6
2
6
5
4
9
0
3
4
8
8
2
9
8
5
0
1
3
8
0
9
2
1
5
8
0
8
4
1
5
1
7
5
8
8
2
5
8
9
9
5
6
7
6
6
9
3
6
5
3
0
2
9
4
2
3
1
3
7
1
6
0
2
3
4
8
8
0
1
5
2
5
1
0
2
0
6
4
2
5
3
4
5
5
8
5
9
6
8
9
8
7
9
9
6
4
3
8
6
3
6
2
7
3
2
1
1
4
2
1
3
0
5
0
4
0
5
9
4
8
5
9
8
7
5
8
4
7
8
2
7
7
4
9
3
9
6
5
6
0
6
4
6
3
2
3
1
3
2
5
2
2
2
0
7
0
3
1
1
4
1
3
5
4
0
8
0
9
8
8
9
1
4
2
5
6
2
5
3
6
3
5
6
6
3
2
8
0
8
1
5
9
2
9
2
8
7
5
5
5
4
4
8
2
2
1
1
0
0
3
0
0
0
1
0
3
1
2
5
9
6
9
7
6
2
3
1
9
1
5
3
5
1
9
1
1
8
2
4
2
2
9
3
5
3
5
6
5
9
5
8
3
8
6
8
7
2
9
3
9
0
1
6
2
4
3
7
0
1
3
9
8
1
4
2
4
9
5
7
1
7
6
4
8
4
8
5
2
9
7
4
2
0
6
0
1
0
3
3
2
0
3
6
0
3
1
2
9
1
0
3
5
8
5
0
6
9
2
1
4
8
6
5
4
5
7
3
8
5
6
4
2
0
8
3
1
0
2
9
0
2
1
1
6
0
3
5
4
3
1
0
8
8
2
4
2
9
0
1
5
5
6
9
4
2
8
2
5
0
9
6
1
2
2
3
1
5
0
1
0
0
4
3
3
2
2
7
2
6
5
5
9
1
5
8
4
9
2
4
9
6
4
4
7
2
7
0
8
8
6
8
2
9
9
4
9
____/____/____
...
Subgrupo 1 da amostra
Subgrupo 2 da amostra
...
Subgrupo k da amostra
Amostra
Estratificada
Servidores
Alunos
Oliveira, D. C. R. e Oliveira, M. S.
____/____/____
Supondo que a opinio sobre a gesto atual da reitoria possa ser relativamente homogneo
dentro de cada categoria, realizaremos uma amostragem estratificada proporcional por categoria,
para obter uma amostra global de tamanho n = 10. A tabela a seguir mostra as relaes de
proporcionalidade.
Estrato
np = ( 0,20)*10 = 2
ns = ( 0,20)*10 = 2
Alunos
na = ( 0,60)*10 = 6
Zona
11
12
10
4
8
Entrevistar todos os
eleitores dessas zonas
Oliveira, D. C. R. e Oliveira, M. S.
____/____/____
Obs.: fcil confundir amostragem estratificada com amostragem por conglomerado, porque
ambas envolvem a formao de subgrupos. A diferena que a amostragem por conglomerado usa
todos os membros de uma amostra de conglomerados, enquanto a amostragem estratificada usa
uma amostra de membros de todos os estratos.
Curiosidade
Tambm podemos encontrar na prtica a Tcnica de Amostragem de Convenincia que
simplesmente usa resultados que sejam muito fceis de obter.
Ei! Voc a favor
da pena de m orte?
Oliveira, D. C. R. e Oliveira, M. S.
10
____/____/____
4. TABULAO DE VARIVEIS
4.1. Variveis Qualitativas Unidimensionais
Quando se estuda uma varivel, o maior interesse do pesquisador conhecer o
comportamento dessa varivel, analisando a ocorrncia de seus possveis resultados.
A tabela a seguir apresenta a distribuio de freqncias da varivel grau de instruo dos
dados da Tabela 2.1.
Tabela 4.1: Freqncias e Porcentagens dos 36 empregados da seo de oramentos da
Companhia MB segundo o grau de instruo.
Grau de Instruo Freqncia (ni) Proporo (fi) Porcentagem (100 x fi)
Fundamental
12
Mdio
18
Superior
6
n = 36
1,0000
Total
Fonte: Bussab e Morettin (2002)
Interpretao da Tabela 4.1.: Nota-se que dos 36 empregados da seo de oramentos, 33,33%
tem nvel fundamental, 50% nvel mdio e apenas 16,67% nvel superior.
Notao: Usaremos a notao ni para indicar a freqncia (absoluta) de cada classificao ou
categoria da varivel. A notao fi = ni/n para indicar a proporo (ou freqncia relativa) de cada
categoria, sendo o n o nmero total de observaes.
As propores so muito teis quando se querem comparar resultados de duas pesquisas
distintas. O prximo exemplo ilustra este fato.
Exemplo: Suponhamos que se queira comparar a varivel grau de instruo para empregados da
seo de oramentos com a mesma varivel para todos os empregados da Companhia MB.
Digamos que a empresa tenha 2000 empregados e que a distribuio de freqncias seja a tabela
abaixo:
Tabela 4.2: Freqncias e Porcentagens dos 2000 empregados da Companhia MB, segundo o grau
de instruo.
Grau de Instruo
Freqncia (ni) Proporo (fi) Porcentagem (100 x fi)
Fundamental
650
Mdio
1020
0,5100
Superior
n = 2000
1,0000
Total
Fonte: Bussab e Morettin (2002)
Comparao entre a Tabela 4.1. e a Tabela 4.2.: No podemos comparar diretamente as colunas
das freqncias (ni) das duas tabelas pois os totais de empregados so diferentes nos dois casos (n =
36 e n = 2000). Mas as colunas das porcentagens (ou propores) so comparveis, pois reduzimos
as freqncias relativas a um mesmo total.
Oliveira, D. C. R. e Oliveira, M. S.
11
____/____/____
C = 1 + 3,2 x log n
Regra 2:
C= n
12
____/____/____
As tabelas usadas neste caso so conhecidas como tabela de dupla entrada, tabela de
associao, tabela de contingncia ou distribuies conjuntas de freqncias.
Tabela 4.4: Distribuio dos funcionrios da empresa MB, segundo o
conceito em Metodologia e a Seo a que pertence.
Seo
Conceito em Metodologia
Total por
Seo
A
B
C
Dep. Pessoal
3
1
3
7
Sc. Tcnica
0
4
3
7
Sec. Venda
4
3
4
11
7
8
10
25
Total por Conceito
Oliveira, D. C. R. e Oliveira, M. S.
13
____/____/____
Seo*
P
P
P
P
P
P
P
T
T
T
T
T
T
T
V
V
V
V
V
V
V
V
V
V
V
Admin.
Direito
Redao
Estat.
Ingls
Metodologia
Poltica
8,0
9,0
8,6
9,0
B
A
9,0
8,0
9,0
7,0
9,0
B
C
6,5
8,0
9,0
8,0
8,0
D
B
9,0
6,0
9,0
8,6
8,0
D
C
6,0
8,0
9,0
8,0
9,0
A
A
6,5
8,0
9,0
8,5
10,0
B
A
6,5
8,0
9,0
8,2
8,0
D
C
9,0
10,0
9,0
7,5
8,0
B
C
6,0
8,0
9,0
9,4
9,0
B
B
10,0
10,0
9,0
7,9
8,0
B
C
9,0
8,0
9,0
8,6
10,0
C
B
10,0
8,0
9,0
8,3
7,0
D
B
6,5
6,0
9,0
7,0
7,0
B
C
6,0
10,0
9,0
8,6
9,0
A
B
10,0
8,0
9,0
8,6
9,0
C
B
10,0
8,0
9,0
9,5
7,0
A
A
9,0
8,0
9,0
6,3
8,0
D
C
10,0
6,0
9,0
7,6
9,0
C
C
6,0
6,0
9,0
6,8
4,0
D
C
6,0
6,0
9,0
7,5
7,0
C
B
6,0
8,0
9,0
7,7
7,0
D
B
6,5
6,0
9,0
8,7
8,0
C
A
6,0
8,0
9,0
7,3
10,0
C
C
9,0
8,0
9,0
8,5
9,0
A
A
6,5
8,0
9,0
7,0
9,0
B
A
9,0
(*) P = Departamento Pessoal; T = Seo Tcnica e V = Seo de Vendas.
Fonte: Bussab e Morettin (2002)
Economia
8,5
8,0
8,5
8,5
9,0
9,5
7,0
8,5
8,0
7,5
8,5
8,0
8,5
7,5
7,0
7,5
7,5
8,5
9,5
8,5
8,0
9,0
7,0
9,0
8,5
Oliveira, D. C. R. e Oliveira, M. S.
14
____/____/____
5. MEDIDAS DE POSIO
5.1. Mnimo e Mximo
Conjunto _ _ _ _ _ _ _
Conjunto _ _ _ _ _ _
Moda = __.
Interpretao: __ ligaes a cobrar foi o que ocorreu com maior freqncia.
5.3. Mdia
i
x1 + x 2 + x3 + L + x n
i =1
=
x=
n
n
Exemplo: Considere o seguinte conjunto de notas: 2, 5, 3, 7, 8. A mdia das notas ___.
Oliveira, D. C. R. e Oliveira, M. S.
15
(5.1)
____/____/____
Nesse caso, a mdia calculada levando em conta as freqncias de cada valor da varivel,
da seguinte forma:
v
x=
x n
i =1
,
(5.2)
n
onde v a quantidade de resultados que a varivel contm e ni a respectiva freqncia da i-sima
classe. Assim, para o exemplo temos:
n
x n
i =1
5.4. Mediana
o valor que divide os dados, isto , metade dos dados ser maior ou igual que a mediana e
metade ser menor ou igual.
Considere a seguinte srie de valores: 5, 2, 6, 13, 9, 15, 10.
De acordo com a definio de mediana, o primeiro passo a ser dado ordenar o conjunto de
valores: 2, 5, 6, 9, 10, 13, 15. O valor que divide a srie em duas partes iguais 9. Logo, a mediana
9.
Mtodo prtico para o clculo da Mediana para dados em Rol
1) Ordenar os valores do menor para o maior, isto , x(1),...., x(n), onde x(1) o mnimo e x(n) o
mximo.
n +1
.
2) Calcular em que posio estar a mediana nos dados ordenados atravs da frmula: p =
2
3) O valor da mediana ser:
(a) Se p for um nmero inteiro, ento a mediana ser o valor que est na posio p nos dados
ordenados, isto
Mediana = x(p)
Oliveira, D. C. R. e Oliveira, M. S.
16
____/____/____
Mediana =
x (P ) + x (P+ )
2
Nesse caso, utilizamos a freqncia acumulada para identificar qual o valor da mediana.
Exemplo: Considere novamente o exemplo da empresa de segurana que desejava estudar qual o
nmero de ligaes a cobrar mais freqentes recebidas em um determinado bairro de classe alta da
cidade de So Paulo no ms de maro. Vamos introduzir uma nova coluna na tabela dos dados
referentes a freqncia acumulada.
Oliveira, D. C. R. e Oliveira, M. S.
17
____/____/____
Como o rol par, pois n = __, a mediana a mdia dos valores que esto nas posies 15 e 16.
Ambos valores que esto nestas posies so __ ligaes a cobrar recebida por residncia, pois F3
a primeira freqncia acumulada que contm os elementos 15 e 16.
Obtenha mnimo, mximo, moda, mdia e mediana dos tempos de falhas das mquinas e interprete
os resultados.
3) As idades dos 20 ingressantes num certo curso de ps-graduao em finanas de uma
universidade foram as seguintes: 22, 22, 22, 22, 23, 23, 24, 24, 24, 24, 25, 25, 26, 26, 26, 26, 27,
28, 35 e 40. Construa uma tabela de freqncias e calcule o mnimo, mximo, moda, mdia e
mediana das idades organizadas nessa tabela.
Oliveira, D. C. R. e Oliveira, M. S.
18
____/____/____
6. MEDIDAS DE DISPERSO
6.1. Motivao
Para preencher uma nica vaga existente em uma empresa, 50 candidatos foram submetidos
a 6 provas sobre conhecimentos especficos de interesse da empresa. Trs destes candidatos
destacaram-se com as notas descritas na tabela abaixo:
Tabela 6.1: Distribuio das Notas
Provas
Candidatos
1
2
3
4
5
A
7,0 7,5 8,0 8,0 8,5
B
6,0 7,0 8,0 8,0 9,0
C
7,5 8,0 8,0 8,0 8,0
Fonte: Dados Hipotticos
6
9,0
10,0
8,5
Que candidato escolher? Um critrio inicial poderia ser o de escolher o que tem a maior mdia,
mas:
Candidatos
A
B
C
Mdia
De modo anlogo, nem adianta pensar em moda ou mediana, pois:
Candidatos
A
B
C
Moda
Mediana
Soluo: Um segundo critrio de escolha pode ser escolher o candidato que apresentou notas mais
homogneas, isto , aquele que apresentou menor disperso das notas.
6.2. Amplitude
A amplitude definida pelo intervalo entre o valor mximo e o valor mnimo da srie de
dados, ou seja,
Amplitude = Mximo Mnimo
(6.1)
Exemplo: Para os trs candidatos temos:
Candidatos
A
B
C
Amplitude
6.3. Varincia e Desvio Padro
( x x ) 2 + ( x 2 x ) 2 + ( x3 x ) 2 + L + ( x n x ) 2
=
s2 = 1
n 1
Oliveira, D. C. R. e Oliveira, M. S.
19
(x
i =1
x)2
n 1
(6.2)
____/____/____
(6.3)
Candidato A
s A2 =
7,0
7,5
Notas
8,0 8,0
8,5
Mdia
8,0
9,0
Candidato B
6,0
7,0
s B2 =
Notas
8,0 8,0
9,0
Candidato C
7,5
8,0
sC2 =
Mdia
8,0
10,0
6 1
Notas
8,0 8,0
8,0
sB =
Mdia
8,0
8,5
=
6 1
s A = 0,5 0,7
sC =
Resumindo
Tabela 6.2: Medidas de Posio e Disperso dos 3 melhores candidatos
Candidatos Mdia Moda Mediana Amplitude Varincia
Desvio Padro
A
8,0
8,0
8,0
B
8,0
8,0
8,0
C
8,0
8,0
8,0
Frmula alternativa para o clculo da varincia
Podemos calcular a varincia atravs da seguinte frmula alternativa:
s2 =
1 n 2
2
xi n ( x )
n 1 i =1
(6.4)
.
A frmula (6.4) obtida atravs de algumas manipulaes algbricas na frmula (6.2). Esta
tem a facilidade de apenas necessitar da informao da mdia ( x ) e da soma dos valores ao
2
quadrado da varivel xi .
Oliveira, D. C. R. e Oliveira, M. S.
20
____/____/____
Oliveira, D. C. R. e Oliveira, M. S.
21
____/____/____
7. ESTATSTICA GRFICA
7.1. Grficos para as Variveis Qualitativas
A representao grfica da distribuio de uma varivel tem a vantagem de, rpida e
concisamente, informar sobre sua variabilidade.
Existem vrios tipos de grficos para as variveis Qualitativas. Aqui sero ilustrados trs
deles: Grficos em Barras, o de Composio em Setores (Pizza) e o Grfico de Pareto.
18
18
16
14
Freqncia (ni)
12
12
10
8
6
4
2
0
Fundamental
Mdio
Grau de Instruo
Superior
22
____/____/____
33%
Superior
17%
500
100
400
80
300
60
200
40
100
20
Modelo-Avies
Count
Percent
Cum %
MD-11
4
0,8
99,4
MD-90
3
0,6
100,0
Porcentagem Acumulada
Frequencia Absoluta
Figura 7.3: Produo de avies em 2000. (Fonte: Boeing Commercial Airplane Company)
Oliveira, D. C. R. e Oliveira, M. S.
23
____/____/____
90
100
Nmero de Defeitos
80
70
80
60
50
40
30
60
30
20
10
Tipo de Defeito
40
21
6
20
4
ia
as
es
as
as
os
as
iv
tr
nc
nt
ur
ad
o
ad
o
t
u
e
r
h
c
i
l
n
O
a
/g
q
ifi
an
sa
co
as
ap
br
/r
se
s
d
l
o
s
u
l
a
d
te
ro
de
en
m
o
ar
fu
/f
ra
a
s
n
P
s
r
o
e
e
e
F
s
d
rt
Fo
lh
r te
ta
ta
Pa
l
a
n
P
E
Fa
Count
30
21
6
6
5
5
4
4
Percent
37,0 25,9
7,4
7,4
6,2
6,2
4,9
4,9
Cum %
37,0 63,0 70,4 77,8 84,0 90,1 95,1 100,0
o
rn
Porcentagem Acumulada
Curiosidade: O grfico de Pareto tem esse nome em homenagem ao economista italiano Vilfredo
Pareto que estabeleceu a teoria de que, em certas economias, a maior parte da riqueza (80%)
pertence minoria da populao (20%).
Oliveira, D. C. R. e Oliveira, M. S.
24
____/____/____
Oliveira, D. C. R. e Oliveira, M. S.
25
____/____/____
Exemplo: Considere a varivel tempo, em segundos, entre carros que passam por um cruzamento,
viajando na mesma direo: 6, 3, 5, 6, 4, 3, 5, 4, 6, 3, 4, 5, 2, 10.
4
5
6
7
8
Figura 7.6: Grfico de Disperso Dot Plot
10
7.2.3. Histograma
O Histograma utilizado para representar a distribuio de freqncia. um grfico de
barras contguas, com bases proporcionais aos intervalos de classes e a rea de cada retngulo
proporcional respectiva freqncia relativa. Indicaremos a amplitude do i-simo intervalo por ai.
Para que a rea do retngulo respectivo seja proporcional a fi, a sua altura deve ser proporcional a
di = fi/ai, que chamada de densidade de freqncia da i-sima classe. Quanto mais dados tivermos
em cada classe, mais alto deve ser o retngulo. Com essa conveno, a rea total do histograma
ser 1 (um).
Oliveira, D. C. R. e Oliveira, M. S.
26
____/____/____
0,09
Densidade de Freqncia
0,08
0,0833
0,07
0,06
0,0695
0,05
0,0556
0,04
0,03
0,0347
0,02
0,01
0,007
04 |-- 08
08 |-- 12
12 |-- 16
Classes de Salrios
16 |-- 20
20 |-- 24
1973
1974
1975
1976
1977
1978
1979
1980
1981
1982
1983
1984
1985
1986
1987
1988
1989
14857
20032
25115
32145
37951
52187
55803
64259
73963
85487
93745
102127
105171
111203
121188
113511
115506
27
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
123439
123910
135949
145726
148295
159256
179935
199998
241644
241468
236156
226067
227689
235414
220182
187987
191999
____/____/____
250000
200000
150000
100000
50000
20
0
20
0
20
0
20
0
19
9
19
9
19
9
19
9
19
9
19
8
19
8
19
8
19
8
19
8
19
7
19
7
19
7
19
7
19
7
19
6
19
6
19
6
19
6
19
6
19
5
19
5
Ano
Figura 7.8: Grfico de Linhas para a varivel Dvida Externa do Brasil no perodo 1956 a 2006
7.2.5. Ramo-e-Folhas
Suponha que os dados sejam representados por x1, x2, ..., xn, e que cada nmero xi consista
em, pelo menos, dois dgitos. Para construir um diagrama ramo-e-folhas dividimos cada nmero xi
em duas partes: um ramo, que consiste em um ou mais dos dgitos lderes, e uma folha, que
consiste nos dgitos restantes. Por exemplo, se os dados representam porcentagens de defeitos
(valores entre 0 e 100), em lotes de placas de semicondutores, ento poderamos dividir o valor 76
no ramo 7 e na folha 6. Em geral, devemos escolher poucos ramos em comparao com o nmero
de observaes. Usualmente, utilizado entre 5 e 20 ramos. Uma vez escolhido um conjunto de
ramos, eles so listados ao longo da margem esquerda do diagrama e, ao lado de cada ramo, so
listadas todas as folhas que correspondem aos valores dos dados observados.
Tabela 7.5: Fora de ruptura em libras por polegada para 100 garrafas
descartveis de 1 litro de refrigerante.
176 221 242 253 261 265 271 278 286 301
187 223 243 254 262 265 272 278 287 307
197 228 245 254 263 267 274 280 290 308
200 231 246 257 263 267 274 280 293 317
205 231 248 258 264 268 274 280 294 318
208 234 248 258 264 268 274 280 296 321
210 235 250 260 265 269 275 281 298 328
214 235 250 260 265 269 276 281 299 334
215 235 250 260 265 270 276 283 299 337
220 242 251 260 265 271 277 283 300 346
Fonte: Hines et al. (2006), p. 157.
Oliveira, D. C. R. e Oliveira, M. S.
28
____/____/____
1 17 6
2 18 7
3 19 7
6 20 058
9 21 045
13 22 0138
19 23 114555
26 24 2235688
36 25 0001344788
(22) 26 0000123344555555778899
42 27 01124444566788
28 28 0000113367
18 29 0346899
11 30 0178
7 31 78
5 32 18
3 33 47
1 34 6
Figura 7.9: Diagrama ramo-e-folhas para os dados da fora de ruptura de garrafas da Tabela 7.5.
O ramo-e-folhas resultante est representado na Figura 7.9. A inspeo dessa representao
revela imediatamente que a maioria das foras de ruptura fica entre 220 e 308 psi, e que o valor
central est em algum ponto entre 260 e 270 psi. Alm disso, as foras de ruptura esto distribudas
de maneira aproximadamente simtrica em torno do valor central. Assim, o ramo-e-folhas, como o
histograma, nos permite determinar rapidamente algumas caractersticas importantes dos dados que
no eram to imediatamente bvias na apresentao original da Tabela 7.5. Note que, aqui, os
nmeros originais no se perdem, como ocorre em um histograma. Atravs do ramo-e-folhas
podemos calcular qualquer medida de posio e disperso.
M x im o
Q3
75%
M ed ian a
50%
Q1
25%
M n im o
Q 1 -1 ,5 (Q 3 -Q 1 )
29
____/____/____
27
26,67
Viscosidade (centipoise)
26
25,9
25,38
25
24,62
24,46
24
23,5
23
22,78
22,45
22,56
22
22,02
21,95
21,49
21
20,49
20,33
20
Mistura 1
Mistura 2
Mistura 3
Figura 7.11: Diagramas de caixas para os dados de viscosidade da mistura na Tabela 7.6.
Oliveira, D. C. R. e Oliveira, M. S.
30
____/____/____
Freqncia Absoluta
Proporo
Densidade
Oliveira, D. C. R. e Oliveira, M. S.
31
____/____/____
8. CORRELAO E REGRESSO
8.1. Estudo da relao entre variveis
O objetivo investigar a presena ou ausncia de relao linear sob trs pontos de vista:
(a) Inspeo visual: diagrama de disperso
(b) Quantificando a fora dessa relao: coeficiente de correlao.
(c) Explicitando a forma dessa relao: ajuste de uma reta.
32
____/____/____
10
9
8
7
Nota
6
5
4
3
2
1
0
10
12
14
Tempo
Exemplo: Estudo da Renda Bruta Mensal pela Porcentagem da Renda Bruta Anual gasta com
Assistncia Mdica.
Numa pesquisa feita com 11 famlias com renda bruta mensal entre 10 e 60 salrios
mnimos mediram-se:
X: renda bruta mensal (em salrios mnimos)
Y: porcentagem da renda bruta anual gasta com assistncia mdica
Tabela 8.2
X
12
16
18
20
28
30
Oliveira, D. C. R. e Oliveira, M. S.
Y
7,2
7,4
7,0
6,5
6,6
6,7
X
40
48
50
54
32
33
Y
6,0
5,6
6,0
5,5
6,5
____/____/____
10
20
30
40
50
60
Figura 8.2: Diagrama de Disperso para as variveis Renda Bruta Mensal e Porcentagem da
Renda Bruta Anual gasta com Assistncia Mdica.
Nesta Figura 8.2, temos o diagrama de disperso de X (Renda Bruta Mensal) e Y
(Porcentagem da Renda Bruta Anual gasta com Assist. Mdica). Podemos notar que, conforme
aumenta a renda bruta mensal, a porcentagem da renda bruta anual gasta com assistncia mdica
diminui. Nota-se tambm uma tendncia linear decrescente.
Fazendo apenas uma mudana na escala do eixo Y da Figura 8.2, obtemos a Figura 8.3, que
ilustra com maior clareza essa tendncia linear decrescente.
7,5
6,5
5,5
10
20
30
40
50
60
Figura 8.3: Diagrama de Disperso para as variveis Renda Bruta Mensal e Porcentagem da
Renda Bruta Anual gasta com Assistncia Mdica.
Oliveira, D. C. R. e Oliveira, M. S.
34
____/____/____
(X
r=
onde
i =1
X )(Yi Y )
(n 1) S x S y
X Y
i i
i =1
nXY
(n 1) S x S y
(9.1)
Recordando: S x =
(X
i =1
X )2
n 1
e Sy =
(Y
i =1
Y )2
n 1
30
20
10
10
20
30
40
Oliveira, D. C. R. e Oliveira, M. S.
50
35
____/____/____
Z=Y/10+0,8
r 0,01
O coeficiente de correlao linear sensvel a valores discrepantes.
r = 0.91
r =0
Oliveira, D. C. R. e Oliveira, M. S.
36
____/____/____
Exemplo: Considere o Estudo da Renda Bruta Mensal pela Porcentagem da Renda Bruta Anual
gasta com Assistncia Mdica. Obter o coeficiente de correlao com os dados da Tabela 8.2.
Medidas Descritivas com os dados da Tabela 8.2
Mdia X
31,63636
Mdia Y
6,454545
Desvio de X 14,63744
Desvio de Y
0,62348
n
11
Soma XY
2160,4
n
r=
X i Yi nXY
i =1
(n 1)S x S y
2160,4 11.31,636363.6,454545
= -0,9399564
10.14,63744.0,62348
Definio de a e b
a: intercepto;
b: inclinao da reta.
Interpretao de b: Para cada aumento de uma unidade em X, temos um aumento mdio de b
unidades em Y.
i =1
i =1
b=
a = Y bX
Oliveira, D. C. R. e Oliveira, M. S.
i =1
37
X i Yi nXY
(n 1) S x2
____/____/____
Temperatura
16
31
38
39
37
A correlao entre X e Y :
X=
Sx =
Tabela 8.3
Consumo
Temperatura
290
36
374
36
393
22
425
15
406
Y=
Sy =
Consumo
370
365
320
270
X Y
i =1
i i
Consumo de Cerveja
390
370
350
330
310
290
270
250
10
15
20
25
30
35
40
45
Temperatura Mxima
Figura 8.4: Diagrama de Disperso para as variveis Temperatura Mxima e Consumo de Cerveja,
juntamente com a Reta de Regresso
Oliveira, D. C. R. e Oliveira, M. S.
38
____/____/____
7,5
6,5
5,5
y = -0,04x + 7,7212
2
R = 0,8835
5
10
15
20
25
30
35
40
45
50
55
60
Oliveira, D. C. R. e Oliveira, M. S.
39
____/____/____
Tempo
Nota
3
4,5
7
6,5
2
3,7
1,5
4
12
9,3
Oliveira, D. C. R. e Oliveira, M. S.
40
____/____/____
Lista de Exerccios 1
1) Identifique a populao e a amostra correspondente : A fim de avaliar a inteno de voto para
presidente dos brasileiros, 122 pessoas foram entrevistadas em Braslia.
2) Classifique as seguintes variveis:
a) Conceitos obtidos na Disciplina Estatstica (R:Ruim, M:Mdio, B:Bom e O:timo);
b) Bacias Hidrogrficas (A:Amaznica, P:Platina, SF:So Francisco, N:do Nordeste, L:do Leste,
S:do Sul);
c) Nmero de sementes germinadas (0, 1, 2, 3, 4, 5);
d) Renda;
3) Selecione uma amostra de tamanho 10 dentre 80 funcionrios, utilizando as tcnicas de
amostragem aleatria simples e sistemtica. Depois, levando em conta que o sexo dos funcionrios
importante na pesquisa, obtenha uma amostra de mesmo tamanho utilizando amostragem
estratificada proporcional considerando que dos 80 funcionrios, 30 so mulheres e 50 so homens.
(Utilize a primeira linha da tabela de nmeros aleatrios, quando for necessrio)
4) Uma certa cidade possui N = 200 zonas eleitorais. Uma empresa destinada a fazer uma pesquisa
eleitoral vai selecionar aleatoriamente n = 15 zonas e entrevistar todos os elementos que esto
dentro dessas zonas eleitorais, isto , foi utilizada amostragem por conglomerado. Apresentem
quais sero as 15 zonas eleitorais amostradas. (Utilize a primeira linha da tabela de nmeros
aleatrios, quando for necessrio)
5) Os dados a seguir referem-se aos conceitos obtidos de n = 60 alunos, na disciplina de Estatstica
na Escola E.
Tabela 1: Dados Brutos
R : Ruim
M : Mdio
B: Bom
O : timo
M R M M M R B B M M R B M M M M R B B R
B M R M B M R M R M B M R M R M B M B M
B B B B O M M M M M B B B B B B B O B O
a) Organize os dados abaixo em uma Tabela de Freqncias, com ttulo, freqncias absoluta e
relativa, porcentagens e interpretao.
b) Faa os grficos de barras,o de composio em setores e o de Pareto para os dados da Tabela 1.
6) Os dados abaixo se referem ao comprimento de 31 canos PVC vendidos em uma loja de material
de construo.
Tabela 2: Dados Brutos (em m)
19,5 20,0 14,1 16,1 10,0 16,0 22,0 20,5 15,0 16,7 22,0
12,5 16,3 15,3 16,0 13,8 19,7 17,0 14,1 18,8 12,3
15,5 14,7 20,3 17,4 19,5 17,9 18,2 16,9 19,3 16,9
41
____/____/____
42
____/____/____
a) Observe o diagrama de disperso e comente sobre a relao linear dessas duas variveis.
b) Verifique se a correlao significativa (atravs do coeficiente de correlao (r)).
c) Obtenha a reta de regresso, considerando o nmero de peixes mortos a varivel dependente e o
nmero de barcos como a varivel independente.
d) Interprete o coeficiente de determinao (r2).
11) esperado que a massa muscular de uma pessoa diminua com a idade. Para estudar essa
relao uma nutricionista selecionou 18 mulheres com idade entre 40 e 79 anos, e observou em
cada uma delas a idade (X) e a massa muscular (Y).
Tabela 7: Dados Brutos
X 71 64 43 67 56 73 68 56 76 65 45 58 45 53 49 78 73 68
Y 82 91 100 68 87 73 78 80 65 84 116 76 97 100 105 77 73 78
a) Faa o diagrama de disperso dos dados.
b) Calcule o coeficiente de correlao linear entre X e Y e interprete-o.
c) Ajuste uma reta de regresso para mostrar a relao linear entre as variveis Y: massa muscular
(dependente) e X: idade (independente) e interprete os coeficientes.
18
X
i =1
18
X Y
i =1
i i
= 1108 ;
18
X
i =1
2
i
= 70362 ;
18
Y
i =1
= 1530 ;
18
Y
i =1
= 133300 e
= 91964 .
Oliveira, D. C. R. e Oliveira, M. S.
43
____/____/____
9. PROBABILIDADE
9.1. Processo ou Experimento Aleatrio
Definio 1: Qualquer fenmeno que gere resultado incerto ou casual chamado de Processo ou
Experimento Aleatrio.
Exemplos:
1) Jogar uma moeda duas vezes e observar a seqncia obtida de caras e coroas;
3) Peso de Animais;
Oliveira, D. C. R. e Oliveira, M. S.
44
____/____/____
9.3. Evento
Definio 3: Evento qualquer subconjunto do espao amostral.
Exemplos:
(a) Alguns eventos do experimento 1: A = {5}, B = {2, 4, 6}, etc.
(b) Alguns eventos do experimento 2:
Existem dois eventos especiais: espao todo () e o conjunto vazio ().
O evento unio de A e B, denotado AB, o evento em que A ocorre ou B ocorre (ou ambos).
A
Exemplo:
Oliveira, D. C. R. e Oliveira, M. S.
45
____/____/____
(e) C D =
(b) A B =
(f) E F =
(c) (A B)c =
(g) (A G)c =
(d) (A B)c =
Oliveira, D. C. R. e Oliveira, M. S.
46
____/____/____
No entanto, fcil perceber que o termo probabilidade j est enraizado no senso comum,
pois as pessoas vivem o cotidiano calculando implicitamente algumas probabilidades, tais como:
9 situaes de sua vida pessoal;
9 organizando-se em relaes a horrios a cumprir, levando em conta as circunstncias do
trfego;
9 agasalhando-se ao sair de casa se a previso do tempo indicar uma frente fria.
Em resumo, prevenindo-se em situaes de risco.
Como podemos definir Probabilidade?
47
____/____/____
Exemplo: Considere o lanamento de uma moeda equilibrada, nesse caso o espao amostral
associado = {Cara, Coroa}. Ento, pela definio clssica, a probabilidade de ocorrncia do
evento cara P(cara) =
.
Exemplo: Populao Residente em So Joo del Rei em 2006
Idade
Menor 1
Masculino
600
572
Feminino
Total
1172
1a4
2592
2457
5049
5 a 9 10 a 14 15 a 19 20 a 29 30 a 39 40 a 49 50 a 59 60 a 69 70 a 79 80 e mais
3411
3491
3774
7027
6699
5528
3300
2222
1085
397
3257
3482
3692
7059
7096
5863
3894
2910
1781
763
6668
6973
7466
14086
13795
11391
7194
5132
2866
1160
Total
40126
42826
82952
= conjunto de 82.952 habitantes residentes em So Joo del Rei em 2006 por faixa etria.
Possveis eventos de interesse:
M = Indivduo sorteado do sexo masculino
F = Indivduo sorteado do sexo feminino
A = Indivduo sorteado tem mais que 80 anos
B = Indivduo sorteado tem entre 15 e 29 anos
M A = Indivduo sorteado do sexo masculino e tem mais de 80 anos
F B = Indivduo sorteado do sexo feminino ou tem entre 15 e 29 anos
20,00
16,69
17,51
Distribuio da Faixa Etria da Cidade de So Joo del Rei em 2006, por Sexo
13,78
16,48
16,00
16,57
18,00
13,69
1,78
2,00
0,99
4,16
2,70
6,79
5,54
8,22
1,50
1,34
4,00
Masculino
Feminino
9,09
5,74
6,00
8,62
7,61
8,00
8,13
10,00
8,70
8,50
9,41
12,00
6,46
Porcentagem
14,00
0,00
Menos
que 1
1a4
5a9
10 a 14 15 a 19 20 a 29 30 a 39 40 a 49 50 a 59 60 a 69 70 a 79
acima
de 80
Grupos de Idade
Oliveira, D. C. R. e Oliveira, M. S.
48
____/____/____
Oliveira, D. C. R. e Oliveira, M. S.
49
____/____/____
1)
2)
3)
4)
5)
Jogada(n)
C ou K
1 ou 0
Caras Acumuladas (m)
Frequncia Relativa (m/n)
1)
2)
3)
4)
5)
Jogada(n)
C ou K
1 ou 0
Caras Acumuladas (m)
Frequncia Relativa (m/n)
31 32 33
10
12
14
17
40
20
47
25
50
30
55
60
Passo 5 depois de completar a 1a parte da planilha, construir a seguinte tabela, usando as linhas 4
e 5 da planilha:
n
m/n
10
20
30
40
50
60
Passo 6 Completar o grfico, usando os valores da tabela recm construda, do seguinte modo:
Eixo Y valores m/n
Eixo X valores da linha 1: (n)
m/n
1,0
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
1 2 3 4 5 6 7 8 9 10 20
n
30
40
50
60
50
____/____/____
Exemplos:
Segue alguns exemplos de funes j descobertas na literatura para calcular
probabilidades, que sero discutidas em detalhes nos captulos posteriores.
1) Distribuio Bernoulli
P(X = x ) = p x (1 p )1 x , x = 0, 1.
2) Distribuio Binomial
n
nx
P(X = x ) = p x (1 p ) , x = 0, 1, ..., n.
p
3) Distribuio Hipergeomtrica
r N r
x n x , 0 x mnimo(r, n).
P(X = x ) =
N
n
4) Distribuio Poisson
P(X = x ) =
e x
, x = 0, 1, ...
x!
5) Distribuio Normal
1
(x )
1
2
f (x) =
e 2
, - < x< +
2
Oliveira, D. C. R. e Oliveira, M. S.
51
____/____/____
6) Distribuio t de Student
[(k + 1) / 2] x 2
1+
f (x) =
k
[k / 2] k
7) Distribuio Qui-Quadrado
f (x) =
1
k
k/2 22
(k +1) / 2
, - < x< +
k
1 x
2
e 2,x>0
Propriedades
P1: P() = 0, onde o conjunto vazio.
P2: Se Ac for o evento complementar de A, ento P(Ac) = 1 P(A).
P3: Se A e B forem dois eventos quaisquer, ento P(A B) = P(A) + P(B) P(A B).
P4: Se A B, ento P(A) P(B).
Nos captulos posteriores veremos algumas distribuies de probabilidade para
variveis discretas e contnuas comumente utilizadas.
9.10. Probabilidade Condicional
A probabilidade condicional surge, por exemplo, quando se deseja calcular a probabilidade
de um evento A ocorrer sabendo que um evento B j ocorreu.
Sejam A e B dois eventos associados a um mesmo espao amostral . Denota-se por
P(A|B) a probabilidade condicionada do evento A, quando o evento B tiver ocorrido.
Sempre que calculamos P(A|B), estamos essencialmente calculando P(A) em relao ao
espao amostral reduzido devido a B ter ocorrido, em lugar de faz-lo em relao ao espao
amostral original .
Assim, uma definio mais formal de probabilidade condicional dada pela definio 9.
Definio 9 (Probabilidade Condicional): Dados dois eventos A e B, a probabilidade condicional
de A dado que ocorreu B representada por P(A | B) e definida por
P( A B)
P( A | B) =
,
P( B) > 0
P ( B)
Da definio de probabilidade condicional, obtemos a regra do produto de probabilidades.
P( A B) = P( B)P( A | B)
Exemplo: Voltando ao Exemplo da Populao Residente em So Joo del Rei em 2006, temos:
Idade
Menor 1
Masculino
600
Feminino
572
Total
1172
1a4
2592
2457
5049
5 a 9 10 a 14 15 a 19 20 a 29 30 a 39 40 a 49 50 a 59 60 a 69 70 a 79 80 e mais
3411
3491
3774
7027
6699
5528
3300
2222
1085
397
3257
3482
3692
7059
7096
5863
3894
2910
1781
763
6668
6973
7466
14086
13795
11391
7194
5132
2866
1160
Total
40126
42826
82952
52
____/____/____
Exemplo: Joaninha tem probabilidade de 0,8 de passar no vestibular enquanto que Joozinho tem
probabilidade de 0,6. Qual a probabilidade dos dois passarem no vestibular? Qual a suposio a ser
feita nesse caso para calcular a probabilidade?
Sejam os eventos: A: Joaninha passa no vestibular e B: Joozinho passa no vestibular
P(AB) = 0,8.0,6 = 0,48
Exerccio Parte II A2: O campo da Engenharia da confiabilidade se desenvolveu rapidamente
a partir do incio da dcada de 1960. Um tipo de problema encontrado o de se estimar a
confiabilidade de um sistema a partir das confiabilidades dos subsistemas. A confiabilidade
definida, aqui, como a probabilidade do funcionamento apropriado durante um certo perodo de
tempo. Considere a estrutura de um sistema em srie simples, como o da figura a seguir:
Sistema
Subsistema 1
Oliveira, D. C. R. e Oliveira, M. S.
Subsistema 2
53
____/____/____
54
____/____/____
Curiosidade
O teorema de Bayes, que aparentemente poderia ser encarado como mais um resultado na teoria de
probabilidades, tem importncia fundamental, pois fornece a base para uma abordagem da
inferncia estatstica conhecida como inferncia bayesiana.
Como estamos falando do Thomas Bayes, no podemos deixar de fazer um breve
comentrio sobre o que chamamos de probabilidades subjetivas, ou seja, cada indivduo, baseado
em informaes anteriores e na sua opinio pessoal a respeito de um evento em questo, pode ter
uma resposta para a probabilidade desse evento. A inferncia Bayesiana toma como uma de suas
bases o fato de que todas as probabilidades so subjetivas. O teorema de Bayes tem um papel
importante nesse tipo de inferncia, pois passa a ser visto como um mecanismo de atualizao de
opinies, ou seja, o indivduo aprende B e passa a ter opinio P(A|B) sobre A.
As probabilidades associadas a eventos de modo subjetivo tm propriedades anlogas as
que foram mencionadas nesse texto.
Exemplo:
Nveis Histricos de Qualidade de Dois Fornecedores
% de Peas Boas
% de Peas Ruins
Fornecedor 1
98
Fornecedor 2
95
Considere uma empresa fabricante que recebe embarques de peas de dois diferentes
fornecedores. Atualmente, 65% das peas compradas pela empresa so do fornecedor 1 e o
restante, 35%, so do fornecedor 2. Dado que uma pea selecionada seja defeituosa, qual a
probabilidade dela ter vindo do fornecedor 2?
P ( F2 | D ) =
55
____/____/____
10.1. Introduo
Vamos incorporar o conceito de probabilidade ao estudo de variveis associadas a
caractersticas em uma populao. Muitos experimentos produzem resultados no-numricos.
Antes de analis-los, conveniente transformar seus resultados em nmeros. Isto feito atravs da
varivel aleatria que uma funo que associa um valor numrico a cada ponto do espao
amostral.
Para entender melhor o conceito, considere o seguinte exemplo.
Exemplo: Observa-se o sexo das crianas em famlias com trs filhos. O espao amostral
= {(MMM), (MMF), (MFM), (FMM), (MFF), (FMF), (FFM),(FFF)}
Uma varivel aleatria de interesse : X = {n. de crianas do sexo masculino}. A cada evento
simples, ou ponto de , associamos um nmero, que o valor assumido pela varivel aleatria X:
Evento
X
MMM
3
MMF
2
MFM
2
FMM
2
MFF
1
FMF
1
FFM
1
FFF
0
x1
P(X=x1)
x2
P(X=x2)
56
...
...
xn
P(X=xn)
____/____/____
n
i =1
P ( X = xi ) = 1
Espao Amostral
HHH
HHM
HMH
MHH
HMM
MHM
MMH
MMM
Probabilidade
21 20 19
x x
= 0,203
35 34 33
21 20 14
x x
= 0,150
35 34 33
Distribuio de Probabilidade
X
P(X)
0
1
2
3
0,203 0,450 0,291 0,056
= 0,291+ 0,056
= 0,347
14 13 12
x x
= 0,056
35 34 33
Nmero xi
0
1
2
3
4
5
Probabilidade P(X = xi)
0,1
0,1
0,2
0,3
0,2
0,1
Se for de R$ 20,00 o lucro por unidade vendida, qual o lucro esperado nas vendas de uma semana?
Oliveira, D. C. R. e Oliveira, M. S.
57
____/____/____
Soluo: Calculemos inicialmente E(X), que o nmero esperado de aparelhos vendidos em uma
semana:
E(X) = (0)(0,1) + (1)(0,1) + (2)(0,2) + (3)(0,3) + (4)(0,2) + (5)(0,1) = 2,70.
Para x unidades vendidas o lucro 20x. Logo, o lucro esperado de R$ 54,00.
10.3. Varincia
Assim como a mdia uma medida de posio de uma v.a., natural que procuremos uma
medida de disperso dessa varivel em relao mdia. Essa medida a varincia, a ser
representada por 2 e definida por
n
Desenvolvendo o termo quadrtico do somatrio, obtemos uma expresso mais fcil de calcular a
varincia dada por:
2 = Var (X) = E(X 2 ) [E (X)]2
n
Desvio Padro
O desvio padro () a raiz quadrada positiva da varincia. Tem sobre essa ltima a
vantagem de exprimir a disperso na mesma unidade de medida da v.a.:
= 2
10.4. Exerccio Parte II A2
1) A distribuio de X: n de crianas por domiclio numa determinada regio dada pela tabela
abaixo:
X
0
1
2
3
4
5
P(X = x)
0,10
0,15
0,25
0,30
0,15
0,05
Calcule:
(a) O nmero mdio de crianas por domiclio, X.
(b) O desvio padro de X, X.
(c) A probabilidade P{X - X X X + X}.
58
____/____/____
1, se ocorrer sucesso
X=
0, se ocorrer fracasso
e funo de probabilidade,
X
P(X=x)
1
p
0
1-p
Segue-se que
E(X) = p
Var(X) = p(1-p)
e
59
Var(X) = np(1-p)
____/____/____
Exemplo: Suponha que 20% dos clientes de uma empresa sejam inadimplentes. Se 10 pessoas
dessa populao forem escolhidas ao acaso e com reposio, determine:
(a) O n esperado de inadimplentes.
(b) A probabilidade de selecionar exatamente 3 pessoas inadimplentes.
(c) A probabilidade de selecionar no mximo 3 inadimplentes.
10.7. Exerccios Parte II A2
1) Nos Estados Unidos, 29% dos advogados e juzes so mulheres (Statistical Abstract of the
United States, 1997). Em uma jurisdio com 30 advogados e juzes, qual o nmero esperado de
mulheres? Qual a varincia e o desvio padro?
2) O maior nmero de reclamaes dos proprietrios de automveis com dois anos de uso se
referem ao desempenho do sistema eltrico. Considere que um questionrio anual, enviado aos
proprietrios de mais de 300 marcas e modelos de automveis, revelou que 10% dos proprietrios
de automveis com dois anos de uso encontraram pontos com problemas no sistema eltrico, que
incluam o motor de arranque, o alternador, a bateria, controles diversos, luzes e radio. Qual a
probabilidade de que uma amostra de 12 proprietrios de automveis com dois anos ter
(a) exatamente dois proprietrios com problemas no sistema eltrico
(b) pelo menos dois proprietrios com problemas no sistema eltrico
(c) no mximo um proprietrio com problemas no sistema eltrico.
x n x , 0 x mnimo(r, n).
P(X = x ) =
N
n
Notao: X ~ Hipergeomtrica (N; n; r)
Esperana: E(X) = np
Varincia: Var(X) = np(1-p)(N-n)/(N-1),
onde p = r/N.
Oliveira, D. C. R. e Oliveira, M. S.
60
____/____/____
Exemplo: Uma fbrica produz peas que so embaladas em caixas com 40 unidades. Para aceitar o
lote de caixas enviado por essa fbrica, o controle de qualidade de uma empresa sorteia uma caixa
do lote e sorteia 10 peas, sem reposio, dessa mesma caixa. Se houver alguma pea defeituosa o
lote inteiro devolvido. Se a caixa sorteada tiver 4 peas defeituosas, qual a probabilidade do lote
no ser devolvido?
N = 40, n = 10 e r = 4
X: nmero de peas defeituosas
4 40 4
0 10 0
P(X = 0) =
0,3
40
10
10.9. Exerccio Parte II A2: Para fazer o controle de qualidade numa empresa, lotes com 100
peas so examinados. O nmero de peas com defeito no lote 10. Aps colher uma amostra de 5
peas sem reposio, calcule a probabilidade de que nessa amostra no haja nenhum item
defeituoso.
x!
Notao: X ~ P()
Esperana e Varincia:
Oliveira, D. C. R. e Oliveira, M. S.
____/____/____
Exemplo: Um departamento de conserto de mquinas recebe uma mdia de cinco chamadas por
hora. Supondo que a distribuio de Poisson seja adequada nessa situao, obter a probabilidade de
que, em uma hora selecionada aleatoriamente, sejam recebidas exatamente trs chamadas:
Oliveira, D. C. R. e Oliveira, M. S.
62
____/____/____
Definio: Seja X uma varivel aleatria. Suponha que os possveis valores de X seja um intervalo
que possui infinitos valores, ento diremos que X uma varivel aleatria contnua.
Exemplos:
1. Mede-se a altura de uma mulher em uma cidade. O valor encontrado um nmero real. Aqui
tambm sabemos que esse nmero no passa de 3 metros, mas conveniente considerar qualquer
n real positivo.
2. Em um exame fsico para selecionar um jogador de futebol medido o peso de cada candidato;
aqui tambm consideramos que o resultado pode ser qualquer nmero real positivo.
3. Em campanhas preventivas de hipertenso arterial comum de tempos em tempos medir-se o
nvel de colesterol. O valor de cada medida pode ser um nmero real no negativo.
4. Para pacientes que se apresentam num hospital a primeira atitude medir-se a temperatura; o
valor da temperatura um nmero real que se pode considerar compreendido entre 35 e 42C.
5. Retira-se uma lmpada da linha de produo e coloca-se a mesma em um soquete acendendo-a;
observa-se a mesma at que se queime. O tempo de durao da lmpada um n real no negativo.
Nos exemplos de 1 a 5, o nmero observado no experimento aleatrio um nmero
real e resulta em geral de uma medio:
altura das mulheres;
peso do atleta;
nvel de colesterol;
temperatura;
tempo de durao da lmpada.
Uma varivel aleatria contnua assume seus valores em um intervalo.
Como so atribudas probabilidades nesse caso?
Exemplo: Suponha que observamos o peso, em kg, de 1500 pessoas adultas selecionadas
aleatoriamente numa populao. O histograma por densidade desses valores apresentado abaixo.
Oliveira, D. C. R. e Oliveira, M. S.
63
____/____/____
f(x)dx = P(a x b)
a
Oliveira, D. C. R. e Oliveira, M. S.
64
____/____/____
Exemplo: Um fabricante de televiso a cores oferece uma garantia de 1 ano para substituio
gratuita se o tubo de imagem falhar. Ele estima o tempo de falha (em unidades de anos), x, como
uma varivel aleatria contnua com a seguinte fdp
1 x
f (x) = e 4 , x > 0
4
= 0, caso contrrio
Qual a probabilidade de voc comprar a televiso e necessitar de uma substituio gratuita?
1
1
P( x 1) = e 4 dx =
4
0
0,2
f ( x )dx = 1
(c) P(a X b) = rea sob a funo densidade de probabilidade f(x) e acima do eixo x entre os
pontos a e b, isto :
b
P(a X b) = f ( x )dx
a
P(X = x 0 ) = f ( x )dx = 0
x0
Conseqncia:
F( x ) = P(X x ) = f (s)ds
E(X) =
x f (x ) dx
Oliveira, D. C. R. e Oliveira, M. S.
65
____/____/____
Exemplo: Para uma varivel que tm densidade f(x) = 2x, 0<x<1, ento:
1
E (X) = x 2x dx = 2 x 2 dx =
2 31 2
x 0=
3
3
f ( x ) dx
Exemplo: Para uma varivel que tm densidade f(x) = 2x, 0<x<1, ento:
E(X) =
2
3
E (X 2 ) = x 2 2 x dx = 2 x 3 dx =
2 41 2
x 0=
4
4
66
____/____/____
f ( x) =
1
2
1 x
< x<
Oliveira, D. C. R. e Oliveira, M. S.
67
____/____/____
___N(, 12)
___N(, 22)
___N(, 32)
12 < 22< 32
Curvas normais
com mesma mdia,
mas com desvios
padro diferentes.
Clculo de Probabilidades
P(a < X < b)
Oliveira, D. C. R. e Oliveira, M. S.
68
____/____/____
Se X ~ N( ; 2), definimos: Z =
X
.
f(x)
f(z)
a
0 b
Dada a v.a. Z ~N (0;1) podemos obter a v.a. X ~ N (;2) atravs da transformao inversa
X = + Z
Oliveira, D. C. R. e Oliveira, M. S.
69
____/____/____
A(z) = P(Z z) , z 0.
0
0.5000
0.5398
0.5793
0.6179
0.6554
0.6915
0.7257
0.7580
0.7881
0.8159
0.8413
0.8643
0.8849
0.9032
0.9192
0.9332
0.9452
0.9554
0.9641
0.9713
0.9772
0.9821
0.9861
0.9893
0.9918
0.9938
0.9953
0.9965
0.9974
0.9981
0.9987
0.9990
0.9993
0.9995
0.9997
0.9998
0.9998
0.9999
0.9999
1.0000
1
0.5040
0.5438
0.5832
0.6217
0.6591
0.6950
0.7291
0.7611
0.7910
0.8186
0.8438
0.8665
0.8869
0.9049
0.9207
0.9345
0.9463
0.9564
0.9649
0.9719
0.9778
0.9826
0.9864
0.9896
0.9920
0.9940
0.9955
0.9966
0.9975
0.9982
0.9987
0.9991
0.9993
0.9995
0.9997
0.9998
0.9998
0.9999
0.9999
1.0000
Oliveira, D. C. R. e Oliveira, M. S.
2
0.5080
0.5478
0.5871
0.6255
0.6628
0.6985
0.7324
0.7642
0.7939
0.8212
0.8461
0.8686
0.8888
0.9066
0.9222
0.9357
0.9474
0.9573
0.9656
0.9726
0.9783
0.9830
0.9868
0.9898
0.9922
0.9941
0.9956
0.9967
0.9976
0.9982
0.9987
0.9991
0.9994
0.9995
0.9997
0.9998
0.9999
0.9999
0.9999
1.0000
3
0.5120
0.5517
0.5910
0.6293
0.6664
0.7019
0.7357
0.7673
0.7967
0.8238
0.8485
0.8708
0.8907
0.9082
0.9236
0.9370
0.9484
0.9582
0.9664
0.9732
0.9788
0.9834
0.9871
0.9901
0.9925
0.9943
0.9957
0.9968
0.9977
0.9983
0.9988
0.9991
0.9994
0.9996
0.9997
0.9998
0.9999
0.9999
0.9999
1.0000
4
0.5160
0.5557
0.5948
0.6331
0.6700
0.7054
0.7389
0.7704
0.7995
0.8264
0.8508
0.8729
0.8925
0.9099
0.9251
0.9382
0.9495
0.9591
0.9671
0.9738
0.9793
0.9838
0.9875
0.9904
0.9927
0.9945
0.9959
0.9969
0.9977
0.9984
0.9988
0.9992
0.9994
0.9996
0.9997
0.9998
0.9999
0.9999
0.9999
1.0000
70
5
0.5199
0.5596
0.5987
0.6368
0.6736
0.7088
0.7422
0.7734
0.8023
0.8289
0.8531
0.8749
0.8944
0.9115
0.9265
0.9394
0.9505
0.9599
0.9678
0.9744
0.9798
0.9842
0.9878
0.9906
0.9929
0.9946
0.9960
0.9970
0.9978
0.9984
0.9989
0.9992
0.9994
0.9996
0.9997
0.9998
0.9999
0.9999
0.9999
1.0000
6
0.5239
0.5636
0.6026
0.6406
0.6772
0.7123
0.7454
0.7764
0.8051
0.8315
0.8554
0.8770
0.8962
0.9131
0.9279
0.9406
0.9515
0.9608
0.9686
0.9750
0.9803
0.9846
0.9881
0.9909
0.9931
0.9948
0.9961
0.9971
0.9979
0.9985
0.9989
0.9992
0.9994
0.9996
0.9997
0.9998
0.9999
0.9999
0.9999
1.0000
7
0.5279
0.5675
0.6064
0.6443
0.6808
0.7157
0.7486
0.7794
0.8078
0.8340
0.8577
0.8790
0.8980
0.9147
0.9292
0.9418
0.9525
0.9616
0.9693
0.9756
0.9808
0.9850
0.9884
0.9911
0.9932
0.9949
0.9962
0.9972
0.9979
0.9985
0.9989
0.9992
0.9995
0.9996
0.9997
0.9998
0.9999
0.9999
0.9999
1.0000
8
0.5319
0.5714
0.6103
0.6480
0.6844
0.7190
0.7517
0.7823
0.8106
0.8365
0.8599
0.8810
0.8997
0.9162
0.9306
0.9429
0.9535
0.9625
0.9699
0.9761
0.9812
0.9854
0.9887
0.9913
0.9934
0.9951
0.9963
0.9973
0.9980
0.9986
0.9990
0.9993
0.9995
0.9996
0.9997
0.9998
0.9999
0.9999
0.9999
1.0000
9
0.5359
0.5753
0.6141
0.6517
0.6879
0.7224
0.7549
0.7852
0.8133
0.8389
0.8621
0.8830
0.9015
0.9177
0.9319
0.9441
0.9545
0.9633
0.9706
0.9767
0.9817
0.9857
0.9890
0.9916
0.9936
0.9952
0.9964
0.9974
0.9981
0.9986
0.9990
0.9993
0.9995
0.9997
0.9998
0.9998
0.9999
0.9999
0.9999
1.0000
____/____/____
d) P(Z 1,5)
e) P(Z -1,3)
f) P(-1,5 Z 1,5)
i) P(-1 Z 2)
Oliveira, D. C. R. e Oliveira, M. S.
71
____/____/____
Exemplo: Seja X o gasto com lanche semanal. Aps estudar esta varivel, vimos que X ~ N (20, 64),
ento obtenha:
a) P(16 < X < 22) =
b) P(X < 18 ou X > 24) = P(X < 18) + P(X > 24) =
Oliveira, D. C. R. e Oliveira, M. S.
72
____/____/____
Calcule:
a) k tal que P( X k) = 0,05
73
____/____/____
Lista de Exerccios 2
Exerccio 01
Sendo A e B dois eventos de um mesmo espao amostral, traduza para a linguagem da teoria dos
conjuntos as seguintes situaes:
(a) Pelo menos um dos eventos ocorre.
(b) Exatamente um dos eventos ocorre.
(c) Nenhum dos eventos ocorre.
(d) A ocorre, mas B no ocorre.
Exerccio 02
Dois processadores, A e B, so colocados em teste por 50 mil horas. A probabilidade de um erro
acontecer em A 2/60, em B 1/80 e em ambos 1/100. Calcule a probabilidade de que:
(a) Pelo menos um processador apresente erro.
(b) Nenhum apresente erro.
(c) Somente A apresente erro.
Exerccio 03
A probabilidade de que um homem que possui veculo motorizado se acidente num perodo de um
ano de 0,113 e uma mulher que tenha um veculo motorizado se acidente num perodo de um ano
de 0,057. Suponha que 55% dos motoristas em Lucas Country sejam homens. No preenchimento
de um questionrio de histrico sobre desempenho ao volante, uma pessoa de Lucas Country
indicou um envolvimento em acidente com veculo motorizado durante o ltimo ano. Qual a
probabilidade de essa pessoa ser uma mulher?
Exerccio 04
Um pai leva o filho ao cinema e gasta R$15,00 nas duas entradas. O filho vai pedir para comer
pipoca com probabilidade 0,7 e pedir para comer bala com probabilidade 0,9. Os pedidos so
atendidos pelo pai com probabilidade 0,5 independentemente. Se a pipoca custa R$2,00 e a bala
R$3,00 estude a varivel aleatria despesa efetuada com a ida ao cinema construindo sua
distribuio de probabilidade.
Exerccio 05
Suponha que a probabilidade de que um item produzido por uma mquina seja defeituoso de 0,2.
Se 4 itens so produzidos por esta mquina so selecionados ao acaso, qual a probabilidade de que
no mais do que um item defeituoso seja encontrado?
Exerccio 06
Na manufatura de certo artigo, sabido que a proporo de artigos defeituosos de 0,1. Qual a
probabilidade de que uma amostra casual de tamanho 5 contenha:
(a) nenhum defeituoso:
(b) exatamente um defeituoso:
(c) no mais que 2 defeituosos:
Oliveira, D. C. R. e Oliveira, M. S.
74
____/____/____
Exerccio 07
De acordo com o Beverage Digest, a Coca Cola e a Pepsi se posicionaram como a nmero um e a
nmero dois em vendas em 1996 (The Wall Street Journal Almanac, 1998). Suponha que de um
grupo de 10 indivduos, 6 prefiram a Coca Cola e 4 prefiram a Pepsi. Uma amostra aleatria sem
reposio de 3 desses indivduos selecionada.
(a)
Qual a probabilidade de que exatamente dois prefiram a Coca Cola?
(b)
Qual a probabilidade de que a maioria (tanto dois como trs) prefira Pepsi?
Exerccio 08
Dos 25 estudantes (14 meninos e 11 meninas) na sala de aula de uma escola, 5 estudantes estavam
ausentes na quinta-feira.
(a) Qual a probabilidade de que 2 dos ausentes fossem meninas?
(b) Qual a probabilidade de que 2 dos ausentes fossem meninos?
(c) Qual a probabilidade de que todos os ausentes fossem meninos?
(d) Qual a probabilidade de que nenhum dos ausentes fosse um menino?
Exerccio 09
Num certo tipo de fabricao de fita magntica, ocorrem cortes a uma taxa de um por 2000 ps.
Qual a probabilidade de que um rolo com 2000 ps de fita magntica tenha:
(a) nenhum corte;
(b) no mximo 3 cortes;
(c) pelo menos dois cortes.
Exerccio 10
Os passageiros de uma linha area chegam s instalaes de passageiros de um grande aeroporto
internacional a uma taxa mdia de 10 por minuto.
(a)
Qual a probabilidade de nenhuma chegada em 1 minuto?
(b)
Qual a probabilidade de que 3 passageiros ou menos cheguem em um perodo de 1
minuto?
Qual a probabilidade de nenhuma chegada em um perodo de 15 minutos?
(c)
Exerccio 11
Depois de tomarmos vrias amostras, decidiu-se adotar um modelo para as medidas do permetro
do trax de uma populao de homens adultos com os parmetros: mdia = 40 polegadas e desvio
padro = 2 polegadas.
(a) Qual a probabilidade de um indivduo sorteado desta populao ter um permetro de trax
entre 40 e 43 polegadas?
(b) Qual a probabilidade de um indivduo sorteado desta populao ter um permetro de trax
maior ou igual a 43 polegadas?
(c) Qual a probabilidade de um indivduo sorteado desta populao ter um permetro de trax
menor que 35 polegadas?
(d) Qual o valor do trax que seria ultrapassado por 25% da populao?
Oliveira, D. C. R. e Oliveira, M. S.
75
____/____/____
Exerccio 12
Considere a altura de 351 mulheres idosas como seguindo uma distribuio normal com mdia =
160 cm e desvio padro = 6 cm. Sorteia-se uma mulher, qual a probabilidade de que ela tenha:
(a) Altura entre 160 cm e 165 cm?
(b) Altura menor do que 145 cm?
(c) Altura maior do que 170 cm?
Exerccio 13
O dimetro X de rolamentos de esfera fabricados por certa fbrica tem distribuio Normal com
mdia = 0,6140 e varincia = (0,0025)2. O lucro T de cada esfera depende de seu dimetro, e:
T = 0,10 se a esfera boa (0,6100 < X < 0,6180);
T = 0,05 se a esfera recupervel (0,6080 < X < 0,6100 ou 0,6180 < X < 0,6200);
T = - 0,10 se a esfera defeituosa (X < 0,6080 ou X > 0,62). Calcular:
(a) As probabilidades das esferas serem boas, recuperveis e defeituosas.
(b) A esperana do lucro ( E(T) ).
Oliveira, D. C. R. e Oliveira, M. S.
76
____/____/____
12. ESTIMAO
12.1. Inferncia Estatstica
A tomada de decises sobre a populao com base em estudos feitos sobre os dados da
amostra constitui o problema central da Inferncia Estatstica. A tais decises esto sempre
associados um grau de incerteza e, conseqentemente, uma probabilidade de erro. A generalizao
da amostra para a populao feita com o auxlio de um modelo estatstico para a situao em
estudo.
Parmetro:
Exemplos:
Conceitos Importantes
qualquer funo da populao ().
P (proporo), (mdia), 2 (varincia).
Exemplos:
Estimativa:
Exemplos:
Estatstica ou Estimador:
Estimador Pontual
O estimador pontual para p (proporo amostral) definido por:
X
P =
n
sendo que
X denota o nmero de elementos na amostra que apresentam a caracterstica;
n denota o tamanho da amostra coletada.
O valor assumido por p na amostra denominado estimativa pontual para p.
Oliveira, D. C. R. e Oliveira, M. S.
77
____/____/____
Exemplo: Sejam, p: proporo de alunos da UFSJ que foram ao cinema pelo menos uma vez no
ltimo ms, e X: nmero de estudantes que respondem sim em uma pesquisa com n
entrevistados. Suponha que foram entrevistados n = 500 estudantes e que, desses, x = 100 teriam
afirmado que foram ao cinema pelo menos uma vez no ltimo ms. A estimativa pontual
(proporo amostral) dada por: p = ( x / n ) = (100 / 500 ) = 0 , 20 , ou seja, 20% dos estudantes
entrevistados afirmaram que foram ao cinema pelo menos uma vez no ltimo ms.
Note que, outra amostra de mesmo tamanho pode levar a uma outra estimativa pontual para
p.
Estimativa Intervalar
Idia: Se selecionarmos vrias amostras de uma populao contendo n dados, observaremos que
cada amostra ter sua respectiva proporo. A fim de obtermos uma estimativa da proporo da
populao em estudo com certo grau de confiabilidade, recorremos a um intervalo de confiana,
que delimita essa proporo.
A estimativa por intervalo de p corresponde a um intervalo determinado da seguinte
maneira:
[ p
; p + ] ,
p (1 p )
p (1 p )
; p + z
IC (p,) = p z
n
n
p (1 p )
. O valor de z obtido da distribuio normal padro. Assim, os valores
n
de z que limitam os nveis de confiana, onde z tal que = P(-z Z z) na N (0,1) so:
Note que, = z
90%
95%
99%
Exemplos
1) No exemplo da UFSJ, considere agora, n = 500 e p = 0,20 . Construa um intervalo de confiana
para p com coeficiente de confiana = 0,95.
Resoluo: Como = 0,95 fornece z = 1,96, o intervalo dado por:
0,20 x0,80
0,20 x0,80
p (1 p )
p (1 p )
; p + z
; 0,20 + 1,96
p z
= 0,20 1,96
= [0,165; 0,235]
n
500
500
n
Nesse intervalo (=0,95), a estimativa pontual para p 0,20, com um erro amostral igual a
0,035.
78
____/____/____
n
p (1 p )
0,03 500
0,2 x0,8
= 1,68
Logo, obtemos:
2 A(z) 1 = 2 A(1,68) 1 = 2 x 0,953 1 = 0,906 (90,6 %).
Portanto a probabilidade da estimativa pontual estar a uma distncia de no mximo 0,03 da
verdadeira proporo de 90,6 %.
79
____/____/____
Obtemos, ento, uma amostra aleatria de tamanho n de X, que representamos por X1, X2, ..., Xn.
Uma estimador pontual para dado pela mdia amostral,
X=
X1 + X 2 + K + X n
=
n
i =1
Xi
n
Estimativa Intervalar
Se selecionarmos vrias amostras de uma populao contendo n dados, observaremos que cada
amostra ter sua respectiva mdia. A fim de obtermos uma estimativa da mdia da populao em
estudo com certo grau de confiabilidade, recorremos a um intervalo de confiana, que delimita essa
mdia.
Uma estimador intervalar ou intervalo de confiana para tem a forma:
[X ; X + ]
2
X ~ N ,
n
Portanto, para n grande a mdia amostral tem distribuio Normal de mdia e desvio padro
/ n
Na prtica, temos que o intervalo de confiana para com um nvel de confiana dado
por:
x z n ; x + z n
10
10
;X + z
;8 + 1,96
X z
= 8 1,96
= [8 1,96 ;8 + 1,96 ] = [6,04 ;9,96 ]
n
n
100
100
80
____/____/____
Exemplo: Deseja-se estimar o tempo mdio de estudo (em anos) da populao adulta de um
municpio. Sabe-se que o tempo de estudo tem distribuio normal com desvio padro = 2,6
anos. Foram entrevistados n = 25 indivduos, obtendo-se para essa amostra, um tempo mdio de
estudo igual h 10,5 anos. Obter um intervalo de 90% de confiana para o tempo mdio de estudo
populacional.
X: tempo de estudo, em anos
X ~ N(, 2,62)
n = 25 x = 10,5 anos
= 0,90 z=1,65
A estimativa intervalar com 90% de confiana dada por:
2 ,6
2 ,6
;X + z
;10 ,5 + 1,65
X z
= 10 ,5 1,65
= [9 ,64 ;11,36 ]
n
n
25
25
S2 =
n
1
( X i X )2
( n 1) i =1
Oliveira, D. C. R. e Oliveira, M. S.
81
s2
____/____/____
Graus de Liberdade
Graus de Liberdade
p = 90%
0,158
0,142
0,137
0,134
0,132
80%
0,325
0,289
0,277
0,271
0,267
70%
0,510
0,445
0,424
0,414
0,408
60%
0,727
0,617
0,584
0,569
0,559
50%
1,000
0,816
0,765
0,741
0,727
40%
1,376
1,061
0,978
0,941
0,920
30%
1,963
1,386
1,250
1,190
1,156
20%
3,078
1,886
1,638
1,533
1,476
10%
6,314
2,920
2,353
2,132
2,015
5%
12,706
4,303
3,182
2,776
2,571
4%
15,894
4,849
3,482
2,998
2,756
2%
31,821
6,965
4,541
3,747
3,365
1%
63,657
9,925
5,841
4,604
4,032
6
7
8
9
10
0,131
0,130
0,130
0,129
0,129
0,265
0,263
0,262
0,261
0,260
0,404
0,402
0,399
0,398
0,397
0,553
0,549
0,546
0,543
0,542
0,718
0,711
0,706
0,703
0,700
0,906
0,896
0,889
0,883
0,879
1,134
1,119
1,108
1,100
1,093
1,440
1,415
1,397
1,383
1,372
1,943
1,895
1,860
1,833
1,812
2,447
2,365
2,306
2,262
2,228
2,612
2,517
2,449
2,398
0,359
3,143
2,998
2,896
2,821
2,764
3,707
3,499
3,355
3,250
3,169
6
7
8
9
10
11
12
13
14
15
0,129
0,128
0,128
0,128
0,128
0,260
0,259
0,259
0,258
0,258
0,396
0,395
0,394
0,393
0,393
0,540
0,539
0,538
0,537
0,536
0,697
0,695
0,694
0,692
0,691
0,876
0,873
0,870
0,868
0,866
1,088
1,083
1,079
1,076
1,074
1,363
1,356
1,350
1,345
1,341
1,796
1,782
1,771
1,761
1,753
2,201
2,179
2,160
2,145
2,131
2,328
2,303
2,282
2,264
2,248
2,718
2,681
2,650
2,624
2,602
3,106
3,055
3,012
2,977
2,947
11
12
13
14
15
16
17
18
19
20
0,128
0,128
0,127
0,127
0,127
0,258
0,257
0,257
0,257
0,257
0,392
0,392
0,392
0,391
0,391
0,535
0,534
0,534
0,533
0,533
0,690
0,689
0,688
0,688
0,687
0,865
0,863
0,862
0,861
0,860
1,071
1,069
1,067
1,066
1,064
1,337
1,333
1,330
1,328
1,325
1,746
1,740
1,734
1,729
1,725
2,120
2,110
2,101
2,093
2,086
2,235
2,224
2,214
2,205
2,197
2,583
2,567
2,552
2,539
2,528
2,921
2,898
2,878
2,861
2,845
16
17
18
19
20
21
22
23
24
25
0,127
0,127
0,127
0,127
0,127
0,257
0,256
0,256
0,256
0,256
0,391
0,390
0,390
0,390
0,390
0,532
0,532
0,532
0,531
0,531
0,686
0,686
0,685
0,685
0,684
0,859
0,858
0,858
0,857
0,856
1,063
1,061
1,060
1,059
1,058
1,323
1,321
1,319
1,318
1,316
1,721
1,717
1,714
1,711
1,708
2,080
2,074
2,069
2,064
2,060
2,189
2,183
2,177
2,172
2,166
2,518
2,508
2,500
2,492
2,485
2,831
2,819
2,807
2,797
2,787
21
22
23
24
25
26
27
28
29
30
0,127
0,127
0,127
0,127
0,127
0,256
0,256
0,256
0,256
0,256
0,390
0,389
0,389
0,389
0,389
0,531
0,531
0,530
0,530
0,530
0,684
0,684
0,684
0,683
0,683
0,856
0,855
0,855
0,854
0,854
1,058
1,057
1,056
1,055
1,055
1,315
1,314
1,313
1,311
1,310
1,706
1,703
1,701
1,699
1,697
2,056
2,052
2,048
2,045
2,042
2,162
2,158
2,154
2,150
2,147
2,479
2,473
2,467
2,462
2,457
2,779
2,771
2,763
2,756
2,750
26
27
28
29
30
35
40
50
60
120
0,126
0,126
0,126
0,126
0,126
p = 90%
0,255
0,255
0,254
0,254
0,254
80%
0,388
0,388
0,387
0,387
0,386
70%
0,529
0,529
0,528
0,527
0,526
60%
0,682
0,681
0,679
0,679
0,677
50%
0,852
0,851
0,849
0,848
0,845
40%
1,052
1,050
1,047
1,045
1,041
30%
1,306
1,303
1,299
1,296
1,289
20%
1,690
1,684
1,676
1,671
1,658
10%
2,030
2,021
2,009
2,000
1,980
5%
2,133
2,123
2,109
2,099
2,076
4%
2,438
2,423
2,403
2,390
2,358
2%
2,724
2,704
2,678
2,660
2,617
1%
35
40
50
60
120
Exemplo:
1) Para n = 11 e p = 10%,
3) Para n = 11 e p = 1%,
temos t =
temos t =
2) Para n = 11 e p = 5%,
4) Para n = 20 e p = 15%,
1
2
3
4
5
Graus de Liberdade
Graus de Liberdade
1
2
3
4
5
temos t =
temos t =
s
s
x t n ; x + t n
A varivel t bem prxima da normal padro z quando a amostra maior ou igual a 25,
Oliveira, D. C. R. e Oliveira, M. S.
82
____/____/____
porm para amostras menores que esse valor essa varivel vai se afastando de z e, quanto menor
for o valor de n, maior o afastamento existente entre a varivel t e z.
A tabela que fornece os valores de t, contm na 1a. linha, a rea locada nas caudas da curva,
esquerda de t e direita de t. Na 1a. coluna, est os graus de liberdade (n-1). Na interseo dos
valores considerados, temos os valores de t correspondente.
Exemplo: Qual o intervalo de confiana para a mdia, no nvel de 95%, sendo que uma amostra de
tamanho 20 forneceu mdia 38 e desvio padro 5?
Soluo:
x = 38 , n = 20, s = 5. No nvel de 95%, obtemos o valor de t cruzando na tabela da t Student: p =
5% e gl = n-1 = 20-1 = 19 t = 2,093. Assim:
s
s
5
5
IC[, 95%] = x t
, x+t
, 38 + 2,093
= [35.66 , 40.34]
= 38 2,093
n
n
20
20
Exemplo: Estabelea limites de confiana para a mdia, no nvel de 90%, sendo que uma amostra
de tamanho 16 forneceu mdia 70 e desvio padro 6,8?
Soluo:
Temos que x = 70 , n = 16, s = 6,8 e para um nvel de 90%, obtemos o valor de t cruzando na
tabela da t Student: p = 10% e gl = n-1 = 16-1 = 15 t = 1,753. Assim:
6,8
6,8
s
s
, x +t
, 70 + 1,753
IC[ , 90%] = x t
= 70 1,753
= [ 67.02 , 72.98]
16
16
n
n
Oliveira, D. C. R. e Oliveira, M. S.
83
____/____/____
versus
Teste de Hipteses
A moeda honesta ou
desequilibrada?
Qual a proporo de
motoristas que tiveram sua
carteira apreendida aps a
vigncia da nova lei de trnsito?
13.1. Introduo
Quando colhemos uma amostra de uma determinada populao, nosso objetivo tirar
concluses sobre os parmetros dessa populao. Assim, a partir das informaes amostrais
estimamos os parmetros da populao.
Entretanto, se existe algum referencial sobre valores que os parmetros de uma populao
devem assumir, podemos testar hipteses, formuladas sobre esses parmetros, de conformidade
com as informaes obtidas da amostra. Igualmente, pode-se testar a hiptese de que uma amostra
pertence a uma populao de parmetros dados ou ainda, se duas populaes tm parmetros
iguais.
13.2. Formulao das Hipteses
Para testarmos parmetros de uma populao, formulamos hipteses a respeito desses
parmetros. Essas hipteses so denominadas:
H0: Hiptese nula
Ha: Hiptese alternativa
Testar hipteses formuladas consiste em decidir se aceita ou se rejeita a hiptese nula (H0).
Quando se rejeita a hiptese nula, automaticamente est sendo aceita a hiptese alternativa (Ha).
Exemplo: Numa amostra de 100 peas produzidas por uma mquina foram encontradas 4
defeituosas. A proporo de peas defeituosas p =0,05?
Testes de Hipteses possveis:
a) H0: p = 0,05
Ha: p 0,05
Teste Bilateral
b) H0: p = 0,05
Ha: p > 0,05
Teste unilateral direita
c) H0: p = 0,05
Ha: p < 0,05
Teste unilateral esquerda
Oliveira, D. C. R. e Oliveira, M. S.
84
____/____/____
Regio de
Aceitao
Regio Crtica
Concluso do Teste de Hipteses: Como zobs = 0,5103 < z = 1,64, no conseguimos rejeitar H0,
isto , aceita-se a hiptese de que a proporo de peas defeituosas igual a 0,03.
Oliveira, D. C. R. e Oliveira, M. S.
85
____/____/____
Exemplo 2: Numa amostra de 100 peas produzidas por uma mquina foram encontradas 3
defeituosas. Testar ao nvel de significncia de 5%, a hiptese de que a proporo de peas
defeituosas p = 0,08 ou menor.
Soluo:
Hipteses:
H0: p = 0,08
H: p < 0,08 (curva unilateral esquerda)
Regra de deciso para Nvel de Significncia = 0,05:
Regio de
Aceitao
0,05
Regio Crtica
Para um nvel de significncia de 0,05 temos que z = - 1,64. O valor de z observado na amostra :
0,05
p p
0,03 0,08
zobs =
=
=
1,84
p(1 p)
0,08(1 0,08)
0,0736
n
100
100
Concluso do Teste de Hipteses: Como zobs = -1,84 < z = -1,64, ento rejeito H0, ou seja, h
indcios de que a proporo de peas defeituosas menor que 0,08.
Exemplo 3: Numa amostra de 100 peas produzidas por uma mquina foram encontradas 4
defeituosas. Testar ao nvel de significncia de 5%, a hiptese de que a proporo de peas
defeituosas p = 0,05 ou diferente.
Soluo:
Hipteses:
H0: p = 0,05
Ha: p 0,05 (teste bilateral)
Regra de deciso para Nvel de Significncia = 0,05:
0,025
0,025
Regio de Aceitao
Regies Crticas
Considerando o nvel de significncia de 5%, temos que os zs que fornecem as reas cinza
representada na figura acima, z = - 1,96 e z= 1,96. O valor de z observado na amostra :
Oliveira, D. C. R. e Oliveira, M. S.
86
____/____/____
0,01
0,04 0,05
p p
=
=
0,46
0,05 . 0,95
0,05(1 0,05)
p(1 p)
100
100
n
Concluso do Teste de Hipteses: Como z = -1,96 < zobs = -0,46 < z = 1,96, ento no rejeitamos
H0, isto , aceito a hiptese de que a proporo de peas defeituosas igual a 0,05.
zobs =
2) Um contador acredita que os problemas de fluxo de caixa de uma empresa so o resultado direto
do lento recebimento das contas a receber. O contador afirma que pelo menos 70% das atuais
contas a receber tm mais de dois meses de idade. Uma amostra de 120 contas a receber mostrou
que 78 tm mais do que dois meses de idade. Teste a afirmao do contador a um nvel de
significncia de 5%.
Oliveira, D. C. R. e Oliveira, M. S.
87
____/____/____
Versus
Teste de Hipteses
As caixinhas de leite da marca A tm em
mdia 1 litro de leite ou mais?
O peso mdio das mulheres que esto no
quarto perodo de Administrao na
UFSJ igual a 60 kg ou diferente?
b) H0: = 0,5
Ha: > 0,5
c) H0: = 0,5
Ha: < 0,5
Zobs
n
Regio de
Aceitao
Regio Crtica
Concluso do Teste de Hipteses: Como zobs = 2,65 > z = 1,64, ento rejeito H0, isto , aceito a
hiptese de que a mdia da populao maior que 40.
Oliveira, D. C. R. e Oliveira, M. S.
88
____/____/____
zobs =
42 44 42 44 2
=
=
= 1
12
12
2
6
36
Regio de
Aceitao
0,05
Regio Crtica
Concluso do Teste de Hipteses: Como zobs = -1 > z = -1,64, ento aceito H0, isto , aceito a
hiptese de que a mdia da populao igual a 44.
Exemplo 3: Uma amostra de 36 elementos de uma varivel X normalmente distribuda forneceu
mdia x = 40. Sabendo que o desvio padro populacional = 12. Testar ao nvel de significncia
de 5%, a hiptese de que a mdia diferente de 40.
Hipteses:
H0: = 40
Ha: 40 (teste bilateral)
12
12
2
6
n
36
0,025
0,025
Regio de Aceitao
Regies Crticas
Concluso do Teste de Hipteses: Como z = -1,96 < zobs = 0 < z = 1,96, ento aceito H0, isto ,
aceito a hiptese de que a mdia da populao igual a 40.
Oliveira, D. C. R. e Oliveira, M. S.
89
____/____/____
2) Sabe-se que o consumo mensal per capita de um determinado produto tem distribuio normal,
com desvio padro (conhecido) 2 kg. A diretoria de uma firma que fabrica esse produto resolveu
que retiraria o produto da linha de produo se a mdia de consumo per capita fosse menor que 8
kg. Caso contrrio, continuaria a fabric-lo. Foi realizada uma pesquisa de mercado, tomando-se
uma amostra de 25 indivduos, e verificou-se um consumo mensal mdio de x = 7,2. Construa um
teste de hiptese adequado, utilizando um nvel de significncia de 5%, e com base na amostra
colhida, determine a deciso a ser tomada pela diretoria da firma.
Oliveira, D. C. R. e Oliveira, M. S.
90
____/____/____
Concluso do Teste de Hipteses: Como tobs = 1 < t = 1,860, ento aceito H0, isto , aceito a
hiptese de que a mdia da populao igual a 40.
Exemplo 2: Uma nova amostra de 16 cigarros da mesma marca forneceu mdia x = 40 mg e
desvio padro s = 4 mg. Testar ao nvel de significncia de 5%, a hiptese de que a mdia menor
que 44 mg.
Soluo:
Hipteses:
H0: = 44
Ha: < 44 (curva unilateral esquerda)
Nvel de significncia de 5%, obtemos na Tabela da t-Student o t que fornece a rea cinza de 0,05,
representada na figura.
Graus de liberdade: n 1 = 16 1 = 15.
Se o teste tiver cauda unilateral esquerda: p = 2 x = 2 x 0,05 = 0,10 = 10%. Ento: t = 1,753.
x 40 44 4 4
Valor de t observado na amostra:
tobs =
=
=
=
= 4
s
4
4
1
4
n
16
Oliveira, D. C. R. e Oliveira, M. S.
91
____/____/____
Concluso do Teste de Hipteses: Como tobs = -4 < t = -1,860, ento rejeito H0, isto , aceito a
hiptese de que a mdia da populao menor que 44.
Exemplo 3: Outra amostra de 16 cigarros forneceu mdia x = 42 mg e desvio padro s = 4 mg.
Testar ao nvel de significncia de 5%, a hiptese de que a mdia diferente de 40.
Hipteses:
H0: = 40
Ha: 40 (teste bilateral)
Nvel de significncia de 5%, obtemos na Tabela da t-Student o t que fornece a rea cinza de 0,05,
representada na figura.
Graus de liberdade: n 1 = 16 1 = 15.
Se o teste tiver cauda bilateral: p = = 0,05 = 5%. Ento: t = -2,131 e t = 2,131.
x 42 40 2 2
Valor de t observado na amostra:
tobs =
=
= = =2
s
4
4 1
4
n
16
Regio de Aceitao
Regio de Rejeio
Concluso do Teste de Hipteses: Como t = -2,131 < tobs = 2 < t = 2,131, ento aceito H0, isto ,
aceito a hiptese de que a mdia da populao igual a 40.
Oliveira, D. C. R. e Oliveira, M. S.
92
____/____/____
2) A experincia de muitos anos de uso de uma lmpada, da marca A, tem mostrado que sua vida
mdia de = 300 horas. Uma amostra de n = 9 lmpadas de uma nova marca B deu uma vida
mdia de x = 290 horas com desvio padro de s = 6 horas. Testar, ao nvel de significncia de 10%,
se as lmpadas das duas marcas tm a mesma vida mdia ou se a vida mdia da B menor que a da
A.
3) Uma amostra de 16 empregados de uma empresa forneceu os seguintes resultados com relao
s alturas: mdia 173 cm e desvio padro 16 cm. Testar ao nvel de 10% as hipteses de que a
mdia da populao igual ou diferente 175cm.
Oliveira, D. C. R. e Oliveira, M. S.
93
____/____/____
Lista de Exerccios 3
Exerccio 01
Examinando 100 peas produzidas por uma mquina, foram encontradas 3 defeituosas. Obter a
estimativa intervalar, no nvel de 95%, para a proporo de peas defeituosas dessa mquina.
Exerccio 02
Uma amostra de 50 estudantes de uma Universidade mostrou que 8 destes apresentam problemas
visuais. Obter a estimativa intervalar, no nvel de 90%, para a verdadeira percentagem dos
estudantes com problemas visuais.
Exerccio 03
Uma amostra de n = 64 elementos de uma varivel normalmente distribuda forneceu mdia 25,4,
sendo que o desvio padro populacional 5,2. Determine o intervalo de confiana de 90% para a
mdia.
Exerccio 04
Determine o intervalo de confiana de 99% para a mdia do ponto de fuso de uma substncia
qumica, sendo que uma amostra de tamanho n = 9 pontos de fuso desta mesma substncia
forneceu uma mdia 75 e um desvio padro amostral igual a 7.
Exerccio 05: Uma moeda lanada 100 vezes, obteve-se 42 caras. Testar com um nvel de
significncia de 10% a hiptese de que essa moeda viciada.
Exerccio 06: Uma amostra de 50 alunos de uma escola de 1o grau apresentou 3 canhotos. Testar,
ao nvel de significncia 10%, a hiptese de que a percentagem de alunos canhotos dessa escola
diferente de 0,05.
Exerccio 07: Sabe-se que o consumo mensal per capita de um determinado produto tem
distribuio normal, com desvio padro 2 kg. A diretoria de uma firma que fabrica esse produto
resolveu que retiraria o produto da linha de produo se a mdia de consumo per capita fosse
menor que 8 kg. Caso contrrio, continuaria a fabric-lo. Foi realizada uma pesquisa de mercado,
tomando-se uma amostra de 25 indivduos, e verificou-se um consumo mensal mdio de x = 7,2.
Construa um teste de hiptese adequado, utilizando um nvel de significncia de 5%, e com base na
amostra colhida, determine a deciso a ser tomada pela diretoria.
Exerccio 08: A experincia de muitos anos de uso de uma lmpada, da marca A, tem mostrado
que sua vida mdia de = 300 horas. Uma amostra de n = 9 lmpadas de uma nova marca B deu
uma vida mdia de x = 290 horas com desvio padro de s = 6 horas. Testar, ao nvel de
significncia de 10%, se as lmpadas das duas marcas tm a mesma vida mdia ou se a vida mdia
da B menor que a da A.
Exerccio 09: Uma amostra de 16 empregados de uma empresa deu os seguintes resultados com
relao s alturas: mdia 173 cm e desvio padro 16 cm. Testar ao nvel de 10% as hipteses de que
a mdia da populao igual ou diferente 175cm.
Observao: O gabarito da Lista de Exerccios 3 encontra-se no Apndice C
Oliveira, D. C. R. e Oliveira, M. S.
94
____/____/____
APNDICE A
Gabarito da Lista de Exerccios 1
1) Populao: eleitores brasileiros.
2) (a) Qualitativa Ordinal; (b) Qualitativa Nominal; (c) Quantitativa Discreta; (d) Quantitativa Contnua.
3) Aleatria Simples: 61, 09, 26, 29, 11, 77, 79, 04, 57, 59.
Sistemtica:N/n = 80/10 = 8; x = 6; Amostra: 6, 14, 22, 30, 38, 46, 54, 62, 70, 78.
Estratificada: Mulheres (4): 09, 26, 29, 11. Homens (6): 09, 26, 29, 11, 04, 02.
4) Zonas: 045, 020, 099, 033, 197, 166, 040, 005, 038, 115, 041, 173, 030, 025, 123.
5) (a)
Tabela: Conceitos obtidos de 60 alunos na disciplina de Estatstica na Escola E
Conceitos
Freqncia Absoluta
Proporo
Porcentagem
timo
03
0,05
05,0
Bom
22
0,367
36,7
Mdio
25
0,417
41,7
Ruim
10
0,166
16,6
Total
60
1
100
Interpretao: Podemos observar na Tabela acima que a maior proporo dos alunos da Escola E obtiveram conceito
Mdio na disciplina Estatstica (42%) e apenas 5% conquistaram o conceito timo. Alm disso, 37% concluram com
conceito Bom e 16% com conceito Ruim.
(b)
25
25
22
Frequncia Absoluta
20
15
10
10
tim o
Bom
Mdio
Ruim
Conce it o
Figura: Grfico de Barras para os Conceitos obtidos na disciplina de Estatstica de 60 alunos da Escola E.
Oliveira, D. C. R. e Oliveira, M. S.
95
____/____/____
R
16,7%
B
36,7%
O
5,0%
M
41,7%
Figura: Grfico de Composio em Setores para os Conceitos obtidos na disciplina de Estatstica de 60 alunos da
Escola E. (O : timo; B : Bom; M : Mdio; R : Ruim)
100
Freqncia Absoluta
50
80
40
60
30
40
20
20
10
0
Conceitos
Count
Percent
Cum %
Mdio
25
41,7
41,7
Bom
22
36,7
78,3
Ruim
10
16,7
95,0
timo
3
5,0
100,0
Porcentagem Acumulada
60
Figura: Grfico de Pareto para os Conceitos obtidos na disciplina de Estatstica de 60 alunos da Escola E.
Oliveira, D. C. R. e Oliveira, M. S.
96
____/____/____
6) (a) mnimo = 10; mximo = 22; mdia = 16,913; moda = 14.1, 16, 16.9, 19.5, 22; mediana = 16,9; Q1 = 15,0; Q3 = 19,5.
(b) amplitude = 12; varincia = 8,296; desvio-padro = 2,88; intervalo-interquartil = 4,5.
(c)
Tabela: Comprimento de 31 canos PVC vendidos em uma loja de material de construo
Comprimento
Freqncia Absoluta
Proporo
Porcentagem
Densidade
[10, 12)
1
0,0322581
3,2
0,0161290
[12, 14)
3
0,0967742
9,7
0,0483871
[14, 16)
6
0,1935480
19,4
0,0967742
[16, 18)
10
0,3225810
32,2
0,1612900
[18, 20)
6
0, 1935480
19,4
0,0967742
[20, 22]
5
0,1612907
16,1
0,0806452
Total
31
1
100
-----Interpretao: A maior parte dos canos tem comprimento entre 16 e 18m (32,2%), ....(descrever a coluna da
porcentagem)
(d)
0,18
0,16129
0,16
0,14
Densidade
0,12
0,0967742
0,10
0,0967742
0,0806452
0,08
0,06
0,0483871
0,04
0,016129
0,02
0,00
10
12
14
16
Comprimento
18
20
22
Figura: Histograma do comprimento de 31 canos PVC vendidos em uma loja de material de construo.
(e)
10
11
12
13
14
15
16
17
Compriment o
18
19
20
21
22
Figura: Diagrama de disperso unidimensional do comprimento de 31 canos PVC vendidos em uma loja de material de
construo.
Oliveira, D. C. R. e Oliveira, M. S.
97
____/____/____
22
20
Comprimento
18
16
14
12
10
Figura: Box-plot do comprimento de 31 canos PVC vendidos em uma loja de material de construo.
1 10 0
1 11
3 12 35
4 13 8
7 14 117
10 15 035
(7) 16 0013799
14 17 049
11 18 28
9 19 3557
5 20 035
2 21
2 22 00
Figura: Ramo-e-folhas do comprimento de 31 canos PVC vendidos em uma loja de material de construo.
7) a) Mdia = 69,87 e Mediana = 68. A mdia e a mediana foram bem diferentes. Embora 50% dos ndios tenham
pulsao abaixo de 68, os ndios com maior pulsao, fez com que o valor mdio da pulsao fosse maior, isto ,
aproximadamente 70. Quando os valores so distintos da mdia e mediana, implica que os dados so assimtricos.
(conforme mostra o grfico da alternativa (d) desse exerccio)
b) Mnimo = 60, Q1 = 60, Q3 = 76 e Mximo = 88.A menor e a maior pulsao foram 60 e 88, respectivamente. 25%
dos ndios tiveram pulsao inferior a 60 e 25% superior a 76. 50% obtiveram entre 60 e 76.
c) Varincia = 91,12 e Desvio Padro = 9,55. A variabilidade das pulsaes foi de 9,55 em torno do valor mdio da
pulsao.
d)
Freqncia Absoluta
60
64
68
72
P u ls a o
76
80
88
Figura: Grfico de barras das medidas da pulsao de 15 ndios nativos dos Alpes Peruanos.
Oliveira, D. C. R. e Oliveira, M. S.
98
____/____/____
A
B
C
N
De
Cobaias
10
8
8
Mnimo
Mximo
Mdia
Mediana
Q1
Q3
Amplitude
Varincia
Desvio
Padro
IQ
13
12
11
15
14
13
14,2
13,375
12,125
14
13,5
12
13,5
13
11,5
15
14
13
2
2
2
0,622
0,554
0,696
0,789
0,744
0,835
1,5
1
1,5
Embora as medidas de disperso, em geral, mostram que o medicamento C tem maior variabilidade dos dados, as
medidas de posio mostraram que o medicamento C o que fornece menor tempo de cicatrizao do completo
fechamento dos cortes provenientes de cirurgia.
10) (a)
80
Mortes
70
60
50
40
30
65
70
75
Barcos
80
85
Figura: Grfico de Disperso do nmero de peixes-boi mortos versus o nmero de barcos de turismo (em milhares) que
circulam em seu habitat na Flrida-EUA.
Podemos observar visualmente que h uma relao linear positiva entre o nmero de peixes-boi mortos com o nmero
de barcos de turismo (em milhares), isto , quanto mais barcos passar no habitat dos peixes-boi, maior ser o nmero
de mortes.
(b) r 0,922. Podemos notar atravs de r, que a correlao positiva entre X e Y significativa.
(c) Mortes = 2,27*Barcos 113
Oliveira, D. C. R. e Oliveira, M. S.
99
____/____/____
d) r2 = 84,9%. 84,9% da variao do nmero de peixes mortos explicado pelo nmero de barcos (em milhares) que
passam no seu habitat. 15,1% devido a outros fatores que no foram estudados, tais como, substncias qumicas
eliminadas no habitat dos peixe-boi, pescadores, etc.
11) (a)
120
110
Massa
100
90
80
70
60
40
50
60
Idade
70
80
Figura: Grfico de Disperso da idade versus a massa muscular de 18 mulheres com idade entre 40 e 79 anos.
(b) r = 0,837. O valor do coeficiente de correlao indica que as variveis idade e massa muscular esto relacionadas
linearmente de forma negativa, ou seja, quanto maior a idade menor a massa muscular.
(c) Y = 148,197 1,027 X. O coeficiente a = 148,197 (intercepto) no pode ser interpretado, porque a variao de X
no contm o valor 0. O coeficiente b = - 1,027 (inclinao) indica que a cada aumento de um ano na idade, espera um
decrscimo de aproximadamente 1 da massa muscular.
Oliveira, D. C. R. e Oliveira, M. S.
100
____/____/____
APNDICE B
Gabarito da Lista de Exerccios 2
1) (a) (A B)
b) (A Bc) (Ac B)
c) (A B)c
d) (A Bc)
2) a) P(AB) 0,0358
b) P((A B)c) 0,9641
c) P((A Bc)) 0,023
3) P(M|A) = 0,292
4)
X
15
17
18
20
E[X] =
P(X)
0,3575
0,1925
0,2925
0,1575
17,05
5) 0,8192
6) (a) 0,59049
(b) 0,32805
(c) 0,99144
7) (a) 0,5
(b) 0,33333
8) (a) 0,376812 (b) 0,282609
(c) 0,0376812
(d) 0,0086957
9) (a) 0,367879 (b) 0,981011
(c) 0,264242
10) (a) 0,0000454(b) 0,0103361
(c) 0
11) (a) 0,4332
(b) 0,0668
(c) 0,0062
(d) 41,34
12) (a) 0,2967
(b) 0,0062
(c) 0,0475
13) (a) boas: 0,8904
recuperveis: 0,0932
defeituosas: 0,0164
(b) E[T] 0,09
Oliveira, D. C. R. e Oliveira, M. S.
101
____/____/____
APNDICE C
Gabarito da Lista de Exerccios 3
0,03.0,97
0,03.0,97
; 0,03 + 1,96
= [0 ; 0,0634]
100
100
0,16.0,84
0,16.0,84
; 0,16 + 1,645
= [0,075 ; 0,245]
50
50
5,2
64
; 25,4 + 1,645
5,2
= [24.3 ; 26.5]
64
7
= [67.2 ; 82.8]
9
; 75 + 3,355
p = 0,42
0,42 0,5
0,5.0,5
100
= 1.6
= 0,06
Proporo Amostral: p
Estatstica do Teste:
z observado =
0,06 0,05
0,05.0,95
50
0.32
Oliveira, D. C. R. e Oliveira, M. S.
102
____/____/____
Estatstica do Teste:
z observado =
7,2 8
= 2
2
25
290 300
= 5
6
9
Regra de Deciso: Pela tabela da t de Student com Graus de Liberdade = 8 e p = 20%, Ha e nvel de significncia:
RC = (- , -1.397]
RA = (-1.397 , +)
Concluso: Como zobservado RC, ento rejeito Ho com um nvel de significncia de 10%, ou seja, a vida mdia de
B menor que a de A.
9) Hipteses: Ho: = 175
Ha: 175
Nvel de Significncia: = 0,10
Estatstica do Teste: t observado
173 175
= 0,5
16
16
Regra de Deciso: Pela tabela da t de Student com Graus de Liberdade = 15 e p = 10%, Ha e nvel de significncia:
RC = (- , -1.753] [1.753 , +)
RA = (-1.753 , 1.753)
Concluso: Como zobservado RA, ento no rejeito Ho com um nvel de significncia de 10%, ou seja, podemos
afirmar que a altura mdia de 175 cm.
Oliveira, D. C. R. e Oliveira, M. S.
103
____/____/____
h) Sabendo que o desvio de Y igual a 10, teste com um nvel de significncia de 10% as hipteses: Ho:
= 256 contra
2) Se entrevistamos 1500 pessoas e 1050 so a favor de um candidato, teste com um nvel de significncia
de 1% se ele vencer as eleies.
3) Quando uma mquina nova est funcionando adequadamente, somente 3% dos itens produzidos
apresentam defeitos. Suponha que 5 itens so selecionadas aleatoriamente.
(a) Qual a probabilidade de encontrarmos 2 defeituosos?
(b) Qual a probabilidade de encontrarmos 3 ou mais defeituosos?
4) Para fazer o controle de qualidade numa empresa, lotes com 100 peas so examinados. Todo lote
composto por 10 peas defeituosas. Aps coletar uma amostra de 5 peas sem reposio, calcule a
probabilidade de que nessa amostra no haja nenhum item defeituoso?
5) Durante o perodo de tempo em que reservas por telefone esto sendo feitas na universidade local, as
chamadas chegam razo de uma a cada dois minutos.
(a) Qual a probabilidade de 3 chamadas em 2 minutos?
(b) Qual a probabilidade de 2 ou mais chamadas em um perodo de 4 minutos?
Oliveira, D. C. R. e Oliveira, M. S.
104
____/____/____