Escolar Documentos
Profissional Documentos
Cultura Documentos
Básica para
Engenharia
1
ÍNDICE
Introdução ...................................................................................................................4
Software R ..................................................................................................................5
Software SPSS............................................................................................................6
Conceitos Básicos de Estatística ................................................................................7
População................................................................................................................9
Amostra .................................................................................................................10
Arredondamento de números ................................................................................10
Proporção ..............................................................................................................14
Porcentagem .........................................................................................................15
Exercícios ..............................................................................................................16
Fases do Método Estatístico .....................................................................................20
Definição do Problema ..........................................................................................20
Planejamento.........................................................................................................20
Coleta dos Dados ..................................................................................................21
Apuração dos Dados .............................................................................................23
Apresentação dos Dados.......................................................................................23
Análise e Interpretação dos Dados........................................................................24
Questionários ............................................................................................................25
Ordem das Questões.............................................................................................26
Tipo de Abordagem ...............................................................................................26
Clareza nas Perguntas ..........................................................................................26
Não Sugerir Respostas..........................................................................................27
A Necessidade do Pré-Teste .................................................................................27
A Prática de Pesquisas por Amostragem ..............................................................27
Amostragem..............................................................................................................28
Amostragem Aleatória Simples..............................................................................29
Amostragem Estratificada......................................................................................31
Amostragem Sistemática .......................................................................................34
Exercícios ..............................................................................................................35
Distribuição de Freqüência........................................................................................41
Dados Brutos .........................................................................................................41
Rol .........................................................................................................................41
Tabela de freqüência .............................................................................................42
Distribuição de Freqüências de Dados Tabulados Não-Agrupados em Classes42
Distribuição de Freqüências de Dados Agrupados em Classes.........................43
Manual para Normalização de Publicações Técnico – cientificas..........................49
Exercícios ..............................................................................................................50
Medidas de Tendência Central. ................................................................................56
Dados brutos .........................................................................................................56
Dados em tabela de distribuição de freqüência .....................................................60
Exercícios ..............................................................................................................67
Separatrizes ..............................................................................................................69
2
Dados brutos ou em tabela de distribuição simples...............................................69
Dados agrupados em classes................................................................................71
Exercícios: .............................................................................................................73
Medidas de Variabilidade ..........................................................................................76
Desvio padrão........................................................................................................77
Coeficiente de variação: ........................................................................................79
Exercícios ..............................................................................................................82
Representação Gráfica .............................................................................................89
Exercícios ............................................................................................................100
Probabilidade ..........................................................................................................101
Técnicas de contagem.........................................................................................101
Cálculo de Probabilidade .....................................................................................105
Exercícios: ...........................................................................................................118
Distribuições de probabilidade ................................................................................126
Variável Aleatória.................................................................................................126
Distribuições discretas de probabilidade..............................................................133
Distribuições contínuas de probabilidade ............................................................140
Teste de Hipótese ...................................................................................................152
Distribuição Amostral ..............................................................................................166
Correlação...............................................................................................................170
Regressão Linear ....................................................................................................177
Regressão Múltipla..................................................................................................184
Bibliografia ..............................................................................................................188
Anexo 1 ...................................................................................................................189
Anexo 2 ...................................................................................................................191
3
Introdução
4
Software R
Comandos básicos
1) Criar vetor: para construir um vetor basta digitar a letra c e, entre parênteses
separados por vírgula, digitar os valores do vetor. Para visualisar o vetor
basta digitar seu nome na linha de comando.
5
Software SPSS
6
Conceitos Básicos de Estatística
Estatísticas
Uma coleção de dados numéricos ou qualitativos.
Estatística
Estatística Descritiva
Probabilidade
Inferência Estatística
Estatística Descritiva
Probabilidade
7
Inferência Estatística
Estatística Descritiva
População Amostra
Inferência
8
Objetivo do Estudo da Estatística
População
Exemplo:
Suponha que estamos interessados em realizar um estudo sobre a qualidade
das peças produzidas por uma empresa em determinado dia. Neste caso existe uma
observação para cada peça fabricada naquele dia. Podemos limitar a população a
cada turno de trabalho da empresa, como por exemplo o 2º turno.
Observação:
É importante ficar bem claro que uma população é estudada em termos das
características a serem estudadas. Assim, por exemplo, o diâmetro de uma peça
constituem uma população. Poderia haver uma população correspondente ao
comprimento dessas mesmas peças.
9
Amostra
Exemplo:
Avaliação da qualidade das peças produzidas por uma determinada empresa.
Seleciona-se, dentre as peças produzidas em determinado dia, uma porcentagem
destas peças. Avalia-se as peças selecionadas.
A partir da amostra estabelecemos o que é conveniente para a população, ou
seja, fazemos uma inferência sobre a população.
Arredondamento de números
12,489 Inteiros 12
20,733 Décimos 20,7
35,992 Centésimos 35,99
Quando o primeiro dígito, aquele situado mais à esquerda entre os que irão
ser eliminados, for maior ou igual a cinco seguido por dígitos maiores que zero, o
dígito anterior será acrescido de uma unidade.
10
Número a arredondar Arredondamento para Número arredondado
15,504 Inteiros 16
16,561 Décimos 16,6
17,578 Centésimos 17,58
Arredondamento centrais
Quando o primeiro dígito, aquele situado mais à esquerda dos que serão
eliminados for um cinco ou um cinco seguido somente de zeros, o último dígito
anterior, se for par, não se altera, e se for ímpar será aumentado uma unidade.
15,500 Inteiros 16
16,500 Inteiros 16
17,750 Décimos 17,8
17,705 Centésimos 17,70
Arredondamento de Soma
11
Erro relativo
Dados dois números diferentes de zero x e y com x > y , o erro relativo
entre eles será calculado pela expressão
x−y
ER =
x
6 − 5,51
ER = = 0,082
6
8 − 7,50
ER = = 0,062
8
15 − 14,63
ER = = 0,025
15
12
25 − 24,73
ER = = 0,011
25
28 − 27,52
ER = = 0,017
28
13
Proporção
N3 N
e 4
N N
Observe que
14
N1 N 2 N 3 N 4 N
+ + + = =1.
N N N N N
Porcentagem
15
Exercícios
16
4) Aplique os critérios de arredondamento para completar o quadro abaixo:
Mês Produção
Julho 35.500
Agosto 34.750
Setembro 36.800
Outubro 35.150
Novembro 32.300
Dezembro 31.250
17
6) Uma escola ia contratar um grupo de 8 professores para dar um curso sobre
computadores em 48 horas, pagando um total de R$ 9 216,00. No entanto, como
medida de economia, ela resolveu contratar somente 6 professores e dar o curso em
36 horas. Quanto a escola economizará?
7) João comprou uma mercadoria em uma loja de utilidades. Quando foi pagar a
conta, o vendedor informou-lhe que devido a uma promoção relâmpago, ele teria 8
% de desconto na compra à vista pagando, pelo produto, R$ 276,00. João optou por
não pagar à vista. Quanto ele pagará pela mercadoria se compra-la a prazo?
18
11) Calcule:
a) 15 % de R$ 2 800,00 ?
b) 42 % de R$ 18 300,00 ?
13) Em um colégio existem 1 200 alunos, dos quais 720 são meninos. Determine:
14) Num livro de 200 páginas, há 30 linhas em cada página. Se houvesse 25 linhas,
quantas páginas teria o livro?
19
Fases do Método Estatístico
Definição do Problema
Planejamento
Nesta fase temos outros elementos importantes que devem ser tratados.
20
a) cronograma das atividades, através do qual são fixados os prazos
para as varias fases;
b) Os custos envolvidos;
c) O exame das informações disponíveis;
d) O delineamento da amostra;
e) A forma como serão escolhidos os dados, etc.
Espécies de dados:
21
d) Uma fonte primária poderá vir acompanhada de cópias dos
impressos utilizados para coletar as informações, juntamente com o
procedimento adotado na pesquisa, a metodologia seguida e o tipo
de tamanho da amostra.
Coleta Direta
22
Coleta Indireta
23
b) Apresentação Gráfica: Constitui uma Apresentação Geométrica.
Embora a apresentação tabular seja de extrema importância, no
sentido de facilitar a análise numérica dos dados, não permite ao
analista obter uma visão tão rápida, fácil e clara do fenômeno e sua
variação como a conseguida através de um gráfico.
24
Questionários
25
Ordem das Questões
Tipo de Abordagem
26
Não Sugerir Respostas
A Necessidade do Pré-Teste
27
Amostragem
Conceitos Fundamentais
28
Amostragem Aleatória Simples
Exemplo: A tabela a seguir refere-se aos diâmetros de 30 eixos produzidos por uma
industria automobilística (dados hipotéticos)
26 32 26 19 20 22 30 31 17 20
16 17 28 15 26 19 14 16 16 26
27 31 13 26 18 29 18 16 21 24
Eixo 01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17
Diâmetro 26 32 26 19 20 22 30 31 17 20 16 17 28 15 26 19 14
Eixo 18 19 20 21 22 23 24 25 26 27 28 29 30
Diâmetro 16 16 26 27 31 13 26 18 29 18 16 21 24
29
Obtemos:
2.ª coluna
Leitura na TNA (2 últimos) 18 15 22 24 03
Diâmetro 16 26 31 26 26
30
Amostragem Estratificada
Note que
N = N1 + N2 + ... + NL
31
M
n L = N L .f
Eletroduto (estrato) E
Fatura 01 02 03 04 05 06
Preço (R$) 710 710 715 715 755 760
Eletroduto (estrato) F
Solução:
8
f= = 0,27
30
32
De cada estrato serão sorteadas respectivamente nE e nF unidades:
nE = (0,27) . 6 = 1,62 ≅ 2
nF = (0,27) . 24 = 6,48 ≅6
Estrato E F
Leitura na 3 1 20 03 18 17 24 12
TNA
Fatura (R$) 715 710 795 750 790 785 820 765
33
Amostragem Sistemática
Solução: A amostragem aleatória simples não pode ser empregada neste caso,
pois o entrevistador não pode determinar quais compradores serão incluídos na
amostra, uma vez que não se conhece o tamanho N da população, até que todos os
compradores tenham ido à loja. Assim, ele pode usar a amostragem sistemática
(digamos 1 em cada 20 compradores) até obter a amostra do tamanho desejado.
34
Exercícios
35
4) O gerente de um determinado banco com o intuito de fazer uma pesquisa junto a
seus clientes utiliza o seguinte processo: Pega o primeiro cliente que compareceu à
agência naquele dia e o entrevista. O segundo a ser entrevistado é o 6.º cliente. O
terceiro a ser entrevistado é o 11.º cliente e assim sucessivamente até que a
agência feche. É CORRETO afirmar que:
6) A única opção que traz dois métodos de amostragem em que é preciso conhecer
todos os elementos da população é:
36
Professor 1 2 3 4 5 6 7 8 9 10 11 12
Taxa de
11,1 12,2 15,2 11,3 14,4 12,7 13,5 15,8 11,7 16,3 14,1 12,5
hemoglobina
TNA 18 15 03 16 01 19
Salário 6.5 10 8.5 4.7 10.1 8.9
37
10) A idade dos 20 ingressantes num certo ano no curso de pós-graduação em
jornalismo de uma universidade foi o seguinte: 22, 22, 22, 22, 23, 23, 24, 24, 24, 24,
25, 25, 26, 26, 26, 26, 27, 28, 35 e 40.
Aluno 1 2 3 4 5 6 7 8 9 10
Português 35 35 34 32 31 30 26 26 24 23
Matemática 31 29 27 28 28 26 30 28 25 23
Aluno 11 12 13 14 15 16 17 18 19 20
Português 23 12 11 20 17 12 14 20 8 10
Matemática 21 32 31 20 21 25 20 13 23 20
38
a) Extraia uma amostra de 5 alunos usando a amostra aleatória simples.
(Usar 3.ª coluna na TNA, dois últimos algarismos);
13) Em uma escola da rede municipal, estão matriculados 370 alunos no curso da
manhã. Eles estão distribuídos na seguinte maneira:
Salas 5.ª A 5.ª B 5.ª C 6.ª A 6.ª B 6.ª C 6.ª D 7.ª A 7.ª B 8.ª A 8.ª B 8.ª C
Alunos 30 25 30 30 30 25 25 35 40 35 35 30
39
Usar: Refinaria: 2ª coluna, Química: 4ª coluna e Residência: 7ª coluna. Ambos
utilizar primeiros lgarísmos.
1 0 3 2 3 5 3 0 2 7
0 4 3 1 3 1 5 3 4 4
2 1 3 1 2 2 1 0 2 0
0 1 1 2 4 5 3 4 3 4
3 3 5 2 1 6 1 2 4 6
3 6 2 4 5 8 2 5 6 3
4 7 4 6 5 5 5 4 3 7
4 4 6 3 9 5 7 4 4 6
18) Um artigo em Technometrics (Vol. 19, 1977, pg. 425) apresenta dados sobre
taxas de octanagem de combustível para motor, de várias misturas de gasolina. 40
destes resultados são apresentados a seguir:
40
Distribuição de Freqüência
Dados Brutos
43 45 49 47 52
45 51 46 44 48
51 50 52 44 48
50 49 50 46 46
49 49 51 50 49
Rol
43 44 44 45 45
46 46 46 47 48
48 49 49 49 49
49 50 50 50 50
51 51 51 52 52
41
Tabela de freqüência
É uma tabela onde cada valor da variável aparece individualmente com sua
respectiva freqüência, repetição. Esse tipo de apresentação é utilizado para
representar uma variável discreta ou descontinua.
42
Tabela 3: Temperatura de efluentes em dias consecutivos
na descarga de uma estação de tratamento de esgoto:
Freqüência
Temperatura fj
43 1
44 2
45 2
46 3
47 1
48 2
49 5
50 4
51 3
52 2
25
Fonte: Estatística Aplicada e Probabilidade para Engenheiros [2]
43
2) Amplitude Total: At
3) Número de Classes
k = 1 + 3,3 log10 N
Onde
k = número de classes
N = número total de observações
4) Limites de classes
44
6) Ponto médio de classe
43 44 44 45 45
46 46 46 47 48
48 49 49 49 49
49 50 50 50 50
51 51 51 52 52
Amplitude total = 52 – 43 = 9
Número de classes:
k = 1 + 3,3 x log 25
k = 1 + 3,3 x 1,3979
k = 5,61
k≅6
Caso o limite superior não seja maior ou igual ao valor máximo então devemos,
como alternativa, fazer um arredondamento por excesso na amplitude de classe.
Limite superior da última classe = 43 + 6. 1,5 = 52
45
Tabela 4: Temperatura de efluentes em dias consecutivos
na descarga de uma estação de tratamento de esgoto
temperatura fj
43,0 |--- 44,5 3
44,5 |--- 46,0 2
46,0 |--- 47,5 4
47,5 |--- 49,0 2
49,0 |--- 50,5 9
50,5 |---| 52,0 5
Total 25
Tipos de freqüência
46
Exemplo: Considere a tabela a seguir
47
ROTEIRO PARA A ELABORAÇÃO DE UMA TABELA DE FREQÜÊNCIAS COM
DADOS AGRUPADOS EM CLASSES
48
Manual para Normalização de Publicações Técnico – cientificas
Ed. UFMG
49
Exercícios
Para os exercícios 1 a 5 construa uma tabela de distribuição de freqüência
simples.
1) As cifras abaixo representam os ganhos de 15 vendedores:
225 182 194 210 205 172 181 198 164 176
180 193 178 193 208 186 183 170 186 188
61 58 59 72 47 55 40 73 66 60
71 69 63 58 51 42 67 80 62 53
0 0 2 1 4 1 0 1 3 2
2 0 1 1 1 4 0 3 1 5
1 1 0 2 0 0 1 1 4 3
0 1 0 2 1 4 3 1 0 0
5 1 2 0 3 0 2 1 1 3
1 4 3 0 2 0 1 1 0 1
50
5) Dão-se, a seguir, os números de alarmes falsos(acionados acidentalmente ou por
mau funcionamento do equipamento) recebidos em 30 dias por um serviço de
monitoramento da segurança:
3 6 2 4 5 8 2 5 6 3
4 7 4 6 5 5 5 4 3 7
4 4 6 3 9 5 7 4 4 6
Notas fj
11 I----- 6
I----- 2
I----- 2
I----- 10
I----- 6
21 I----- 4
Total 30
a) ( ) 17;
b) ( ) 18;
c) ( ) 19;
d) ( ) 20;
e) ( ) Nenhuma das alternativas acima.
a) ( ) 13;
b) ( ) 14;
51
c) ( ) 15;
d) ( ) 16;
e) ( ) Nenhuma das alternativas acima.
a) ( ) 8;
b) ( ) 10;
c) ( ) 20;
d) ( ) 26;
e) ( ) Nenhuma das alternativas acima.
a) ( ) 0,2000;
b) ( ) 0,2667;
c) ( ) 0,3333;
d) ( ) 0,6667;
e) ( ) Nenhuma das alternativas acima.
10) Porcentagem dos alunos que tiraram abaixo de 50% da nota da prova é de:
a) ( ) 20%;
b) ( ) 27%;
c) ( ) 34%;
d) ( ) 67%;
e) ( ) Nenhuma das alternativas acima.
11) A nota em que 66% dos alunos estão acima dela é de:
a) ( ) 15;
b) ( ) 16;
c) ( ) 17;
d) ( ) 18;
e) ( ) Nenhuma das alternativas acima.
52
As questões de 12 a 15 são referentes à tabela a seguir. Ela se refere a pacientes
internados no hospital X, localidade Y, no ano Z.
16) Os dados se referem aos pesos dos alunos de uma determinada escola:
60.5 60 70 47.4 60 57 52 47 55 50
55 58 54 66 58.5 63 73 95 39 54.5
72.8 47 58 85.2 49.2 52 56 84 75 50
80.9 57.8 68.5 54.5 48 49 58 60 55 71
55 58 63.5 52.5 51.6 59 87 73 49 86
53
17) Os dados abaixo se referem aos pesos dos alunos de uma determinada escola:
60.5 60 70 47.4 60 57 52 47 55 50
55 58 54 66 58.5 63 73 95 44 54.5
72.8 47 58 85.2 49.2 52 56 84 75 50
80.9 57.8 68.5 54.5 48 49 58 60 55 71
55 58 63.5 52.5 51.6 59 87 73 49 86
54
19) Uma importante característica de qualidade da água é a concentração de
material sólido suspenso. Em seguida, são apresentadas 60 medidas de sólidos
suspensos de um certo lago. Os dados são do livro Estatística Aplicada e
Probabilidade para Engenheiros.
55
Medidas de Tendência Central.
Dados brutos
n
∑ xi
i =1
x =
n
N
∑ xi
i =1
µ =
N
56
Exemplo: Os dados a seguir representam as temperaturas (em ºF) em que ocorrem
uma deflexão, devido à carga, em uma amostra de 10 tubos plásticos idênticos.
206 188 205 187 194 193 207 185 189 213
∑x
i =1
i
x =
n
206 + 188 + 205 + 187 + 194 + 193 + 207 + 185 + 189 + 213
x=
10
1.967
x=
10
x = 196,7
2) Mediana: Md
n +1
Assim dizemos que a mediana é o valor do elemento.
2
57
Exemplo: Os dados a seguir representam as temperaturas (em ºF) em que ocorrem
uma deflexão, devido à carga, em uma amostra de 10 tubos plásticos idênticos.
206 188 205 187 194 193 207 185 189 213
Qual a mediana?
185 187 188 189 193 194 205 206 207 213
Como temos 10 elementos, número par, a mediana será a média aritmética dos dois
193 + 194
elementos centrais. Logo a mediana é Md = = 193,5 .
2
40 32 37 30 24 40 38 35 40 28 32
24 28 30 32 32 35 37 38 40 40 40
58
3) Moda: Mo
26 25 28 23 25 24 24 21 23 26
28 26 24 32 25 27 24 23 24 22
Qual a moda?
Solução: A moda vale 24, pois ocorre 5 vezes.
Solução: Temos que os números 121 e 133 repetem, ambos, duas vezes. Portanto a
moda não é única. Logo as modas são 121 e 133.
59
Dados em tabela de distribuição de freqüência
Considere:
k
∑ x i . fi
i =1
x =
k
∑ fi
i =1
OBS.:
60
Exemplo: A tabela abaixo representa o número de defeitos por peça.
0 5
1 10
2 18
3 12
4 5
50
Fonte: Referência bibliográfica [1]
0 5 0
1 10 10
2 18 36
3 12 36
4 5 20
50 102
A média será
k
∑x . f
i =1
i i
102
x = k
= = 2,0
50
∑f
i =1
i
61
Exemplo: A tabela abaixo representa as temperatura de efluentes em dias
consecutivos na descarga de uma estação de tratamento de esgoto.
temperatura fj
43,0 |--- 44,5 3
44,5 |--- 46,0 2
46,0 |--- 47,5 4
47,5 |--- 49,0 2
49,0 |--- 50,5 9
50,5 |---| 52,0 5
Total 25
temperatura fj xj x jf j
43,0 |--- 44,5 3 43,75 131,25
44,5 |--- 46,0 2 45,25 90,50
46,0 |--- 47,5 4 46,75 187,00
47,5 |--- 49,0 2 48,25 96,50
49,0 |--- 50,5 9 49,75 447,75
50,5 |---| 52,0 5 51,25 256,25
Total 25 1.209,25
∑x . f
i =1
i i
1.209,25
x = k
= = 48,37
25
∑f
i =1
i
62
2) Mediana
Freqüência
Número de defeitos (xi) fi
0 5
1 10
2 18
3 12
4 5
50
Fonte: Referência bibliográfica [1]
Solução: Como temos 50 elementos, o valor mediano deverá ser a média dos dois
elementos centrais. Neste caso os dois elementos centrais são os elementos de
2+2
posição 25º e 26º, = 2 . Assim o número mediano de defeito é 2.
2
Para uma distribuição de freqüência agrupada em classes, a mediana é tal
que metade da área total dos retângulos do histograma da distribuição está à sua
esquerda, e a outra metade está à sua direita.
De modo geral podemos calcular a mediana por:
n
−∑ f
x = L+ ⋅h
2
Md = ~
F
63
onde
temperatura fi
43,0 |--- 44,5 3
44,5 |--- 46,0 2
46,0 |--- 47,5 4
47,5 |--- 49,0 2
49,0 |--- 50,5 9
50,5 |---| 52,0 5
Total 25
3) Moda
Freqüência
Número de defeitos (xi) fi
0 5
1 10
2 18
3 12
4 5
50
Fonte: Referência bibliográfica [1]
65
Quando temos uma tabela de distribuição de freqüência agrupada em
classes, o cálculo da moda é feito utilizando a fórmula de Czuber.
1.º passo: Identificamos a classe modal ( aquela que possui maior frequência)
2.º passo: Aplica-se a fórmula
∆1
Mo = L + ⋅h
∆1 + ∆ 2
onde
L: É o limite inferior da classe modal.
∆1 : Diferença entre a freqüência da classe modal e a classe imediatamente anterior.
∆2 : Diferença entre a freqüência da classe modal e a classe imediatamente
posterior.
h: Amplitude da classe modal
temperatura fi
43,0 |--- 44,5 3
44,5 |--- 46,0 2
46,0 |--- 47,5 4
47,5 |--- 49,0 2
49,0 |--- 50,5 9
50,5 |---| 52,0 5
Total 25
66
Solução:
1.º passo: A classe modal é a 5.ª, pois ela possui a maior freqüência.
2.º passo: Temos
L = 49,0 , ∆ 1 = 9 − 2 = 7 , ∆ 2 = 9 − 5 = 4 e h = 1,5
7
Mo = 49,0 + ⋅ 1,5
7+4
Mo = 49,95
Exercícios
I) Considere a tabela
Tabela: Quantidade de óxido de enxofre (em toneladas)
emitidas por uma indústria em 70 dias
Tempo f
6,2 |--- 9,4 4
9,4 |--- 12,6 8
12,6 |--- 15,8 9
15,8 |--- 19,0 14
19,0 |--- 22,2 14
22,2 |--- 25,4 11
25,4 |--- 28,6 8
28,6 |--- 31,8 2
70
Fonte: referência bibliográfica [2]
Calcule:
1) Média aritmética
2) Mediana
3) Moda
4) Compare as medidas calculadas.
67
II) Considere a tabela
Tempo f
11,4 |--- 25,65 20
25,65 |--- 39,90 36
39,90 |--- 54,15 29
54,15 |--- 68,40 5
68,40 |--- 82,65 1
82,65 |--- 96,90 4
96,90 |--- 111,15 3
111,15 |--- 125,40 2
100
Fonte:
Calcule:
1) Média aritmética
2) Mediana
3) Moda
4) Compare as mediadas calculadas.
68
Separatrizes
Quartis
165 135 151 153 155 182 152 158 146 149
124 162 173 204 159 130 177 162 141 156
Calcule:
1) 2º quartil
Solução: Ordenando os dados.
124 130 135 141 146 149 151 152 153 155
156 158 159 162 162 165 173 177 182 204
2
Posição: PQ i = (20 + 1) = 10,5
4
i
( )
Valor: Q i = X ( j ) + X ( j +1) − X ( j ) = 155 + 0 ,5(156 − 155) = 155,5
4
69
2) 3º quartil
3
Posição: PQ i = (20 + 1) = 15,75
4
i
Valor: Q i = X ( j ) + (X ( j +1) − X ( j ) ) = 162 + 0,75(165 − 162) = 164,2
4
Decis
Percentis
Os percentis dividem um conjuto de dados em cem partes uguais. Assim:
P1 = 1º percentil
P2 = 2º percentil
M
P99 = 99º percentil
Exercícios
124 130 135 141 146 149 151 152 153 155
156 158 159 162 162 165 173 177 182 204
Calcule:
1) 3º decil;
70
2) 9º decil;
3) 75º percentil;
4) 95º percentil.
43 44 44 45 45
46 46 46 47 48
48 49 49 49 49
49 50 50 50 50
51 51 51 52 52
Calcule:
1) 3º decil;
2) 7º decil;
3) 85º percentil;
Quartis
Os quartis dividem um conjuto de dados em quatro partes uguais. Assim:
Q1 = 1º quartil
Q2 = 2º quartil
Q3 = 3º quartil
O cálculo dos quartis é feito utilizando a fórmula:
n⋅i
− ∑ f ⋅h
Qi = LQi +
4
FQi
Onde:
LQi : é o limite inferior da classe em que o quartil deve estar.
h: o intervalo de classe
n: é o número de elementos ou tamanho da amostra
71
D1 = 1º decil
D2 = 2º decil
M
D9 = 9º decil
O cálculo dos decis é feito utilizando a fórmula:
n⋅i
−∑ f ⋅h
Di = LDi +
10
FDi
Onde:
LDi : é o limite inferior da classe em que o decil deve estar.
h: o intervalo de classe
n: é o número de elementos ou tamanho da amostra
n⋅i
−∑ f ⋅h
Pi = LPi +
100
FPi
Onde:
L Pi : é o limite inferior da classe em que o percentil deve estar.
h: o intervalo de classe
n: é o número de elementos ou tamanho da amostra
72
Exercícios:
1) Considere a tabela
Tabela: Quantidade de óxido de enxofre (em toneladas)
emitidas por uma indústria em 70 dias
Tempo f
6,2 |--- 9,4 4
9,4 |--- 12,6 8
12,6 |--- 15,8 9
15,8 |--- 19,0 14
19,0 |--- 22,2 14
22,2 |--- 25,4 11
25,4 |--- 28,6 8
28,6 |--- 31,8 2
70
Fonte: Referência bibliográfica [2]
Calcule:
a) 3º quartil
b) 6º decil
c) 90º percentil
2) Considere a tabela
Tempo f
11,4 |--- 25,65 20
25,65 |--- 39,90 36
39,90 |--- 54,15 29
54,15 |--- 68,40 5
68,40 |--- 82,65 1
82,65 |--- 96,90 4
96,90 |--- 111,15 3
111,15 |--- 125,40 2
100
Fonte:
Calcule:
a) 2º quartil
b) 4º decil
c) 95º percentil
73
3) Em uma fábrica ou um escritório, o tempo, no horário de trabalho, durante o qual
uma máquina não está funcionando em virtude de quebra ou falha é chamado tempo
parado. A tabela a seguir é uma amostra da duração desses tempos parados de
certa máquina.
0 ---- 9 2
9 ---- 18 15
18 ---- 27 17
27 ---- 36 12
36 ---- 45 3
45 ---- 54 1
Total 50
Calcule:
a) Tempo 70º percentil.
b) Tempo 3º quartil.
1,00 4. 1
3,00 4 . 233
1,00 4. 5
4,00 4 . 6677
4,00 4 . 8899
5,00 5 . 00111
10,00 5 . 2222233333
9,00 5 . 444555555
12,00 5 . 666666777777
15,00 5 . 888888899999999
16,00 6 . 0000000011111111
15,00 6 . 222222233333333
11,00 6 . 44444445555
7,00 6 . 6666777
2,00 6 . 89
1,00 7. 1
1,00 7. 3
1,00 7. 4
1,00 7. 6
74
Stem width: 10
Each leaf: 1 case(s)
75
Medidas de Variabilidade
Conjunto 1 20 20 20 20 20 20 20
Conjunto 2 30 15 15 20 20 20 20
76
Desvio padrão
Símbolo: S
Dados não agrupados
Amostral Populacional
2
n N
2
∑ x
i ∑ xi
1 n 2
i =1
1 N 2 i =1
S= ∑ xi − σ= ∑ xi − N
n − 1 i =1 n N i =1
Sejam :
xi o ponto médio da classe i ,
fi a freqüência da classe i,
k a quantidade de classe.
Amostral Populacional
2
2
k k
1 k 2
∑ x .
i if
∑ xi .fi
S=
∑
n − 1 i =1
xi . f i − i =1
n σ =
1 k
∑ xi2.fi − i =1
n i =1 n
77
Exemplo:
1) Voltando aos dois conjuntos iniciais
Conjunto 1 20 20 20 20 20 20 20
Conjunto 2 30 15 15 20 20 20 20
0 |---- 9 2
9 |---- 18 15
18 |---- 27 17
27 |---- 36 12
36 |---- 45 3
45 |---- 54 1
Total 50
78
Solução: Para o cálculo do desvio-padrão é necessário alguns resultados. Podemos
obtê-los completando a tabela, veja a seguir:
Tempo parado Frequência Tempo
(minutos) f Médio: xi xi fi x i2 f i
0 |---- 9 2 4,5 9 40,5
9 |---- 18 15 13,5 202,5 2733,75
18 |---- 27 17 22,5 382,5 8606,25
27 |---- 36 12 31,5 378 11907
36 |---- 45 3 40,5 121,5 4920,75
45 |---- 54 1 49,5 49,5 2450,25
Total 50 1143 30658,5
O desvio-padrão será:
k
2
∑ xi . f i
1 k 2
∑ xi . f i −
i =1
S=
n − 1 i =1 n
1 (1143)2
S= 30658,5 −
50 − 1 50
1
S= [30658,5 − 26.128,98]
49
S = 92,4392
S = 9,6
Coeficiente de variação:
79
s
CV =
x
Podemos expressar o valor do coeficiente de variação em porcentagem
multiplicando por 100 o resultado.
Temos que
1 (28.475)2
s= 1.833.725 −
500 − 1 500
1
s= (1.833.725 − 1.621.651,25)
499
1
s= (212.073,75)
499
s = 424,9975
s = 20,6
Logo o desvio-padrão é de 19,2.
A média é 57,0.
O coeficiente de variação é dado por:
s 19,2
CV = = = 0,3368 = 33,68 %
x 57,0
80
Neste caso o desvio-padrão corresponde a 33,68 % da média.
Em um conjunto de dados, seja ele amostral ou populacional, o ideal seria
encontrar desvio-padrão igual a zero. No entanto isso é difícil. Então quanto mais
próximo de zero estiver o coeficiente de variação melhor.
Uma pergunta interessante seria a seguinte: se dois conjuntos de dados tem
o mesmo desvio-padrão então eles seriam igualmente bons? A resposta é não.
Para ilustrar a finalidade do coeficiente de variação considere os conjuntos:
Conjunto 1:
10 11 12 13 14 15 16
Conjunto 2:
81
Exercícios
b) Calcule a variância.
a) ( ) negativo;
b) ( ) positivo;
c) ( ) a unidade;
d) ( ) zero.
82
a) ( ) zero;
b) ( ) o valor da constante;
c) ( ) a unidade;
d) ( ) a quantidade de valores que temos
a) ( ) 3;
b) ( ) 4;
c) ( ) 16;
d) ( ) 81.
6) Uma empresa possui dois serventes recebendo salários de R$ 250,00 cada um,
quatro escriturários recebendo R$ 600,00 cada um, um chefe de escritório com
salário de R$ 1.000,00 e três técnicos. A média de salários da empresa é de R$
1.050,00. Quanto cada técnico recebe?
46 57 21 16 4
É igual a?
144 152 159 160 160 151 157 146 154 145
141 150 142 146 142 141 141 150 143 158
Determine:
83
a) O índice médio.
b) O índice mediano.
136 125 135 137 126 129 124 118 120 126
119 92 115 115 127 95 100 113 95 113
146 103 101 118 121 129 110 126 106 148
137 87 126 119 125 132 108 118 119 117
120 110 82 105 102 104 133 104 132 146
13) Um artigo de jornal fez menção a determinada pesquisa citando que o conjunto
amostral acusa Σx = 5, Σx2 = 7 e s = 0,5. Por erro esqueceram de citar o tamanho da
amostra utilizado. Considerando as informações anteriores o que podemos dizer
sobre os possíveis tamanho da amostra?
84
14) Uma lista de números acusa Σx =202, Σx2 = 3.452 e n = 15. Qual o desvio-
padrão?
15) Em quatro paradas no box, o mecânico dos pneus dianteiros trocou o pneu
dianteiro direito dos carros de corrida em
Horas fj
10 |--- 15 9
15 |--- 20 28
20 |--- 25 27
25 |--- 30 12
30 |--- 35 4
Total 80
Calcule:
a) o tempo médio
b) o tempo mediano
c) Qual a porcentagem dos alunos que dedicam mais de 25 horas de lazer ?
17) Uma lista de números acusa Σx =40 e Σx2 = 156. Quantos valores figuram na
lista, se seu desvio-padrão é 2,0?
85
18) Um inspetor de controle de qualidade examinou 15 engradados de telhas de
cerâmica, contendo cada um 144 telhas. Os números de telhas trincadas nessas
caixas foram
2 5 3 4 2 0 1 5 7 3 0 2 2 4 3
Calcule:
a) o número médio de telhas trincadas e
b) o desvio-padrão.
Calcule:
a) a média
b) a mediana
c) a moda
86
20) A tabela a seguir apresenta os salários pagos a 100 operários de uma empresa
N.º de salários
mínimos fj
0 |--- 2 40
2 |--- 4 30
4 |--- 6 10
6 |--- 8 15
8 |--- 10 5
Total 100
Calcule:
a) o salário médio
b) o salário mediano
c) Qual a porcentagem dos empregados que ganham acima de 4
salários?
d) O dono da empresa afirmou, em entrevista, que seus funcionários
ganham, em média, R$ 1440,00. Considerando o salário mínimo no
valor de R$ 330,00, a afirmação do dono da empresa é verdadeira?
6 5 5 4 3 6 14 8 9
11 8 10 11 12 14 17 19 21
87
Tabela: o tempo, no horário de trabalho, durante o qual
uma máquina não está funcionando em virtude de quebra ou falha
0 |---- 9 2
9 |---- 18 15
18 |---- 27 17
27 |---- 36 12
36 |---- 45 3
45 |---- 54 1
Total 50
Calcule:
a) Desvio-padrão.
88
Representação Gráfica
a) Gráficos de Informação
b) Gráficos de Análise
89
2) Histograma
43 45 49 47 52
45 51 46 44 48
51 50 52 44 48
50 49 50 46 46
49 49 51 50 49
Solução: No R temos:
a) Crie um arquivo, y, com os dados;
b) Use o comando:
hist(y,freq=F,ylab="Frequência",xlab="Temperatura",main="Temperatura de
efluentes",ylim = c(0, 0.2))
O resultado é o gráfico a seguir
90
Gráfico: temperatura de efluentes em dias consecutivos
na descarga de uma estação de tratamento de esgoto
Exemplo: Um artigo em Technometrics (Vol. 19, 1977, pg. 425) apresenta dados
sobre taxas de octanagem de combustível para motor, de várias misturas de
gasolina. 20 destes resultados são apresentados a seguir:
Construa o histograma.
Solução: No R temos:
a) Crie um arquivo, y, com os dados;
b) Use o comando:
hist(y,freq=T,ylab="Frequência",xlab="Taxas",main="Taxa de octanagem",ylim = c(0,
10))
O resultado é o gráfico a seguir
91
Gráfico: taxas de octanagem de combustível para motor,
de várias misturas de gasolina
3) Box-plot
92
43 45 49 47 52
45 51 46 44 48
51 50 52 44 48
50 49 50 46 46
49 49 51 50 49
Consrua o box-plot.
Exemplo: Um artigo em Technometrics (Vol. 19, 1977, pg. 425) apresenta dados
sobre taxas de octanagem de combustível para motor, de várias misturas de
gasolina. 20 destes resultados são apresentados a seguir:
93
89,9 98,8 88,3 90,4 91,2 90,6 92,2 87,7 91,1 86,7
Construa o box-plot.
Solução: Utilizando o R temos:
a) construa o vetor y com os dados;
b) utilize o comando: boxplot(t,ylab="Frequência",xlab="Taxa",ylim=c(80,100))
O resultado é o gráfico
4) Ramo-e-folhas
É uma forma de visualização dos dados originais o qual nos permite ver a
distribuição dos dados sem a perda de informações.
Permite visualizar a ordenação dos dados.
Para a construção de um gráfico ramo-e-folhas tomamos como ramo os
algarismos mais a esquerda e as folhas os algarismos mais a direita. Por exemplo,
no número 352, o ramo é 35 e a folha é o 2.
94
Exemplo: Os dados a seguir representam a temperatura de efluentes em dias
consecutivos na descarga de uma estação de tratamento de esgoto:
43 45 49 47 52
45 51 46 44 48
51 50 52 44 48
50 49 50 46 46
49 49 51 50 49
42 | 0
44 | 0000
46 | 0000
48 | 0000000
50 | 0000000
52 | 00
Podemos utilizar o comando, scale=argumento, para melhorar a visualização
dos dados. Veja o mesmo exemplo anterior utilizando o comndo stem(y, scale=2).
95
Gráfico: Temperatura de efluentes em dias consecutivos
na descarga de uma estação de tratamento de esgoto
43 | 0
44 | 00
45 | 00
46 | 000
47 | 0
48 | 00
49 | 00000
50 | 0000
51 | 000
52 | 00
381 389 389 418 429 430 472 486 568 1209
669 682 699 728 821 821 856 822 904 866
96
Gráfico: Salários, em reais, pagos em determinada empresa
The decimal point is 2 digit(s) to the right of the |
3 | 899
4 | 23379
5|7
6 | 78
7 | 03
8 | 22267
9|0
10 |
11 |
12 | 1
100 110 121 124 145 135 122 100 146 151 162 121 123 134 122 118 145 151 100
144 125
97
Gráfico: número de telhas estragadas em 21 lotes de um milheiro cada
The decimal point is 1 digit(s) to the right of the |
10 | 000
11 | 08
12 | 1122345
13 | 45
14 | 4556
15 | 11
16 | 2
98
Tabelas - Normalização de Publicações Técnico – cientificas - Ed. UFMG
99
Exercícios
300
250
200 160
150 120
100
40 30
50
0
0 1 2 3 4 5
Número de defeitos
Número de defeitos fi
0
1 120
2
3
4
5
Total
100
Probabilidade
Técnicas de contagem
Fatorial
fatorial).
O fatorial do número n é obtido pela multiplicação de n por todos os inteiros
inferiores até o número 1.
n ! = n ⋅ (n − 1)⋅ (n − 2 )⋅K⋅ 1
Exemplos:
1) 4 ! = 4 . 3 . 2 .1 = 24
2) 6 ! = 6 . 5 . 4 . 3 . 2 .1 = 720
Por definição:
0! = 1
1! = 1
Observação:
6 ! = 6 .5 .4! = 6 .5 !
Exemplo:
12 !
Qual o valor de ?
10 ! ⋅ 3 !
12 ! 12 .11 .10 ! 12 .11
Solução: = = = 22
10 ! ⋅ 3 ! 10 ! . 3 . 2 .1 6
Exercício:
Muitas calculadoras ou computadores não podem calcular diretamente valores de
70 ! ou superiores. Para n muito grande, n ! pode ser aproximado por n ! = 10 k ,
101
onde o valor de k é dado por k = (n + 0 ,5 )log n + 0 ,39908993 − 0 ,43429448 n .
Exemplos:
1) Quantas placas para identificação de veículos podem ser confeccionadascom 3
letras e 3 algarismos? ( Considere 26 letras, supondo que não há nenhuma
restrição)
Arranjo Simples
102
Exemplos:
b) Temos 3 itens diferentes da área industrial. Os outros 9 não precisam ficar juntos.
Podemos então considerar os 3 itens da produção como um único bloco. Assim
teremos
10 ! 3!
A10 , 10 . A3 , 3 = ⋅ = 10 ! . 3 !
(10 − 10 )! (3 − 3)!
Combinação Simples
103
O número de combinações simples (sem repetição) de r elementos escolhidos
dentre n elementos é
n!
Cn , r =
(n − r )! . r !
Exemplos:
1) Uma empresa de pesquisa mercadológica deseja selecionar uma comissão
formada por 4 consumidores de uma amostra previamente selecionada de 8
pessoas. Calcule:
Solução:
8!
a) C 8 , 4 = = 70
(8 − 4 )! . 4 !
8!
b) A8 , 4 = = 1.680
(8 − 4 )!
2) Em um departamento industrial existem 8 engenheiros eletricistas e 7 técnicos em
eletrônica. Sabendo que uma comissão deverá ser formada, calcule de quantas
maneiras a comissão poderá ser elaborada, supondo que:
a) 5 pessoas devem ser escolhidas.
b) 3 engenheiros e 2 técnicos devem ser escolhidos.
Solução:
15 !
a) C15 , 5 = = 3.003
(15 − 5 )! . 5 !
8! 7!
b) C 8 , 3 ⋅ C7 = ⋅ = 1.176
, 2
(8 − 3)! . 3 ! (7 − 2 )! . 2 !
104
Cálculo de Probabilidade
Definições:
Exemplos:
E1 : Retirar uma carta de um baralho com 52 cartas e observar seu naipe.
E 2 :Jogar uma moeda 10 vezes e observar o número de caras obtidas.
E3 : Em uma linha de produção, fabricam-se peças em série e conta-se o
número de peças defeituosas produzidas em um período de 24 horas.
E4 : Uma lâmpada é fabricada. Em seguida é testada e verifica-se o tempo
de vida.
E5 : Retira-se uma bola de uma urna que contém bolas pretas, vermelhas e
amarelas e observa sua cor.
Exemplos:
105
2. Infinito enumerável: formado por um número infinito de resultados, os quais
podem ser listados ou enumerados.
Exemplo:
Considere o experimento
E = jogar um dado e observar o número da parte de cima.
Então S = {1, 2 , 3 ,4 , 5 , 6}
Sejam os eventos: A = ocorrer um número par, e B = ocorrer um número
ímpar.
Então A = {2 , 4 ,6 } , B = {1, 3 , 5} e A ∩ B = φ .
106
Dado um experimento aleatório E, S o espaço amostral e A um evento. A
probabilidade do evento A, P( A) , é uma função definida em S que associa a cada
evento um número real calculada pela relação:
n( A )
P ( A) =
n (S )
Onde: n( A) : é o número de vezes em que o evento A pode ocorrer
Exemplos:
1. Considere um baralho com 52 cartas. Qual a probabilidade de se retirar uma
carta de ouro?
Solução: Em um baralho temos 13 cartas de ouro. Logo considerando o evento A
13 1
= retirar uma carta de ouro temos P( A) = =
52 4
4 4!
Número de maneiras do evento A ocorrer = = =6 .
2 (4 − 2 )! .2!
12 12!
Número de maneiras do espaço S ocorrer = = = 66 .
2 (12 − 2 )! .2!
6 1
Logo P( A) = = .
66 11
3. A MasterCard International efetuou um estudo de fraude em cartões de
crédito. Os resultados estão apresentados na tabela a seguir.
107
Tabela: Tipos de fraude em cartões de crédito
Tipo de fraude Número de ocorrência
Cartão roubado 243
Cartão falsificado 85
Pedido por correio/ telefone 52
Outros 46
Propriedades da probabilidade
108
Evento Composto: É qualquer evento que combina dois ou mais eventos simples.
Observações:
P( A ∪ B ) denota a probabilidade do evento A, ou do evento B, ou de
ambos.
P( A ∩ B ) denota a probabilidade do evento A e do evento B
simultaneamente em um mesmo experimento.
Exemplos:
1) As preferências de homens e mulheres por cada gênero de filme alugado em uma
locadora de vídeos, estão apresentados na tabela a seguir:
Tabela: Preferência de homens e mulheres por filmes
Sexo / Filme Comédia Romance Policial
Homens 136 92 248
Mulheres 102 195 62
109
359 310 62 607
P( A ∪ B ) = + − = = 0 ,7269
835 835 835 835
b) Considere os eventos
A = homem aluga o filme e
B = Filme é do gênero romance
P ( A ∪ B ) = P ( A) + P (B ) − P ( A ∩ B )
476 287 92 671
P( A ∪ B ) = + − = = 0 ,8036
835 835 835 835
110
Regra da Multiplicação: Se A e B são dois eventos quaisquer, então:
P( A ∩ B ) = P( A) . P (B | A) se A e B são dependentes
Exemplos:
1) Uma determinada companhia produz um lote de 50 filtros de combustíveis, dos
quais 6 são defeituosos. Escolhem-se aleatoriamente e testam-se dois filtros do lote.
Determine a probabilidade de ambos serem bons, se os filtros são selecionados:
a) com reposição;
b) sem reposição.
111
B = filtro bom.
a) Como processo de escolha é com reposição, então a escolha do primeiro filtro
não afeta a escolha do segundo filtro. Logo são independentes. Assim
P ( A ∩ B ) = P ( A) . P (B )
44 44 1936
P( A ∩ B ) = ⋅ = = 0 ,7744
50 50 2500
b) Como processo de escolha é sem reposição, então a escolha do primeiro filtro
afeta a escolha do segundo filtro. Logo são dependentes. Assim
P( A ∩ B ) = P ( A) . P ( B | A)
44 43 1892
P( A ∩ B ) = ⋅ = = 0 ,7722
50 49 2450
112
4 19 76
P( A ∩ B ) = ⋅ = = 0 ,2111
12 30 360
Portanto a probabilidade de apenas uma ser defeituosa é de
P(apenas uma defeituosa ) = 0 ,2444 + 0 ,2111 = 0 ,4555
b) 12,22%.
c) 42,22%.
113
Teorema da probabilidade total
c) P( Ai ) ≥ 0 para i = 1, 2, K , k .
Cqd.
Exemplo:
Uma determinada peça é manufaturada por três fábricas, denominadas X, Y e Z.
Sabe-se que X produz o dobro de peças que Y, e Y e Z produzem o mesmo
número de peças. Sabe-se também que 2% das peças produzidas por X e Y são
defeituosas, enquanto que 4% das produzidas por Z são defeituosas. Todas as
peças são colocadas em um depósito, e depois uma peça é extraída
aleatoriamente. Qual a probabilidade de que a peça escolhida seja defeituosa?
114
Solução:Considere os seguintes eventos
F = a peça é defeituosa
A1 = a peça provém da fábrica X.
A2 = a peça provém da fábrica Y.
A3 = a peça provém da fábrica Z.
Empregando o teorema da probabilidade total temos
P(F ) = P( A1 )P (F | A1 ) + P( A2 )P(F | A2 ) + P( A3 )P(F | A3 )
Sabe-se que:
1
P( A1 ) =
2
1
P( A2 ) =
4
1
P( A3 ) =
4
P(F | A1 ) = P(F | A2 ) = 0 ,02
P(F | A3 ) = 0 ,04
Logo
1 1 1
P (F ) = ⋅ 0 ,02 + ⋅ 0 ,02 + ⋅ 0 ,04 = 0 ,0250
2 4 4
Assim, a probabilidade da peça ser defeituosa é de 0,0250 ou 2,50%.
115
Teorema de Bayes (Thomas Bayes 1702 - 1761)
c) P( Ai ) ≥ 0 para i = 1, 2 , K , k .
Exemplo:
1) (voltando ao exemplo anterior) Uma determinada peça é manufaturada por três
fábricas, denominadas X, Y e Z. Sabe-se que X produz o dobro de peças que Y, e Y
e Z produzem o mesmo número de peças. Sabe-se também que 2% das peças
produzidas por X e Y são defeituosas, enquanto que 4% das produzidas por Z são
defeituosas. Todas as peças são colocadas em um depósito, e depois uma peça é
extraída aleatoriamente. Qual a probabilidade de que a peça escolhida seja
produzida pela fábrica Y dado que ela era defeituosa?
Solução:Considere os seguintes eventos
F = a peça é defeituosa
A1 = a peça provém da fábrica X.
A2 = a peça provém da fábrica Y.
A3 = a peça provém da fábrica Z.
Sabe-se que:
P(F ) = 0 ,0250 (pelo exemplo anterior)
1
P( A2 ) =
4
P(F | A1 ) = P(F | A2 ) = 0 ,02
Logo
116
P( A2 )P(F | A2 )
P( A2 | F ) =
P(F )
1
⋅ 0 ,02
P( A2 | F ) = 4
0 ,0250
0 ,005
P( A2 | F ) =
0 ,0250
P( A2 | F ) = 0 ,2000
2) Uma rede local de computadores é composta por um servidor e cinco clientes (A,
B, C, D e E). Registros anteriores indicam que dos pedidos de determinado tipo de
processamento, realizados através de uma consulta, cerca de 10% vêm do cliente A,
15% do B, 15% do C, 40% do D e 20% do E. Se o pedido não for feito de forma
adequada, o processamento apresentará erro. Usualmente, ocorrem os seguintes
percentuais de pedidos inadequados: 1% do cliente A, 2% do cliente B, 0,5% do
cliente C, 2% do cliente D e 8% do cliente E.
a) Qual é a probabilidade de o sistema apresentar erro?
b) Qual é a probabilidade de que o processo tenha sido pedido pelo cliente E,
sabendo-se que apresentou erro?
As pessoas que elaboraram o teste afirmam que ele pode detectar altos níveis de
poluentes orgânicos com 99,7% de acurácia, solventes voláteis com 99,95% de
acurácia e composto clorados com 89,7% de acurácia.
117
Amostras são preparadas para calibração do teste e 60% delas são contaminadas
com poluentes orgânicos, 27% com solventes voláteis e 13% com traços de
compostos clorados.
Exercícios:
118
4) Se 226 dentre 300 assinantes de um jornal, selecionado aleatoriamente,
afirmaram que lêem a seção cômica diariamente. Qual a probabilidade de um
assinante escolhido aleatoriamente não ler a seção cômica?
7) Um grupo de 100 alunos de dois cursos de uma faculdade foram escolhidos para
responderem a uma pesquisa. A tabela a seguir apresenta a composição destes
alunos:
Matemática Pedagogia
Homens 31 10
Mulheres 23 36
8) Uma livraria acaba de receber 40 novos livros, entre eles 12 romances históricos.
Se quatro desses livros são escolhidos aleatoriamente, e sem reposição, qual a
119
probabilidade de nenhum deles ser romance histórico? (Expressar o resultado em
fração)
Sexo e Número
Alas Masculino Feminino Total
A 415 220 635
B 250 375 595
C 105 220 325
Total 740 815 1555
120
11) Dois dados são lançados simultaneamente. Qual a probabilidade de o primeiro
resultado ser menor do que o segundo?
12) Um grupo de 100 alunos de dois cursos de uma faculdade foram escolhidos para
responderem a uma pesquisa. A tabela a seguir apresenta a composição destes
alunos:
Matemática Pedagogia
Homens 31 10
Mulheres 23 36
13) Uma livraria acaba de receber 40 novos livros, entre eles 12 romances
históricos. Se um desses livros é escolhido aleatoriamente, e sem reposição, qual a
probabilidade dele ser romance histórico? (Expressar o resultado em fração)
121
18) A MasterCard International efetuou um estudo de fraude em cartões de crédito.
Os resultados estão na tabela a seguir
Selecionada?
24) Se P( A) = 0,4 e P( B) = 0,5 , o que se pode dizer quanto a P( A ∪ B) se A e B são
eventos mutuamente exclusivos?
25) Num lote de 12 peças, 4 são defeituosas; três peças são retiradas
aleatoriamente. Calcule:
a. A probabilidade de ambas serem defeituosas.
b. A probabilidade de ambas não serem defeituosas.
c. A probabilidade de ao menos uma ser defeituosa.
26) Um lote é formado por 10 peças boas, 4 com defeitos leves e 2 com defeitos
graves. Uma peça é escolhida aleatoriamente. Calcule a probabilidade de:
a. Ela não tenha defeitos graves.
b. Ela não tenha defeito.
c. Ela ou seja boa ou tenha defeitos graves.
27) Três máquinas, A, B e C produzem respectivamente 40%, 50% e 10% do total
de peças de uma fábrica. As porcentagens de peças defeituosas nass respectivas
máquinas são 3%, 5% e 2%. Uma peça é selecionada aleatoriamente e verifica-se
que é defeituosa. Qual a probabilidade de que a peça tenha vindo da máquina B?
28) A probabilidade de o aluno X resolver um problema é de 3/5 e a do aluno Y
resolver o mesmo problema é de 4/7. Qual a probabilidade de que o problema seja
resolvido?
29) Um grupo de 15 elementos apresenta a seguinte composição:
Homem Mulher
Menores 5 3
Adultos 5 2
123
d. Sabendo-se que o elemento escolhido é adulto, qual a probabilidade de ser
homem?
e. Dado que a escolhida é mulher, qual a probabilidade de ser menor/
30) Suponha que um fabricante de sorvete recebe 20% de todo o leite que utiliza de
uma fazenda F1 , 30% de uma outra fazenda F2 e 50% de F3 . Um órgão de
31) Uma companhia que fura poços artesianos trabalha numa região escolhendo
aleatoriamente o ponto de furo. Não encontrando água nessa tentativa, sorteia outro
local e, caso também não tenha sucesso, faz uma terceira e última tentativa. Admita
probabilidade de 0,7 de encontrar água em qualquer ponto dessa região. Calcule a
probabilidade de:
a) encontrar água na segunda tentativa.
b) encontrar água em até duas tentativas
encontrar água.
124
Selecionando-se aleatoriamente uma pastilha qual a probabilidade dela ter alta
contaminação ou a pastilha esteja no centro de uma ferramenta de recolhimento?
125
Distribuições de probabilidade
Variável Aleatória
Definição:
Sejam E um experimento e S o espaço amostral associado ao experimento.
Uma função X, que associe a cada elemento s ∈ S um número real X (s ) é
denominada variável aleatória.
Veja a ilustração
Exemplo:
E: Lançamento de duas moedas;
X: Número de caras obtidas nas duas moedas;
S = {(c , c ), (c , k ), (k , c ), (k , k )}, onde c= cara e k= coroa;
A variável aleatória X pode assumir os valores 0, 1 e 2.
126
Definições:
Exemplo:
a. O número de espectadores que vêem um filme.
b. Número de peças produzidas em um dia.
Exemplo:
a) A voltagem em uma pilha.
b) Quantidade de leite em um copo.
Distribuição de Probabilidade
127
Tabela: Distribuição de probabilidade do nº
de caras no lançamento de duas moedas
Nº de caras Probabilidade
x
0 1/4
1 2/4
2 1/4
Total 1
Assim, definimos:
A Distribuição de probabilidade de uma variável aleatória X é a descrição do
conjunto de probabilidades associadas aos possíveis resultados de X. Podemos
também chamá-la de função de probabilidade.
Simbolicamente temos: p( xi ) = P( X = xi ) com i = 1, 2, ...
128
Gráfico: Distribuição de probabilidade do número
de caras no lançamento de duas moedas
2) ∑ p( x ) = 1 .
i
i
129
Tabela: Distribuição de probabilidade acumulada do nº
de caras no lançamento de duas moedas
Valores possíveis Distribuição acumulada
x
0 1/4
1 3/4
2 4/4
Valor esperado
A média ou valor esperado de uma variável aleatória X é dado por:
k
µ = E( X ) = ∑ xi . p( xi )
i =1
130
Variância
A variância de uma variável aleatória X é dada por:
0 1/4 0 0
1 2/4 2/4 2/4
2 1/4 2/4 1
Total 1 1 1,5
Assim
k
µ = ∑ xi . p( xi ) = 1
i =1
Var( X ) = E( X 2 ) − µ 2 = 1,5 − 1 = 0 ,5
Exercícios
1) Num lote de 12 peças, 4 são defeituosas. Duas peças são retiradas
aleatoriamente sem reposição. Resolva:
a) Encontre a distribuição de probabilidade associada a variável aleatória
X = número de peças defeituosas.
b) Faça o gráfico do resultado obtido na letra a.
c) Encontre a distribuição acumulada de X.
d) Faça o gráfico do resultado obtido na letra c
e) Encontre a média de peças defeituosas, ou seja, a média de X.
f) Encontre a variância do número de peças defeituosas, ou seja, a variância de X.
2) Considere o lançamento de um dado honesto. Encontre a distribuição de
probabilidade associada ao resultado da face deste dado.
131
x
3) Suponha P(x ) = (onde x assume valores 0, 1, 2, 3). P(x ) Define uma
5
distribuição de probabilidade?
x
4) Suponha P(x ) = (onde x assume valores 0, 1, 2). P(x ) Define uma distribuição
3
de probabilidade?
3
5) Suponha P(x ) = (onde x assume valores 0, 1, 2, 3). P(x ) Define uma
[4(3 − x)! x!]
distribuição de probabilidade?
6) O peso de um livro escolhido aleatoriamente é uma variável aleatória discreta ou
contínua?
7) O custo de uma peça escolhida aleatoriamente é uma variável aleatória discreta
ou contínua?
8) Suponha que a variável aleatória discreta x possa tomar os valores 1, 2, 3, ..., n e
(n + 1)
que esses valores sejam igualmente prováveis. Mostre que µ = e
2
σ2 =
(n 2
−1 )
12
Pricipais propriedades:
Considere c constante e X e Y variáveis aleatórias.
Média Variância
E(c) = c V(c) = 0
E(X+c) = E(X) + c V(X + c) = V(X)
E(cX) = c E(X) V(cX) = c2 V(X)
E(X+Y) = E(X) + E(Y) DP(cX) = |c| DP(X)
E(X-Y) = E(X) - E(Y)
132
Distribuições discretas de probabilidade
I) Distribuição Binomial
Exercícios:
1) Num lote de 12 peças, 4 são defeituosas; duas peças são retiradas
aleatoriamente e com reposição. Calcule:
a) Qual a probabilidade de ambas serem defeituosas?
b) Qual a probabilidade de apenas uma ser defeituosa?
133
Solução:
a) Usando probabilidade (regra da multiplicação) temos
4 4 1
P ( A) = ⋅ = .
12 12 9
Resolvendo usando a distribuição binomial temos:
4
Seja A: uma peça ser defeituosa. Então P ( A) = p = . Assim a probabilidade de
12
retirar duas peças defeituosas é:
2 2
2 4 4 2−2 2 4 8 0 16 1
P( X = 2) = . .(1 − ) = . .( ) = =
2 12 12 2 12 12 144 9
b) Exercício
2
3
18
b) P( X ≥ 4) = 1 − P( X < 4 ) = 1 − ∑ .(0,1) .(1 − 0,1)18− x = 0,098
x
x =0 x
6 18
c) P(3 ≤ X < 7) = ∑ .(0,1) .(1 − 0,1)18− x = 0,265
x
x =3 x
134
e) e de itens bons?
135
A distribuição é chamada geométrica porque seus valores sucessivos
constituem uma progressão geométrica.
Considere um experimento E e uma variável aleatória X com
probabilidade de sucesso p. Se X tem distribuição geométrica, então a
probabilidade de X obter sucesso na x-ésima prova é dada por
P ( X = x ) = p (1 − p )
x −1
, x = 1, 2, 3, L
onde
1
E(X ) =
p
Var ( X ) =
(1 − p )
p2
Exercícios;
1) Num lote de 12 peças, 4 são defeituosas. Seleciona-se aleatoriamente 5 peças,
com reposição. Qual a probabilidade de a primeira peça defeituosa ser a 3ª peça
escolhida?
Solução: A probabilidade de uma peça ser defeituosa é
4
p(defeito ) = = 0 ,3333
12
Escolhida 5 peças, a probabilidade da primeira peça defeitosa ser a 3ª é
P ( X = 3) = 0,3333 ⋅ (1 − 0,3333 ) = 0,1481
2
136
3) A probabilidade de uma criança contrair uma doença contagiosa, à qual está
exposta é 0,70. Qual é a probabilidade de a sétima criança exposta à doença ser a
primeira a contraí-la?
4 8
2 2 − 2 1
P( X = 2) = =
4 + 8 11
2
Exemplo:
a) número de consultas em uma base de dados por minuto;
b) número de erros de tipografia em um formulário;
Se tivermos:
a) Independência entre as ocorrências do evento e
b) Os eventos ocorrerem de forma aleatória,
Exercícios:
1) Suponha que as consultas num banco de dados ocorrem de forma independente
e aleatória, com uma taxa média de três consultas por minuto. Qual a probabilidade
de que no próximo minuto ocorram:
a) nenhuma consulta?
137
b) uma consulta?
c) duas consultas?
d) menos do que três consultas?
Solução:
Seja λ = taxa média = 3 consultas/min.
a) Queremos a probabilidade de não ter consulta no próximo minuto, ou seja,
x = 0. Assim
e −3 .30 0,0498 ⋅ 1
P ( X = 0) = = = 0,0498
0! 1
Portanto a probabilidade de, no próximo minuto, ter nenhuma consulta é 0,0498.
b) Queremos a probabilidade de ter 1 consulta no próximo minuto, ou seja,
x = 1. Assim
e −3 .31 0,0498 ⋅ 3
P ( X = 1) = = = 0,1494
1! 1
Portanto a probabilidade de, no próximo minuto, ter uma consulta é 0,1494.
c) Queremos a probabilidade de ter 2 consultas no próximo minuto, ou seja,
x = 2. Assim
e −3 .3 2 0,0498 ⋅ 9
P ( X = 2) = = = 0,2241
2! 2
Portanto a probabilidade de, no próximo minuto, ter duas consultas é 0,2241.
a) P( X = 4 )
b) P( X ≤ 2)
138
4) O número de falhas na superfície de painéis de plástico usados no interior de
automóveis tem uma distribuição de poisson, com uma média de 0,05 falha por pé
quadrado de painel de plástico. Considere que o interior de um automóvel contém 10
pés quadrados de painel plástico. (Obs.: um pé equivale a 30,48 cm)
139
Distribuições contínuas de probabilidade
Uma variável aleatória X é dita contínua quando ela assume qualquer valor
real dentro de um intervalo.
Exemplos:
1) Altura de uma pessoa;
2) Tempo de viagem;
3) Tempo de uma reação química;
4) Volume de leite em um copo; etc
Definição
1) f ( x ) ≥ 0, ∀x real
+∞
∫ f ( x)dx = 1
2) −∞
b
3) Se A = [a, b] , então P(a ≤ X ≤ b) = ∫ f ( x)dx .
a
Exemplos:
140
A função de distribuição acumulada de uma variável aleatória contínua X é:
x
F (x ) = P( X ≤ x ) = ∫ f (u )du
−∞
+∞
b) σ = Var ( X ) = ∫ ( x − µ ) 2 . f ( x)dx .
2
−∞
141
I) Distribuição Uniforme.
Uma variável aleatória X tem distribuição uniforme quando todos os seus valores
possíveis tem a mesma probabilidade.
A curva de densidade de X é uma reta horizontal.
1
, para x ∈ [α , β ]
f ( x) = β − α
0, para x ∉ [α , β ]
Neste caso
α +β (β − α ) 2
E( X ) = e Var ( X ) = .
2 12
Exemplos:
142
Exercício:
1) Um profissional de computação observou que seu sistema gasta entre 20 e 24
segundos para realizar determinada tarefa. Considere a probabilidade uniforme em
[20, 24]. Resolva:
a) Encontre, graficamente, a função densidade de probabilidade.
b) P ( X > 23) .
c) E( X )
d) Var ( X ) .
70
f (x ) =
69 x 2
para 1 < x < 70 libras.
Calcule:
c) Se o custo para despachar for R$ 5,00 por libra, qual será o custo médio para
despachar um pacote?
d) a variância do peso?
143
II) Distribuição Exponencial
f (t ) = λ.e − λ .t
1 1
Onde E (T ) = e Var (T ) =
λ λ2
b
− λ .t
A probabilidade P (a ≤ T ≤ b ) = ∫ λ .e .
a
144
Exercícios:
1) Seja a variável aleatória T definida como o tempo de resposta na consulta a um
banco de dados, em minutos. Suponha que essa variável tenha a seguinte função
densidade de probabilidade:
2e −2t , para t ≥ 0
f ( x) =
0, para t < 0
Calcule:
a) A probabilidade de a resposta demorar mais do que 3 minutos?
b) Calcule P ( 2 ≤ T ≤ 3) .
Solução:
∞
− 2.t
a) P (T ≥ 3 ) = ∫ 2.e dt = −e − 2.t ∞
3 = −e − 2.∞ + e − 2.3 =0 + 0 ,0025 = 0 ,0025 .
3
3
P(2 ≤ T ≤ 3) = ∫ 2.e − 2.t dt = −e − 2.t 32 = −e − 2.3 + e − 2.2 =0 ,0025 + 0 ,0183
b) 2
= 0 ,0208
145
3) A função densidade de probabilidade do tempo em que clientes chegam a um
terminal (em minutos depois de 8h) é
x
−
e 10
f (x ) =
10
para x > 0. Determine a probabilidade de:
a) o primeiro cliente chegar até 9h.
b) o primeiro cliente chegar entre 8h15min e 8h30min.
c) dois ou mais clientes chegarem antes das 8h40min, entre os cinco que chegam ao
terminal. Considere que as chegadas dos clientes sejam independentes.
d) determine a função de distribuição acumulada.
146
III) Distribuição Normal
100
50
10
15
20
25 0
30
35
40 0
45
50
55
60
0
0,
00
00
00
00
00
00
00
00
00
00
00
0
,0
,0
,0
,0
,0
,0
,0
,0
,0
Vendas de auto peças
Definição
Dados os parâmetros µ e σ > 0 reais, a função densidade de probabilidade
da normal é dada por:
1 x−µ 2
1 − (
2 σ
)
f ( x) = .e
σ . 2π
Onde E ( X ) = µ e Var ( X ) = σ .
147
Como existem uma infinidade de distribuições normais (uma para cada média
e desvio-padrão), transformamos a unidade estudada seja ela qual for (peso,
espessura, tempo, etc.) na unidade Z, que indica o número de desvios-padrão a
contar da média.
Para padronizar um conjunto de dados que tem distribuição normal é só
aplicar a fórmula
X −µ
z=
σ
148
Exercícios
1) Utilizando a tabela da distribuição normal padronizada calcule:
a) P ( z < 0 ,42 )
b) P ( z < 0 ,75 )
c) P ( z < −0 ,30 )
d) P ( z > 0 ,56 )
e) P (0 ,25 < z < 0 ,72 )
f) P (− 0 ,25 < z < 0 ,20 )
2) xlim f (x ) = 0
→∞
área=1
área=0,5 área=0,5
149
f(x)
A B
Exercícios
150
2) Uma fábrica de chocolates comercializa barras que pesam em média 200g. Os
pesos são normalmente distribuídos. Sabe-se que o desvio padrão é igual a 40g.
Calcule a probabilidade de uma barra de chocolate, escolhida aleatoriamente, pesar
a) entre 200 e 250g;
b) mais de 230g;
c) menos que 150g.
3) Suponha que uma variável aleatória X tenha distribuição normal com média 5 e
desvio-padrão 4. Calcule:
P(2 ≤ X < 8 )
151
Teste de Hipótese
Teste de Hipótese
Exemplos:
a) Testar a afirmação de que a média populacional é 75.
Solução: Neste caso temos H 0 : µ = 75 e H1 : µ ≠ 75 .
H 0 verdadeira H 0 falsa
152
5) Erro tipo II: Consiste em não rejeitar a hipótese nula quando ela é falsa.
6) A probabilidade de ocorrer o erro tipo II é β .
7) Estatística de teste: É uma estatística amostral baseado nos dados amostrais.
8) Região crítica: É o conjunto de todos os valores da estatística de teste que
levam à rejeição da hipótese nula.
9) Valor Crítico: É o valor, ou valores, que separa(m) a região crítica dos valores
da estatística de teste que não levam à rejeição da hipótese nula.
Tipos de teste
153
• Unilateral esquerdo (sinal de H1 : <): a região crítica está situada na parte
esquerda. Neste caso P(Erro tipo I ) = α .
• Unilateral direito (sinal de H1 : >): a região crítica está situada na parte direita.
P(Erro tipo I ) = α .
154
Teste de uma afirmação sobre uma média: grandes amostras
x − µx
Estatística de teste: z =
σ
n
Exemplo:
O tempo médio entre falhas de um rádio da Telektronic Companhy para
aviões de pequeno porte é 420 horas. Após terem sido modificados 35 aparelhos de
rádio, em uma tentativa de melhorar sua confiabilidade, os testes acusaram um
tempo médio de 385 horas para esta amostra, com desvio-padrão de 24 horas. Ao
nível de significância de 0,05, teste a afirmação de que o tempo médio, após as
modificações, é menor que 420 horas .
Solução:
H 0 : µ ≥ 420
a) As hipóteses são:
H1 : µ < 420
b) O teste é unilateral esquerdo, pois o sinal de H1 é <.
c) O nível de significância é α = 0,05 ;
155
e) Os dados amostrais são: x = 385 e s = 24 ;
f) Como n=35 ( n ≥ 30 ), a estatística de teste é dada por:
x − µx 385 − 420
z= = = −8,63
σ 24
n 35
Exercícios
2) A vida média de uma amostra de 100 lâmpadas de certa marca é 1615 horas.
Por similaridade com outros processos de fabricação, supomos o desvio-
padrão igual a 120 horas. Utilizando um nível de significância de 2 %, teste a
afirmação de que a duração média de todas as lâmpadas dessa marca é igual
a 1600 horas.
156
Teste de uma afirmação sobre uma média: pequenas amostras
x − µx
Estatística de teste: t =
s
n
Exemplo:
Os sete valores relacionados a seguir são cargas axiais (em libras) da
primeira amostra de sete latas de alumínio de 12oz. A carga axial de uma lata é o
peso máximo que seus lados podem suportar, e deve ser superior a 165 libras,
porque esta é a pressão máxima aplicada quando se fixa a tampa no lugar. Ao nível
de significância de 0,01, teste a afirmação do engenheiro supervisor de que esta
amostra provém de uma população com média superior a 165 libras.
Solução:
H 0 : µ ≤ 165
a) As hipóteses são:
H1 : µ > 165
b) O teste é unilateral direito, pois o sinal de H1 é>;
c) O nível de significância é α = 0,01 ;
157
d) O valor do grau de liberdade é de 7-1 = 6. Logo o valor crítico é tα = 3,143 ;
Logo temos:
x − µ x 252,7 − 165
t= = = 8,407
s 27,6
n 7
Exercícios
82 - 84 - 78 - 85 - 69 - 80 - 75
158
2) O inspetor de qualidade da JF Construções mediu 25 barras de aço e obteve
as seguintes medidas em metros:
4,51 5,38 4,84 5,33 4,74 4,99 5,15 5,52 5,82 5,45
4,68 4,74 5,53 5,40 4,72 4,97 5,24 4,94 4,75 5,50
4,81 5,25 4,86 4,93 4,95
Pode-se afirmar, com com nível de significância de 5%, que tais barras foram
sacadas de um lote cujo comprimento médio é de 5,00 metros?
Estatística de teste: χ 2
=
(n − 1) ⋅ s 2
,
σ2
onde
n = tamanho da amostra
s 2 = variância amostral
σ 2 = variância populacional
159
Exemplo:
O tempo para transmitir 10 MB em determinada rede de computadores varia
segundo um modelo normal, com média 7,4 segundos e variância 1,3 segundos.
Depois de algumas mudanças na rede, acredita-se numa redução no tempo de
transmissão de dados, Além de uma possível mudança na variabilidade. Foram
realizados 10 ensaios independentes com um arquivo de 10 MB e foram coletados
os tempos de transmissão, em segundos:
6,8 7,1 5,9 7,5 6,3 6,9 7,2 7,3 6,6 6,3
Resolva:
a) Existe evidência suficiente de que as mudanças na rede de computadores
alteraram a variabilidade no tempo de transmissão de dados? Ao nível de
0,05.
b) Existe evidência suficiente de que as mudanças na rede de computadores
alteraram o tempo médio de transmissão de dados? Ao nível de 0,05
Solução da letra a:
H 0 : σ 2 = 1,3
a) As hipóteses são: 2
H 1 : σ ≠ 1,3
160
d) O valor do grau de liberdade é de 10-1 = 9. Logo os valores críticos são
χ 2 = 2,700 e χ 2 = 19,023 ; Logo temos:
(10 − 1) ⋅ 0,261
χ2 = = 1,807
1,3
Exercícios
161
Teste a hipótese de que o desvio-padrão é 1, ao nível se significância de 0,05.
SUPOSIÇÕES:
1) São verificadas as condições para um experimento binomial. Isto é, temos um
número fixo de provas independentes com probabilidade constante, e cada
prova comporta dois resultados, que designamos “sucesso” e “falha”.
162
______________________________________________________________
NOTAÇÃO:
n : número de provas;
p : proporção populacional (usada na hipótese nula);
x
pˆ = : proporção amostral;
n
q =1 − p
______________________________________________________________
ESTATÍSTICA DE TESTE:
pˆ − p
z=
pq
n
Os valores críticos são obtidos na tabela A – 2 (distribuição normal
padronizada).
Exemplos:
1) Uma empresa retira periodicamente amostras aleatórias de 500 peças de sua
linha de produção para análise da qualidade. As peças da amostra são
classificadas como defeituosas ou não, sendo que a política da empresa
exige que o processo produtivo seja revisto se houver evidência de mais de
1,5% de peças defeituosas. Na última amostra, foram encontradas nove
peças defeituosas. Usando nível de significância de 1%, o processo precisa
ser revisto?
Solução:
H 0 : p ≤ 0,015
h) As hipóteses são:
H 1 : p > 0,015
i) O teste é unilateral direito, pois o sinal de H1 é > .
j) O nível de significância é α = 0,01 ;
163
9
l) Os dados amostrais são: pˆ = = 0,018
500
m) Critérios para a aproximação normal:
o) Conclusão: Como a estatística de teste está fora da região crítica, então não
rejeitamos H 0 .
164
Para verificar a validade desta afirmação, foi coletada uma amostra de 150
lâmpadas das quais 138 estavam sem defeito.
Com 1% de significância, há evidência de que o processo está de acordo com
o esperado?
165
Distribuição Amostral
Exemplos:
Propriedade do estimador:
()
E x =µ
( )
E s2 = σ 2
1 1 2 3
1 3
A média amostral é 2.
A média populacional é 1,75.
X −µ
Z=
σ
n
quando n tende ao infinito, é a distribuição normal padrão.
Ou:
167
Teorema Central do Limite
µx = µ
Por sua vez, o desvio-padrão das médias amostrais se denota por σ x ; então,
σ
σx =
n
Exemplo:
L(θ ) = f ( x1 , θ ) ⋅ f ( x 2 , θ ) ⋅ L ⋅ f ( xn , θ )
P( X 1 = x1 , K , X n = xn )
Exemplo:
168
(x − µ )
i
2
1 −
Sugestão: Utilize f ( x, µ ) = e 2σ 2
σ 2π
169
Correlação
Com muita freqüência, na prática, verifica-se que existe uma relação entre
duas (ou mais) variáveis. Por exemplo: os pesos dos adultos do sexo masculino
dependem, em certo grau, de suas alturas; as circunferências de círculos dependem
de seus raios; a pressão de uma determinada massa de gás depende de sua
temperatura e de seu volume.
Em engenharia uma das perguntas interessantes é:
170
Vamos aqui estudar variáveis que se relacionam linearmente. No final deste
estudo daremos um exemplo de variáveis que não se relacionam linearmente e sim
de forma quadrática.
Definição: Existe uma correlação entre duas variáveis quando uma delas está, de
alguma forma, relacionada com a outra.
n ∑ xy − ( ∑ x )( ∑ y )
r =
n ∑ x 2 − ( ∑ x )2 . n ∑ y 2 − ( ∑ y )2
171
Propriedades do Coeficiente de Correlação Linear r
30
25
20
Y 15
10
5
0
0 5 10
X
30
25
20
Y 15
10
5
0
0 5 10
X
30
25
20
Y 15
10
5
0
0 2 4 6 8 10
X
30
25
20
Y 15
10
5
0
0 2 4 6 8 10
X
Correlação nula
30
25
20
Y 15
10
5
0
0 2 4 6 8 10
X
173
Quando não houver relação entre as variáveis X e Y, ou seja, quando as
variações de X e Y ocorrerem independentemente não existe correlação entre elas.
Neste caso r = 0.
Correlação não-linear
30
20
Y
10
0
0 5 10
X
Assim,
174
n ∑ xy − (∑ x)(∑ y )
r=
n∑ x 2 − (∑ x ) 2 . n∑ y 2 − (∑ y ) 2
9 ⋅ (26.864,4) − (220,5) ⋅ (1.333)
r=
9 ⋅ (7.053,67) − (220,5)2 ⋅ 9 ⋅ (220.549 ) − (1.333)2
r = −0,938
Interpretação do valor de r
175
Método: Estatística de Teste é r. Usamos o valor calculado do Coeficiente de
Correlação Linear de Pearson r.
176
Regressão Linear
Suposições:
Fórmulas:
Estimamos os valores b0 e b1 , utilizando método dos mínimos quadrados,
pelas fórmulas a seguir.
(∑ y)( ∑ x 2 ) − (∑ x )( ∑ xy )
b0 =
n(∑ x 2 ) − (∑ x ) 2
n(∑ xy ) − (∑ x )(∑ y)
b1 =
n(∑ x 2 ) − (∑ x ) 2
177
Arredondamentos
(∑ y )(∑ x 2 ) − (∑ x)(∑ xy )
b0 =
n( ∑ x 2 ) − ( ∑ x ) 2
(1.333)(7.053,67) − (220,5)(26.864,4)
b0 =
9 ⋅ (7.053,67) − (220,5) 2
b0 = 234,07
e
n(∑ xy ) − (∑ x)(∑ y )
b1 =
n(∑ x 2 ) − (∑ x ) 2
9 ⋅ (26.864,4) − (220,5)(1.333)
b1 =
9 ⋅ (7.053,67) − (220,5) 2
b1 = −3,51
178
y = 234,07 − 3,51 ⋅ 41
y = 90,16
Estimativa da variância
n
Seja SQE = ∑ ( yi − yˆ i )2 a soma dos quadrados dos erros. Uma estimativa da
i =1
Volume desgastado
-4 3 Yˆ (Y − Yˆ ) 2
Y (10 mm )
240 228,454 133,3101
181 201,076 403,0458
193 179,665 177,8222
155 163,87 78,6769
172 156,85 229,5225
110 109,465 0,286225
113 83,14 891,6196
75 91,915 286,1172
94 118,24 587,5776
2.787,978
Assim,
SQ E
σˆ 2 =
n−2
2.787,978
σˆ 2 =
7
σˆ 2 = 398,28
179
Exemplo:
1) Os dados a seguir trazem os resultados do experimento que avalia o índice de
octanagem da gasolina (y) em função da adição de um novo aditivo (x), em
porcentagem.
x (%) y (%)
1 80
2 81
3 82
4 83
5 83
6 85
H 0 : β0 = 0 H 0 : β1 = 0
e
H1 : β 0 ≠ 0 H 1 : β1 ≠ 0
βˆ0
T0 = onde T0 tem distribuição t com n-2 graus de liberdade. Utilizamos
σˆ 2
S xx
2
n
∑ xi
n
2 i =1
S xx = ∑ xi − .
i =1
n
180
Utilizamos o método análogo para testar β1 . Neste caso a estatística de teste
βˆ1
é T1 = onde T1 tem distribuição t com n-2 graus de liberdade.
σˆ2
S xx
2
n
∑ xi
n
2 i =1
S xx = ∑ xi −
i =1
n
S xx = 7.053,67 −
(220,5)2
9
S xx = 7.053,67 − 5.402,25
S xx = 1.651,42
Estatística de teste
βˆ0
T0 =
σˆ 2
S xx
234,07
T0 =
398,28
1.651,42
T0 = 476,63
Estatística de teste
181
βˆ1
T1 =
σˆ 2
S xx
− 3,51
T1 =
398,28
1.651,42
T1 = −7,147
σˆ 2 σˆ 2
βˆ1 − tα ,n−2 S
≤ β1 ≤ ˆ +t
β 1 α ,n−2
2 xx 2 S xx
1 x2
2 1 x2
βˆ0 − tα ,n −2
σˆ 2 + ≤ β 0 ≤ βˆ0 + tα , n − 2 σˆ +
2 n S xx 2 n S xx
1 x2
2 1 x2
βˆ0 − tα ,n−2
σˆ 2 + ≤ β 0 ≤ ˆ
β 0 + t α ,n−2 σˆ +
2 n S xx 2 n S xx
1 24,5 2 1 24,5 2
234,07 − 2,365 398,28 + ≤ β 0 ≤ 234,07 + 2,365 398,28 +
9 1.651,42 9 1.651,42
1 24,5 2 1 24,5 2
234,07 − 2,365 398,28 + ≤ β 0 ≤ 234,07 + 2,365 398,28 +
9 1.651,42 9 1.651,42
201,56 ≤ β 0 ≤ 266,58
182
ˆ σˆ 2 ˆ σˆ 2
β1 − tα , n − 2 ≤ β1 ≤ β1 + tα , n − 2
2 S xx 2 S xx
398,28 398,28
− 3,51 − 2,365 ≤ β1 ≤ −3,51 + 2,365
1.651,42 1.651,42
− 4,67 ≤ β1 ≤ −2,35
Exercício:
Y = 74,283 + 14,947 X
Se =
∑ y 2 − b0 ∑ y − b1 ∑ xy
n−2
Se =
∑ y 2 − b0 ∑ y − b1 ∑ xy
n−2
220.549 − 234,07 ⋅ (1.333) − (− 3,51) ⋅ 26.864,4
Se =
7
S e = 403,962
S e = 20,01
183
Regressão Múltipla
_______________________________________________________________
Definição:
Uma equação de regressão múltipla expressa um relacionamento linear entre
uma variável dependente y e duas ou mais variáveis independentes
(x1 , x2 , K, xk ) .
_______________________________________________________________
Notação:
yˆ = b0 + b1 x1 + b2 x2 + L + bk xk + ε : fórmula geral da equação de regressão múltipla
estimada;
n : tamanho da amostra;
k : número de variáveis independentes;
ŷ : valor predito da variável dependente;
x1 , x2 , K, xk : variáveis independentes;
β 0 : intercepto;
b0 : estimativa de β 0 ;
β1 , β 2 , K, β k : coeficientes das variáveis independentes x1 , x2 , K, xk ;
b1 , b2 , K, bk : estimativas de β1 , β 2 , K, β k .
ε : erro
Exemplos:
Os dados seguintes se referem ao mercado brasileiro de tratores e
colheitadeiras. Baseados neles, determine a equação de regressão múltipla da
produção em função das vendas internas e das exportações.
184
Ano 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000
Produção 22,20 22,08 32,18 51,33 28,34 22,19 31,66 33,41 28,22 35,43
Vendas
18,94 16,84 27,41 46,69 22,74 13,97 21,47 24,85 24,70 31,06
internas
Exportações 4,22 5,82 4,48 5,03 5,26 8,36 10,06 8,86 4,21 5,27
Estatística de regressão
R múltiplo 0,998739179
R-Quadrado 0,997479948
R-quadrado 0,996759933
ajustado
Erro padrão 0,498084785
Observações 10
ANOVA
gl SQ MQ F F de
significação
Regressão 2 687,3836208 343,6918104 1385,359963 8,03403E-
10
Resíduo 7 1,736619173 0,248088453
Total 9 689,12024
185
RESULTADOS DE RESÍDUOS
Interpretações:
Na primeira tabela:
• o valor de R-quadrado igual a 0,997 indica que, na amostra observada, cerca
de 99,7% da variação da produção pode ser explicada por uma relação linear
que envolve as vendas internas e as exportações.
186
187
Bibliografia
188
Anexo 1
freqagrup<-function(dados){
cat("Dados",dados,"\n\n")
n<-length(dados)
cat("dimensão dados =",n,"\n\n")
menor<-min(dados)
maior<-max(dados)
At<-maior-menor;
k1<-1+3.3*log(n)/log(10);
cat("Numero de classes sem arredondamento =",k1,"\n\n")
k2<-round(1.5+3.3*log(n)/log(10),0);
cat("Número de classes arredondado =",k2,"\n\n")
k<-k2
Ac<-At/k;
cat("At =",At,"\n\n")
cat("k =",k,"\n\n")
cat("Ac =",Ac,"\n\n")
for(j in 1:k){
if(j<k){
freq2<-0
freq1<-0
for(i in 1:n){
if((menor+(j-1)*Ac)<=dados[i]&dados[i]<(menor+(j)*Ac)){
freq<-1
freq1<-freq+freq1
}
}
freq2[j]<-freq1
if((menor+(j-1)*Ac)<=dados[i]&dados[i]<=(menor+(j)*Ac)){
freq<-1
freq1<-freq+freq1
}
189
}
freq2[j]<-freq1
190
Anexo 2
Comandos Software R
#=======================================================
Gerar amostras aleatórias
#=======================================================
#=======================================================
# Mudar diretório
#=======================================================
Arquivo
Mudar diretorio
Nome da pasta
#=======================================================
# Leitura e Preliminares dos Dados
#=======================================================
191
#==========================================================
# Estatísticas Descritivas
#==========================================================
summary(gasolina)
summary(frango)
mean(gasolina)
median(gasolina)
var(gasolina)# variância
cov(frango,alcatra) #Covariância
cor(frango,alcatra)#correlação
#==============================================================
# Tabela
#===============================================================
#==============================================================
# Graficos
#===============================================================
boxplot(gasolina,ylab="Preços da Gasolina")
boxplot(frango,alcatra,ylab="Preços",xlab="frango X alcatra")
hist(frango)
plot(alcatra)
par(mfrow=c(2,1))#divide a tela em 2.
hist(gasolina)
192
abline(v=mean(gasolina))# faz uma linha na média de x1.
#==============================================================
Regressão linear
#===============================================================
193