Escolar Documentos
Profissional Documentos
Cultura Documentos
Universidade Federal Do Rio Grande Do No
Universidade Federal Do Rio Grande Do No
Estatística Aplicada
a Engenharia I
Natal / RN
ÍNDICE
REFERÊNCIAS
ANEXOS
ANEXO A - DISTRIBUIÇÃO NORMAL PADRÃO
TABELA B - DISTRIBUIÇÃO T DE STUDENT
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
UNIDADE I
ESTATÍSTICA DESCRITIVA
Estatística é a ciência que diz respeito à coleta, apresentação e análise de dados quantitativos, de tal
forma que seja possível efetuar julgamentos sobre os mesmos.
Ramos da Estatística:
a) Estatística descritiva → trata da observação de fenômenos de mesma natureza, da coleta de
dados numéricos referentes a esses fenômenos, da sua organização e classificação através de
tabelas e gráficos, bem como da análise e interpretação.
b) Probabilidade estatística → utilizada para analisar situações que envolvem o acaso
(aleatoriedade).
c) Inferência estatística → estuda as características de uma população com base em dados
obtidos de amostras.
OBS: Estatística Indutiva pode ser denominada como inferência. Portanto, a estatística indutiva
estuda as características de uma população, com base em dados obtidos de amostras.
andrerochaest@yahoo.com.br
1
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
3) Coleta de Dados → consiste na busca ou compilação dos dados. Pode ser classificado,
quanto ao tempo em:
• Contínua (inflação, desemprego, etc);
• Periódica (Censo);
• Ocasional (pesquisa de mercado, eleitoral)
4) Crítica dos dados → objetiva a eliminação de erros capazes de provocar futuros enganos.
Faz-se uma revisão crítica dos dados suprimindo os valores estranhos ao levantamento.
5) Apresentação dos dados → a organização dos dados denomina-se “Série Estatística”. Sua
apresentação pode ocorrer por meio de tabelas e gráficos.
6) Análise e Interpretação dos Dados → consiste em tirar conclusões que auxiliem o
pesquisador a resolver seu problema, descrevendo o fenômeno através do cálculo de medidas
estatísticas, especialmente as de posição e as de dispersão.
andrerochaest@yahoo.com.br
2
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
POPULAÇÃO:
É o conjunto de elementos (na totalidade) que têm, em comum, uma determinada
característica. Pode ser finita, como o conjunto de alunos de uma determinada escola, ou infinita,
como o número de vezes que se pode jogar um dado.
AMOSTRA:
É qualquer subconjunto da população. A técnica de seleção desse subconjunto de elementos
é chamada de Amostragem.
Como já vimos, a inferência estatística tem como objetivo a estimação de parâmetros para uma
população tendo como base às informações extraídas através de uma amostra. Neste contexto, o
estudo dos mais diversos tipos de procedimentos de amostragem se faz necessário.
Exercício 1.1: Dentre os 3000 alunos de uma escola, selecionaram-se 30 e inquiriram-se sobre o
programa de televisão preferido. Sendo respondidos como programas preferidos “Telejornal”,
“Novelas” e “Cinema”, com 10, 12 e 8 alunos, respectivamente. Responda:
a) a população;
b) a amostra.
Exercício 1.2: Para saber a aceitação de uma nova ração canina para filhotes de médio porte, uma
empresa selecionou 200 filhotes com até 6 meses de idade de diversas raças de médio portem, e
contabilizou a engorda deles.
Indique:
a) a população;
b) a amostra;
Exercício 1.3: Para realizar um estudo sobre o tempo gasto, em segundos, por 100 atletas na corrida
dos 100 metros com obstáculos, registrou-se o tempo gasto por 16 desses atletas e obtiveram-se os
seguintes resultados:
Indique:
a) a população;
b) a amostra;
andrerochaest@yahoo.com.br
3
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
Exercício 1.4: Um aluno da UFMG do curso de “Cinema de Animação e Artes Digitais ” realizou
um sorteio dentre todas as fitas de VHS da biblioteca de sua Universidade, de 8 fitas para seu
Trabalho de Conclusão de Curso.
a) a população;
b) a amostra;
• Amostragem Aleatória Simples: cada elemento da população tem a mesma chance (ou
probabilidade) de ser selecionado. Os elementos são escolhidos através de sorteio. Para isso,
tabelas de números aleatórios são frequentemente utilizadas. Por exemplo, selecionar 5
alunos de uma turma usando a lista de chamada.
andrerochaest@yahoo.com.br
4
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
Exercício 1.6: Para cada uma das seguintes situações diga qual o tipo de amostragem foi utilizada.
− O conselho universitário de uma universidade deseja conhecer a opinião dos alunos e
professores sobre uma resolução a ser votada, que estabelece horários fixos para o
atendimento de alunos pelos professores. Para compor a amostra foram sorteados
aleatoriamente 10% dos alunos matriculados e 10% dos professores.
− Um treinador de uma confederação esportiva deseja dividir 20 times em dois grupos. Para o
primeiro grupo seleciona aleatoriamente 10 times, e considera os 10 restantes para o segundo
grupo.
− Uma lista de corredores de uma maratona contém 1000 nomes, numerados consecutivamente
de 1 a 1000. Iniciando-se do 5º nome, uma amostra foi composta considerando sorteados os
nomes referentes aos números 15º, 25º, 35º, 45º, 55º e assim sucessivamente até que fossem
escolhidos 100 nomes.
andrerochaest@yahoo.com.br
5
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
− Um treinador sorteia 6 jogadores de seu time de futebol sem mais critério s de seleção e tira
uma amostra de urina de cada um.
− O programa Planned Parenthood (Planejamento Familiar) pesquisa 500 homens e 5000
mulheres sobre seus pontos de vista sobre o uso de anticoncepcionais.
TIPOS DE VARIÁVEIS:
É condição inerente a uma população natural existir variação quanto aos atributos que lhe podem
ser estudados. Portanto, a variabilidade é uma característica comum aos dados de observação e
experimentos. Um atributo sujeito à variação é descrito em Estatística por uma variável.
Nominal
Qualitativa
Ordinal
Variável
Discreta
Quantitativa
Contínua
Variável Qualitativa: os dados podem ser distribuídos em categorias mutuamente exclusivas. Por
exemplo, sexo (masculino, feminino), cor, causa de morte, grupo sanguíneo, etc.
- Nominal: as categorias podem ser permutáveis (não existe ordem natural dos seus níveis);
Exemplo: [masculino, feminino], [sim, não], [fuma, não fuma];
Variável Quantitativa: os dados são expressos através de números. Por exemplo, idade, estatura,
peso, etc.
- Discreta: Assumem valores que podem ser associados aos números naturais ( = 1, 2, 3,... ).
Dá uma ideia de contagem.
Exemplo: Número de irmãos dos 30 alunos da turma de Engenharia
[0, 1, 2, 5, 3, 4, 1, 0, 2, 3, 5, 4, 0, 1, 2, 2, 1, 0, 1, 1, 2, 0, 0, 3, 2 , 3, 4, 2, 1, 2].
andrerochaest@yahoo.com.br
6
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
Consiste em dispor os dados em linhas e colunas, distribuídas de modo ordenado, segundo algumas
regras práticas e obedecendo (ainda) à Resolução nº 886/66, de 26 de outubro de 1966, do Conselho
Nacional de Estatística. As tabelas devem conter:
andrerochaest@yahoo.com.br
7
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
Tabelas com grandes números de dados são cansativas e não dão uma visão rápida e geral do
fenômeno. Dessa forma, é necessário que os dados sejam organizados em uma tabela de
distribuição de frequências. Estas podem ser simples (dados não-agrupados) ou por classes (dados
agrupados).
Exemplo 1.2: Numa pesquisa feita para detectar o número de filhos de empregados de uma
multinacional, foram encontrados os seguintes valores:
1 4 2 5 3 2 0 3 2 1 5 4 2 5 0
3 2 4 2 3 2 3 2 1 4 2 1 3 4 2
Solução:
Rol (dados em ordem crescente):
0 0 1 1 1 1 2 2 2 2 2 2 2 2 2
2 3 3 3 3 3 3 4 4 4 4 4 5 5 5
andrerochaest@yahoo.com.br
9
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
Exemplo 1.3: Veremos como fica a distribuição de frequências simples com essas informações
adicionais:
Número de filhos de empregados de uma multinacional
Nº de filhos fi f % F↓ F↑ F↓% F↑%
0 2 6,7 2 30 6,7 100
1 4 13,3 6 28 20 93,3
2 10 33,3 16 24 53,3 80
3 6 20 22 14 73,3 46,7
4 5 16,7 27 8 90 26,7
5 3 10 30 3 100 10
Total 30 100 - - - -
Fonte: Dados fictícios
Responda:
a) Quantos empregados têm até 2 filhos?
Resp: Se dá por F↓, sendo igual a 16 filhos.
b) Quantos empregados têm ao menos 4 filhos?
Resp: Se dá por F↑, sendo igual a 8 filhos.
c) Qual o percentual de empregados com no máximo 1 filho?
Resp: Se dá por F%↓, sendo igual a 93,3%.
d) Qual o percentual de empregados com no mínimo 2 filhos?
Resp: Se dá por F↑%, sendo igual a 80%.
andrerochaest@yahoo.com.br
10
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
A = LS - LI
Número de Classes (c): corresponde à quantidade de classes, nas quais serão agrupados os
elementos do rol. Para determinar c, utiliza-se a fórmula de Sturges:
C = 1 + (3,33333.....) · log(n)
em que n = número de elementos do rol.
Amplitude ou Intervalo de Classe (i): geralmente utilizam-se intervalos iguais, obtidos através
da fórmula:
i = A/C
andrerochaest@yahoo.com.br
11
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
f) Para indicar o intervalo, utilizaremos o símbolo |- . Por exemplo, no caso de haver o limite
inferior 7,4 e o limite superior 8,9. Indicaremos este intervalo como : 7,4 |- 8,9.
Isso significa todos os números que estão entre 7,4 e o mais próximo possível de 8,9, porém,
caso haja um número igual ao limite superior dessa classe, este deverá ser computado apenas
na próxima classe (para o Exemplo do número 5, na 2º classe, sendo esta: 8,9 |- 10,4).
g) Uma vez definidas as classes, a tabela de frequências pode ser construída, a partir da 2º coluna
de nome “frequência” ou simplesmente “fi”, fazendo-se o processo de contagem, que consiste
em verificar a qual classe cada dado pertence.
OBS: Em algumas situações, pode-se utilizar uma distribuição de frequências por classes para
dados discretos quando todos os números ou a maioria são diferentes.
Exemplo 1.4: Construir uma distribuição de frequências para o número diário de experimentos
realizados em um laboratório durante duas semanas. [0, 2, 3 ,4 , 5, 10, 12, 7, 9, 0, 5, 13, 17, 10, 6].
Para essa situação, a mais viável será uma distribuição por classes, que deverá seguir o mesmo
procedimento, apenas com o cuidado ao calcular o intervalo entre classes (i), o mesmo deverá ser
arredondado para um número inteiro.
Exemplo 1.5: Construa de uma Distribuição de Frequências com CLASSES para os dados
referentes ao Peso (kg) de 14 blocos de concreto:
56 57 58 60 62 64 69 74 74 74 76 80 81 95
Solução:
Amplitude Total (A): A = LS – LI = 95 – 56 = 39.
andrerochaest@yahoo.com.br
12
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
Exemplo 1.6: Um determinado hospital está interessado em analisar a quantidade de creatinina (em
miligramas por 100 mililitros) encontrada na urina (de 24 horas) de seus pacientes internados com
problemas renais. Os dados são os seguintes:
1,51 1,65 1,58 1,54 1,65 1,40 1,61 1,08 1,81 1,38 1,56 1,83
1,69 1,22 1,22 1,68 1,47 1,68 1,49 1,80 1,33 1,83 1,50 1,46
1,67 1,60 1,23 1,54 1,73 1,43 2,18 1,46 1,53 1,60 1,59 1,49
1,46 1,72 1,56 1,43 1,69 1,15 1,89 1,47 2,00 1,58 1,37 1,40
1,76 1,62 1,96 1,66 1,51 1,31 2,29 1,58 2,34 1,66 1,71 1,44
1,66 1,36 1,43 1,26 1,47 1,52 1,57 1,33 1,86 1,75 1,57 1,83
1,52 1,66 1,90 1,59 1,47 1,86 1,73 1,55 1,52 1,40 1,86 2,02
andrerochaest@yahoo.com.br
13
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
Solução:
Rol (dados em ordem crescente):
1,08 1,15 1,22 1,22 1,23 1,26 1,31 1,33 1,33 1,36 1,37 1,38
1,40 1,40 1,40 1,43 1,43 1,43 1,44 1,46 1,46 1,46 1,47 1,47
1,47 1,47 1,49 1,49 1,50 1,51 1,51 1,52 1,52 1,52 1,53 1,54
1,54 1,55 1,56 1,56 1,57 1,57 1,58 1,58 1,58 1,59 1,59 1,60
1,60 1,61 1,62 1,65 1,65 1,66 1,66 1,66 1,66 1,67 1,68 1,68
1,69 1,69 1,71 1,72 1,73 1,73 1,75 1,76 1,80 1,81 1,86 1,86
1,86 1,86 1,86 1,86 1,89 1,90 1,96 2,00 2,02 2,18 2,29 2,34
i = A / c = (1,26) / 7 = 0,18
Quantidade de creatinina (ml) encontrada na urina de 84 pacientes com problemas renais.
Classes fi f% Pm (X) f %↓ f %↑ F↓ F↑
andrerochaest@yahoo.com.br
14
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
Observação 1: O melhor valor para representar cada classe é o ponto médio (Pm), o qual se obtém
pela fórmula:
Pm = Li + (i / 2), ou ainda, Pm = (Li + Ls) / 2
Observação 2: 1,08 |- 1,26, intervalo fechado à esquerda (pertencem a classe valores iguais ao
extremo inferior) e aberto à direita (não pertencem a classe valores iguais ao extremo superior). De
forma análoga, 2,16 |-| 2,34, intervalo fechado à esquerda e à direita.
Responda:
a) Quantos pacientes têm até 1,79 ml de creatinina?
Resp: Se dá por F↓, sendo igual a 68 pacientes.
b) Quantos pacientes têm ao menos 1,98 ml de creatinina?
Resp: Se dá por F↑, sendo igual a 5 pacientes.
c) Qual o percentual de pacientes com no máximo 1,61 ml de creatinina?
Resp: Se dá por F%↓, sendo igual a 59,5%. (mais da metade).
d) Qual o percentual de pacientes com no mínimo 1,98 ml de creatinina?
Resp: Se dá por F↑%, sendo igual a 6%.
Exercício 1.8: Na fabricação de semicondutores, o ataque químico por via úmida é frequentemente
usado para remover silicone da parte posterior das pastilhas antes da metalização. A taxa de ataque
é uma característica importante no processo. Um tipo de solução pra ataque químico foi estudada,
usando uma amostra de 50 pastilhas. As taxas observadas de ataque (10-3 mils/min) são dadas a
seguir:
2,1 4,2 2,7 28,2 9,9 9 2 6,6 3,9 1,6 14,7 9,6 16,1 8,1 8,2 20,2 6,9
4,3 3,3 1,2 4,1 18,4 0,2 6,1 13,5 7,4 0,2 8,3 0,3 1,3 14,1 1,0 2,4 2,4
16,2 8,7 24,1 1,4 8,2 5,8 1,6 3,5 12,2 18 26,7 3,7 12,3 23,1 5,6 0,4
andrerochaest@yahoo.com.br
15
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
Todo o gráfico deve apresentar título (pode ser colocado tanto acima como abaixo) e escala
(crescem da esquerda para a direita e de baixo para cima). As legendas devem ser colocadas à
direita ou abaixo do gráfico. A seguir vemos os principais tipos de gráficos:
Tabela 1.1:: Principais rações caninas vendidas numa certa cidade em 2010
Marca da Ração Percentual (%)
Caninu’s 18
Campeão 15
Foster 24
Pedigree 43
Fonte: Dados Fictícios
Figura 1.1:: Principais rações caninas vendidas numa certa cidade em 2010
andrerochaest@yahoo.com.br
16
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
Figura 1.2:
1. Principais causas de morte nos EUA em 2004
andrerochaest@yahoo.com.br
17
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
Figura 1.3: Principais rações caninas vendidas numa certa cidade em 2010
A apresentação tabular dos dados é feita através de uma distribuição de frequências. Fica
complementada com uma representação gráfica
gráfica desses mesmos dados. O histograma e o polígono
de frequências são tipos de gráficos
ficos usados para representar uma distribuição
distribuiç de frequências simples
de uma variável quantitativa contínua.
47 ├ 68 19 38 19 38
68 ├89 19 38 38 76
89 ├110 9 18 47 94
110 ├131 2 4 49 98
131 ├152 1 2 50 100
Total 50 100 - -
andrerochaest@yahoo.com.br
18
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
andrerochaest@yahoo.com.br
19
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
HISTOGRAMA
Figura 1.4: Histograma da distribuição de frequência dos preços dos ovos nos estados
POLÍGONO DE FREQUÊNCIAS
Figura 1.5: Polígono de frequência dos preços dos ovos nos estados americanos
andrerochaest@yahoo.com.br
20
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
A média aritmética pode ser definida em dois tipos: populacional ( µ ) e amostral ( X ). Nos dois
casos existem três situações quanto aos cálculos.
∑x
i=1
i
soma de todos os elementos do rol
A média será: X = =
n número de elementos do rol
Exemplo 1.11: Número de tonadas a serem trocadas em 12 hotéis de Natal (50, 62, 70, 86, 60, 64,
66, 77, 58, 55, 82, 74) X =67
Análise: O número médio de tomadas para serem trocadas é de 67 por hotel.
∑x f i i
A média será: X = i=1
n
∑f
i =1
i
Exemplo 1.12: Número de peças com defeitos produzidas em 27 dias em certa fábrica
X 0 1 2 3 4 Total
f 2 4 10 6 5 27
andrerochaest@yahoo.com.br
21
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
∑x f
i =1
i i
(0).(2) + (1).(4) + (2).(10) + (3).(6) + (4).(5)
X= n
= = 2,3
27
∑f i =1
i
Análise: Verifica-se que o número médio de peças com defeitos é de 2,3 por dia.
Exercício 1.10: As informações abaixo apresentam a idade dos usuários de drogas internos numa
clínica para tratamento. Determine a idade média dos internos.
Idade fi
17 2
18 4
19 5
20 6
21 3
22 4
23 2
Total 26
∑P f
m i
A média será: X = i =1
n
∑f i =1
i
andrerochaest@yahoo.com.br
22
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
∑P
i =1
f
m i
(1,75).(3) + (2,25).(16) + … + (4,75).(1)
X= n
= =3
100
∑f i =1
i
Análise: Verifica-se que o peso médio dos 100 nascidos vivos observados é 3 kg.
1.6.2 – Mediana
Valor que divide a distribuição em duas partes iguais, em relação à quantidade de elementos. Isto é,
é o valor que ocupa o centro da distribuição, de onde se conclui que 50% dos elementos ficam
abaixo dela e 50% ficam acima.
Colocados em ordem crescente, a mediana (Med ou Md) é ou valor que divide a amostra, ou
população, em duas partes iguais.
0 Med 100%
andrerochaest@yahoo.com.br
23
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
2 2
3 elemento + 4 elemento 12 + 14
Med = Mediana = = = 13
2 2
Interpretação: a média do 3º e 4º elemento do rol (13) divide 50% da distribuição dos dados à
direita e à esquerda.
andrerochaest@yahoo.com.br
24
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
n = 42 (par)
Elemento mediano: (n/2)º = 21º elemento
(n/2)º + 1 = 22º elemento
3ª classe contém o 21º e o 22º elemento
Med = (87 + 87)/2 = 87
- F ↓ - = frequência absoluta acumulada "abaixo de" da classe anterior à classe que contém a
mediana;
- fMe = frequência absoluta da classe que contém a mediana;
- iMe = intervalo da classe que contém a mediana;
andrerochaest@yahoo.com.br
25
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
1,08 |- 1,26 5 5
1,26 |- 1,44 13 18
1,44 |- 1,62 32 50
1,62 |- 1,80 18 68
1,80 |- 1,98 11 79
1,98 |- 2,16 2 81
2,16 |-| 2,34 3 84
Total 84 -
Fonte: Dados fictícios
andrerochaest@yahoo.com.br
26
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
1.6.3 - Moda
É o valor que ocorre com maior frequência na série, ou seja, aquele que mais se repete.
Exemplo: Na série 3, 4, 5, 7, 7, 7, 9, 9 Mo = 7
Exemplo 1.19:
X fi
1 13
3 15
6 25
10 8
Total 61
Mo = 6
andrerochaest@yahoo.com.br
27
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
Exemplo 1.20:
Tipo de Sangue fi
O 547
A 441
B 123
AB 25
Total 1136
Mo = sangue do tipo "O"
Mo = 3 ⋅ Med - 2 ⋅ X
andrerochaest@yahoo.com.br
28
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
a) Assimetria à esquerda: X < Med < M oP (concentração à direita ou nos valores maiores);
c) Assimetria à direita: M oP < Med < X (concentração à esquerda ou nos valores menores).
Exemplo 1.22: Calcule a moda de Pearson para os seguintes dados X = 1,61 e Med = 1,57.
Análise: M oP < Med < X , o que indica uma assimetria à direita, isto é, uma maior concentração à
esquerda (ou em direção aos valores menores).
4,08 |- 5,44 49 49
5,44 |- 6,80 70 119
6,80 |- 8,16 142 261
8,16 |- 9,52 29 290
9,52 |-| 10,88 30 320
Total 320 -
Fonte: Dados fictícios
andrerochaest@yahoo.com.br
29
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
1.6.4 – Separatrizes
Além das medidas de posição que estudamos, há outras que, consideradas individualmente,
não são medidas de tendência central, mas estão ligadas à mediana, já que se baseiam em sua
posição na série. Essas medidas - os quartis, os percentis e os decis - são, juntamente com as
medianas, conhecidas pelo nome genérico de separatrizes.
Os quartis, decis e percentis são muito similares à mediana, uma vez que também
subdividem a distribuição de medidas de acordo com a proporção das frequências observadas.
Enquanto a mediana divide a distribuição em duas metades, os quartis dividem-se em quatro
quartos, os decis em 10 partes e os pontos percentis dividem a distribuição em 100 partes.
São utilizadas para se conhecer, com precisão, as distribuições dos dados como um todo. As
separatrizes podem ser utilizadas tanto em dados não-agrupados (em forma de rol ou em
distribuição de frequência simples) tanto quanto em dados agrupados (distribuição de frequências
em classes).
!-------------------!-------------------!
Md
!---------!---------!---------!---------!
Q1 Q2 Q3
!-----!-----!-----!-----!-----!-----!-----!-----!-----!-----!
D1 D2 D3 D4 D5 D6 D7 D8 D9
!----------!----------!----------!----------!----------!----------!----------!----------!----------!----------!
P10 P20 P30 P40 P50 P60 P70 P80 P90
andrerochaest@yahoo.com.br
30
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
Exemplo 1.23: Considere o tempo (anos) de 24 máquinas utilizadas numa indústria. Calcule os
Quartis.
17 18 19 20 21 22 23 24 25 26 27 29 32
33 35 38 39 42 44 46 48 50 54 57
Em relação aos quartis, encontramos os 6º, 12º e o 18º elemento da distribuição dos dados, que
correspondem aos números 22, 29 e 42. Assim, podemos concluir que 25% das máquinas têm idade
de até 22 anos de uso, como também metade delas têm até 29 anos e 25% têm ao menos 42 anos.
25% das máquinas têm mais de 42 anos de uso na indústria.
andrerochaest@yahoo.com.br
31
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
x ⋅ n 3 ⋅ 24 7o elemento + 8o elemento 23 + 24
Ed3 = = = 7, 2 ≈ = = 23,5
10 10 2 2
5 ⋅ 24
Ed5 = Mediana = = 12o elemento=29
10
9 ⋅ 24 21o elemento + 22o elemento 48 + 50
Ed9 = = 21, 6 ≈ = = 49
10 2 2
Em relação aos decis calculados, encontramos os 7º, 12º e o 22º elemento da distribuição dos
dados, que correspondem aos números 23,5, 29 e 49. Assim, podemos concluir que 30% das
máquinas têm até 23,5 anos de uso, como também metade delas têm até 29 anos e 90% têm ao
menos 49 anos. 10% das máquinas têm mais de 49 anos de uso na indústria.
x ⋅ n 17 ⋅ 24 4o + 5o 20 + 21
Ep17 = = = 4, 08o elemento ≈ = = 20,5
100 100 2 2
35 ⋅ 24 8o + 9o 24 + 25
Ep35 = = 8, 4o elemento ≈ = = 24,5
100 2 2
83 ⋅ 24 19o + 20o 44 + 46
Ep83 = = 19,92o elemento ≈ = = 45
100 2 2
Em relação aos percentis calculados, encontramos os 4º, 8º e o 20º elemento da distribuição dos
dados, que correspondem aos números 20,5; 24,5 e 45. Assim, podemos concluir que 17% das
máquinas têm até 20,5 anos de uso, como também 35% deles têm até 24,5 anos e 65% têm ao
menos 24,5 anos. Conclui-se também que 83% têm até 45 anos de utilização na indústria e 17%
têm no mínimo 45 anos.
andrerochaest@yahoo.com.br
32
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
objetivo é construir medidas que avaliem a representatividade da média, para isto usaremos as
medidas de dispersão.
Uma breve reflexão sobre as medidas de tendência central permite-nos concluir que elas não
são suficientes para caracterizar totalmente uma sequência numérica.
Se observarmos as seguintes sequências:
X=
∑x i
⇒X=
350
= 70 Y=
∑y i
=
350
= 70 Z=
∑z i
=
350
= 70
n 5 n 5 n 5
Observamos, então, que os três conjuntos apresentam a mesma média aritmética igual a 70.
Calculando a mediana para os três, dará também o mesmo resultado, ou seja, 70. Assim,
pensaríamos que essas três variáveis são iguais, no entanto, são sequências completamente distintas
do ponto de vista da variabilidade de dados.
Na sequência X, não há variabilidade dos dados. A média 70 representa bem qualquer valor
da série. Na sequência Y, a média 70 representa bem a série, mas existem elementos da série
levemente diferenciados da média 70. Na sequência Z, existem muitos elementos bastante
diferenciados da média 70. Concluímos que a média 70 representa otimamente a sequência X,
representa razoavelmente bem a sequência Y, mas não representa bem a sequência Z.
Nosso objetivo é construir medidas que avaliem a representatividade da média. Para
isto, usaremos as medidas de dispersão.
Observe que na sequência X os dados estão totalmente concentrados sobre a média 70, não
há dispersão de dados. Na sequência Y, há forte concentração dos dados sobre a média 70, mas há
fraca dispersão de dados. Já na série Z há fraca concentração de dados em torno da média 70 e forte
dispersão de dados em relação à média 70.
As principais medidas de dispersão absolutas são: amplitude total, variância, desvio padrão e
coeficiente de variação.
andrerochaest@yahoo.com.br
33
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
1.7.1 – Variância
È a medida de dispersão mais utilizada. É definida como sendo o quociente entre a soma
dos quadrados dos desvios e o número de elementos. É classificada em dois tipos:
∑( )
2
( i)
2
σ2 =
Xi − X 1
= ∑ X i −
2 ∑ X
Variância Populacional ( σ ) 2
⇒
N N N
∑( )
2
( )
2
Xi − X 1 ∑ X
∑ X i −
i
Variância Amostral (s2) ⇒ S2 = = 2
n −1 n −1 n
∑( X − X )
2
2 2 2 2 2
S 2
=
i
=
(1,92 − 1,82) + (1, 72 − 1,82) + (1,82 − 1,82 ) + (1,80 −1,82) + (1,84 −1,82)
n −1 5 −1
2 2 2 2 2
=
( 0,1) + ( −0,1) + ( 0) + ( −0, 02) + ( 0,02 ) =
0,01 + 0,01 + 0 + 0,0004 + 0,0004
=
4 4
0,0208
= = 0,0052.
4
andrerochaest@yahoo.com.br
34
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
Exercício 1.13: Calcule a variância do número de incisões feitas em três crianças numa cirurgia dos
membros superiores e inferiores. Comenta sobre a variabilidade.
Corpo de prova
Laboratório
I II III IV
1
(∑ x ⋅ f ) 2
1
(∑ x ⋅ f ) 2
∑ σ = ∑
2 i i
s = ⋅xi2
f − 2
⋅ fxi2
−
n −1 n N N
1
(∑ Pm ⋅ f ) 2
1
(∑ Pm ⋅ f ) 2
2
s =
n −1 ∑ Pm 2
⋅f −
n
σ =
2
N ∑ Pm 2
⋅f −
N
andrerochaest@yahoo.com.br
35
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
∑(X )
2
i −X
Desvio Padrão Populacional (σ) ⇒ σ =
N
∑( )
2
Xi − X
Desvio Padrão Amostral (s) ⇒ S =
n −1
OBS: Quanto maior o valor do desvio padrão significa que mais dispersos estão os elementos
em torno da média.
andrerochaest@yahoo.com.br
36
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
OBS: Quando a distribuição não é perfeitamente simétrica, estes percentuais apresentam pequenas
variações para mais ou para menos, segundo o caso. Ou seja, na presença de assimetria ou outliers,
as três propriedades definidas acima não ocorrem com exatidão.
Exemplo 1.25: Suponha uma série com média x = 100 e desvio padrão σ = 5 , podemos interpretar
estes valores da seguinte forma:
andrerochaest@yahoo.com.br
37
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
Dissemos antes que, por serem as unidades do desvio-padrão as mesmas que as unidades dos
dados originais, é mais fácil entender o desvio-padrão do que a variância. No entanto, aquela
mesma propriedade torna difícil comparar a variação para valores originados de diferentes
populações, ou seja, quando as medidas de duas ou mais variáveis são expressas em unidades
diferentes como peso/altura, capacidade/comprimento, etc. Usa-se então o Coeficiente de Variação
(CV), que é uma medida relativa, que expressa o desvio padrão como uma porcentagem da média
aritmética e ele não tem unidade específica. Quanto mais próximo de zero, mais homogênea é a
distribuição. Quanto mais distante, mais dispersas.
O CV mede a dispersão em relação à média. É a razão entre o desvio padrão e a média. O
resultado obtido dessa operação é multiplicado por 100, para que o coeficiente de variação seja
dado em porcentagem.
s
CV = ⋅100
X
ANÁLISE
OBS.: Um CV alto indica que a dispersão dos dados em torno da média é muito grande.
Exemplo 1.26: Alturas e Pesos de Homens. Usando os dados amostrais de alturas e pesos de 40
homens de uma turma de estatística, encontramos as estatísticas dadas na tabela a seguir.
Calcule o coeficiente de variação para altura e peso, e a seguir, compare os dois resultados.
andrerochaest@yahoo.com.br
38
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
Solução:
S 7,56
CV para Altura: CVAltura = ⋅100 = ⋅100 = 0, 045 ⋅100 = 4,5%.
X 168
S 10,98
CV para Peso: CVPeso = ⋅100 = ⋅100 = 0,1525 ⋅100 = 15, 25%.
X 72
Reparem que se fôssemos comparar apenas o desvio padrão (fazendo isso já estaríamos
errando, pois não se podem comparar desvios-padrão de populações com unidades de medição
diferentes, neste caso cm e kg), iríamos erroneamente deduzir que as duas populações tinham
variabilidade muito próximas. No entanto, ao calcular os coeficientes de variação para as duas
populações, analisa-se que a variabilidade das alturas dos homens é quase quatro vezes menos que a
variabilidade dos pesos. Isso faz sentido intuitivamente, porque vemos rotineiramente que os pesos
entre homens variam muito mais do que as alturas. Por exemplo, é muito raro ver dois homens
adultos com um deles tendo duas vezes a altura do outro, mas é muito comum ver dois homens com
um deles pesando duas vezes o peso do outro.
Exercício 1.14: Em um grupo de pacientes, foram tomadas as pulsações (batidas por minuto) e
dosadas as taxas de ácido úrico (mg/100ml). Mas médias e os desvios-padrão foram:
No caso de uma distribuição com outliers, não é ideal representar um conjunto de valores
com o uso da média e do desvio-padrão, pois devido a presença de valores extremos, elas foram
afetados. Tukey (1970, 1977) sugeriu o uso de cinco medidas para analisar casos como esse, sendo
elas:
andrerochaest@yahoo.com.br
39
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
Forma de representação:
Li Q1 Q2 = Med Q3 Ls
Notações:
a) Q3 - Q1 = Intervalo interquartil (dj)
b) Me - Li = Dispersão inferior
c) Ls - Me = Dispersão superior.
Estas cinco medidas são chamadas de estatística de ordem e são medidas resistentes de
posição de uma distribuição. Dizemos que uma medida de posição é resistente quando for pouco
afetada por mudanças de uma pequena porção dos dados. A mediana é uma medida resistente, ao
passo que a média não o é.
1.8.2 – BOX-PLOT
É a representação gráfica dos 5-números, em que são destacados o intervalo interquartil (dj)
3 3
e as observações discrepantes, ou seja: valores menores que Q1 − dj ou maiores que Q3 + dj . (Os
2 2
pontos discrepantes são representados por um asterisco ou travessão).
O desenho esquemático (Figura abaixo) dá uma ideia da posição, dispersão, assimetria,
caudas e dados discrepantes. A posição central dos valores é dada pela mediana e a dispersão por dj.
As posições relativas de Q1, Q2 e Q3, dão uma noção da assimetria. As caudas são as linhas acima e
abaixo do retângulo (ou caixa).
andrerochaest@yahoo.com.br
40
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
(Q3 + 3/2dj)
LS
Q3
Q2 = Med
Q1
LI
(Q1 - 3/2dj)
Exemplo 1.27: Os dados abaixo são referentes ao tempo em segundos até uma reação química
realizada em 40 tubos de ensaio. Construa um Boxplot e faça uma breve descrição sobre os dados.
47,5 50 50 57,5 60 62,3 63,2 63,56 64,5 65,1 72,2 72,3 74,1 74,8
75,7 76,2 79 79,2 79,3 81,5 82,1 84 85,3 88,1 88,5 90 92,6 94,7
95,5 96 98,3 98,7 99,2 100 101,2 110 122,7 125,9 134,6 136,2
dj = Q3 - Q1 = 96 – 65,1 = 30,9.
Me - Li = 81,5 – 47,5 = 34
andrerochaest@yahoo.com.br
41
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
1. Podemos analisar que 25% dos experimentos tiveram uma reação química em até 65 segundos,
e que metade deles houve reação em até 81 segundos. Assim como na outra metade, teve
reação química acima de 81 segundos.
segundos
2. Analisa-se
se também que 75% dos reações ocorreram no máximo em 96 segundos,
segundos assim como,
25% delas no mínimo 96 s.
3. Chama-se atenção que a reação mais rápida foi em 47 segundos e a mais demorada, de 136
segundos.
4. Não há outliers na distribuição dos dados.
andrerochaest@yahoo.com.br
42
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
UNIDADE II
PROBABILIDADE
A Teoria da probabilidade é útil para analisar situações que envolvem o acaso. Jogos de
dados e de cartas, ou o lançamento de uma moeda para o ar. As distribuições de probabilidade
incorporam a estatística descritiva e a teoria da probabilidade. Ambas formam a base da inferência
estatística. Algumas aplicações:
- Na maioria dos jogos esportivos (futebol, basquete, surfe...), até certo ponto;
- Na decisão de parar de imunizar pessoas com menos de 20 anos contra determinada doença;
- Na decisão de arriscar-se a atravessar uma rua no meio do quarteirão;
- Na engenharia, com uso na tomada de decisões, sendo aplicado principalmente conceitos de
planejamento de experimentos e amostragem;
- Todas utilizam a probabilidade consciente ou inconscientemente.
São experimentos que ao serem repetidos nas mesmas condições não produzem sempre o mesmo
resultado, ou seja, exibem variação nos seus resultados.
Exemplo 2.1: Considere alguns exemplos de experimentos aleatórios, denotados aqui por ε.
• ε1: Tempo, em horas, até a falha de um equipamento;
• ε2: Número de itens defeituosos em uma linha de produção em um período de 24 horas;
• ε3: Ocorrência ou não da ruptura de uma viga a um peso x em toneladas;
• ε4: A sequência de caras e coroas verificada no lançamento de uma moeda 4 vezes;
• ε5: Lançamento de uma moeda até que apareça cara pela primeira vez.
Embora não sejamos capazes de afirmar qual o particular resultado deste experimento, poderemos
descrever o conjunto de todo os seus possíveis resultados.
andrerochaest@yahoo.com.br
43
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
Exemplo 2.2: Consideramos a seguir o espaço amostral associado a cada um dos experimentos
citados no Exemplo 2.1.
• Tempo, em horas, até a falha de um equipamento;
Ω1 = { t ; t ≥ 0 }
• Número de itens defeituosos em uma linha de produção em um período de 24 horas;
Ω2 = {0, 1, ..., n}; sendo n o número máximo de itens produzidos em 1 dia.
• Ocorrência ou não da ruptura de uma viga a um peso x em toneladas;
Ω3 = { sim , não }
• A sequência de caras e coroas verificada no lançamento de uma moeda 4 vezes;
Ω4 = {cccc, ccck, cckc, ckcc, kccc, kkkk, kkkc, kkck, kckk, ckkk, cckk, ckck, kckc, kkcc, ckkc, kcck}
• Lançamento de uma moeda até que apareça cara pela primeira vez.
Ω5 = {c, kc, kkc, kkkc, kkkkc, ...}
2.3 - Eventos
Exemplo 2.3: Os eventos Ai a seguir referem-se aos espaços amostrais dados no Exemplo 2.2.
• Tempo, em horas, até a falha de um equipamento;
A1 = {“ ocorre falha em menos de 3 horas ”} A1 = { t, t > 3};
• Número de itens defeituosos em uma linha de produção em um período de 24 horas;
A2 = {“ menos de 5 itens defeituosos ”} A2 = { 0, 1, 2, 3, 4 };
• Ocorrência ou não da ruptura de uma viga a um peso x em toneladas;
A3 = {“ viga com ruptura”} A3 = { sim };
• A sequência de caras e coroas verificada no lançamento de uma moeda 4 vezes;
A4 = {“ somente caras ”} A4 = { cccc };
• Lançamento de uma moeda até que apareça cara pela primeira vez.
A5 = {“ apareça cara em até 3 lançamentos ”} A5 = { c, kc, kkc }.
andrerochaest@yahoo.com.br
44
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
Obs: Também são eventos o próprio Ω (chamado de evento certo,, ou seja, sempre ocorre), o
conjunto vazio Ø (chamado de evento impossível,
impossível ou seja, nunca ocorre),, ou qualquer resultado
individual de Ω.
Dado que os eventos associados a um espaço amostral são por sua vez conjuntos, podemos
efetuar as operações do tipo: união, intercessão, complementação e diferença, de forma semelhante
às respectivas operações que se realizam com os subconjuntos de qualquer conjunto abstrato, e
formar a partir destas operações, novos eventos tais como:
• A ∪ B = {x : x ∈ A ou x ∈ B} , isto é: A ∪ B é o evento que ocorre sempre que ocorre
A ou sempre que ocorre B, e somente neste caso.
A∪ B
• A ∩ B = {x : x ∈ A e x ∈ B} isto é: A ∩ B é o evento que ocorre somente quando
ocorrem A e B simultaneamente.
simultanea
A∩ B
• Ac = {x : x ∈ Ω, x ∉ A}, isto é Ac é o evento contrário de A, somente ocorre se A não
nota que Ac ∪ A = Ω.
ocorre, (e não ocorre, se A ocorre). Claramente nota-se
A
Ac
• A – B = {x : x ∈ A e x ∉ B}, isto é: (A – B) é o evento que ocorre unicamente quando
ocorre A e não ocorre B.
A B
A-B
andrerochaest@yahoo.com.br
45
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
Quando dois eventos são tais que, eles nunca podem ocorrer simultaneamente, neste caso se
tem que A ∩ B = ∅, eles são chamados eventos mutuamente exclusivos ou mutuamente
excludentes, (em termos de conjunto, diríamos que são conjuntos disjuntos). Seguem-se exemplos,
para melhor esclarecer do acima exposto.
Ex. 1. Uma fábrica produz processadores para computador. Da linha de produção são
retirados 03 processadores e cada um testado. Classificando como B (bom) ou D (defeituoso). Um
espaço amostral associado ao experimento é:
Ω = {BBB, DDD, BBD, DBB, DDB, DBD, BDD, BDB}
Ex. 2. Considere o experimento que consiste em selecionar uma família aleatoriamente, em
certo distrito do Seridó, e verificar o nº de filhos que esta família já registrou. Um espaço amostral
associado a este experimento é:
Ω = {0, 1, 2, 3, 4, ...}
Ex. 3. Seja agora o experimento que consiste em retirar uma lâmpada de um lote e medir
seu tempo de vida antes de se queimar. Um espaço amostral pode ser:
Ω = R+, isto é, Ω = {t : t ≥ 0}
Ex. 4. Um dado é lançado e o nº que aparece na face superior é observado. Um espaço
amostral é:
Ω = {0, 1, 2, 3, 4, 5, 6}
Com exceção do exemplo 3, que é contínuo, todos os demais são espaços amostrais do tipo
chamado discreto. Um espaço amostral é discreto quando é formado por um conjunto contável
(finito ou infinito). Caso contrário, ele é dito contínuo.
Consideremos novamente o Ex. 1. Sejam os eventos associados a este espaço, tais como:
• A = “obter dois processadores defeituosos”. Logo, A = {DDB, DBD, BDD}
• B =“obter no mínimo 1 processador bom”. Logo, B={DDB, DBD, BDD, BBD, BDB, DBB,
BBB}
• C = “obter no máximo 1 processador defeituoso”. Logo, C = {BBB, BBD, BDB, DBB}
Então poderemos ter, por exemplo, os novos eventos (resultantes das operações).
• A ∩ B = {DDB, DBD, BDD} = A
• A ∩ C = ∅, (portanto A e C são incompatíveis ou mutuamente exclusivos ou excludentes).
Consideremos agora o exemplo 3 (espaço amostral contínuo), e seja A o evento dado por:
A = “o tempo de vida da lâmpada é inferior a 20 horas”. Então, A = {t : 0 ≤ t < 20} e Ac = (t ≥ 20}.
Naturalmente que A ∪ Ac = (t : t ≥ 0) = Ω é o evento certo. E observe que, sempre,
A∩Ac=∅, para qualquer evento A.
Suponha, por exemplo, que sorteamos numa urna com n bolas numeradas, 1, 2, 3, ..., n, uma
bola ao acaso. A probabilidade de cada bola (cada ponto amostral) será 1/n. Se um evento A,
associado a este espaço é formado por K pontos, digamos A = 1, 2, ..., 10, (n>10), então se tem :
1 10
P( A) = 10 =
n n
andrerochaest@yahoo.com.br
47
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
ABORDAGEM CLÁSSICA
Seja Ω um espaço amostral finito, formado por n eventos equiprováveis. Seja A um evento de Ω
com m destes elementos. Então a probabilidade de A é a fração
P(A) = m / n
Exemplo 2.5. Considere o lançamento de duas moedas. Queremos saber a probabilidade do evento
A={“duas caras”}. Considere o espaço amostral Ω1 = {“duas caras”, “duas coroas”, “uma cara e
uma coroa”}.
Se usamos a definição acima com este espaço amostral, diríamos que P(A) = 1/3. Esta resposta é
falsa, pois os elementos de Ω1 não são equiprováveis. O espaço amostral equiprovável seria
Ω={cc, ck, kc, kk} e como A = {cc} temos que P(A) = 1/4.
ABORDAGEM FREQUENTISTA
andrerochaest@yahoo.com.br
48
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
#( A)
P( A) = lim
n →∞ n
Exemplo 2.6. Considere uma certa moeda cuja probabilidade de ocorrência de “cara” é
desconhecida. Para se obter essa probabilidade, esta moeda é submetida a n repetições
independentes de cada lançamento. A Tabela 1 e a Figura 1 a seguir mostram os resultados obtidos.
F(A) 0,800 0,520 0,595 0,5000 ... 0,506 0,509 0,501 0,496 0,499
andrerochaest@yahoo.com.br
49
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
ABORDAGEM AXIOMÁTICA
A abordagem axiomática é motivada pelas definições clássica e frequentista. Ela representa uma
proposta para dar à teoria da probabilidade uma base matemática sólida. Assim, é nesta abordagem
que se baseiam as propriedades estabelecidas daqui em diante.
Este conceito de probabilidade se estabelece a partir de uma função real P(A), definida sobre
os eventos associados a um espaço amostral, a qual faz corresponder a cada subconjunto A, de Ω
(sendo este subconjunto um evento), um nº real, tal que cumpra os seguintes axiomas:
a) 0 ≤ P(A) ≤ 1
b) P(Ω) = 1
c) Se A e B são eventos mutuamente exclusivos, isto é A ∩ B = ∅, então se tem que
P(A∪B) = P(A) + P(B).
Obs: Esta definição axiomática é mais abrangente que a regra de Laplace, dado que a definição
clássica se limita aos espaços amostrais finitos equiprováveis.
Sejam A e D, eventos quaisquer, associados a um espaço amostral sendo P(D) > 0. Muitos
problemas envolvem o cálculo da probabilidade da ocorrência de A, quando já se tem a informação
de que houve a ocorrência de D. Isto é, a probabilidade de A será calculada considerando-se a
condição de que já houve a ocorrência de D. Esta nova informação (de que D ocorreu) equivale a
restringir o espaço amostral, que agora será considerado como o conjunto dos pontos amostrais que
formam o evento D. A probabilidade de A, dentro desta condição, chama-se “probabilidade
condicional de A, dado que D ocorreu”. Na qual será escrita sob a forma: P(A / D), sendo definida
como:
andrerochaest@yahoo.com.br
50
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
P(A ∩ D)
P ( A / D) = , com P(D) > 0
P ( D)
Esta regra pode ser estendida para mais de dois eventos: Sejam A1, A2, … , An eventos quaisquer
associados a Ω, então:
Solução:
Sejam os eventos: A: “a soma dos dois dados é 6”
B: “ocorre o nº 2 em pelo menos um dos dados”
P(A ∩ B)
P( B / A) =
P(A)
# Ω = 6 x 6 = 36
A = {(1,5), (2,4), (3,3), (4,2), (5,1)} ⇒ # A = 5 P(A)=5/36
B = {(2,1), (2,2), (2,3), (2,4), (2,5), (2,6), (1,2), (3,2), (4,2), (5,2), (6,2)} ⇒ # B = 11 P(B)=11/36
A ∩ B = {(2,4), (4,2)} ⇒ # (A ∩ B) = 2 P(A ∩ B) = 2/36
2
P( A ∩ B) 2
Portanto, P ( B / A) = = 36 = .
P ( A) 5 5
36
andrerochaest@yahoo.com.br
51
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
RESISTÊNCIA AO CHOQUE
Alta Baixa
RESISTÊNCIA A Alta 90 9
ARRANHÕES Baixa 16 15
Exemplo 2.10: Um lote de 165 chips semicondutores contém 40 itens defeituosos. Dois deles são
selecionados, ao acaso, sem reposição.
b) Qual a probabilidade de que o segundo chip selecionado seja defeituoso, sabendo que o
primeiro deles foi defeituoso?
d) Como a resposta do item (b) mudaria se os chips selecionados fossem repostos antes da
primeira seleção?
andrerochaest@yahoo.com.br
53
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
Solução:
Sejam os eventos:
Definição: Variável aleatória (que escrevemos de modo abreviado: v.a.) num espaço amostral Ω, é
uma função x, que associa Ω, (isto é, a cada ω ∈ Ω), um nº real, X(ω). Ver Figura abaixo.
andrerochaest@yahoo.com.br
54
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
Ω X R
ω X(ω)
A partir do estudo das variáveis aleatórias, foram definidos modelos probabilísticos (discretos e
contínuos) para as principais situações do cotidiano. Destes, estudaremos a seguir três modelos:
Em muitos problemas teóricos e aplicados, e a primeira vista, sob diversas condições, várias
funções de probabilidade aparecem com tanta frequência que merecem ser estudadas. Nesta
Unidade, estudaremos o Modelo de Probabilidade Discreto de Bernoulli e Binomial.
andrerochaest@yahoo.com.br
55
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
Exemplo 2.11: Suspeita-se que uma moléstia contagiosa possa ter atingido os moradores de uma
região. Cada morador da região é classificado conforme tenha sido contagiado ou não.
Evento de interesse (Sucesso): A pessoa examinada foi contagiada.
Fracasso: A pessoa examinada NÃO foi contagiada.
Exemplo 2.11: Uma operação de enchimento tente encher embalagens de detergentes até o peso
especificado.
Evento de interesse (Sucesso): A embalagem do detergente está com o peso especificado.
Fracasso: A embalagem do detergente NÃO está com o peso especificado.
Exemplo 2.12: Dentre os portadores de um determinado vírus, foram avaliados, após a aplicação de
uma nova vacina teste, se cada um obteve cura ou não no determinado vírus.
Evento de interesse (Sucesso): O portador obteve a cura após a aplicação da nova vacina.
Fracasso: O portador do vírus NÃO obteve a cura após a aplicação da nova vacina.
Usaremos a notação X ~ Bernoulli (p). Observe que poderíamos também representar a distribuição
de X coma tabela abaixo:
X 0 1
P(X) 1-p p
E( X ) = p
Var ( X ) = pq
Exemplo 2.13: Uma empresa de cimento têm no estoque 10 sacos que foram produzidos a 3
semanas, 20 sacos que foram produzidos a 2 semanas e 20 sacos produzidos a 3 dias. Retira-se um
saco de cimento do estoque. Seja X o evento em que o saco de cimento foi fabricado a 3 dias.
Determine a probabilidade de sucesso e fracasso.
andrerochaest@yahoo.com.br
56
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
Solução:
1, se o saco de ciemnto foi fabricado a 3 dias;
X =
0, se o saco de ciemento NÃO foi fabricado a 3 dias.
Podemos calcular a distribuição de X pela sua fórmula de distribuição de probabilidade, sendo esta
calculada abaixo:
1− x
P ( X = x ) = p x (1 − p ) , x = 0,1
0 1− 0
20 20
P ( X = 0) = 1 − = 1 ⋅ 0, 6 = 0, 6
50 50
1 1−1
20 20
P ( X = 1) = 1 − = 0, 4 ⋅1 = 0, 4
50 50
Logo, a distribuição de X pode ser representada por:
X 0 1
P(X) 0,6 0,4
andrerochaest@yahoo.com.br
57
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
em que
X = Número de sucessos variando de 1 até n;
p = Probabilidade de sucesso em cada repetição;
1-p = Probabilidade de fracasso em cada repetição;
n = Número de repetições
A variável X tem distribuição Binomial, com parâmetros n e p, e indicaremos pela notação
X~Binomial (n, p).
- Se lançarmos uma moeda 100 vezes, qual o número esperado de caras (p=1/2)?
- Se lançarmos um dado 600 vezes, qual o número esperado de faces “5” (p=1/6)?
Solução:
1) X~Binomail (100; 0,5) E(X)=np=100·0,5=50.
Assim, se lançarmos uma moeda 100 vezes, esperamos que ocorram 50 caras. (Obs: Isso
quando estamos supondo que a moeda é honesta, ou seja, a probabilidade de cara e coroa é a
mesma, que nessa situação é igual a 1/2).
2) X~Binomail (600; 1/6) E(X)=np=600·(1/6)=100.
Assim, se lançarmos um dado 600 vezes, esperamos que o número de faces “5” ocorra 100
vezes.
Exemplo 2.14: Uma prova tem 10 questões independentes de igual pontuação. Cada questão tem 5
alternativas. Apenas uma das alternativas é a correta. Se um aluno resolve a prova respondendo a
esmo as questões, qual a probabilidade de tirar nota 6?
andrerochaest@yahoo.com.br
58
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
Solução:
X = nº de acertos. X = 0, 1, .........., 10
p = Probabilidade (acerto) = 1/5 ⇒ X~Binomial( 10, 1/5 )
6 10 − 6
n k n −k 10 1 4
P ( X = 6) = p ⋅ q = ⋅ ⋅ = 0,0055=0,55%
k 6 5 5
E(X)=n·p=10·(1/5)=2;
Var(X)=n·p·(1-p)=10·(1/5)·(1-1/5)=10·0,2·0,8=1,6.
Soluão:
a) Seja X = {nº de bicos de bunsen que estão funcionando corretamente dentre os 10 testados no
laboratório}. X = 0, 1, ..., 10.
p = P( sucesso ) = P (o bico de bunsen está funcionando corretamente) = 4/5 = 0,8.
Assim, podemos definir X como: X ~ Binomial (n = 10; p = 0,8) .
andrerochaest@yahoo.com.br
59
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
7 10 − 7
10 4 1
P ( X = 7 ) = . . =
7 5 5
10! 4 7 1 3
= ⋅ . =
(10 − 7 ) !7! 5 5
= (120 ) ⋅ ( 0,2097152 ) ⋅ ( 0,008 ) = 0,201326592=20,13%
4 4 1
E ( X ) = n ⋅ p = 10 ⋅ =8 Var ( X ) = n ⋅ p ⋅ q = 10 ⋅ ⋅ = 1, 6
5 5 5
Assim, temos:
10 10 − 0
P ( X = 0 ) = ⋅ ( 0,8 ) ⋅ (1 − 0,8 ) = (1) ⋅ (1) ⋅ ( 0, 2 ) = 0,0000001024=0,00001%
0 10
0
10 10 −1
P ( X = 1) = ⋅ ( 0,8 ) ⋅ (1 − 0,8 ) = (10 ) ⋅ ( 0,8 ) ⋅ ( 0, 2 ) = 0,000004096=0,0004%
1 9
1
10 10 − 2
P ( X = 2 ) = ⋅ ( 0,8 ) ⋅ (1 − 0,8 ) = ( 45 ) ⋅ ( 0, 64 ) ⋅ ( 0, 2 ) = 0,000073728=0,007%
2 8
2
P ( X ≤ 2 ) = P ( X = 0 ) + P ( X = 1) + P ( X = 2 ) =
= 0,00001% + 0,0004% + 0,007% = 0,00741%
c)
10 0 10 −0
P ( X = 0 ) = ⋅ ( 0,8 ) ⋅ (1 − 0,8 ) =
0
(1) (1) ( 0, 2 )
10
= ⋅ ⋅ = 0,0000001024=0,00001%
10 5 10 −5
P ( X = 5 ) = ⋅ ( 0,8 ) ⋅ (1 − 0,8 ) =
5
= ( 252 ) ⋅ ( 0,32768 ) ⋅ ( 0,00032 ) = 0,025690112 = 2,56%
andrerochaest@yahoo.com.br
60
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
e) P(ao menos 9 bicos de bunsen estão funcionando corretamente) = P(X≥9) = [P(X=9) + P(X=10)]
10 10 −9
P ( X = 9) = ⋅ ( 0,8) ⋅ (1 − 0,8)
9
=
9
= (10 ) ⋅ ( 0,134217728 ) ( 0, 2 )
1
⋅ = 0,2684=26,84%
10 10 10 −10
P ( X = 10 ) = ⋅ ( 0,8 ) ⋅ (1 − 0,8 ) =
10
= (1) ⋅ ( 0,1073741824 ) ⋅ (1) = 0,1073741824=10,74%
P ( X ≥ 9 ) = P ( X = 9 ) + P ( X = 10 ) =
= 26,84% + 10, 74% = 37,58%
Exercício 2.3: Um produto eletrônico contém 40 circuitos integrados. O fabricante declarou que 1 a
cada 50 é defeituoso. Os circuitos integrados são independentes. O produto opera somente se
houver até dois circuitos integrados defeituosos.
a) Qual a probabilidade de que o produto opere?
b) Qual a probabilidade de que o produto não opere?
e − λ .λk
P(X = k ) =
k!
• Esperança (média) e Variância
E( X ) = λ
Var( X ) = λ
andrerochaest@yahoo.com.br
61
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
Exemplo 2.16: Uma central telefônica recebe em média 5 chamadas por minuto. Suponha que as
chamadas seguem uma distribuição de Poisson. Calcule a probabilidade de:
Solução:
Letra (a):
Seja X = o número de chamadas que chegam em t minutos, com distribuição de Poisson com
parâmetro λ =5t.
λ = 5 ⋅1 = 5
e −5 ( 5 )
0
P ( X = 0) = = e −5 = 0, 00673
0!
Letra (b):
λ = 5 ⋅ 4 = 20
P ( X ≤ 2 ) = P ( X = 0 ) + P ( X = 1) + P ( X = 2 ) = 0, 000000455
0
e −20 ( 20 )
P ( X = 0) = =
0!
e −20 ( 20 )
1
P ( X = 1) = =
1!
e−20 ( 20 )
2
P ( X = 2) = =
2!
Letra (c):
λ = 5 ⋅ ( 0,5 ) = 2, 5
2
e −2,5 ( 2, 5 )
P ( X = 2) = = 0, 256
2!
andrerochaest@yahoo.com.br
62
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
Letra (d):
λ = 5 ⋅ ( 0, 5 ) = 2, 5
5
e −2,5 ( 2,5 )
P ( X = 5) = = 0, 067
5!
Letra (e):
λ = 5 ⋅ 2 = 10
e −10 (10 )
3
P ( X = 3) = = 0, 0075
3!
Exemplo 2.17: A dureza de uma peça de aço pode ser pensada como sendo uma variável aleatória
com distribuição uniforme no intervalo (50; 70) da escala de Rockwell. Calcular a probabilidade de
que uma peça tenha dureza entre 55 e 60.
andrerochaest@yahoo.com.br
63
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
Solução:
Definindo X = “Dureza de uma peça de aço”, temos:
1
, se X ∈ (50, 70)
f ( X ) = 70 − 50
0, caso contrário
Logo:
60 1 x 60 5 1
P ( 55 ≤ X ≤ 60 ) = ∫ dx = = =
55 20 20 55 20 4
(b − a )
2
Var ( X ) =
12
Exercício 2.5: O peso líquido, em libras, de um pacote com herbicida químico é uniforme no
intervalo de 49,75 a 50,25 libras. Determine:
andrerochaest@yahoo.com.br
64
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
λe − λx se x ≥ 0
f (x ) = o gráfico da f.d.p. de X é:
0 se x < 0
∞ ∞
∫0
λ e− λ x dx = (−e− λ X ) |
0
=1
Exemplo 2.18: Uma fábrica de tubos de TV determinou que a vida média dos tubos de sua
fabricação é de 800 horas de uso contínuo e segue uma distribuição exponencial. Qual a
probabilidade de que a fábrica não tenha que substituir um tubo gratuitamente, se oferece uma
garantia de 300 horas de uso?
Solução:
X: vida útil dos tubos de TV e E(X) = 800
1 1 1
Como E ( X ) = ⇒ = 800 ⇒ λ =
λ λ 800
800
1− x
1
e 800 , se x ≥ 0
Logo f ( x) =
0 , se x < 0
300 1 − 8001 x 1 X
− 800 300 − 300
andrerochaest@yahoo.com.br
65
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
Exercício 2.6: Certo tipo de fusível tem duração de vida que segue uma distribuição exponencial
com vida média de 100 horas. Qual a probabilidade de um fusível durar mais de 150 horas?
Definição: Dizemos que a v. a. X tem distribuição normal com parâmetros µ e σ2, − ∞ < µ < +∞ e
( x −µ) 2
−
1 2σ 2
f (x) = .e , − ∞ < x < +∞
σ 2π
Gráfico: A figura abaixo ilustra uma particular curva normal, determinada por valores particulares
de µ e σ2.
f) f(x) é simétrica ao redor de x = µ, isto é, f(µ + x) = f(µ - x), para todo − ∞ < x < +∞
A distribuição normal, independente dos valores dos parâmetros, apresenta sempre a seguinte
relação:
andrerochaest@yahoo.com.br
66
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
Se X tem distribuição normal, com média µ e variância σ2, escreveremos: X~N(µ, σ2).
• A Normal-Padrão
Para o cálculo das probabilidades, surgem dois grandes problemas:
1) Para integração de f(x), pois para o cálculo é necessário o desenvolvimento em séries;
2) Seria a elaboração de uma tabela de probabilidades, pois f(x) depende de dois parâmetros,
fato este que acarretaria um grande trabalho para tabelar
tabelar essas probabilidades considerando-
considerando
se as várias combinações de µ e σ2.
andrerochaest@yahoo.com.br
67
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
Os problemas foram solucionados por meio de uma mudança de variável obtendo-se, assim,
a distribuição normal padronizada ou reduzida: Quando µ = 0 e σ2 = 1, temos uma normal padrão
ou reduzida, e escrevemos: N(0,1). Se X~N(µ, σ2), então a v.a. Z definida por
X−µ
Z= terá uma distribuição N(0,1).
σ
É fácil demonstrar que Z tem média 0 e variância 1. A normalidade de Z já não é imediata e não
será provada aqui. A figura abaixo ilustra a N(0,1).
Uma das propriedades associadas à distribuição normal é a sua capacidade para predizer as
probabilidades de encontrar um valor entre dois números quaisquer.
andrerochaest@yahoo.com.br
68
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
andrerochaest@yahoo.com.br
69
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
0 1 2 3 4 5 6
0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636
0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026
0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406
0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772
Exemplo 2.19: Suponhamos que o comprimento de um tubo de PVC tem distribuição normal com
média de 200cm e desvio padrão de 20 cm. Veja o gráfico desta distribuição.
andrerochaest@yahoo.com.br
70
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
Qual a probabilidade de um tubo apresentar comprimento entre 200 e 225 cm. Está probabilidade
corresponde a figura a seguir.
X −µ
Z= - µ = média; σ = desvio padrão
σ
- X = valor pesquisado
Z = X - 200 = 1,25
20
andrerochaest@yahoo.com.br
71
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
Exemplo 2.20: Referente ao Exemplo .19, qual é a probabilidade do tubo de PVC apresentar menos
do que 190 cm de comprimento. Para resolver este problema, é preciso "reduzir" o valor X = 190
para uma normal padrão. Assim, temos:
A probabilidade de z assumir o valor menor que z = - 0,50 é igual a probabilidade de ocorrer valor
maior do que z = 0,50 (fato este pela normal ser simétrica em torno do zero). Consultando o
ANEXO A da distribuição normal reduzida, vemos que no cruzamento entre a linha e a coluna, na
primeira coluna, temos o valor 0,5 e na primeira linha o valor zero para compor o número z = 0,50,
em que está o valor 0,1915; que é a probabilidade de ocorrer valor zero e z = 0,50. Como a
probabilidade de ocorrer valor maior do que a média zero é 0,5, a probabilidade pedida é dada por:
0,5 - 0,1915 = 0,3085 ou 30,85%.
Exercício 2.7: Sabendo a quantidade de calcário por 100kg de cimento CP II – F do tipo Composto
é uma variável aleatória com distribuição normal de média µ=16 kg e desvio padrão σ=1,75 kg.
Calcule a probabilidade de numa amostra de 1000kg desse cimento apresentar de 13 a 18kg de
calcário.
b) P(Z ≤ 0) g) P( Z ≥ 2,8)
andrerochaest@yahoo.com.br
72
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
X −µ
t= , com (n-1) graus de liberdade,
s/ n
andrerochaest@yahoo.com.br
73
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
2. A distribuição t de Student tem média t = 0 (tal como a normal padronizada, com média Z = 0).
3. O desvio-padrão da distribuição t de Student varia com o tamanho da amostra, mas é superior a
1 (ao contrário da distribuição normal padronizada).
4. Na medida em que aumenta o tamanho da amostra, a distribuição t de Student se aproxima mais
e mais da distribuição normal padronizada. Para valores n > 30, as diferenças são tão pequenas
que podemos utilizar os valores críticos Z.
∑( x − x)
2
i
2 i =1
Sabe-se que, a variância de uma amostra deve ser calculada por S = .
n −1
A necessidade dessa correção esta relacionada com o número de g.l., por exemplo:
andrerochaest@yahoo.com.br
74
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
∑( x − µ )
2
i
n
xi σ2 = i =1
µ = X =∑ e
i =1 n n
são estatísticas com "n" graus de liberdade, pois existem n valores xi livres que devem ser
considerados para podermos calcular o valor da estatística.
A estatística s2, por usar X ao invés de µ , tem um grau de liberdade a menos. Isso ocorre porque
para o cálculo de s2 é necessário que se tenha calculado X , ou seja, já utilizamos uma vez todo os
valores da amostra; estes estiram sendo usados pela segunda vez para o cálculo de s2.
Exercício 2.9: Com base na tabela t de Student determine o valor da distribuição nos seguinte
casos:
a) t (5; 1%)
b) t (6; 2%)
c) t (19; 5%)
d) t (21; 10%)
e) t (28; 5%)
f) t (12; 1%)
andrerochaest@yahoo.com.br
75
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
UNIDADE III
INFERÊNCIA ESTATÍSTICA
Introdução
Nas últimas unidades vimos como construir modelos probabilísticos para descrever alguns
fenômenos. Nessa parte, iremos estudar um ramo muito importante da Estatística conhecido como
Inferência Estatística, ou seja, como fazer afirmações sobre características de uma população,
baseando-se em resultados de uma mostra.
Inferência Estatística é o ramo da Estatística que refere-se ao processo de obter informações sobre
uma população a partir de resultados observados na amostra.
θ θˆ
Inferência Estatística
POPULAÇÃO: Conjunto de indivíduos (ou objetos), tendo pelo menos uma variável comum
observável. Pode ser finita, como o conjunto de alunos de uma escola em um determinado ano, ou
infinita, como o número de vezes que se pode jogar um dado.
A maioria das pesquisas realizadas nas mais variadas áreas do conhecimento humano são
feitas com amostras. O pesquisador, no entanto, almeja generalizar seus resultados, ou seja, saber
se o que obteve com amostras é válido para toda a população. Essa é, sem dúvida, a essência da
andrerochaest@yahoo.com.br
76
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
PARÂMETRO: Medida usada para descrever uma característica da população [ µ,σ 2 ( x ),σ ( x ),... ].
andrerochaest@yahoo.com.br
77
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
Sejam X uma v.a. com valor esperado µ e variância σ2 e X a média de uma amostra
aleatória de tamanho n de X. Então:
- E( X )=µ
- Var( X )=σ2/n
- A distribuição de X aproxima-se de uma distribuição normal com valor esperado µ
e variância σ2/n, quando n tende ao infinito. (Teorema Central do Limite).
Observações:
i. Como regra prática, aceita-se que para amostras com mais de 30 elementos, a
aproximação citada em (iii) já pode ser considerada boa.
ii. Se a distribuição é normal com valor esperado µ e a variância σ2, então a média
amostral baseada em uma amostra aleatória de tamanho n tem distribuição normal
com valor esperado µ e variância σ2/n, independente do tamanho da amostra.
Solução:
Temos nesse exemplo que a distribuição da média amostral X é aproximadamente N(55; 6,4).
σ2 256
Ou seja, X ~ N µ , ⇒ X ~ N 55, ⇒ X ~ N ( 55; 6, 4 ) . Assim, teremos:
n 40
X − 55 60 − 55
P ( X > 60 ) = P > = P( Z > 1,98) = 0, 5 + 0, 4761 = 0,9761
6, 4 6, 4
andrerochaest@yahoo.com.br
78
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
Consideremos uma população que tem uma proporção p de portadores de certa característica
e seja X1, X2, ..., Xn uma amostra aleatória onde Xi, 1 ≤ i ≤ n, é definida por:
1, se o i-ésimo elemento é portador da característica;
Xi =
0, em caso contrário.
Temos que Xi, 1 ≤ i ≤ n, tem distribuição de Bernoulli, com E(Xi)=p e Var(X)=p(1-p). Portanto, a
distribuição da média amostral X se aproxima de uma distribuição normal, com valor esperado p e
variância p(1-p)/n, quando n tende ao infinito. (Teorema Central do Limite).
Observação: Dado que X é a proporção de elementos da amostra que são portadores da citada
característica, então costumamos fazer X = pˆ .
Exemplo 3.2: Em certa cidade, 30% dos motoristas envolvidos em acidentes fatais mostram
evidência do uso de drogas. Numa amostra de 200 acidentes fatais, qual será a probabilidade de que
mais de 25% desses motoristas tenham usado drogas?
Solução:
Definindo a variável aleatória p̂ =proporção de motoristas que usam drogas numa amostra de 200
acidentes fatais, temos que a distribuição de p̂ é aproximadamente N(0,30; 0,00105). Assim,
pˆ − 0,30 0, 25 − 0,30
P ( pˆ > 0, 25) = P > = P ( Z > −1,54 ) = 0,9382 .
0, 00105 0, 00105
Logo, a probabilidade de que mais de 25% desses motoristas tenham usado drogas é de 93,82%.
andrerochaest@yahoo.com.br
79
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
A partir da amostra procura-se construir um intervalo de variação, θˆ1 ≤ θ ≤ θˆ2 , com uma
certa probabilidade de conter o verdadeiro parâmetro populacional.
1) TESTES PARAMÉTRICOS
• A hipótese é formulada com respeito ao valor de um parâmetro populacional.
2) TESTES NÃO-PARAMÉTRICOS
• A hipótese é formulada com respeito à natureza da distribuição da população.
INTERVALOS DE CONFIANÇA
É um intervalo real, centrado na estimativa pontual que deverá conter o parâmetro com
determinada probabilidade. A probabilidade de o intervalo conter o parâmetro estimado é
denominada de nível de confiança associado ao intervalo. A notação mais usual para o nível de
confiança associado ao intervalo é 1 - α ou (1 - α )%.
andrerochaest@yahoo.com.br
80
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
Assim como as estimações pontuais, os intervalos de confiança podem ser vistos como uma
técnica para se fazer inferência estatística. Ou seja, a partir de um intervalo de confiança, construído
com os elementos amostrais, pode-se inferir sobre um parâmetro populacional.
θ : Parâmetro populacional
θˆ : Estimador de θ
A partir da distribuição de probabilidade de θˆ é possível construir um intervalo
O valor da probabilidade (1 − α ) que usualmente assume os valores 90%, 95%, 98%, etc.,
é denominado NÍVEL DE CONFIANÇA (quanto maior melhor), e o valor α é chamado NÍVEL
DE SIGNIFICÂNCIA (quanto menor melhor), isto é, representa o erro que se está cometendo
quando se afirma que a probabilidade do intervalo, θˆ1 ≤ θ ≤ θˆ2 , conter o verdadeiro valor do
parâmetro populacional é (1 − α ) .
Permite uma idéia da precisão com que foi calculada a estimativa do parâmetro, pois
expressa o erro aceito ao calculá-la.
- Intervalo muito pequeno ALTA PRECISÃO DA ESTIMATIVA DO PARÂMETRO;
- Quanto maior o grau de confiança MENOR PRECISÃO DA ESTIMATIVA DO
PARÂMETRO.
andrerochaest@yahoo.com.br
81
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
Métodos
Fatores
Distribuição Normal Distribuição t-Student
Tamanho da amostra n ≥ 30 n < 30
Variância σ2 (conhecida) S2 (desconhecida)
Variável utilizada Z T
Seja ( )
X ~ N µ , σ 2 . Sabe-se que o estimador de µ, X (média amostral), tem distribuição de
probabilidade dada por:
(
X ~ N µ ,σ 2 / n ) , para populações infinitas
X −µ
Então, Z= ~ N (0,1)
σ/ n
Fixando-se um nível de confiança (1 − α ) tem-se:
P (− Z α / 2 ≤ Z ≤ Zα / 2 )= 1−α
andrerochaest@yahoo.com.br
82
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
X −µ
P − Z α / 2 ≤ ≤ Z α / 2 = 1 − α
σ/ n
σ σ
P − Zα / 2. − X ≤ −µ ≤ Zα /2. − X =1−α
n n
σ σ
P X − Zα /2. ≤ µ ≤ X + Zα /2. =1−α
n n
Exemplo 3.5: O departamento de Recursos Humanos de uma grande empresa informa que o tempo
de execução de tarefas que envolvem participação manual varia de tarefa para tarefa, mas que o
desvio padrão permanece aproximadamente constante em 3 min. Uma nova tarefa está sendo
implantada na empresa. Uma amostra aleatória do tempo de execução de 50 dessas novas tarefas
forneceu o valor médio de 15 min. Determine o intervalo de confiança de 95% para o tempo médio
de execução dessa nova tarefa.
Sabe-se que, (
X ~ N µ ,σ / n 2
) , então (
X ~ N 15, 3
2
50 ) ;
Pela Tabela do ANEXO A (Tabela da Normal Padrão), o valor de α/2=1,96. Então, temos :
σ σ
P X − Zα /2. ≤ µ ≤ X + Zα /2. =1−α
n n
3 3
P 15 − 1, 96. ≤ µ ≤ 15 + 1, 96. = 95%
50 50
(n ≥ 30) S ≅σ
S é um estimador viesado para σ , mas aumentando o tamanho da amostra o viés tende a
desaparecer; portanto o IC para µ pode ser construído.
Quanto menor a amostra mais necessária se torna a introdução de uma correção: t(n-1) ao
invés de Z.
X −µ
Sabe-se que, (
X ~ N µ ,σ 2 / n ) e Z=
σ/ n
~ N (0,1)
X −µ
Então, t n −1 =
S/ n
P (− tα / 2 ≤ t ≤ tα / 2 ) = 1 − α
X −µ
P − tα / 2 ≤ ≤ tα / 2 = 1 − α
S/ n
S S
P − tα / 2 . − X ≤ − µ ≤ tα / 2 . − X =1−α
n n
andrerochaest@yahoo.com.br
84
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
S S
P X − tα / 2 . ≤ µ ≤ X + tα / 2 . = 1−α
n n
OBS: Quanto menor o tamanho da amostra, mais necessário se torna a introdução de uma correção,
a qual consiste em usar a variável t-Student (t(n-1)) ao invés de usar a variável Z.
Exemplo 3.6: Uma amostra de 25 peças de laminado usado na fabricação de placas de circuito foi
selecionada, e a quantidade de deformação (in.) sob condições específicas foi determinada para
cada peça, resultando em uma deformação média amostral de 0,0635 in. E um desvio-padrão
amostral de 0,0065 in. Construa um intervalo de confiança para a média ao nível de 99%.
Solução:
Média amostral: X = 0, 0635 in.
S S
P X − tα / 2 . ≤ µ ≤ X + tα / 2 . =1−α
n n
0, 0065 0, 0065
P 0, 0635 − ( 2, 7969 ) . ≤ µ ≤ 0, 0635 + ( 2, 7969 ) . = 99%
25 25
P ( 0, 0598 ≤ µ ≤ 0, 0671) = 99%
Interpretação: Podemos afirmar, a um nível de 99% de confiança, que o intervalo [0,0598; 0,0671]
contém a verdadeira média; A precisão dessa estimativa nos permite afirmar, com 99% de certeza,
de que não estamos errando por mais de 0,00365 ([0,0671 - 0,0598] / 2) nessa estimação. Logo, se
realizássemos esse procedimento 100 vezes, por exemplo, espera-se que 99 dos intervalos
calculados contenham o verdadeiro valor do parâmetro estimado. Ou seja, espera-se a um nível de
99% de confiança, que a deformação média, medida em “in.”, nas placas de circuito seja entre
0,0671 in. a 0,0598 in.
andrerochaest@yahoo.com.br
85
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
Exercício 3.1: Após analisar o teor alcoólico de 52 amostras de sangue de pessoas que estavam
numa festa, um químico obteve através do software R uma média de 3,9% de C2H5OH e um desvio-
padrão de 5,78% de C2H5OH.
a) Calcule um intervalo de 95% de confiança para o percentual médio de C2H5OH para as
pessoas que beberam nessa festa. Interprete os resultados.
b) Com 99% de confiança, o intervalo para o percentual médio de C2H5OH é de [1,76% ;
6,04%]. Por que é diferente do intervalo da letra (a)?
pˆ − p
Z= ~ N ( 0,1)
pq / n
pˆ ( qˆ ) pˆ ( qˆ )
P pˆ − Z α / 2 . ≤ p ≤ pˆ + Z α / 2 . = 1−α
n n
Exemplo 3.7: Uma pesquisa recente efetuada com 300 habitantes de uma grande cidade revelou
que 128 pessoas apresentavam insuficiência respiratória. Determine um intervalo de confiança de
90% para a proporção de habitantes dessa cidade que apresentaram insuficiência respiratória.
Solução:
n=300 & k=128;
Logo, temos que a proporção das pessoas que apresentavam insuficiência respiratória é de
128
pˆ = = 0, 4267 ou 42,67%. Assim, teremos para o cálculo do intervalo de confiança:
300
andrerochaest@yahoo.com.br
86
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
pˆ ( qˆ ) pˆ ( qˆ )
I .C . = pˆ − Z α / 2 . ≤ p ≤ pˆ + Z α / 2 . = 1−α
n n
( 0, 4267 ) ⋅ ( 0, 5733 ) ≤ p ≤ 0, 4267 + 1, 645. ( 0, 4267 ) ⋅ ( 0, 5733 ) = 90%
I .C . = 0, 4267 − 1, 645.
300 300
I .C . = ( 0, 4267 − 0, 0285 ≤ p ≤ 0, 4267 + 0, 0285 ) = 90%
I .C . = ( 0, 3982 ≤ p ≤ 0, 4552 ) = 90%
IC α =10% = [ 0, 3982 ; 0, 4552 ]
Interpretação: Podemos afirmar, a um nível de 90% de confiança, que o intervalo [0,3982; 0,4552]
contém o valor verdadeira da proporção populacional. Logo, se realizássemos esse procedimento
100 vezes, por exemplo, espera-se que 90 dos intervalos calculados contenham o verdadeiro valor
do parâmetro estimado. Ou seja, com 10% de significância, o percentual de habitantes com
insuficiência respiratória será entre 39,82% a 45,52%.
Exercício 3.2: Um artigo em Fortune (21/09/1992) afirma que aproximadamente metade de todos
os engenheiros químicos continua seus estudos acadêmicos além do grau de bacharelado, recebendo
no final o grau de mestre ou doutor. Dados de um artigo em Engineering Hozizons indicaram que
117 de 484 novos engenheiros químicos graduados estavam planejando fazer uma pós-graduação.
Calcule um intervalo com 99% de confiança a cerca da proporção de engenheiros químicos que
continuam seus estudos além da graduação. Interprete os resultados.
Suponha que numa determinada região, o peso de crianças aos 12 anos, seja modulado pela
distribuição normal, tal que X ~N (48, 16). Um pesquisador da área médica desconfia que devido a
mudanças nos hábitos alimentares, o peso médio seja maior. Para tentar comprovar sua suposição o
pesquisador seleciona, por processo aleatório, uma amostra de 100 crianças dessa população,
obtendo como peso amostral x = 51,3 kg. Será que ele tem razão? A resposta deve ser analisada
cuidadosamente e uma decisão mais segura só é possível depois de submeter seus dados a um teste
estatístico, também conhecido como teste de hipóteses que estará sujeito a uma regra de decisão.
Regra de decisão que permite aceitar ou rejeitar uma hipótese, decisão esta que é tomada em
função dos valores amostrais. Em outras palavras, formula-se uma hipótese quanto ao valor do
andrerochaest@yahoo.com.br
87
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
HIPÓTESE ESTATÍSTICA
Suposição quanto ao valor de um parâmetro ou quanto à natureza da distribuição de uma
probabilidade
lidade de uma variável populacional.
TIPOS DE HIPÓTESES
H 0 : é aquela que será testada, sendo sempre contrária ao resultado do experimento amostral;
hipótese nula. É formulada com base nos dados populacionais.
H1 : é qualquer hipótese diferente da hipótese nula, sendo sempre a favor do resultado do
experimento amostral; hipótese alternativa.
OBS: a aceitação de H0 implica na rejeição de H1, e a rejeição de H0 implica na aceitação de H1.
Exemplo: H0: µ = µ 0
H1: µ > µ 0
andrerochaest@yahoo.com.br
88
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
Regra de Decisão
Se o teste estatístico acusar um valor na região de rejeição de H0. Quando a probabilidade associada
a um valor observado de um teste estatístico é menor ou igual do que o valor previamente
determinado de α, concluímos que H0 é falsa, tal valor observado é chamado "significativo". H0 é
rejeitada sempre que ocorre um valor "significativo".
TIPOS DE ERROS:
1 Erro Tipo I (α): P(rejeitar H0 | H0 é verdadeira) Probabilidade de rejeitar H0 dado que H0 é
verdadeira.
2 Erro Tipo II (β): P(aceitar H0 | H0 é falsa) Probabilidade de aceitar H0 dado que H0 é falsa.
Decisão
Realidade
Aceitar H0 Rejeitar H0
H0 é verdadeira Decisão Correta (1 − α ) Erro Tipo I (α )
H0 é falsa Erro Tipo II (β ) Decisão Correta (1 − β )
ERRO TIPO I ⇒ cometido quando rejeitamos H0 , quando na verdade, ela é verdadeira. Esse tipo
de erro é o mais importante a ser evitado. A probabilidade de se cometer um erro tipo I é o que se
chama de nível de significância de um teste. α =P(erro tipo I).
ERRO TIPO II ⇒ cometido quando não rejeitamos H0, quando na verdade ela é falsa.
TAREFA DIFÍCIL: para uma amostra de tamanho n a probabilidade de se incorrer em um erro tipo
II aumenta à medida que diminui a probabilidade do erro tipo I (vice-versa).
TESTES PARAMÉTRICOS
Quando queremos realizar um teste de hipótese para a média populacional, se conhecemos o valor
do desvio-padrão da população, teremos como base para a estatística do teste a distribuição normal.
Assim, uma possível solução, seria estimar o resultado da característica de interesse da população
(com um nível (1-α) de certeza), extraindo uma amostra de tamanho n, e, utilizando o desvio-padrão
da população na estimação. A figura abaixo ilustra o procedimento proposto.
andrerochaest@yahoo.com.br
90
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
1. Enunciar as hipóteses:
H 0 : µ = µ0
µ ≠ µ ( a ) T este Bilateral α
0 2 ( )
H 1 : µ > µ 0 ( b ) T este U nilateral (α )
µ < µ ( c ) T este U nilateral (α )
0
andrerochaest@yahoo.com.br
91
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
X −µ
Zcal =
5. Calcular a variável do teste σ
n
6. Conclusões
1. Se –Zα/2 < ZCalc < Zα/2, não rejeita H0 Teste Bilateral
2. Se ZCalc > Zα, rejeita-se H0 Teste Unilateral
3. Se ZCalc < Zα, rejeita-se H0 Teste Unilateral
Exemplo 3.8: Em indivíduos sadios, a taxa de fósforo no sangue tem distribuição aproximadamente
normal com média µ = 3 mg/100cc e desvio-padrão σ = 0,6mg/100cc. Com o objetivo de saber se
no artritismo essa taxa média aumentou, um pesquisador tomou uma amostra de 36 doentes e testou
sua hipótese ao nível de 5% de significância. Observou-se na amostra a média X = 3,12mg/100cc.
Solução:
As hipóteses serão as seguintes
H0: µ = 3,0
H1: µ > 3,0 (teste unilateral)
OU
H0: A taxa de fósforo no sangue de pessoas com artritismo é igual a 3,0mg/100cc.
H1: A taxa de fósforo no sangue de pessoas com artritismo é maior que 3,0mg/100cc.
Usaremos α = 0, 05. A estatística a ser utilizada será:
andrerochaest@yahoo.com.br
92
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
Após termos calculado a estatística do teste, vamos agora encontrar a probabilidade na tabela de
distribuição Normal-Padrão (Tabela do ANEXO A). Lembre-se que como o teste é unilateral, o
valor de α será igual a 5%, e não a 2,5%.
Logo, como a tabela da distribuição normal nos dá de 0 até +∞ (50% da área total, ou probabilidade
igual a 0,5), temos que:
Como na tabela não encontramos um valor exato de 0,45. O mais próximo dessa probabilidade são
dois valores de P(Z < 1,64) = 0,4495 e P(Z < 1,65) = 0,4505. Repare que para Z=1,64 e Z=1,65, um
é menor e outro é maior, respectivamente, que 0,45 na mesma proporção. Assim, faz-se necessário
realizar uma interpolação apenas realizando uma média aritmética de ambos os valores de Z, tendo
assim: P(Z < 1,645) ≈ 0,445.
1, 64 + 1, 65
P ( Z < x ) = 0, 45 ⇒ x = = 1, 645 ⇒ P ( Z < 1, 645 ) ≈ 0, 45.
2
andrerochaest@yahoo.com.br
93
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
Exercício 3.3: Em indivíduos normais, o consumo renal médio de oxigênio é de 12 cm3/min com
desvio-padrão de 2,3 cm3/min. Um pesquisador interessado em saber
saber se isso realmente ocorre,
selecionou uma amostra de 28 pessoas sadias e obteve um consumo renal médio de oxigênio de
13,45 cm3/min. Teste a um nível de 5% se realmente ocorre o que o pesquisador averiguou.
averiguou Defina
as hipóteses e interprete.
andrerochaest@yahoo.com.br
94
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
Quando queremos realizar um teste de hipótese para a média populacional, se conhecemos o valor
do desvio-padrão
padrão da população, teremos como base para a estatística do teste a distribuição normal.
No entanto, quando
uando desconhecemos o desvio-padrão
desvio padrão populacional, que é o que ocorre na prática,
tomamos como base a distribuição t de Student.
2 2
Neste caso, como não conhecemos σ , precisamos calcular a estimativa S a partir de uma amostra.
Para a construção das hipóteses a serem analisadas, a região de rejeição será baseada numa
estatística de teste com base na distribuição t de Student:
X −µ
T~ ~ tn −1
S2
n
andrerochaest@yahoo.com.br
95
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
a) Enunciar as hipóteses:
H 0 : µ = µ0
µ ≠ µ ( a ) T este Bilateral α
0 2 ( )
H 1 : µ > µ 0 ( b ) T este U nilateral (α )
µ < µ ( c ) T este U nilateral (α )
0
X −µ
d) Calcular a variável do teste
Tcal =
S/ n
e) Conclusões
4. Se –tα/2 < TCalc < tα/2, não rejeita H0 Teste Bilateral
5. Se TCalc > tα, rejeita-se H0 Teste Unilateral
6. Se TCalc < tα, rejeita-se H0 Teste Unilateral
Exemplo 3.9: A tolerância de dieta diária de zinco recomendada entre homens com mais de 50 anos
é 15mg/dia. O artigo “Nutrient Intakes and Dietary Patterns of Older Americans: A National
Study” (J. Gerontology, 1992, pg. 145-150) relata sobre ingestão uma média de 17,3 mg/dia e
desvio-padrão de 6,43 mg/dia para uma amostra de 88 homens com mais de 50 anos.
Esses dados, a um nível de 5% de significância, indicam que a ingestão de zinco diária média na
população dos homens com mais de 50 anos está na tolerância permitida? Defina as hipóteses e
interprete.
Solução:
H0: µ = 15 mg/dia
H1: µ ≠ 15 mg/dia (teste bilateral)
andrerochaest@yahoo.com.br
96
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
OU
H0: Os homens com + de 50 anos estão com a tolerância de dieta diária de zinco recomendada.
H1: Os homens com + de 50 anos NÃO estão com a tolerância de dieta diária de zinco recomendada.
X −µ 15 − 17,3 −2,3
TCalc = = = = −3,3557
S2 6, 43 0, 6854
n 88
Os graus de liberdade (g.l.) para o teste “t” de Student serão obtidos da seguinte forma:
g.l. = n – 1 = 88 – 1 = 87
Após termos calculado a estatística do teste e o número de g.l., vamos agora encontrar a
probabilidade na tabela de distribuição t-Studentl (Tabela do ANEXO B). Como usar esta tabela?
- Localizar o valor correspondente de φ (g.l. = n - 1); Nesse caso temos que g.l.=88-1=87;
- No cruzamento da linha com (φ = 87) com a coluna (α = 2,5%), por ser um teste
bilateral, então α/2, está o número 1,9876.
andrerochaest@yahoo.com.br
97
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
α
25% 10% 5% 2,5%
φ
81 0,6775 1,2921 1,6639 1,9897
82 0,6775 1,2920 1,6636 1,9893
83 0,6775 1,2918 1,6634 1,9890
84 0,6774 1,2917 1,6632 1,9886
85 0,6774 1,2916 1,6630 1,9883
Conclusão: Como TCalc ≤ -tα/2 , ou seja, -3,3557 < -1,9876.. Então, a um nível de significância de
5%, rejeitaremos a hipótese nula, assim, os homens com + de 50 anos NÃO estão com a
tolerância de dieta diária de zinco recomendada.
andrerochaest@yahoo.com.br
98
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
Exercício 3.4: Uma companhia de produtos para o consumidor está formulando um xampu novo e
está interessado na altura (em milímetros) da espuma. A altura da espuma tem distribuição
aproximadamente normal com S = 20 mm. A companhia analisou 10 frascos de xampu e obteve
uma altura média de 175 mm, diferente da esperada pelos engenheiros, de 179 mm. Usando esses
resultados, a companhia pode assumir que seu xampu alcança a altura média menor que a estimada
pelos engenheiros? Faça um teste de hipóteses para comprovar sua teoria.
1. Enunciar as hipóteses:
H 0 : p = p0
p ≠ p0 (a)
H1 : p > p0 (b)
p < p (c)
0
pˆ − p 0
Calcular a variável do teste Z cal =
p0 q0 / n
4. Conclusões
a) Se –Zα/2 < ZCalc < Zα/2, não rejeita H0
b) Se ZCalc > Zα/2, rejeita-se H0
c) Se ZCalc < -Zα/2, rejeita-se H0
Exemplo 3.10: Um pesquisador afirma que a fração de circuitos integrados defeituosos produzidos
em um processo de fotolitografia (técnica utilizada na confecção de circuitos integrados) é igual a
5%. Uma amostra de 300 circuitos é testada, encontrando 13 defeituosos. Teste ao nível de
significância de 1%, se o pesquisador está correto. Defina as hipóteses e Interprete.
Solução:
p0 = 0,05 , n = 300 , k = 13, α = 0,05 e pˆ = 13/ 300 = 0,04
andrerochaest@yahoo.com.br
99
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
1. Enunciar as hipóteses
H 0 : p = 0, 05
H 1 : p ≠ 0, 0 5
2. α = 0.05
pˆ − p 0 0, 04 − 0, 05 − 0, 01
Z cal = = = = − 0, 8
p0 q0 / n ( 0, 05 )( 0, 95 ) / 300 0, 0125
4. Determinar RA e RC:
5. Conclusão:
Como -ZTab < ZCal < +ZTab 1,96 < -0,8 < 1,96; NÃO rejeita H0, ou seja, com 5% de
significância, concluí-se
se que a fração de
de circuitos integrados defeituosos produzidos em um
processo de fotolitografia é igual a 5%.
andrerochaest@yahoo.com.br
100
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
Exercício 3.5: Uma máquina foi regulada para fabricar placas de 5 mm de espessura. No entanto,
após uma inspeção de rotina, o técnico informou ao seu dono que ela está produzindo 4% das placas
com defeitos. Assim, foi retirada uma amostra de 40 placas, identificando apenas 2 com defeito.
Teste a um nível de 99% de confiança se a máquina está produzindo um percentual de peças com
defeito acima do que o técnico informou. Defina as hipóteses e interprete.
4.3.4 - Valor-P
A seção anterior sobre teste de hipóteses mostrou que se pode rejeitar ou não uma hipótese usando
um nível de significância α, um valor crítico e uma correspondente região de rejeição, que é a
abordagem clássica. A seguir, será apresentada uma outra maneira equivalente, bastante comum e
abordada na maioria dos softwares estatísticos e na literatura científica, de se obter o mesmo
resultado final.
Observação 1: No caso do uso do valor-p, não precisamos mais calcular uma estatística do teste e
compará-la com um valor tabela da distribuição de referência (normal, t-student, F, qui-quadrado,
etc). Basta compararmos o resultado do valor-p diretamente com o nível de significância α.
Observação 2: Quanto menor for o valor-p, mais forte será a evidência fornecida pela amostra
contra H0. Por outro lado, quanto maior for o valor-p, menor será a evidência contra H0.
andrerochaest@yahoo.com.br
101
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
Exemplo 3.11: Um pesquisador deseja determinar o efeito da taxa de escoamento de C2F6 sobre a
uniformidade do ataque químico em uma pastilha de silicone usada na fabricação de um circuito
integrado. Três taxas de escoamento são usadas no experimento e a uniformidade (em porcentagem)
resultante, para seis pastilhas de silicone para cada taxa de escoamento. O experimento foi
completamente aleatorizado.
HIPÓTESES TESTADAS:
H1: Há diferença na resposta entre pelo menos duas das taxas de escoamento de C2F6.
Solução:
Exemplo 3.12: Um pesquisador deseja testar a resistência do concreto à compressão. Ele deseja
investigar quatro técnicas diferentes de mistura. O experimento foi completamente aleatorizado.
HIPÓTESES TESTADAS:
H1: Há diferença na resposta entre pelo menos duas das diferentes técnicas de mistura.
Solução:
Solução:
Solução:
andrerochaest@yahoo.com.br
102
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
Exemplo 3.13: Um experimento foi feito para determinar se quatro temperaturas específicas de
queima afetam a densidade de um certo tipo de tijolo. Utilizando 4 tijolos para cada temperatura
específica, foi determinada a densidade para o tipo de tijolo de acordo com a variação das
temperaturas. O experimento foi completamente aleatorizado.
HIPÓTESES TESTADAS:
H1:Há diferença na densidade do tipo de tijolo em pelo menos duas das temperaturas.
Solução:
Solução:
Solução:
andrerochaest@yahoo.com.br
103
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
REFERÊNCIAS
9. SILVA, Francisco de Assis Medeiros da. Estatística Aplicada à Administração. Natal: UFRN,
2004. (Notas de Aula).
andrerochaest@yahoo.com.br
104
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
ANEXOS
andrerochaest@yahoo.com.br
105
EST0323– Estatística Aplicada a Engenharia I – Prof. Msc. André Luiz Sena da Rocha
P(0 ≤ Z ≤ zc)
zc 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549
0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852
0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133
0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 *0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890
2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916
2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 *0,4951 0,4952
2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964
2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974
2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981
2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986
3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990
3,10 ou + 0,4999
ϕ = graus de liberdade
α α
25% 10% 5% 2,5% 1% 0,5% 25% 10% 5% 2,5% 1% 0,5%
ϕ ϕ
1 1,0000 3,0777 6,3138 12,7062 31,8207 63,6574 46 0,6799 1,3002 1,6787 2,0129 2,4102 2,6870
2 0,8165 1,8856 2,9200 4,3027 6,9646 9,9248 47 0,6797 1,2998 1,6779 2,0117 2,4083 2,6846
3 0,7649 1,6377 2,3534 3,1824 4,5407 5,8409 48 0,6796 1,2994 1,6772 2,0106 2,4066 2,6822
4 0,7407 1,5332 2,1318 2,7764 3,7469 4,6041 49 0,6795 1,2991 1,6766 2,0096 2,4049 2,6800
5 0,7267 1,4759 2,0150 2,5706 3,3649 4,0322 50 0,6794 1,2987 1,6759 2,0086 2,4033 2,6778
6 0,7176 1,4398 1,9432 2,4469 3,1427 3,7074 51 0,6793 1,2984 1,6753 2,0076 2,4017 2,6757
7 0,7111 1,4149 1,8946 2,3646 2,9980 3,4995 52 0,6792 1,2980 1,6747 2,0066 2,4002 2,6737
8 0,7064 1,3968 1,8595 2,3060 2,8965 3,3554 53 0,6791 1,2977 1,6741 2,00
2,0057 2,3988 2,6718
9 0,7027 1,3830 1,8331 2,2622 2,8214 3,2498 54 0,6791 1,2974 1,6736 2,0049 2,3974 2,6700
10 0,6998 1,3722 1,8125 2,2281 2,7638 3,1693 55 0,6790 1,2971 1,6730 2,0040 2,3961 2,6682
11 0,6974 1,3634 1,7959 2,2010 2,7181 3,1058 56 0,6789 1,2969 1,6725 2,0032 2,3948 2,6665
12 0,6955 1,3562 1,7823 2,1788 2,6810 3,0545 57 0,6788 1,2966 1,6720 2,0025 2,3936 2,6649
13 0,6938 1,3502 1,7709 2,1604 2,6503 3,0123 58 0,6787 1,2963 1,6716 2,0017 2,3924 2,6633
14 0,6924 1,3450 1,7613 2,1448 2,6245 2,9768 59 0,6787 1,2961 1,6711 2,0010 2,3912 2,6618
15 0,6912 1,3406 1,7531 2,1315 2,6025 2,9467 60 0,6786 1,2958 1,6706 2,0003 2,3901 2,6603
16 0,6901 1,3368 1,7459 2,1199 2,5835 2,9208 61 0,6785 1,2956 1,6702 1,9996 2,3890 2,6589
17 0,6892 1,3334 1,7396 2,1098 2,5669 2,8982 62 0,6785 1,2954 1,6698 1,9990 2,3880 2,6575
18 0,6884 1,3304 1,7341 2,1009 2,5524 2,8784 63 0,6784 1,2951 1,6694 1,9983 2,3870 2,6561
19 0,6876 1,3277 1,7291 2,0930 2,5395 2,8609 64 0,6783 1,2949 1,6690 1,9977 2,3860 2,6549
20 0,6870 1,3253 1,7247 2,0860 2,5280 2,8453 65 0,6783 1,2947 1,6686 1,9971 2,3851 2,6536
21 0,6864 1,3232 1,7207 2,0796 2,5177 2,8314 66 0,6782 1,2945 1,6683 1,9966 2,3842 2,6524
22 0,6858 1,3212 1,7171 2,0739 2,5083 2,8188 67 0,6782 1,2943 1,6679 1,9960 2,3833 2,6512
23 0,6853 1,3195 1,7139 2,0687 2,4999 2,8073 68 0,6781 1,2941 1,6676 1,9955 2,3824 2,6501
24 0,6848 1,3178 1,7109 2,0639 2,4922 2,7969 69 0,6781 1,2939 1,6672 1,9949 2,3816 2,6490
25 0,6844 1,3163 1,7081 2,0595 2,4851 2,7874 70 0,6780 1,2938 1,6669 1,9944 2,3808 2,6479
26 0,6840 1,3150 1,7056 2,0555 2,4786 2,7787 71 0,6780 1,2936 1,6666 1,9939 2,3800 2,6469
27 0,6837 1,3137 1,7033 2,0518 2,4727 2,7707 72 0,6779 1,2934 1,6663 1,9935 2,3793 2,6459
28 0,6834 1,3125 1,7011 2,0484 2,4671 2,7633 73 0,6779 1,2933 1,6660 1,9930 2,3785 2,6449
29 0,6830 1,3114 1,6991 2,0452 2,4620 2,7564 74 0,6778 1,2931 1,6657 1,9925 2,3778 2,6439
30 0,6828 1,3104 1,6973 2,0423 2,4573 2,7500 75 0,6778 1,2929 1,6654 1,9921 2,3771 2,6430
31 0,6825 1,3095 1,6955 2,0395 2,4528 2,7440 76 0,6777 1,2928 1,6652 1,9917
,9917 2,3764 2,6421
32 0,6822 1,3086 1,6939 2,0369 2,4487 2,7385 77 0,6777 1,2926 1,6649 1,9913 2,3758 2,6412
33 0,6820 1,3077 1,6924 2,0345 2,4448 2,7333 78 0,6776 1,2925 1,6646 1,9908 2,3751 2,6403
34 0,6818 1,3070 1,6909 2,0322 2,4411 2,7284 79 0,6776 1,2924 1,6644 1,9905 2,3745 2,6395
35 0,6816 1,3062 1,6896 2,0301 2,4377 2,7238 80 0,6776 1,2922 1,6641 1,9901 2,3739 2,6387
36 0,6814 1,3055 1,6883 2,0281 2,4345 2,7195 81 0,6775 1,2921 1,6639 1,9897 2,3733 2,6379
37 0,6812 1,3049 1,6871 2,0262 2,4314 2,7154 82 0,6775 1,2920 1,6636 1,9893 2,3727 2,6371
38 0,6810 1,3042 1,6860 2,0244 2,4286 2,7116 83 0,6775 1,2918 1,6634 1,9890 2,3721 2,6364
39 0,6808 1,3036 1,6849 2,0227 2,4258 2,7079 84 0,6774 1,2917 1,6632 1,9886 2,3716 2,6356
40 0,6807 1,3031 1,6839 2,0211 2,4233 2,7045 85 0,6774 1,2916 1,6630 1,9883 2,3710 2,6349
41 0,6805 1,3025 1,6829 2,0195 2,4208 2,7012 86 0,6774 1,2915 1,6628 1,9879 2,3705 2,6342
42 0,6804 1,3020 1,6820 2,0181 2,4185 2,6981 87 0,6773 1,2914 1,6626 1,9876 2,3700 2,6335
43 0,6802 1,3016 1,6811 2,0167 2,4163 2,6951 88 0,6773 1,2912 1,6624 1,9873 2,3695 2,6329
44 0,6801 1,3011 1,6802 2,0154 2,4141 2,6923 89 0,6773 1,2911 1,6622 1,9870 2,3690 2,6322
45 0,6800 1,3006 1,6794 2,0141 2,4121 2,6896 90 0,6772 1,2910 1,6620 1,9867 2,3685 2,6316
andrerochaest@yahoo.com.br
107