Escolar Documentos
Profissional Documentos
Cultura Documentos
Laboratório de EAA
DME – Departamento de Matemática da PUC Minas
2º semestre de 2006
© DME /2006-2 2 de 70
1.1. Introdução
O Minitab 14 para Windows é um sistema computacional para análise estatística de dados.
Caracteriza-se pela simplicidade de uso e pela correção com que as técnicas estatísticas foram
programadas. Este pacote é um dos mais utilizados no ensino da disciplina.
Iniciando o Software
O menu principal encontra-se no topo da janela contendo, na primeira linha, grupos de funções (File,
Edit, Data, ...) e, na segunda linha, alguns atalhos (imprimir, salvar...):
Grupo de Funções
• File: funções de manipulação de arquivos: abrir e fechar projetos (Project), planilhas de dados
(worksheet); salvar; imprimir e etc...
• Edit: funções de manipulação de células da planilha e edições de preferências;
• Data: manipulações da planilha de dados: recodificação; ordenação; atribuição de postos
(ranking), cópia, empilhamento de colunas; etc...
• Calc: funções que envolvem cálculos matemáticos ou probabilísticos em células, linhas ou
colunas;
• Stat: funções estatísticas envolvendo variáveis do banco de dados;
• Graph: funções gráficas;
• Editor: movimentações com colunas; busca e substituição de valores; etc...
• Tools: algumas ferramentas disponíveis e complementares como, por exemplo, abertura do
Notepad; Calculadoras, etc...
• Windows: opções de apresentação das janelas de trabalho; apresentação das janelas
utilizadas no projeto facilitando sua exposição; etc...
• Help: Ajuda aos recursos, às funções, às definições das funções e aos procedimentos do
Minitab.
© DME /2006-2 3 de 70
Considere a Tabela abaixo com o Conjunto de Dados (banco de dados). Esta tabela contém as
informações sobre uma amostra aleatória de 15 vendedores
Para cada tipo de variável existem técnicas mais apropriadas para resumir as informações; daí a
importância de classificar corretamente cada variável. Uma classificação muito usada é:
Nominal
Qualitativa
Ordinal
Discreta
Quantitativa
Continua
Sintetizando os Dados
Para as quantitativas:
• Tabelas (Distribuição de freqüência, Distribuição de freqüência relativa percentual, Distribuição de
freqüência acumulada e Distribuição de freqüência relativa percentual acumulada);
• Gráficos (Gráfico de pontos, Ramo e folhas, Gráfico em caixas, Histograma, Diagrama de dispersão);
• Medidas: (Média aritmética, Mediana, Quartil Inferior e Superior, Variância, Desvio padrão, Coeficiente
de variação, Coeficiente de correlação etc.)
© DME /2006-2 6 de 70
Complete:
f1) Na amostra temos ________ vendedores regulares e _______% de bons.
f2) ______ % são bons ou excelentes vendedores.
f3) _______ % dos vendedores foram alocados na zona sul, que corresponde a _______
pessoas.
Observação: A variável quantitativa discreta Teste também pode ser sintetizada da mesma
maneira uma vez que assume poucos valores e é discreta.
Complete:
f4) ______ vendedores acertaram 5 questões no teste de múltipla escolha, que corresponde a
_____%.
f5) ______ vendedores acertaram menos de 5 questões no teste de múltipla escolha.
f6) ______ % dos vendedores acertaram menos de 5 questões no teste de múltipla escolha.
f7) ______ % dos vendedores acertaram 5 ou menos questões no teste de múltipla escolha.
Tabela 1.2: Tabulação cruzada para o Conceito do Gerente e divisão por Zonas de Vendas
Conceito do Zona
gerente Norte Sul Oeste Total
Regular
Bom
Excelente
Total
Responda:
Tabela 1.3: Distribuição conjunta das proporções (em porcentagens) da classificação do Conceito do
gerente de acordo com a Zona
Conceito do Zona
gerente Norte Sul Oeste Total
Regular
Bom
Excelente
Total 100 100 100 100
© DME /2006-2 8 de 70
O minitab permite construir uma tabela de dupla entrada colocando em cada célula todas as informações
possíveis, ou seja:
Freqüência;
Percentagem em relação ao total da linha;
Percentagem em relação ao total da coluna;
Percentagem em relação ao total da amostra;
Bibliografia
ANDERSON, D. R.; SEENEY, D. J.; WILLIAMS, T. A. Estatística Aplicada à Administração e Economia.
2. ed. São Paulo: Pioneira Thomson Learning, 2002.
BUSSAB, W. O., MORETTIN, P. A. Estatística Básica. 5. ed. rev. São Paulo: Saraiva, 2003.
© DME /2006-2 9 de 70
Observação:
Como não usamos a opção Statistics o Minitab forneceu sua escolha padrão:
N = número de dados; N* = número de dados omissos;
Mean = média aritmética;
SE Mean = erro padrão da média, que é o desvio padrão dividido pela raiz quadrada do tamanho
da amostra. Esta medida é utilizada na inferência sobre a média populacional e será estudada
posteriormente;
StDev = desvio padrão; Minimum = mínimo; Q1 = primeiro quartil;
Median = mediana; Q3 = terceiro quartil; Maximun = máximo.
Poderíamos ter escolhido as medidas desejadas dentre uma lista de estatísticas disponíveis
usando a opção Statistics.
a) Complete:
e) O diretor de vendas anunciou que transferirá para outra praça todos os vendedores cujo
o
volume médio de vendas for inferior ao 1 quartil da distribuição. Qual é o volume mínimo de
vendas que um vendedor deve realizar para não ser transferido?
____________________________________________.
f) A menor nota no teste foi _______ e a maior _______. Setenta e cinco por cento acertaram
_____ ou mais questões.
g) Vinte e cinco por cento dos vendedores têm _______ ou mais anos de experiência.
h) Em média, os vendedores têm _____ anos de experiência.
Complete:
O valor máximo de vendas foi de _______ mil unidades monetárias. ______ vendedores tiveram um
volume médio mensal de 24000 unidades monetárias. No intervalo de 36 a 48 mil, temos _____
vendedores.
Stem-and-leaf of Vendas N = 15
Leaf Unit = 1,0
1 1 6
7 2 113444
(2) 2 79
6 3 002
3 3
3 4
3 4 8
2 5 04
Complete:
_________ venderam 24 000 unidades monetárias ou menos.
_________ venderam de 27 a 29 000 unidades monetárias.
_________ venderam 48 000 unidades monetárias ou mais.
_________ venderam 30 000 unidades monetárias ou mais.
Complete:
a) Calcule as medidas descritivas, para a variável Venda, de acordo com a variável Zona.
Analise os resultados, levando em conta as medidas de posição e de variabilidade. Não
esqueça de calcular os coeficientes de variação.
Complete:
Quadro 2.2: Sumário da variável Vendas, de acordo com a Zona para a qual o
vendedor foi designado.
Medidas Zona
Norte Sul Oeste
Menor valor
1º Quartil
Segundo quartil
3º Quartil
Maior valor
Média aritmética
Desvio padrão
Coeficiente de
variação
Responda:
b) Faça o gráfico de caixas para a variável Vendas, de acordo com a variável Zona.
Analise o gráfico observando o que ocorreu com a zona oeste, em comparação com as outras.
______________________________________________________________________________
______________________________________________________________________________
________________
Complete:
os valores das amplitudes interquartílicas são: _______, ______ e ______ para as zonas norte,
sul e oeste, respectivamente.
Bibliografia
ANDERSON, D. R.; SEENEY, D. J.; WILLIAMS, T. A. Estatística Aplicada à Administração e Economia.
2. ed. São Paulo: Pioneira Thomson Learning, 2002.
BUSSAB, W. O., MORETTIN, P. A. Estatística Básica. 5. ed. rev. São Paulo: Saraiva, 2003.
© DME /2006-2 14 de 70
Tabela 3.1 - Medidas de espessura (em mm) de 160 azulejos produzidos pela fábrica separados por
turma de trabalho
Espessura dos azulejos (em mm)
Turma A Turma B
4.2 2.6 4.3 3.5 5.3 5.8 6.0 5.7
3.0 5.4 3.3 3.1 5.9 5.5 6.9 5.3
3.5 3.3 3.6 4.0 6.5 6.3 5.3 5.1
3.7 4.6 3.6 4.0 5.7 5.7 6.2 5.5
4.3 4.7 5.6 3.4 6.4 6.0 5.7 6.1
5.6 2.8 3.9 2.4 6.4 5.8 6.7 5.7
5.4 3.9 4.5 3.4 5.7 6.0 5.9 5.9
3.8 3.9 2.9 3.8 6.1 5.7 5.6 5.8
4.9 4.7 4.5 4.1 6.3 7.0 5.3 5.7
4.1 2.8 5.9 4.0 5.9 5.7 6.6 5.8
3.0 5.5 3.5 3.7 6.7 5.9 6.1 5.8
4.1 2.9 3.1 2.3 5.7 5.7 6.5 5.6
4.9 4.0 4.5 2.9 5.8 6.1 5.4 6.4
3.8 2.4 4.5 3.1 6.4 6.7 6.3 6.8
4.3 3.7 3.0 4.0 6.0 5.8 6.2 5.0
4.4 3.1 3.5 4.6 6.5 4.9 5.4 5.4
4.2 3.7 2.4 4.5 5.4 4.9 5.7 5.7
3.1 3.5 2.7 4.4 5.6 5.8 5.3 5.1
2.8 2.7 3.5 5.2 6.1 6.2 5.9 6.5
5.7 4.2 5.1 3.1 5.1 5.3 6.2 5.4
a) Responda:
Quais as reclamações dos Clientes?
____________________________________________________________________________________
____________________________________________________________
Os azulejos aceitáveis devem ter uma espessura de ______ a ______ mm.
© DME /2006-2 15 de 70
A primeira coluna (C1) contem todas as medidas de espessura. A coluna seguinte (C2) serve para indicar
qual turma produziu cada azulejo.
Complete:
Média aritmética: _______ mm; Desvio padrão: _______ mm;
Menor valor: _______ mm; Primeiro quartil: _______ mm;
Mediana: _______ mm; Terceiro quartil: _______ mm;
Maior valor: _______ mm; Tamanho da amostra: ______ azulejos.
e) Construa um histograma utilizando os dados de espessura dos 160 azulejos. Mostre as freqüências
acima de cada coluna e exiba no gráfico os limites de especificação. Para isso, siga os passos:
1. Selecione Graph;.
2. Selecione Histogram;
3. Escolha a opção Simple;
4. Selecione a variável Espessura para o quadro Graph variables.
Responda:
e1) O histograma possui _____ classes;
e2) O ponto médio da primeira classe é de _____ mm;
e3) O ponto médio da última classe é de _____ mm;
e4) A largura da classe (diferença entre dois pontos médios consecutivos) é de ___ mm.
© DME /2006-2 16 de 70
f) O histograma não ficou da maneira desejada. Serão necessárias algumas modificações para que ele
apresente um formato mais útil para a análise dos dados. Essas modificações serão feitas
diretamente no gráfico.
Vamos modificar o histograma fazendo exibir os limites de classe em vez dos pontos médios.
Inicie a primeira classe com o limite de 2 mm e faça a última classe exibir o limite superior de 7,5
mm, com a largura de cada classe de 0,5 mm. Para isso, siga os passos:
Responda:
f1) O histograma possui agora _______ classes no lugar de 20 classes.
f2) A classe com maior número de azulejos possui o limite inferior de ____ mm e o superior de ____
mm.
f3) A primeira classe possui os limites: ______ e ______, enquanto que a última possui _____ e
_____ mm.
f4) Abaixo do limite inferior de especificação (LIE) temos _____ azulejos e acima do limite superior
de especificação (LSE) temos _____.
f5) A proporção de azulejos abaixo do limite inferior de especificação é de ____ % e a proporção de
azulejos acima do limite superior de especificação é de ____ %.
f6) A proporção de azulejos fora da especificação é de ____ %.
f7) A proporção de azulejos fabricados de acordo com a especificação é de ____ %.
f8) Você considera que a “espessura não adequada dos azulejos” pode ser considerada como uma
causa influente dos problemas detectados? _____.
f9) Justifique sua resposta.
______________________________________________________________________________
________________________________________________________________
g) Separe as medidas de espessura que estão na coluna 1 (Espessura) de acordo com a turma, ou
seja, coloque na coluna C3 os dados produzidos pela turma A e na coluna C4 os da turma B. Para
isso, siga os passos:
h) Calcule as medidas descritivas usuais para a espessura dos azulejos de cada turma.
1. Selecione Stat;
2. Selecione Basic Statistics;
3. Selecione Display Descriptive Statistics;
(3)
4. Selecione as variáveis Espessura_A e Espessura_B para o quadro Variables ;
5. Selecione Statistics e escolha: Mean (Média), Standard deviation (Desvio-padrão), Coefficient
of variation (coeficiente de variação), First quartile (primeiro quartil), Median (Mediana), Third
quartile (terceiro quartil), Minimum (mínimo), Maximum (máximo), N nonmissing (no. válidos
de observações);.
6. Selecione Ok, duas vezes.
(3) Podemos também selecionar C1 em Variables e C2 em By Variables(optional)
Qual turma produz azulejos mais homogêneos em torno da respectiva média? _______
1. Selecione Graph;
2. Selecione Histogram;
3. Selecione as variáveis C3 (Turma A) e C4 (Turma B) para o quadro Graph variables;
4. Selecione Ok.
5. Refaça os processos para ‘definir os limites das classes’ e nomear ‘os limites de especificação’.
i2) Você considera que as duas turmas trabalham do mesmo modo ou existe diferença entre a
qualidade dos azulejos produzidos pelas duas turmas? Justifique sua resposta.
________________________________________________________________________________
__________________________________________________________________
i3) O problema de quebra dos azulejos parece ser comum aos azulejos produzidos por ambas as
turmas de trabalho da empresa ou parece estar associado a uma turma específica? Por quê?
_______________________________________________________
© DME /2006-2 18 de 70
68 63 51 60 65 73 60 60 67 60
62 49 60 52 61 79 41 60 60 64
27 47 60 85 68 72 75 60 49 26
65 68 70 65 60 75 49 29 74 61
65 38 39 80 42 82 65 38 52 57
53 70 82 76 82 97 31 96 77 75
a) Abra o arquivo aula3ex2.mtw que contém os dados s sintetize as notas finais desta turma calculando
as medidas descritivas usuais.
Complete:
A s notas finais dos ____ alunos variaram de ____ a ____, com média de ____, mediana de _____ e
desvio padrão de ___ pontos. Os 25% melhores alunos ficaram com nota maior ou igual _____ e os 25%
piores ficaram com nota menor ou igual a ____ pontos.
Responda:
c1) A mediana está localizada no __________ ramo e a média no ____ ramo;
c2) ______ alunos ficaram com 57 pontos ou menos;
c3) ______ alunos ficaram com 70 pontos ou mais;
d4) ______ alunos ficaram com nota de 60 a 68 pontos;
c5 ) ______ alunos ficaram com 39 pontos ou menos;
c6) A forma da distribuição das notas é: ________________.
Stem-and-leaf of Notas N = 60
Leaf Unit = 1,0
3 2 679
7 3 1889
13 4 127999
18 5 12237
(24) 6 000000000011234555557888
18 7 00234555679
7 8 02225
2 9 67
d) Construa um histograma com o limite inferior da primeira classe igual a 20, o limite superior da última
igual a 100 e a amplitude da classe igual a 10 pontos. Considerando que a nota mínima de
aprovação é 60, coloque este limite de especificação no gráfico e calcule a porcentagem de alunos
reprovados nessa disciplina de Estatística (Caso você tenha concluído o histograma sem usar a
opção Data Labels dentro de Labels, você pode clicar na barra de ferramentas em: Editor → Add →
Data Labels → Ok).
Bibliografia
WERKEMA, M. C. C. As ferramentas estatísticas básicas para o gerenciamento de processos.
Belo Horizonte: UFMG: Fundação Christiano Ottoni, 1995. (Ferramentas de Qualidade, 2).
© DME /2006-2 19 de 70
EXERCÍCIO 4.1 (WERKEMA, 1995, p. 97):Uma indústria automobilística verificou que, nos últimos
meses, ocorreu um aumento do número de reclamações sobre a ocorrência de defeitos no suporte da
lanterna traseira de um modelo de automóvel por ela fabricado. A empresa desejava eliminar esta
situação indesejável. Na etapa de identificação do problema, os técnicos da indústria fizeram uma
reunião com as pessoas envolvidas no processo, com o objetivo de levantar as possíveis causas de
defeito no suporte da lanterna (brainstorming). Os principais tipos de defeitos sugeridos foram: moldagem
solta, solda quebrada, centro da moldagem deslocado, lateral da moldagem deslocada, moldagem
arranhada, moldagem dentada, plástico arranhado, limpeza incompleta, orifício deslocado e pino
deslocado.
Os defeitos foram classificados, no quadro abaixo, de acordo com sua causa. Por exemplo, o defeito
Moldagem solta foi considerado como devido à Causa Humana.
Quadro 4.1 - Principais tipos de defeitos levantados de acordo com suas causas
Causas Tipos de defeitos
Causa Humana Moldagem solta.
Causa de Máquina Solda quebrada.
Causa de Material Plástico arranhado.
Causa do Método Centro da moldagem deslocado; Lateral da moldagem deslocada;
Moldagem arranhada; Moldagem dentada.
Causa da Medida Orifício deslocado; Pino deslocado.
Causa do Ambiente Limpeza incompleta.
1
O professor Kaoru Ishikawa construiu o primeiro diagrama de causa e efeito para explicar a alguns engenheiros de uma indústria
japonesa como vários fatores de um processo estavam interrelacionados.
© DME /2006-2 20 de 70
O princípio de Pareto estabelece que um problema pode ser atribuído a um pequeno número de causas
vitais. Logo, se forem identificadas as poucas causas vitais dos poucos problemas vitais enfrentados pela
empresa, será possível eliminar quase todas as perdas por meio de um pequeno número de ações. Ou
seja, em um primeiro momento, devemos concentrar nossa atenção sobre os poucos vitais, deixando de
lado os muitos triviais, para que os problemas possam ser resolvidos da forma mais eficiente possível.
O princípio de Pareto foi inicialmente estabelecido por J. M. Juran, que adaptou aos
problemas da qualidade a teoria para modelar a distribuição de renda desenvolvida pelo
sociólogo e economista italiano Vilfredo Pareto (1843-1923). Pareto mostrou, em 1897, que
a distribuição de renda era muito desigual, com a maior parte da riqueza pertencendo a
muito poucas pessoas. Juran foi o primeiro a notar que esta mesma idéia se aplicava aos
problemas da qualidade – a distribuição dos problemas e de suas causas é desigual e,
portanto as melhorias mais significativas poderão ser obtidas se nossa atenção for
concentrada, primeiramente, na direção dos poucos problemas vitais e logo a seguir na
direção das poucas causas vitais destes problemas.
EXERCÍCIO 4.2: Voltando ao exercício 4.1. Depois de criado o Diagrama de Causa e Efeito, os técnicos
da indústria contaram o total de peças defeituosas encontradas em uma amostra de peças produzidas
durante uma semana de trabalho, de acordo com os tipos de defeito que foram detectados. Os dados
estão na tabela abaixo e se encontram no arquivo aula4ex2.mtw.
Note que nesta tabela a segunda coluna representa a freqüência de ocorrência de cada tipo de defeito e
a terceira coluna representa o prejuízo resultante da ocorrência de um defeito do tipo correspondente
(prejuízo unitário).
Quantidade de Prejuízo
Tipo de defeito
Defeitos Unitário (US$)
Moldagem solta 14 0,25
Solda quebrada 01 0,10
Centro da moldagem deslocado 04 0,15
Lateral da moldagem deslocada 24 0,10
Moldagem arranhada 01 0,10
Moldagem dentada 44 0,75
Plástico arranhado 07 5,25
Limpeza incompleta 79 0,30
Orifício deslocado 01 0,10
Pino deslocado 05 0,35
Responda:
b1) Qual o tipo de defeito que possui o maior prejuízo unitário? ____________
b2) Qual o tipo de defeito que possui o maior prejuízo total? ____________
c) Construa um Gráfico de Pareto onde o eixo vertical represente a quantidade de defeitos. Siga
os passos:
Responda:
c1) Você tem na coluna 1 da planilha____ categorias de defeitos e no gráfico foram destacadas
____ categorias.
c2) Quantas categorias de defeitos foram agrupadas na coluna “outros” do gráfico? ______. A
categoria “outros” corresponde a ___ % do total de defeitos.
© DME /2006-2 22 de 70
c3) Agrupe as categorias menos freqüentes criando uma nova categoria “outros” que englobe até
10% do total de defeitos. Para isso, siga os passos 1 a 3 do quadro acima e modifique 95 para 90
em:
Combine defects after the first ______ % into one
No novo gráfico:
Quantas categorias de defeitos foram agrupadas na categoria “outros”? ______.
A categoria “outros” corresponde a ___ % do total de defeitos.
c4) Qual o principal defeito no suporte da lanterna? ________________. Quantas vezes este
defeito ocorreu? _____________. Este defeito corresponde a ___ % do total de defeitos.
c5) Os dois defeitos mais freqüentes contribuem com ___ % do total dos defeitos. Identifique os
tipos de defeitos que os técnicos da empresa deveriam “atacar” em primeiro lugar, com o objetivo
de melhorar os resultados que vinham sendo obtidos pela indústria. Justifique sua resposta.
______________________________________________________________________________
______________________________________________________________________________
d) Construa um Gráfico de Pareto onde o eixo vertical represente o prejuízo total associado a
cada tipo de defeito.
Siga os passos:
d1) Qual categoria de defeito responde pelo maior prejuízo total? _______________. O prejuízo
em dólares para este tipo de defeito é de ___________, que corresponde a ____ % do prejuízo
total.
d2) Quantas colunas há no gráfico? Foram aglomerados _____ categorias de prejuízo total na
categoria “outros”.
d3) Identifique os dois tipos de defeitos que os técnicos da empresa deveriam “atacar” em
primeiro lugar, com o objetivo de melhorar os resultados que vinham sendo obtidos pela indústria.
Justifique sua resposta. _________________________
____________________________________________________________________
d4) Calcule a quantia em dólares que poderia ser economizada pela indústria, caso estes dois
defeitos fossem eliminados (obs: posicione o cursor no segundo ponto da ogiva).
© DME /2006-2 23 de 70
EXERCÍCIO 4.3 (WERKEMA, 1995, p. 77): Uma indústria fabricante de lentes classificou uma amostra
retirada da produção de uma semana, de acordo com os tipos de defeitos detectados. Os resultados
estão abaixo.
b) Construa o Gráfico de Pareto onde o eixo vertical representa a quantidade de defeitos inicial
(colunas C1 e C2).
c) Identifique os dois tipos de defeitos que você "atacaria" em primeiro lugar, com o objetivo de
melhorar os resultados que vêm sendo obtidos pela indústria. Justifique a sua resposta.
_________________________________________________________________________________
_________________________________________________________________________________
d) Após a adoção das medidas corretivas propostas pelos funcionários, a indústria coletou uma
nova amostra, constituída de 1200 lentes, obtendo os resultados apresentados na tabela a
seguir.
d1) Construa o Gráfico de Pareto onde o eixo vertical representa a quantidade de defeitos após a
implantação das melhorias (colunas C1 e C3).
TDA - TDD
MT = × 100%
TDA
onde:
MT = Melhoria Total; TDA = Total de Defeitos Antes e TDD = Total de Defeitos Depois.
© DME /2006-2 24 de 70
EXERCÍCIO 4.4: (WERKEMA,1995 p. 94). Uma indústria automobilística registrou a ocorrência de 161
defeitos em automóveis de um certo modelo. Os dados da tabela abaixo e os desdobramentos dos dois
principais defeitos estão no projeto do Minitab projAula4ex4.mpj .
Quantidade de
Tipo de defeito
defeitos
Motor 20
Sistema elétrico 11
Carroceria 80
Acessórios 45
Outros 5
b) Construa os gráficos de Pareto para as tabelas acima. Selecione, usando o menu Window, cada
uma das pastas de trabalho (worksheets)
b1) Abra a planilha “defeitos nos automóveis”, construa o gráfico de Pareto e responda:
Os defeitos mais frequentes são: ______________ e ______________. Eles respondem por ____ e
____% dos defeitos respectivamente. Juntos respondem por ___% dos defeitos.
b2) Abra a planilha “defeitos na carroceria”, construa o gráfico de Pareto e responda:
Os defeitos mais frequentes são: ______________ e ______________. Eles respondem por ____ e
____% dos defeitos respectivamente. Juntos respondem por ___% dos defeitos.
b3) Abra a planilha “defeitos na pintura” , construa o gráfico de Pareto e responda:
A categoria arranhão corresponde a ____% dos defeitos na pintura.
b4) Abra a planilha “defeitos nos acessórios”, construa o gráfico de Pareto e responda:
Os defeitos no ar condicionado respondem por ____% dos defeitos nos acessórios
© DME /2006-2 25 de 70
EXERCÍCIO 4.5: Uma companhia de seguros colocou como meta reduzir a ocorrências de erros no
preenchimento de formulários de apólice de seguro. Nesta empresa, existiam dois modelos distintos de
formulários (I e II), quatro operadores (Júnia, Júlia, Jorge e José) trabalhavam no preenchimento das
apólices e cinco tipos de erros (A, B, C , D e E) poderiam ocorrer. Durante uma semana de trabalho
foram registrados 557 erros de preenchimentos nos formulários. Os dados estão digitados no arquivo
aula4ex5.mtw. (adaptado de WERKEMA,1995, p. 100).
Observação: Note que estamos trabalhando com os dados brutos, ou seja, cada linha do
arquivo corresponde a um erro de preenchimento do formulário. Por isto é que usamos
“Chart defects data in” em vez de “Chart defects table”. Este último é usado quando já
temos uma tabela já pronta com os tipo de erros e a freqüência de cada um.
b) Repetir os passos do item a) para Operador, Dia da semana e Formulário. Quais são as suas
conclusões?
Complete:
O tipo de erro mais freqüente no preenchimento das apólices é o tipo ____, que corresponde a _____ %
do total de erros. O operador que mais comete erros é __________, que responde por ___% do total de
erros dos operadores. O dia da semana não é um causador de problemas, pois a Quinta, a Terça, a
Quarta, a Sexta e a Segunda feira respondem por _____, _____, _____, _____e _____% dos erros,
respectivamente. Também não há grande diferença entre a quantidade de erros nos dois tipos de
formulário, onde o formulário I responde por ___%dos preenchidos com erro e o do tipo II com o restante.
c) Construa um gráfico de Pareto para os tipos de erros considerando: Operador, Dia da semana e
Formulário. Analise os resultados.
Siga os passos:
1. No menu, selecione Stat > Quality Tools > Pareto Chart;
2. Escolha Chart defects data in e selecione C1 (Tipo de erro);
3. Em BY variable in, selecione C2 (ou C3 ou C4). Clique em Ok
4. Deixe a opcao padrão: Default (all on one graph, same ordering of bars).
Bibliografia
Experiência 1 2 4 4 5
Tempo 7 8 3 2 2
a) Abra o arquivo.
b) Calcule a média e o desvio padrão de cada variável. Preencha o quadro abaixo.
Média
Desvio padrão
e) Algumas linhas de referência podem ser incluídas no gráfico para auxiliar na interpretação. Inclua no
diagrama de dispersão as linhas de referência nas posições: 4,4 minutos ( y = 4,4) e 3,2 anos
( x = 3,2). Analise o gráfico.
EXERCÍCIO 5.2 (Bussab & Morettin, cap. 4, pag. 81) Dados o tempo de serviço em anos de 10
funcionários de uma companhia de seguros e a quantidade de clientes que cada um possui, verifique se
existe uma associação entre essas variáveis. Os dados estão digitados no arquivo aula5ex2.mtw.
Tempo de serviço 2 3 4 5 4 6 7 8 8 10
Quantidade de clientes 48 50 56 52 43 60 62 58 64 72
a) Escolha adequadamente X e Y.
b) Construa o diagrama de dispersão e descreva a relação que existe entre as variáveis.
c) Calcule a média das duas variáveis e inclua no gráfico as linhas de referência
d) Calcule e interprete o coeficiente de correlação linear de Pearson.
EXERCÍCIO 5.3 (Bussab & Morettin, cap. 4, pag. 82) Numa pesquisa feita com 10 famílias com renda
bruta mensal entre 10 e 60 salários mínimos, mediram-se as seguintes variáveis: Renda: renda bruta
mensal (expressa em números de salários mínimos) e %R_Saúde: porcentagem da renda bruta anual
gasta com assistência médica. Os dados estão digitados no arquivo aula5ex3.mtw.
Renda 12 16 18 20 28 30 40 48 50 54
%R_Saúde 7,2 7,4 7,0 6,5 6,6 6,7 6,0 5,6 6,0 5,5
a) Escolha adequadamente X e Y.
b) Construa o diagrama de dispersão;
c) Calcule e interprete o coeficiente de correlação linear de Pearson.
EXERCÍCIO 5.4 (Farias et al, cap 13, pág. 232) Os quatro conjuntos de dados a seguir foram preparados
pelo estatístico F. J. Anscombe e são usados com freqüência em aulas sobre correlação. Os dados estão
digitados no arquivo aula5ex4.mtw.
Y variables X variables
1 Y1 X1
2 Y2 X2
3 Y3 X3
4 Y4 X4
e) Analise os resultados.
EXERCÍCIO 5.5 (Barbetta, cap. 13, p.275). Considere as variáveis nota na prova do vestibular de
matemática e nota final na disciplina de cálculo. Estas variáveis foram observadas para 20 alunos, ao
final do primeiro período letivo de um curso de engenharia. Os dados são apresentados logo abaixo e
estão digitados no arquivo aula5ex5.mtw.
Matemática 39 57 34 40 43 47 52 70 21 28 35 80 64 75 30 32 65 47 28 67
Cálculo 65 92 56 70 78 89 75 50 52 73 50 90 82 98 50 58 88 71 52 88
a) Escolha adequadamente X e Y.
b) Construa um diagrama de dispersão e verifique se existe correlação entre os dados observados
das duas variáveis.
c) Calcule coeficiente de correlação entre a nota no vestibular de matemática e a nota na disciplina
de cálculo.
d) Existe algum aluno que foge ao comportamento geral dos demais (ponto discrepante)?
e) Retire o valor discrepante detectado e calcule novamente o coeficiente de correlação. Interprete.
EXERCÍCIO 5.6 (Bussab & Morettin, cap.4, p. 96) Muitas vezes a determinação da capacidade de
produção instalada para certo tipo de indústria em certas regiões é um processo difícil e caro. Como
alternativa, pode-se estimar a capacidade de produção através da escolha de uma outra variável de
medida mais fácil e que esteja linearmente relacionada com ela.
Suponha que foram observados os valores para as variáveis: capacidade de produção instalada (em
2
toneladas), potência instalada (em 1000 kw) e área construída (em 100 m ). Com base em um critério
estatístico qual das variáveis você escolheria para estimar a capacidade de produção instalada. Os
dados estão digitados no arquivo aula5ex6.mtw.
a) Construa o diagrama de dispersão da capacidade de produção instalada com cada uma das
possíveis variáveis explicativas. Qual variável parece estar mais correlacionada com a
capacidade de produção instalada?
b) Calcule o coeficiente de correlação nos dois casos. O coeficiente confirma a impressão visual dos
diagramas?
EXERCÍCIO 5.7 No arquivo aula5ex7.mtw são apresentados os dados de 100 profissionais da área
gerencial referentes às seguintes variáveis: tempo de conclusão do curso de graduação, salário (em
número de salários mínimos) e instituição em que se formou.
BIBLIOGRAFIA
BARBETTA, P. A. Estatística aplicada às ciências sociais. 5.ed. rev. Florianópolis: Ed. da UFSC, 2002.
BUSSAB, W. O., MORETTIN, P. A. Estatística Básica. 5. ed. rev. São Paulo: Saraiva, 2003.
STEVENSON, W. J. Estatística aplicada à administração. São Paulo: Harper & Row do Brasil, 1981.
SOARES, J. F., FARIAS, A. A, CESAR, C. C. Introdução à estatística. 2. ed. Rio de Janeiro: LTC, 2003.
© DME /2006-2 30 de 70
Após a análise do diagrama de dispersão e do coeficiente de correlação, se concluirmos que existe uma
correlação linear significativa entre duas variáveis, o próximo passo será tentar estimar uma equação que
melhor descreva a relação entre essas variáveis. A relação mais simples que conhecemos é aquela
descrita pela equação de uma reta.
Considere que certo banco esteja interessado em estabelecer um critério objetivo para avaliar a eficiência
de seus gerentes e para isso, levantou dados à respeito do depósito médio mensal por agência e a
quantidade de estabelecimentos comerciais para uma amostra de 9 subdistritos onde o banco
possuía agência. Pelo diagrama de dispersão mostrado na figura 1a fica evidente que o valor do depósito
depende da quantidade de comércios e pela disposição dos pontos vemos que uma reta seria a melhor
descrição. Na figura b1, é exibida a reta que melhor ajusta aos pontos e a equação que gerou a reta.
500 500
Depósito médio mensal (y)
450 450
350 350
300 300
250 250
200 200
0 50 100 150 200 250 300 350 400 0 50 100 150 200 250 300 350 400
Quantidade de estabelecimentos comerciais (x) Quantidade de estabelecimentos comerciais (x)
(a) (b)
Figura 1 – Relação observada entre depósito médio mensal nas agências bancárias e a quantidade de
estabelecimentos comerciais
Mesmo que y = β 0 + β1x + ε seja um modelo simples, ainda assim devemos fazer algumas suposições à
respeito do erro aleatório ε. As suposições são necessárias para que possamos fazer inferências sobre
alguma previsão e parâmetros do modelo (teste de hipóteses e construção de intervalo de confiança).
Suposições
2
1) Os erros se distribuem normalmente com média zero e variância constante σ
2) Os erros não são correlacionados. Ou seja, o fato de um erro ser maior não tende a elevar o
valor de um outro erro.
Usando apenas os dados amostrais não podemos obter os valores exatos dos parâmetros β0 e β1. Esses
parâmetros deverão ser estimados com base nos dados amostrais. A equação de regressão com os
parâmetros estimados é representada por
Ŷ = b 0 + b1 X
b 0 é uma estimativa do β 0 e representa o coeficiente linear (ou intercepto) da reta estimada
b1 é uma estimativa do β1 e representa o coeficiente angular (ou inclinação) da reta estimada
Como é impossível a reta passar por todos os pontos, sempre haverá diferença entre algum valor
observado y i e o valor ajustado pela reta ŷ i para o i-ésimo ponto. Essa diferença y i − ŷ i é denominada
de resíduo (ou erro de estimação) .
O Método dos Mínimos Quadrados é um critério que utiliza os dados da amostra para obter os valores de
b0 e b1. O método procura os valores de b0 e b1 que minimiza a soma dos quadrados dos resíduos
L(b 0 , b 1 ) . Com essas estimativas conseguimos tornar os resíduos tão menores quanto possível e ajustar
a reta que chamamos de reta de regressão (ou reta ótima, ou reta de melhor ajuste ou reta de mínimos
quadrados).
n n
L( b 0 , b 1 ) = ∑i =1
( y i − ŷ i ) 2 = ∑ (y
i =1
i − b o − b1 x ) 2
n (∑ x y )− (∑ x )⋅ (∑ y )
i i i i
• b1 = coeficiente angular ou inclinação da reta
n (∑ x )− (∑ x )
2 2
i i
O erro-padrão da estimativa ( s e ) representa uma estimativa da medida de dispersão dos pontos em torno
da reta ajustada. Da mesma forma que desvio-padrão mede a variabilidade dos dados em torna da meda
amostral, o erro-padrão da estimativa mede a variabilidade dos pontos em torno da reta ajustada.
∑ (y i − ŷ) 2 (∑ y )− b (∑ y )− b (∑ x y )
2
i 0 i 1 i i
se = =
n−2 n−2
© DME /2006-2 32 de 70
1 n ⋅ (x 0 − x) 2
ŷ 0 ± t α 2 ⋅ s e ⋅ +
n n⋅ (∑ ) (∑ )
x i2 − xi
2
1 n ⋅ (x 0 − x) 2
ŷ 0 ± t α 2 ⋅ s e ⋅ 1 + +
n n⋅ (∑ ) (∑ )
x i2 − xi
2
EXERCÍCIO 6.1 (Bussab & Morettin, cap. 4, pag. 81) Um gerente de uma companhia de seguros
selecionou uma amostra 10 funcionários e registrou para cada um deles o tempo de serviço (em anos) e
a quantidade de clientes que cada um possui. O interesse do gerente é estabelecer um modelo para
prever a quantidade de clientes de um funcionário com base no tempo de serviço. Os dados estão na
tabela abaixo e digitados no arquivo aula6ex1.mtw.
Quantidade
Func. Tempo a) Estabeleça inicialmente a variável independente X e
de clientes
variável dependente Y.
Beto 2 48
Nivia 3 50 b) Construa o diagrama de dispersão e determine o
coeficiente de correlação. Escreva uma frase
Bina 4 56
descrevendo o tipo da relação entre as variáveis.
Bob 5 52
João 4 43 c) Assumindo uma relação linear entre as variáveis,
estime a equação de regressão que melhor descreve
Manoel 6 60 essa relação. Interprete os coeficientes de regressão b0
Pedro 7 62 e b1.
José 8 58 d) Faça uma previsão da quantidade de clientes para um
Rui 8 64 funcionário com 8 anos de casa.
Lucas 10 72 2
e) Calcule e interprete o coeficiente de determinação (R ).
© DME /2006-2 33 de 70
SOLUÇÃO
Diagrama de dispersão
• Graph > Scatterplot > Simple > Ok;
• Clientes em Y variables e Tempo em X variables > Ok.
Coeficiente de correlação
• Stat > Basics Statistics > Correlation;
• Clientes e Tempo em Variables; desmarque a seleção Display p-values > Ok
b0 = 39,67 é o coeficiente linear ou intercepto da reta (valor de y para x = 0). Para funcionários
iniciando hoje (tempo zero) ele teria cerca de 40 funcionários (39,67 arredondado). Isso tem
sentido?. Note que a unidade de b0 é a mesma do y.
d) Clientes = 39,67 + 2,952 * (8) = 63,286 ≈ 63 clientes (quantidade prevista de clientes para um
funcionário com 8 anos de casa)
Note que devemos dar muita atenção às unidades das variáveis. Por exemplo, qual seria a previsão
da quantidade de clientes para um funcionário com 60 meses de casa?
2
e) Coeficiente de Determinação R = (Variação Explicada) / (Variação Total) = 76,9%
76,9% da variação total nos números de clientes pode ser explicada pela variação no tempo de
serviço através da equação de regressão estimada. Os outros 23,1% restantes são explicados
por outros fatores além do tempo de serviço e que não foram incluídos no modelo.
© DME /2006-2 34 de 70
70
65
Clientes
60
55
50
45 S 4,36270
R-Sq 76,9%
R-Sq(adj) 74,0%
40
1 2 3 4 5 6 7 8 9 10
Tempo
Continuando com o exemplo 1, a previsão feita na letra “d” do número de clientes para funcionário com 8
anos de casa é apenas uma estimativa pontual. Podemos melhorar essa estimativa incorporando a ela
alguma medida de precisão e conseguimos isto ao construir uma estimativa de intervalo de confiança
(para estimar a média populacional de Y) e de intervalo de predição (para estimar um valor individual
de Y) .
f) Construa o intervalo de confiança de 95% para o número médio de clientes dos [todos]
funcionários com 8 anos de tempo de serviço.
Queremos um intervalo de confiança IC para a média µ Y|X = x 0 = µ Y0 = número médio
de clientes dos [todos] funcionários com x0 = 8 anos de tempo de serviço.
g) Construa o intervalo de previsão de 95% para o número de clientes para um único funcionário com
8 anos de tempo de serviço.
Queremos um intervalo de previsão IP para a previsão YX = x 0 = Y0 = previsão do
número de clientes de um único funcionário com x0 = 8 anos de tempo de serviço.
Estimar a equação de regressão, fazer previões da variável Y (Número de clientes) com base na
variável X (Tempo de serviço) e construir intervalos de confiança e predição
• Stat > Regression > Regression
• Clientes em Response e Tempo em Predictors.
• Entre em Options
em prediction intervals for new observations digite 8 (valor de X para o qual você quer fazer
previsão)
em Confidence level, escolha o nível de confiança para o intervalo de confiança e intervalo de
predição
© DME /2006-2 35 de 70
New
Obs Fit SE Fit 95% CI 95% PI
1 63,29 1,91 (58,89; 67,69) (52,31; 74,27)
(Resposta da letra f) Estamos 95% confiantes de que µ Y0 , número médio de clientes dos funcionários
com 8 anos de tempo de serviço, está dentro do intervalo de 58,89 a 67,69 clientes (arredondando
para 59 a 68 clientes)
(Resposta da letra g) Estamos 95% confiantes de que Y0 , número de clientes de um único funcionários
com 8 anos de tempo de serviço, está dentro do intervalo de 52,31 a 74,27 clientes (arredondando para
52 a 74 clientes)
EXERCÍCIO 6.2 Suponha os seguintes dados na tabela abaixo. Os dados estão digitados no arquivo
aula6ex2.mtw.
EXERCÍCIO 6.3 (Toledo e Ovalle, 1995) A tabela abaixo fornece os resultados de uma pesquisa com 10
famílias de determinada região. Os dados estão digitados no arquivo aula6ex3.mtw.
d) Construa uma estimativa do intervalo de previsão de 95% do valor poupado para uma única
família com R$ 2.000,00.
Queremos um intervalo de previsão IP para a previsão YX = x 0 = Y0 = previsão do
valor poupado para uma única família com renda x0 = 2 mil reais
EXERCÍCIO 6.4 Barbetta (2001, p.308). Com o objetivo de verificar se numa certa região existe
correlação entre o nível de escolaridade médio dos pais e o nível de escolaridade dos filhos, observou-se
uma amostra aleatória de 8 indivíduos adultos, verificando o número de anos que estes freqüentaram (e
tiveram aprovação) em escolas regulares (Y) e o número médio de anos que os seus pais freqüentaram
(e tiveram aprovação) em escolas regulares (X). Os resultados são apresentados na tabela abaixo e
estão digitados no arquivo aula6ex4.mtw.
X 0 0 2 3 4 4 5 7
Y 2 3 2 5 9 8 8 15
EXERCÍCIO 6.5 A administração de um banco deseja estabelecer um critério objetivo para avaliar a
eficiência de seus gerentes. A princípio, o banco gostaria de prever o depósito médio em suas agências
com base na quantidade de estabelecimentos comerciais. Nove subdistritos foram selecionados e
registrados o depósito médio mensal por agência e a quantidade de estabelecimentos comerciais
existentes nesses subdistritos. Os dados obtidos estão na tabela abaixo e estão digitados no arquivo
aula6ex5.mtw.
EXERCÍCIO 6.6 Barbetta (2001, p.308). A tabela a seguir relaciona os pesos (em centenas de kg) e as
taxas de consumo de combustível em rodovia (km/litro) numa amostra de 10 carros de passeio novos. Os
dados estão digitados no arquivo aula6ex6.mtw.
a) Calcule o coeficiente de correlação de Pearson. Como você avalia o relacionamento entre o peso
e o consumo, na amostra observada?
b) Para estabelecer uma reta de regressão, qual deve ser a variável dependente e qual deve ser a
variável independente? Considerando a resposta, estabeleça a equação de regressão entre Y e
X.
c) Você considera adequado o ajuste do modelo de regressão do item ‘c’? Dê uma medida desta
adequação interpretando-a.
d) Qual o consumo esperado para um carro de 2.000 kg? Lembrete: os dados de consumo na
tabela estão em centenas de kg.
e) Você considera seu estudo capaz de predizer o consumo esperado para um carro de 7000 kg?
Justifique sua resposta.
© DME /2006-2 38 de 70
EXERCÍCIO 6.7 Use as observações de poupança agregada e renda (em bilhões de reais) em um país
XYZ no período de 1990 a 1999 (dados fictícios), para estimar a influência do nível de renda sobre a
poupança. Os dados estão digitados no arquivo aula6ex7.mtw.
Diagrama de dispersão
• Graph > Scatterplot > Simple > Ok;
• Poupança em Y variables e Renda em X variables > Ok.
Coeficiente de correlação
• Stat > Basics Statistics > Correlation;
• Poupança e Renda em Variables; desmarque a seleção Display p-values > Ok
c) Para cada bilhão a mais na renda o acréscimo na poupança agregada será de 0,1138 bilhão de
reais.
55
550
50
500
Poupança
consumo
45
450
40
35 400
Bibliografia
LEVINE, David M.; STEPHAN, David; KREHBIEL, Timothy C.; BERENSON, Mark L.. Estatística:
Teoria e Aplicações usando Microsoft Excel em português. 3 ed.. Rio de Janeiro - RJ: LTC - Livros
Técnicos e Científicos. 2005.
TRIOLA, Mario F. Introdução à estatística. Rio de Janeiro: LTC - Livros Técnicos e Científicos, c2005.
656p.
VIEIRA, S. Princípios de Estatística, São Paulo: Pioneira, 1999.
© DME /2006-2 40 de 70
Podemos escrever resumidamente que uma variável aleatória X tem distribuição Binomial com
parâmetros n e p do seguinte modo: X ~ B(n; p).
No Minitab:
EXERCÍCIO 7.1 A experiência indica que 10% das pessoas que entram em uma loja de computadores
fazem compras. Se 10 pessoas entram na loja::
a) Calcule o número esperado de pessoas que compram. ____________
b) Determine a distribuição de probabilidade da variável aleatória X: número de pessoas que
compram entre as 10 que entram na loja.
Para isso:
1. Digite na coluna 1 os valores de zero a dez (um em cada linha). Digite o título para a coluna no
local apropriado: x
2. Na barra de ferramentas, escolha Calc;
3. Selecione Probability distributions;
4. Selecione Binomial
5. Selecione Probability
6. Digite 10 na caixa Number of trials
7. Digite 0,1 na caixa Probability of success
8. Digite C1 na caixa Input column
9. Digite C2 na caixa Optional storage
10. Selecione Ok para produzir as probabilidades
11. Coloque f(x) como título na coluna C2.
Para isso:
d) Com as duas distribuições, calcule as probabilidades para as próximas 10 pessoas que entram
na loja:
d1) Exatamente uma faça compras: f(1) = 38,74%
d2) X= média: f(1) = 38,74%
d3) Exatamente nove não comprem: f(1) = 38,74%
d4) Ninguém compre: f(0) = 34,87%
d5) Ao menos uma faça compras: 1 – f(0) = 65,13%
d6) Três ou menos pessoas façam compras: F(3) = 98,72%
d7) Menos de cinco pessoas façam compras: F(4) = 99,84%
d8) Cinco pessoas ou mais façam compras: 1- F(4) = 0,16%
d9) De 3 a 5 pessoas façam compras: F(5) – F(2) = 7%;
d10) Entre 2 a 6 pessoas façam compras: F(5) – F(2) = 7%
Repita os passos para a construção do gráfico para a distribuição acumulada, trocando C2 por C3
no item 6
Como só vamos calcular uma probabilidade, usaremos a opção Input constant no lugar de Input
column.
Resolva o exercício:
EXERCÍCIO 7.2 Uma pesquisa de opinião pública revelou que 1/4 da população de determinada cidade
assiste regularmente televisão. Colocando-se 300 pesquisadores, sendo que cada um possa entrevistar
10 pessoas diariamente, fazer uma estimativa de quantos desses pesquisadores informarão que até 50%
das pessoas entrevistadas são realmente telespectadores habituais? Resp: 294 pesquisadores
Siga os passos:
EXERCÍCIO 7.3 Sabe-se que a probabilidade de um estudante que entra na Universidade se formar é
0,3. Determine a probabilidade de que dentre 6 estudantes escolhidos aleatoriamente:
a) Nenhum se forme; 11,765%
b) Pelo menos 2 se formem; 57.98%
c) A média e o desvio padrão dos que se formam. µ = 1,8 ≅ 2 σ = 1,12 ≅ 1
EXERCÍCIO 7.4 A probabilidade de uma peça ser defeituosa em uma linha de produção é de 0,05. Para
quinze peças escolhidas aleatoriamente, determine:
a) A probabilidade de se encontrar menos que duas peças defeituosas; 82,905%
b) Mais que doze peças perfeitas; 96,38%
c) Entre dez e treze peças perfeitas; 3,56%
d) De dez a treze peças perfeitas; 17,09%
e) Mais que três peças defeituosas; 0,55%
EXERCÍCIO 7.5 Sabe-se que uma lâmpada comum tem uma probabilidade de 0,90 de durar mais de seis
meses. Se uma pessoa instalou 20 dessas lâmpadas, determine a probabilidade dela ter que substituir:
a) No máximo 2 lâmpadas antes de seis meses; 67,69%
b) Mais que duas lâmpadas antes de seis meses; 32,31%
c) De duas e quatro lâmpadas antes de seis meses; 56,39%
d) Nenhuma lâmpada antes de seis meses; 12,16%;
e) Para cada lote de 50 lâmpadas, qual o número médio de lâmpadas que deverão ser substituídas
depois de seis meses de uso? 45
EXERCÍCIO 7.6 Apenas 10% das empresas de exportação de matéria prima, que atuam em Minas
Gerais, não reduziram pessoal no ano de 2002. Sorteando-se aleatoriamente quinze destas empresas,
determine as seguintes probabilidades:
a) Apenas duas empresas não terem reduzido seu quadro de funcionários; 26,69%
b) Ao menos uma não ter reduzido seu quadro de funcionários; 79,41%
c) Mais que duas empresas tenham reduzido o quadro de funcionários. 100%
Analise os gráficos das distribuições de probabilidade quanto à simetria e calcule os respectivos valores
esperados. Verifique a forma das distribuições de probabilidades acumuladas.
EXERCÍCIO 7.8 Uma prova de múltipla escolha, que vale 10 pontos, tem 50 questões e 5 alternativas por
questão. Apenas uma das alternativas é a correta. Se um aluno resolve a prova respondendo a esmo as
questões, qual a probabilidade de tirar nota 5? Calcule E(X) e o Desvio-padrão σ .
1
Resp: p = = 0,20 P ( X = 25) = 0 E ( X ) = 10 questões σ = 2,828 questões
5
EXERCÍCIO 7.9 Abra o projeto: projAula7ex9.mpj.
2
1 x−µ
−
1 σ
f ( x) = e 2 para − ∞ < x < ∞
2π σ
onde:
e = 2,71828182;
π = 3,14159265;
µ = média da população;
σ = desvio padrão da população;
x = qualquer valor da variável aleatória.
Podemos escrever resumidamente que uma variável aleatória X tem distribuição Normal com parâmetros
µ e σ do seguinte modo: X ~ Normal(µ; σ).
2
1 x − 550
−
1 2 120
f ( x) = e para − ∞ < x < ∞
2π 120
Quando µ = 0 e σ =1, temos a distribuição Normal Padrão que tem a seguinte função densidade de
probabilidade:
1
1 − z2
f (z) = e 2 para − ∞ < z < ∞
2π
Siga os passos:
1. Abra o Minitab;
2. Digite z como título da coluna C1;
3. Digite f(z) como título da coluna C2;
4. Na linha 1 da coluna C1, digite o valor –4 e na linha 2 da mesma coluna digite o valor –3,99. Selecione
os dois valores usando o botão esquerdo do mouse e arraste até a linha 801;
5. Na barra de ferramentas, selecione Calc→Probability Distributions→Normal
6. Selecione Probability density;
7. Digite 0 na caixa Mean;
8. Digite 1 na caixa Standart deviation;
9. Selecione: Input column;
10. Digite C1 na caixa Input column;
11. Digite C2 na caixa Optional storage;
© DME /2006-2 45 de 70
EXERCÍCIO 8.3 O total de pontos obtidos no vestibular de uma universidade é uma variável aleatória
normal com média 550 e desvio padrão 120.
Siga os passos:
Teremos o resultado:
x P( X <= x)
700,0000 0,8944
Siga os passos:
P (200 < X < 700) = P (X < 700) - (X ≤ 200) = 0,8944 - __________= 0,8926
© DME /2006-2 46 de 70
Teremos o resultado:
Inverse Cumulative Distribution Function
P( X <= x) x
0,9500 747,3824
b) Determine uma faixa de pontuação, simétrica em torno da média, que contenha aproximadamente
85% dos candidatos. Resp.: 377,26 pts a 722,74 pts
a) Compare o gráfico da distribuição Normal Padrão com o gráfico das outras distribuições
Normais;
b) Usando os valores de x (coluna C1) do projeto, calcule f(x) de uma Normal(1; 2) e guarde os
resultados na coluna C6. Nomeie a coluna C6 como ‘f(x) Normal(1; 2)’;
c) Acrescente o gráfico da distribuição N(1; 2) no mesmo gráfico seguindo os seguintes passos:
3. Verifique se em Multiple Graphs está selecionada a opção Overlaid on the same graph;
4. Selecione Ok.
EXERCÍCIO 8.6 Uma clínica de emagrecimento recebe pacientes adultos com peso seguindo uma
distribuição normal com média 130 kg e desvio padrão 20 kg. Para efeito de determinar o tratamento
mais adequado, os 25% pacientes de menor peso são classificados de “magros”, enquanto os 25% de
maior peso de “obesos”. Determine os valores que delimitam cada uma dessas classificações.
Resp.: magros: 116,51 kg; obesos: 143,49 kg
© DME /2006-2 47 de 70
EXERCÍCIO 8.7 Um teste de aptidão feito pelos pilotos de aeronaves em treinamento inicial requer que
uma série de operações seja realizada em uma rápida sucessão. Suponha que o tempo necessário para
completar o teste seja distribuído normalmente com média de 90 minutos e desvio padrão 20 minutos.
EXERCÍCIO 8.8 (Barbetta, 2001, p.156) Suponha que numa universidade, a altura dos estudantes do
sexo masculino tenha distribuição normal com µ=170 cm e σ=10 cm. Calcule:
a) P(X>190);
b) P(150<X<190);
c) P(X<160);
d) A percentagem esperada de estudantes com altura entre 150 e 190 cm.
Resp.: a) 0,0228 b) 0,9545 c) 0,1587 d) 95,45%
EXERCÍCIO 8.9 (Barbetta, 2001, p.165) Calculou-se em 70 minutos o tempo médio para o vestibular de
2
uma universidade, com variância de 144 minutos . Quanto deve ser a duração da prova, de modo a
permitir tempo suficiente para que 90% dos vestibulandos terminem a prova? Admita distribuição normal
para o tempo de duração da prova. Resp.: 85,38 minutos
EXERCÍCIO 8.12 Um estudo do Sindicato dos Bancários indica que cerca de 30% dos funcionários de
banco têm problemas de estresse provenientes das condições de trabalho. Numa amostra de 200
bancários, qual é a probabilidade de pelo menos 50 com essa doença? (calcule aproximando pela
normal). Resp.: 0,9474
EXERCÍCIO 8.13 Barbetta, 2001, p.165) Numa amostra aleatória de 3000 eleitores, qual a probabilidade
de a maioria se declarar favorável a um certo candidato, se na população existem 52% de favoráveis a
este candidato? (aproxime pela normal) Resp.: 0,9852
EXERCÍCIO 8.14 (Freund & Simon, cap.9, pag. 76) Uma companhia aérea sabe que o número de malas
que ela perde semanalmente em certa rota é uma variável aleatória que tem distribuição
aproximadamente Normal com média 26,2 e desvio padrão 5,8. Determine as probabilidades de que, em
uma semana, a companhia aérea perca nesta rota:
a) exatamente 22 malas;
b) no máximo 22 malas;
c) no mínimo 22 malas. Resp.: a) 0,0529 b) 0,2618 c) 0,7911
© DME /2006-2 48 de 70
EXERCÍCIO 9.1 Um investidor planeja abrir uma agência de viagens e deseja estimar o faturamento
médio mensal em dólares. Suponha que os faturamentos mensais de uma agência de viagens, do porte
que o investidor pretende abrir, se distribuam normalmente com um desvio padrão σ = US$130. Durante
nove meses, o investidor anotou o faturamento líquido mensal de uma agência de viagem do mesmo
porte. Os dados estão digitados no arquivo aula9ex1.mtw.
c) Construa e interprete um intervalo de 95% de confiança para o faturamento médio mensal de uma
agência de viagem desse porte.
Obtemos o resultado:
One-sample Z: Faturamento
The assumed standard deviation = 130
Interpretação do intervalo: O investidor pode afirmar com 95% de confiança que o faturamento médio
mensal de uma agência de viagens desse porte está entre 3417,29 e 3587,15 dólares.
d) Com base nessa amostra, qual é a estimativa pontual do faturamento médio mensal de uma
agência de viagem desse porte? ____________dólares
EXERCÍCIO 9.2 (Larson & Farber, cap. 6, pág.214). O diretor do comitê de admissão de uma
universidade deseja estimar a idade média de todos os estudantes aprovados no momento. Em uma
amostra aleatória de 20 estudantes, a idade média encontrada foi de 22,9 anos. A partir de estudos
passados, sabe-se que o desvio padrão é de 1,5 ano e que a população está normalmente distribuída.
a) Qual é o parâmetro que o diretor do comitê de admissão de uma universidade deseja estimar?
___________________________________________________
Obtemos o resultado:
One-sample Z
The assumed standard deviation = 1,5
N Mean SE Mean 90% CI
20 22,9 0,3354 (22,3483; 23,4517)
d) Com base nessa amostra, qual é a estimativa pontual da idade média dos estudantes aprovados?
____________anos
s s
x ± tα / 2 , onde: é o erro padrão estimado da média;
n n
s
tα / 2 é a margem de erro.
n
EXERCÍCIO 9.3 O tempo médio necessário para os operários completarem determinada montagem tem
sido igual a 55 minutos. Suponha que a distribuição do tempo de execução da montagem tenha
distribuição normal. Para avaliar se atualmente o tempo médio de execução da montagem continua
sendo igual a 55 minutos, o supervisor decide registrar, em um determinado dia, os tempos de execução
para uma amostra de 16 operários, obtendo os resultados abaixo que estão digitados no arquivo
aula9ex3.mtw.
Obtemos o resultado:
One-sample T: Tempo
Variable N Mean StDev SE Mean 95,0 % CI
C2 16 61,5625 6,1990 1,5498 (58,2593; 64,8657)
d) Com base nessa amostra, qual é a estimativa pontual do tempo médio de execução da
montagem atualmente? ____________minutos
EXERCÍCIO 9.4 Em uma pesquisa de orçamento familiar desenvolvida pelo Instituto ZX no período t,
solicitou-se a 16 domicílios de certa região que anotassem suas despesas com alimentação durante uma
semana. O resultado foi uma despesa média de R$330,00 com um desvio padrão de R$40,00.
a) Construa um intervalo com 98% de confiança para a verdadeira despesa média com alimentação
por domicílio de toda a região. (Suponha que a população tenha uma distribuição
aproximadamente normal).
Obtemos o resultado:
One-sample T
N Mean StDev SE Mean 98% CI
16 330,00 40,00 10,00 (303,975; 356,025)
pˆ (1 − pˆ ) pˆ (1 − pˆ )
pˆ ± zα / 2 , onde: é o erro padrão da proporção;
n n
pˆ (1 − pˆ )
zα / 2 é a margem de erro.
n
EXERCÍCIO 9.5 (Magalhães & Lima, cap. 7, pág.240) Uma amostra de 30 dias do número de ocorrências
policiais em certo bairro de Belo Horizonte, apresentou os resultados abaixo que estão digitados no
arquivo aula9ex5.mtw.
7 11 8 9 10 14 6 8 8 7 8 10 10 14 12
14 12 9 11 13 13 8 6 8 13 10 14 5 14 10
a) Definindo dia violento como dia com pelo menos 12 ocorrências policiais, crie a variável “Dia
violento” na coluna C2 com as categorias “Sim” e “Não”.
b) Construa um intervalo de 88% de confiança para a proporção de dias violentos nesse bairro.
Temos o resultado:
Variable X N Sample p 88% CI
Dia violento 10 30 0,333333 (0,199520; 0,467147)
d) Em um ano (360 dias) e com a mesma confiança de 88%, qual seria a estimativa do número de
dias violentos nesse bairro? ________________________________
© DME /2006-2 53 de 70
EXERCÍCIO 9.6 Em um levantamento, solicitou-se a 200 pessoas que identificassem sua maior fonte de
informação; 110 delas afirmaram que suas maiores fontes eram as notícias de televisão.
Temos o resultado:
Sample X N Sample p 94,0 % CI
1 110 200 0,55 (0,483837; 0,616163
a) Qual é a estimativa pontual da proporção de pessoas que identificam as notícias de televisão como
sua maior fonte de informação? _________
EXERCÍCIO 9.7 (Magalhães & Lima, cap 7, pág. 239) O consumo de combustível é uma variável
aleatória com parâmetros dependendo do tipo de veículo. Suponha que, para certo automóvel, o desvio
padrão do consumo seja conhecido e igual a 2 km/l, porém precisamos informações sobre o consumo
médio. Para tal, foi observado o consumo para uma amostra de 40 automóveis desse modelo e
encontrado um consumo médio de 9,3 km/l.
EXERCÍCIO 9.8 Para saber a situação do trabalhador em relação ao vale transporte, foi feita uma
pesquisa com 500 trabalhadores da região metropolitana de Belo Horizonte. Os dados coletados estão
digitados no arquivo aula9ex8.mtw.
EXERCÍCIO 9.9 Usando os dados do exemplo 9.5 que estão no arquivo aula9ex5.mtw,
EXERCÍCIO 9.8 - Simular uma distribuição amaostral para a média de uma amostra
1ª parte: Considere uma população fictícia de uma turma de 10 alunos de um curso de Laboratório de
Estatística. Seja Yi o número de acessos de cada aluno à Internet em uma aula em que a
Internet foi disponibilizada.
Abra o arquivo aula9ex8.mtw. Na coluna C1, está digitado o número de acessos de cada aluno da
turma.
C1
Nº de acessos
1
2
3
4
5
6
7
8
9
10
2ª parte: Vamos agora estudar a distribuição das médias de acesso. Dentro deste conceito, vamos
considerar todas as possíveis amostras (sem reposição) de tamanho 2 para a população do
2
número de acessos à Internet. Calculando C10 temos um total de 45 amostras. As possíveis
amostras de tamanho 2 são:
a a a a a a
1 2 1 2 1 2
seleção seleção seleção seleção seleção seleção
1 2 2 9 5 6
1 3 2 10 5 7
1 4 3 4 5 8
1 5 3 5 5 9
1 6 3 6 5 10
1 7 3 7 6 7
1 8 3 8 6 8
1 9 3 9 6 9
1 10 3 10 6 10
2 3 4 5 7 8
2 4 4 6 7 9
2 5 4 7 7 10
2 6 4 8 8 9
2 7 4 9 8 10
2 8 4 10 9 10
a) Calcule na coluna C4 a média de acesso dos pares selecionados, ou seja, a média de cada amostra
de tamanho 2.
b) Nomeie a coluna C4 como “Média”. Construa um histograma para esta variável. Qual e a forma deste
histograma? Compare com o histograma obtido no item a da 1ª parte do exemplo.
c) Calcule as estatísticas descritivas para este conjunto de dados. Complete: A variável média assumiu
valores de _______ a ________ acessos, com média igual a ________ acessos, variância
2
__________ (acessos) e desvio padrão ________ acessos.
d) Compare com as estatísticas descritivas obtidas no item b da 1ª parte do exemplo. Que conclusões
você pode tirar desta análise?
© DME /2006-2 57 de 70
O valor p é a área
à esquerda de z
z z
-3 -2 -1 0 1 2 3
4.2 Se H a : µ > µ0 (teste unilateral direito)
O valor p é a área
à direita de z
-3 z z
-2 -1 0 1 2 3
-3 -z z
-2 -1 0 1 2 3
Sim Não
EXERCÍCIO 10.1 (Adaptado do Provão-ECO-2002) Uma rede de postos de gasolina afirma que, em seus
estabelecimentos, não se vende gasolina adulterada. Sabe-se que, de acordo com os padrões de
qualidade, a gasolina não pode conter mais que 240 ml de álcool por litro. Um órgão de fiscalização
colheu 25 medições da quantidade de álcool na gasolina em ml/l nos postos dessa rede. A amostra se
encontra abaixo. Admita que a quantidade de álcool presente na gasolina tem uma distribuição normal
com desvio padrão de 2,5 ml/litro. Os dados estão digitados no arquivo aula10ex1.mtw.
d) Qual é a estimativa pontual da quantidade média de álcool presente na gasolina dos postos da
rede? ________________ ml/litro
e) Com base no intervalo de confiança calculado, qual é o erro máximo cometido na estimação da
verdadeira quantidade média de álcool presente na gasolina dos postos da rede? ____________
ml/litro
Obtemos o resultado:
One-sample Z: Quant_álcool
Test of mu = 240 vs > 240
The assumed Standard deviation = 2,5
EXERCÍCIO 10.2 Um fabricante de lâmpadas garante que a vida média de um determinado tipo de
lâmpada é de pelo menos 750 horas. Se uma amostra ao acaso com 26 lâmpadas tiver uma vida média
de 745 horas, você tem evidência suficiente para rejeitar a alegação do fabricante? Use α = 0,02.
Suponha que o desvio padrão da população seja conhecido (por experiências passadas) e igual a 60
horas.
Obtemos o resultado:
One-sample Z
Test of mu = 750 vs < 750
The assumed Standard deviation = 60
N Mean SE Mean Z P
26 745 11,767 -0,42 0,335
x − µ0 s
t= onde σˆ X =
σˆ X n
EXERCÍCIO 10.3 Um produto alimentar é preparado para o consumo em latas, que comportam um peso
médio líquido de 1 Kg. O enchimento das latas é automático e o produtor deseja saber se as máquinas
estão trabalhando regularmente (controle de qualidade). Para isso, examina uma amostra de 6 latas e
encontra os seguintes pesos líquidos; 0,999, 0,999, 1,000; 1,011; 1,009; e 0,995 Kg. Qual a conclusão
em relação ao trabalho das máquinas ao nível α = 0,01? Considere que o peso líquido tem distribuição
normal.
b) Com 99% de confiança, o peso médio líquido das latas está entre _______ e ______ kg.
Temos o resultado:
One-sample T: Tempo
Test of mu = 1 vs mu not = 1
h) Interprete o valor p.
__________________________________________________________________
__________________________________________________________________
EXERCÍCIO 10.4 (Larson & Farber, cap. 7, pág. 273) Um agente de seguros afirma que o custo médio
para segurar um Ford F-150 Super Cab 1999 é de pelo menos 875 dólares. Uma amostra aleatória de 9
seguros similares tem custo médio de 825 dólares e desvio padrão de 62 dólares. Há evidência suficiente
para rejeitar a alegação do vendedor ao nível α = 0,01. Suponha que a população esteja normalmente
distribuída.
Obtemos o resultado:
One-sample T
Test of mu = 875 vs < 875
e) Interprete o valor p.
_________________________________________________________________________________
_________________________________________________________________________________
pˆ − po po (1 − p0 )
z= onde σˆ pˆ =
σ pˆ n
EXERCÍCIO 10.5 (Bhattacharyya & Johnson, cap. 8, pág. 280) Uma indústria deseja avaliar se o
detergente líquido neutro e o limão são igualmente preferidos pelos consumidores. A preferência de 250
consumidores foi levantada e se encontra digitada no arquivo aula10ex5.mtw.
Temos o resultado:
Event: neutro
c) Interprete o valor p.
_______________________________________________________________________________
_______________________________________________________________________________
f) Com 95% de confiança, pode-se afirmar que a porcentagem de consumidores que preferem o
detergente líquido neutro está entre _____ e _____. Em outras palavras, 58% dos consumidores
preferem o detergente líquido neutro com um erro para mais ou para menos de ______ %.
EXERCÍCIO 10.6 (Adaptado de Bhattacharyya & Johnson, cap. 8, pág. 263) Um censo de há dois anos
passados revelou que 20% das famílias de uma grande comunidade viviam abaixo do nível de pobreza.
Para determinar se essa porcentagem diminuiu, estudou-se uma amostra aleatória de 500 famílias,
encontrando-se 91 abaixo do nível de pobreza.
Temos o resultado:
Test and CI for One Proportion
Test of p = 0,2 vs p < 0,2
c) Interprete o valor p.
_______________________________________________________________________________
_______________________________________________________________________________
d) Qual é o menor valor de α para o qual a hipótese nula pode ser rejeitada? _______
e) Conclua de acordo com o contexto.
_______________________________________________________________________________
_______________________________________________________________________________
a) Com base nos dados, qual deve ser a decisão dos produtores, considerando um nível de
significância de 5%? Não esqueça de escrever as hipóteses (escreva as formulações verbal e
matemática), calcular a estatística do teste, calcular e interpretar o valor p e tirar a conclusão.
b) Construa e interprete um intervalo de 95% de confiança para a proporção de famílias que
assistem regularmente ao programa.
c) Qual é a estimativa da proporção de famílias que assiste regularmente ao programa atualmente?
d) Com base no intervalo de confiança calculado, qual é a margem de erro?
EXERCÍCIO 10.8 Um investidor, que planeja abrir uma agência de viagens, quer avaliar se faturará em
média mais que US$3400 por mês. Suponha que os faturamentos mensais de uma agência de viagens,
do porte que o investidor pretende abrir, se distribuam normalmente com um desvio padrão
σ = US$130. Durante 9 meses, o investidor anotou o faturamento líquido mensal de uma agência de
viagem do mesmo porte:
Faça o teste estatístico adequado usando um nível de significância de 5%. Não esqueça de escrever as
hipóteses, calcular a estatística do teste, calcular e interpretar o valor p e tirar a conclusão. Os dados
estão digitados no arquivo aula10ex8.mtw.
Resp: Valor observado da estatística do teste z = 2,36 valor p = 0,009 Conclusão: Rejeita-se
a hipótese nula ao nível de 5% de significância, ou seja, o investidor pode concluir que
uma agência de viagens desse tipo faturará em média mais de US$3400 por mês. A
chance de errar ao rejeitar a hipótese nula, com base na amostra observada, é de 0,9%
.
EXERCÍCIO 10.9 O tempo médio necessário para os operários completarem determinada montagem tem
sido igual a 55 minutos. Suponha que a distribuição do tempo de execução da montagem tenha
distribuição normal. Para avaliar se atualmente o tempo médio de execução da montagem continua
sendo igual a 55 minutos, o supervisor decide registrar, em um determinado dia, os tempos de execução
para uma amostra de 16 operários, obtendo os seguintes dados:
Faça o teste estatístico adequado usando um nível de significância de 5%. Não esqueça de escrever
as hipóteses, calcular a estatística do teste, calcular e interpretar o valor p e tirar a conclusão. Os
dados estão digitados no arquivo aula10ex9.mtw.
Resp: Valor observado da estatística do teste t = 4,23 valor p = 0,001 Conclusão: Rejeita-se a
hipótese nula ao nível de 5% de significância, ou seja, o tempo médio de execução da
montagem é diferente de 55 minutos. Com base na amostra, a chance de errar ao
fazer esta afirmação é de 0,1%.
© DME /2006-2 67 de 70
LABORATÓRIO DE ESTATÍSTICA
** Exercícios de revisão para 1ª avaliação **
EXERCÍCIO 1.1 (adaptado de Morettin & Bussab, cap. 2, pág. 11): A tabela a seguir apresenta
informações sobre estado civil, grau de instrução, número de filhos, salário (em salários mínimos), idade
(medida em anos) e região de procedência (capital, interior do estado de Minas Gerais ou outro estado
do Brasil) de 36 funcionários da seção de orçamentos da Companhia Milsa e está digitada no arquivo
rev1ex1.mtw.
a) Abra o arquivo rev1ex1.mtw e classifique cada variável como quantitativa (discreta ou contínua) ou
qualitativa (nominal ou ordinal):
Estado Civil: _______________________ _________________________________
Grau de instrução:_____________________ _______________________________
Nº de filhos:___________________________ _______________________________
Salário: ______________________________ _______________________________
Idade: __________________________________ ____________________________
Procedência: ____________________________ ____________________________
b) Complete:
Dos 36 funcionários ________são casados, o que corresponde a ______%. Com relação ao grau
de instrução, ________ funcionários tem 1º ou 2º grau o que corresponde a _____% do total de
funcionários. Um total de ________funcionários não informaram o número de filhos. Um total de
________ (______%) tem menos de 3 filhos. Somente ______ (______%) tem 4 ou 5 filhos. Um
total de ______ (______%) funcionários são do estado.
f) Faça a síntese numérica e construa um gráfico de pontos para a variável salário. Faça um parágrafo
comentando as medidas e o gráfico.
g) Construa um histograma para os salários dos funcionários, com limite inferior da primeira classe igual
a 4 salários mínimos e amplitude de cada classe igual a 4 salários mínimos. Responda:
Quais são os limites da classe de maior freqüência? __________ e _________
Quantos funcionários estão nesta faixa salarial? ___________
Qual é a forma da distribuição dos dados?_____________________________
h) Calcule as medidas descritivas da variável salário para cada categoria do grau de instrução. Não
esqueça de incluir o coeficiente de variação entre as estatísticas selecionadas. Complete o quadro a
seguir:
© DME /2006-2 68 de 70
Apresente duas conclusões a respeito dos salários dos funcionários uma em relação às medidas de
posição central e outra em relação às medidas de variabilidade.
__________________________________________________________________________________
__________________________________________________________________________________
__________________________________________________________________________________
i) Construa e análise um Boxplot para a variável salário de acordo com a grau de instrução.
__________________________________________________________________________________
__________________________________________________________________________________
j) Estude a associação entre salário e idade construindo o gráfico adequado e calculando a medida de
associação correspondente.
__________________________________________________________________________
_________________________________________________________________________________
k) Estude a associação entre salário e idade, levando em consideração o grau de instrução, construa o
gráfico adequado e calcule as medidas de associação correspondentes.
_________________________________________________________________________________
_________________________________________________________________________________
EXERCÍCIO 1.2 Numa fábrica de refrigeradores foram apontados alguns problemas com a linha de
produção. Para melhor avaliação foi realizado um levantamento dos principais tipos de problemas,
obtendo-se os resultados na tabela abaixo e que estão digitados no arquivo rev1ex2.mtw.
LABORATÓRIO DE ESTATÍSTICA
** Exercícios de revisão para 2ª avaliação **
EXERCÍCIO 2.1 O tempo necessário para a troca do óleo de um carro em um posto de serviço é uma
variável aleatória que tem distribuição normal com µ = 9,2 minutos e σ = 90 segundos.
b) Determine o tempo k abaixo do qual se realizam 90% das trocas de óleo do posto de serviço.
k = 11,1223
c) Determine um intervalo de tempo, simétrico em torno da média, que compreenda 65% das trocas
de óleo do posto. a = 7,7981 b = 10,6019
EXERCÍCIO 2.2 Um estudo mostra que 35% das famílias residentes em uma grande área metropolitana
têm mais de um carro. Considerando uma amostra de 7 famílias, reponda:
x 0 1 2 3 4 5 6 7
p(x)
b) A probabilidade de que:
a1) exatamente 3 famílias tenham mais de um carro; Resp: P(X = 3) = ?
a2) no máximo 5 famílias tenham mais de um carro; Resp: P(X ≤ 5) = ?
a3) de 3 a 5 famílias tenham ao mais de um carro. Resp: P(3 ≤ X ≤ 5) = ?.
c) O número de famílias com mais de um carro, tal que a probabilidade de observar no máximo
esse número de famílias com mais de um carro, em uma amostra aleatória de 7 famílias, seja no
máximo 95%.
Resp: k = ?, tal que P(X ≤ k) ≤ 0,95
EXERCÍCIO 2.3 (Larson & Farber, cap. 6, pág.214). O diretor do comitê de admissão de uma
universidade deseja estimar a idade média de todos os estudantes aprovados no momento. Em uma
amostra aleatória de 20 estudantes, a idade média encontrada foi de 22,9 anos. A partir de estudos
passados, sabe-se que o desvio padrão é de 1,5 ano e que a população está normalmente distribuída.
EXERCÍCIO 2.4 Um escritório de investimentos acredita que o rendimento médio das diversas ações que
movimenta é de 20 u.m com um desvio padrão de 5 u.m. Uma nova estratégia foi definida com o objetivo
de aumentar o rendimento médio das diversas ações que movimenta mantendo a uniformidade nos
rendimentos, ou seja, mantendo o desvio padrão em torno de 5 u.m. Para verificar esta hipótese,
tomaram-se 8 empresas ao acaso, obtendo-se os seguintes rendimentos: 23,6; 22,8; 25,7; 24,8; 26,4;
24,3; 23,9 e 25. obs: u.m = unidade de medida
a) Com base na amostra, qual é a estimativa pontual do rendimento médio das diversas ações após
a nova estratégia? Resp: 24,56 u.m
b) Construa um intervalo de 99% de confiança para o rendimento médio das diversas ações após a
nova estratégia. Calcule também a margem de erro. Resp: (20,01; 29,12) E = 4,56 u.m
c) Ao nível 1% de significância, teste se a nova estratégia foi eficiente em aumentar o rendimento
médio das diversas ações que movimenta. Qual sua conclusão. Obs: Mostre as hipóteses, a
estatística do teste e o valor-p. Resp: z = 2,58 valor-p = 0,005 (0,5%)
EXERCÍCIO 2.5 Uma indústria deseja avaliar se o detergente líquido neutro e o limão são igualmente
preferidos pelos consumidores. Em uma amostra de 250 consumidores, 145 expressaram sua
preferência pelo detergente líquido neutro, enquanto os 105 restantes preferem o detergente líquido
limão.
a) Com base na amostra, qual é a estimativa pontual da proporção de consumidores que preferem o
detergente líquido neutro? Resp: 0,58 (ou 58%)
b) Construa um intervalo de 95% de confiança para a proporção de consumidores que prefere o
detergente líquido neutro. Resp: ( 0,5188; 0,6412)
c) Com base no intervalo calculado, qual é o erro máximo cometido na estimação da verdadeira
proporção de consumidores que preferem o detergente líquido neutro? Resp: E = 0,0612 (ou
6,12%).
d) Os dados indicam que existe diferença significativa entre a popularidade dos dois tipos de
detergente líquido? Para responder a esta pergunta, vamos testar ao nível de significância de 5%
as hipóteses abaixo:
H 0 : p = 0,50 onde p = proporção de consumidores que preferem o
detergente líquido neutro.
H 0 : p ≠ 0,50
Resp: z = 2,53 p = 0,011 (1,1%).